開発のモチベーション
社会シミュレータは、人間の行動や社会的な相互作用をデジタルモデルを通して研究する技術です。 特に大規模言語モデル(LLM)の登場により、これまでより複雑な現象に比較的低コストでアプローチできる道が開かれました。 なぜ社会シミュレータが有用なのか、これまでの手法と何が違うのか、どのような活用が可能なのかについて簡単にまとめました。
少し結論を先取りすると、社会シミュレータを通して究極的にはこういう知見を得たいと思っています。
より一般化した人間理解をしたい
人間について我々が獲得した知見は、既存の地球環境やこれまでの歴史的展開、限られた資料への依存を前提としている。
人間社会の新しい振る舞いを発見したい
例えば「人権」のように直接観察できないような概念を導入し、人間社会に大きな影響を与え、うまく集団を振る舞わせることができる。 より人間社会を良いものとするための規範や文化、概念を発見したい。
既知の社会現象についての解像度を高めたい
無意識的な偏見が、社会に与えている影響はあるとされるがどれだけ強く影響するか知りたい。
心理学にとってどのような意味があるのか?
人間の中のメカニズムを知るための代表的な学問が心理学です。その誕生から約150年、多くの知見を生み出してきた分野です。 しかし、いくつか構造的な制約や困難を抱えています。
人間が複雑であるが故、現象の全体像を把握するには膨大なデータが必要
例えば、なぜ何かの食べ物が美味しいのか、を説明しようと思った時に、色々原因が挙げられます。 「濃いめの味だった(食べ物の成分)」、「空腹だった(体の状態)」、「CMをみた」、「家族で食べた思い出がある(記憶)」、 「美味しいということが期待されてる状況(社会環境)」、「気温や湿度(外部環境)」、「濃いめの味を選好する遺伝や生育環境」、 思いつくだけでもこれだけ因子がありえますが、これらがさらに相互作用を起こすとその組み合わせ分だけ調べることがあります。
そして、これらの因子がある・ない、強い/弱いなどを一つ一つ比較しその影響度合いを調べると、膨大な量のリサーチが必要になり、 現実的なコストでは収まらなくなります。なので、現実的には気になるポイントを絞り、それ以外の条件が影響しないようにして( 統制や高度な統計処理をして)調査を行うわけです。
これらの制約や困難をある程度緩和する可能性を社会シミュレータは秘めています。
望ましい複雑さを設計が可能であり、あえて指定しなければノイズになる経験や知識の影響を受けないと看做せる
条件設定が自由にできるので、統制の仕方を変えたり、現実には設定しづらい環境や時間軸での人間の振る舞いをシミュレートできる
全てのプロセスのログを残せるので、思考や感情などが発生するプロセスを観察可能
リアルな人間ではないので、研究しづらいテーマに取り組みが可能。また人間が観察する/されることによる影響を排除可能
これまでのシミュレーションと何が違うのか?
シミュレーションはこれまでも有効な知見の創出方法として存在してきました。ロバート・アクセルロッド氏による囚人のジレンマに関する研究は有名ですし、COVID-19の感染予測に用いられたモデルは記憶に新しいところです。しかし、これらのモデルは極めてシンプル化した形で人間を取り扱います。 例えば、COVID-19の感染予測の代表的なモデルでは、健康・感染・隔離(回復)の3状態のみを人間の状態と見立てます。
しかし、より複雑な社会現象を扱おうとした時に限界があります。 例えば、人間関係を捉えようと思った時、実際には同じひととの付き合いにおいても 、仕事の関係、友人の関係、近所の関係、その人と共通の知り合いとの関係など多数の要素を踏まえて行動したり判断したりしますが、 この一要素だけを捉えても人間関係を説明できたことにはなりません。
また、複雑化しようにも膨大なインプットが必要です。仕事の関係と言っても、 上司・部下・同僚、取引先、顧客といった概念、それぞれの関係において期待される振る舞い、 その業界ごとに違いなどを逐一ルールとして定義することは困難です。
これをある程度緩和してくれるのがLLMの存在です。LLMが既に膨大な学習をしてくれているので、 記述するのは強調したい部分やコントロールしたい部分で済みます。いわゆる常識的なことを全部言語化して記述する手間がなくなったので、 複雑なシミュレーションをする道が開けたのです。
LLMを用いた社会シミュレータの限界や想定される批判
もちろん、これまで挙げたメリットを手放しで享受できる訳ではありません。これからの研究を通じて下記のような限界の乗り越え方や、批判に対する答えを見出していかなければいけません。
LLMから知識を消去したり限定することが困難
膨大な学習をあらかじめしてくれていることの負の面ですが、既に学習してしまったことを知らない状態にすることが困難です。 広範な知識を動員できる人間のシミュレーションという不自然さがあります。 例えば、幼い子供を再現することは難しいかもしれないです。
LLMの学習データが偏っている可能性が高い
LLMの学習データは、主にインターネットにある文章ですが、そうすると自ずとそのデータの偏りの影響を受けます。 英語のデータでかつ現代のデータが圧倒的に多いことが想定されます。 また、チューニングの過程でチューニングをした企業や団体の影響を受けてしまいます。 実際、経験的にGPTによって制御したエージェントの発言や振る舞いは「アメリカ人ぽい」印象を受けます。 先の知識を消去したり限定することが困難なため、この問題がより重くなってきます。
LLMは現状、人間がこれまで言語化したことしか知らない
人間は身体があり、身体が環境から受ける影響で当然思考や感情が変化し、 言葉を介さなくても結果的にそれが行動などに影響しますが、LLMは身体を持っておらす、 シミュレーションでも現状身体性を表現できていません。全て言葉の世界で生きています。 またその言葉もこれまで人間が言語化したものに限られます。
あくまでシミュレーションであり、人間を丸ごと表現できている訳ではない
心理学に様々なメリットをもたらしうるシミュレータですが、 これまで心理学が直面しなかった課題に直面します。 心理学は、研究の対象である人間そのものを材料にして実験を行うので、 実験結果が人間に当てはまることは自明のことでした。 しかしシミュレーションでは、どれだけ人間に似ているのか、 ということが知見を生み出す上で新たに問われます。
人間をどこまで表現すべきと考えているのか?
上記に挙げた社会シミュレータの限界や想定される批判のうち、 「人間を丸ごと表現できている訳ではない」という点は特に根本的であり、 考え方を早期に整理する必要がありますが、現状の考えをまとめます。
そもそも、リアルな人間を全て理解している訳ではない
先述の通り、心理学でこれまでとってきた研究方法にも制約があり、 あらゆる場面において完全に人の振る舞いを説明できる理論やモデルを構築できた訳ではありません。 そのため、シミュレーションであっても、リアルな人間であっても、我々が研究可能なのは、 ある状況における、ある人間の側面に限られます。
集団の傾向が似ていれば良い
ここまで強調する場面がなかったのですが、あくまで目指しているのは社会シミュレータであり、 人間個体ではありません。そのため、一個体一個体が実際の人間に似ていなくても、 全体として振る舞いが似ていれば目的には資する訳です。
まとめると、限定された場面で、人間の一側面を、集団の傾向として表現できれば良いと考えていますし、 それは我々の人間理解の限界や確率的に振る舞うLLMの特性とも相性が良いと思われます。
逆に言えば、漠然とシミュレーションをしても何も知見が得られないリスクは高く、 明確な仮説を持って設計された実験である重要性が高いと言えます。 (研究一般もそうではありますが)
活用のパターン
上記に挙げた、可能性や限界を踏まえて、活用を類型化し対応するアプリケーションを挙げてみました。
複雑な現象における仮説生成
状況設定パターンの多種多様な並行実験が可能であることを活かす
人間で検証を行なうことを前提とし、有効な仮説を絞り込むためにシミュレーションを行う
アプリケーション例
- オフィス環境が、社員のコミュニケーションに与える影響
- テナント配置や構成が、ショッピング体験に与える影響
- メンバーの構成(組み合わせや人数)が労働生産性に与える影響
生の人間で効果量が得られなかった現象の計算機科学/情報工学による裏付け
ある心理的な効果の存在は認められているものの、どれだけ強い効果なのかについての知識の更新
アプリケーション例
- メンタルヘルス変化や同調行動を生じさせる要因についての研究
- 気分や感情が、知覚や評価、意思決定に与える影響についての研究
- 無意識的な偏見が、対人認知に与える影響
極端な環境や、時間スケールの大きな実験
倫理的、物理的な制約が弱いことを活かす
アプリケーション例
- 宇宙環境に長期滞在することが、集団の人間関係に与える影響
- 文化や規範が長い時間軸の中で、変化していく様子の観察
上記の他にも、蓄積した知見を活かして、自動研究を行うシミュレーション、物語生成などのエンタメへの活用などにもチャレンジしています。
もっと詳しく知りたい方へ
弊社のやりたいことをわかりやすく伝えるため、平易な記述を心がけましたが、その分正確性、厳密性、先行研究への配慮などが不足しています。 より詳細な内容について知りたい方は、専門家の知見を借りて作成予定の研究計画や実験成果記事をお読みください。