こないだからずーっとこの辺りを考えてるんだよねー。ロボットの意識や感情って、どうやったら生まれるんだろうって。
— 鷹野 凌さん (@ryou_takano) 2月 14, 2012
Twitter でこんなことをつぶやいたら、お勧めされた本です。人工生命の可能性を分かりやすく解説しています。有田隆也さんは、自然情報学科複雑システム系を専門とする、名古屋大学の教授です。下記は、この書籍のサポートサイトです。
「心はプログラムできるか」のすべて! 公式サポートサイト(サイエンス・アイ新書)
生命の長い進化の歴史を、人工生命の研究から解き明かそうという内容になっています。ところどころにボクには少し難解な部分がありましたが、非常に丁寧な説明と豊富な図が理解の手助けになりました。
第1章はいきなり、アリの話から始まります。アリがエサを巣に持ち帰るとき、嬉しくて(?)フェロモンを分泌するので、他のアリはそれを手がかりにしてエサを見つけるそうです。巣へ帰るルートは、多くの試行の結果として最短ルートのフェロモンが最も濃くなるという「正のフィードバック」がかかるとか。
アリの群れによる知能を利用した最適化手法を ACO (Ant Colony Optimization)と言い、サウスウェスト航空の貨物運搬や、ブリティッシュ・テレコムの電話回線ルーティングなどに応用されているそうです。
こうした生物の群れが実現するある種の知能を “群知能(Swarm intelligence)” というそうです。また、単純な機能を持つ部分が集まって相互作用すると、全体として予想もしないような機能・構造・振る舞いを示すという現象を、人工生命研究では「創発」現象と呼ぶそうです。
普通の科学だと仮説→検証という流れですが、人工生命研究ではプログラムした人が待ったく予想もしていなかったような結果、すなわち創発現象が起きる方がいいそうです。
『利己的な遺伝子』の著者であるリチャード・ドーキンスは、「累積的進化=自然選択+突然変異」がいかにパワフルなメカニズムであるかを説明してきたそうです。無数の変化の蓄積が、自然選択というフィルタが付随することで、1回の突然変異による小さな変化からは想像もつかないような、複雑で知的な構造や機能を、自発的に生み出すと。
この自然選択というフイルタの代わりに、人間の主観によって進化の方向性を決める手法を「対話型進化計算」というそうです。上記のサポートサイト最下部に、対話型進化計算によって好みの顔を作り出す「顔モルフ」というプログラムのサンプルがあります。
進化プールから好きな顔を選ぶと、それを親にした突然変異が8個生まれます。好みのパーツは固定、つまり進化をやめることができます。このプロセスを何十回か繰り返すと、好みの顔ができあがるというものです。実際やってみると、自分では到底思いつかないような顔になったりして、面白いですよ。
さて、元祖デジタル生命は「ティエラ(Tierra: スペイン語で地球)」と言い、1990年1月4日に生まれたそうです。突然変異と淘汰によって累積的進化するデジタル生命の研究は、生物進化研究の新たな道を開いたとか。
「社会的生物はなぜ利他的行為をするのか」という謎があります。自分が生き残ることより、他者を守るために自分を犠牲にするという行動は、一見すると「自らの子孫を残す」という生物の目的とは不整合に見えます。これには次の3つの説が唱えられているそうです。
- 血縁選択説
自分の遺伝子を受け継いだ子や孫まで含めたトータルで考えると、自分を犠牲にしても残る遺伝子の方が多いから。
- 互恵主義説
利他的行為をすると、将来他者から利他的行為が返ってくるから。
- マルチレベル選択説
親切な人が多いグループが、トータルで見ると得をするから。
これらを具体的に説明しているパートが面白い。例えばグーとパーだけのじゃんけん(囚人のジレンマ)というのがあります。パーで勝つ(裏切り)と5点、グーであいこ(双方協調)だと3点、パーであいこ(双方裏切り)だと1点、グーで負ける(裏切られ)と0点という対戦ゲームでアルゴリズムを募集したところ、1つ前の相手の手を真似する「しっぺ返し」という最もシンプルなプログラムだったそうです。
その結果を全て公開した上で2回目の大会をやっても、再度「しっぺ返し」が優勝したというのは驚きです。継続的な関係を考えると、お互いに持ちつ持たれつという互恵的な関係を築くほうが結局トクになる、というのが数理的モデルで明らかになった、ということのようです。
こうした話の流れから、第7章でいよいよ人工生命的手法で「感情」へアプローチをします。
ここではディートリッヒ・デルナーの感情理論というのが紹介されています。
- 活性度(目標行動にエネルギーをどの程度使っているか)
- 外在性(外に見える行動にどれほど処理を費やしているか)
- 正確さ(目標行動をどれほど綿密に行なっているか)
- 集中度(どれだけ狭い範囲に注意を注いでいるか)
この4つの値の組み合わせで感情が生まれる、というものです。例えば平常なら全て0.5、怒りなら活性度・外在性・集中度が1で正確さが0、悲しみなら正確さ・集中度が1で活性度・外在性が0といった感じです。
これをロボットに組み込んで、その動きだけで人間がロボットの感情を判断できるか?というテストを行ったそうです。
- 活性度 → 定期的に止まって向きと速度を調整する時間間隔
- 外在性 → 移動スピード
- 正確さ → 右左折するときに正確に曲がるか大雑把に曲がるか
- 集中度 → 目標とするコースにどれだけ忠実に沿って進むか
1000人にテストしてもらったらところ、どの感情に関しても出題側が意図した回答を選んだ人が最も多いという結果になったそうです。驚きですね。ただし、怒りと興奮、悲しみと心配を間違える人は多かったそうです。これは、実際の感情として考えても、わりと区別しづらかったりしますよね。
何百万年の人類の歴史で、99.5%は狩猟採集の生活環境でした。進化心理学では、その生活環境こそが私たちの感情を形成したと考えるそうです。例えばヘビ(毒で大勢の人が殺される)を見ると、即座にギョッとして恐れを感じ、退避・防御の行動に切り替えることが生き残り上有利なので、そうでない個体に比べて適応度が高いはず、というような解釈です。
ここで解説されている進化の4段階や、社会的知能仮説は、非常に興味深いものでした。もちろん「これが答えだ!」というような結論はまだ出ていませんが、人工生命の研究から、そのロジックが「わりと答えに近いような気がする」と感じさせるような状況になってきているというのは本当に面白いと思います。
ちなみに、たまたまこの本を読んでいる最中に、Google+のストリームで遺伝的アルゴリズムの動画が話題になっていました。本にもその解説が載っているんですよね。偶然というのは恐ろしいと思いました。
心はプログラムできるか 人工生命で探る人類最後の謎 (サイエンス・アイ新書 31)
posted with amazlet at 12.02.21
有田 隆也
ソフトバンククリエイティブ
売り上げランキング: 137236