心と体はどのように進化し成功するのか、スタンフォード大学がAI生物でシミュレーション

次の記事

IoTでミツバチの動きや健康状態をリアルタイムで追跡するBeeHeroの精密受粉プラットフォーム

人工知能は、プログラムされた心を持ち、デジタルな空間に浮かんでいる実体のないものと考えられがちだ。だが人間の心は体と深く結びついている。今回紹介する、仮想生物がシミュレーション環境でタスクを実行する実験は、AIが心と体を与えられることで、何らかの恩恵を受ける可能性を示唆している。

スタンフォード大学の科学者たちは、私たちが未開の状態から道具を使う類人猿へと進化する際の、物理的・精神的な相互作用について興味を持っていた。脳が身体の機能から影響を受けたり、またその逆の現象も起きたりするのだろうか。実際には、これは以前から指摘されていたことだ(1世紀以上前から指摘されていた)。確かに、モノをつかむことのできる手を使うほうが、それほど分化していない付属器官を使うよりも、より早く物体を操作することを学ぶことができることは明らかだ。

同じことがAIにも言えるかどうかは、開発がより構造化されているので直ちにはわからない。とはいえ以下のような考えがもらたす疑問には説得力がある。つまり、AIが初めから世界に適応するように進化していけば、AIはよりよく学び世界に適応できるのではないだろうか。

今回科学者たちがデザインした実験は、何十年も前から進化アルゴリズムのテストに使われてきたシミュレーション環境に似ているところがある。仮想空間を設定して、そこにシンプルなシミュレートされたクリーチャー(生物)を配置する。この段階では複数の連結された幾何学的形状がランダムに動くだけだ。そんな千匹のうごめく個体の中から、一番遠くまでのたうちながら移動した10匹の個体を選び出し、そこから千匹のバリエーションを作り出して、それを何度も繰り返す。ほどなく、ひと握りの多角形が仮想表面を、まずまず滑らかに横切って歩くようになる。

しかし、それはもう古い話だ。研究者たちが説明するように、シミュレーションをより堅牢で可変的なものにする必要があった。単に歩き回る仮想的な生物を作るのではなく、それらの生物が行動をどのようにして学習したのか、そして他の個体よりも良く学習したり速く学習したりするものがあるのかを調べようとしているのだ。

それを確かめるために、研究チームは、以前のものと同様のシミュレーションを作成しunimals(ユニマルス、universal animal=「普遍的な動物」の意、果たしてこの用語が市民権を得られるかどうか)と呼ばれる生物たちを、まずは歩くことを学ばせるためにシミュレーションに投入した。このシンプルな形状たちは、球状の「頭」と数本の枝状の関節を持つ手足を持ち、それらを使っていくつものおもしろい歩き方を編み出した。ある個体はよろめきながら前進し、ある個体はトカゲのような関節歩行を身につけ、ある個体は陸上のタコを思わせるようなバタバタとした、しかし効果的なスタイルを身につけた。

見よこの動き!(画像クレジット:スタンフォード大学)

ここまでは以前の実験と同じだが、似ているのはそこまでだ。

これらのユニマルスの中には、起伏のある丘や低い障壁を乗り越えることが強いられる、いわば異なる母星で育ったものもある。そして次の段階では、これらの異なる地形出身のユニマルスが、しばしば言われる「逆境こそが適応力の母」という言葉が正しいかどうかを観察するために、より複雑な課題で競い合った。

論文共著者のAgrim Gupta(アグリム・グプタ)氏は「この分野の先行研究のほとんどは、単純な平地でエージェントを進化させてきました。さらに、環境との直接的な感覚運動の相互作用を通じて、エージェントの制御や行動が学習されていないという意味では、学習は行われていません」とTechCrunchに説明した。「この研究は初めて、段差、丘、尾根のある地形のような複雑な環境で、進化と学習を同時に行い、複雑な環境での操作を可能にするものです」。

各環境の上位10匹のユニマルは、新しい障害物の出現、ボールをゴールに運ぶ、箱を丘に押し上げる、2つの地点の間をパトロールするといった課題が与えられた。ここでは「グラディエーター 」(ローマの剣闘士)たちが、真にバーチャルな根性を発揮したのだ。変化に富んだ地形の上を歩くことを学んだユニマルは、平地で育ったユニマルよりも、新しい作業を早く覚えて上手にこなすことができた。

画像クレジット:スタンフォード大学

米国時間10月6日、学術誌「Nature」に掲載された論文で著者らは「要するに私たちが発見したのは、進化は学習速度の速い形態を急速に選択することで、初期の祖先が一生の後半で学んだ行動を、子孫が一生のうちで早い段階で発現させることを可能にしていることです」と述べている。

単に速く学習することを学んだだけでなく、進化の過程で、より速く適応し、より速く学習を生かすことができるような体型が選択されたのだ。平坦な場所では、タコのようにジタバタしても同じように早くゴールできるかもしれないが、坂道や尾根では、スピード、安定性、適応性に優れた体型が選択された。この体をグラディエーターの闘いの場に持ち込んでみると、苦境を乗り越えたユニマルスたちは競争に強かった。彼らの汎用性のある身体は、頭で考えたことを実践するのに適しており、ジタバタするだけの競争相手にすぐに大差をつけた。

3Dの棒人間がバーチャルな地形を疾走するGIFを多少楽しめること以外に、これは何を意味するのだろうか。論文によると、この実験は「環境の複雑さ、形態的な知性、制御タスクの学習可能性の間に、学習と進化がどのように協力して高度な関係を作り出すのかについて、科学的な洞察を得るための、大規模な仮想実験を行うための扉を開くものです」ということだ。

例えば、4本足のロボットで階段を上るような、比較的複雑なタスクを自動化したいとしよう。動きを手動で設計したり、カスタムメイドのものとAIが生成したものを組み合わせたりすることもできるが、一番の解決策は、エージェントが自分の動きをゼロから進化させることだろう。この実験は、身体とそれをコントロールする心を連動させて進化することに、潜在的に大きなメリットがあることを示している。

コーディングに精通していれば、自分のハードウェア上ですべての操作を行うことができる。研究グループが、すべてのコードとデータをGitHubに無償で公開しているからだ。そして、ハイエンドのコンピューティングクラスターやクラウドコンテナも用意しておこう。なにしろ「デフォルトのパラメーターでは、16台のマシンでコードを実行することを想定しています。各マシンが72個以上のCPUを持つことを確認してください」とのことなので。

関連記事:かくれんぼで遊んでいたAIが道具の使い方やルールの破り方を自分で発見

画像クレジット:Stanford

原文へ

(文:Devin Coldewey、翻訳:sako)