人工知能・AI
数学(用語)
タンパク質 / プロテイン(用語)
機械学習 / ML(用語)
DeepMind(企業)

純粋数学もタンパク質生成も、人工知能におまかせを

次の記事

税理士向けシステム開発などのBesoが3000万円のプレシード調達、税理士業務の効率化を支援するZooUの事前登録受付開始

人工知能(AI)が興味深い分野である理由の1つに、AIは何が得意なのかを誰も知らない、ということがある。12月2日号の「Nature」に掲載された最先端の研究所による2つの論文では、機械学習(ML)は、タンパク質生成のような技術的に難しい作業、純粋数学のような抽象的な作業のどちらにも対応し得ることが示されている。

最近話題になった、Google(グーグル)が買収したDeepMind(ディープマインド)やワシントン大学David Baker(デビッド・ベイカー)研究室による、タンパク質の物理的構造(フォールディング)の予測に対するAIの利用の実証結果を見れば、タンパク質の話はさほど驚くことではないかもしれない。偶然ではないが、この記事で紹介する論文を発表したのは、そのDeepMindとベイカー研究室である。

関連記事
DeepMindのAlphaFold2に匹敵するより高速で自由に利用できるタンパク質フォールディングモデルを研究者が開発
DeepMindがAlphaFoldで折りたたみを行った人体のすべてのプロテオームをオンライン化

ベイカー研究室の研究によると、タンパク質配列がどのようにフォールディングされるかを調べるために作成したモデルは、本質的に反対(逆)のことをさせることができるという。つまり、特定のパラメータを満たす新しいタンパク質配列を生成し、in vitro(試験管内)のテストで想定通りに機能させることができるというのだ。

タンパク質の構造を予測するために作成されたAIが、逆に新しいタンパク質を作ることもできるという発見は重要である。なぜなら、絵の中のボートを検出するAIがボートを描けないとか、ポーランド語を英語に翻訳するAIが英語をポーランド語に翻訳することができないという例はあっても、逆のことができるかどうかは必ずしも明らかではなかったからだ。

逆方向の可能性の研究は、SalesForce Research(セールスフォースリサーチ)のProGen(プロジェン)など、すでにさまざまなラボで行われている。しかし、ベイカー研究室のRoseTTAFoldとDeepMindのAlphaFoldは、プロテオームの予測の精度という点では圧倒的に優れており、これらのシステムのテクノロジーを創造的な活動に活かせるというのは喜ばしいことだ。

AIの抽象化

一方、Natureの表紙を飾ったDeepMindの論文は、AIが数学者の複雑で抽象的な作業を支援できることを示している。これは数学の世界を覆すものではないが、機械学習モデルが数学をサポートできるということを示す、実に斬新で、これまでになかった成果だ。

この研究は、数学とは主に関係性とパターンの研究である、という事実に基づいている。例えば、あるものが増えれば別のものが減り、多面体の面が増えればその頂点の数も増える。これらの事象はシステマチックなので、数学者はこれらの正確な関係性を推測することができる。

中学校で習う三角関数は、そのシンプルな例だ。三角形の内角の和が180度になることや、直角三角形の斜辺以外の辺の二乗の和が斜辺の二乗になるというのは三角形の基本的な性質である。しかし、8次元空間にある900辺の多面体ではどうだろう。a2 + b2 = c2のような公式を見つけることができるだろうか?

結び目の幾何学的表現と代数的表現という2つの複雑な性質の関係を示す例(画像クレジット:DeepMind)

観察された事象が偶然のものではなく普遍的なものであることを確信するためには、多くの例を調べる必要があるが、数学者による作業には限界がある。DeepMindはここにAIモデルを導入し、省力化を図ることにした。

オックスフォード大学のMarcus du Sautoy(マーカス・デュ・ソートイ)教授(数学)は、DeepMindのニュースリリースの中で「コンピューターは人間が追随できない規模のデータを出力することに長けているが、(今回の場合)異なるのは、人間だけでは検出できなかったであろうデータのパターンを拾い出すAIの能力である」と説明している。

このAIシステムにサポートされて得られた実際の成果は筆者が理解できる範囲をはるかに超えているが、読者の中に数学者がいれば、DeepMindから引用された以下の内容を理解してもらえると思う。

ある有向グラフと多項式の間には関係があるはずだという「組み合わせ不変性予想」は、40年近く進歩を拒んできました。MLの技術を用いて、そのような関係が実際に存在するという確信を得ること、そしてその関係が、破れた二面体の間隔や極値反射などの構造に関連しているのではないか、という仮説を立てることができました。この知識をもとに、Geordie Williamson(ジョーディー・ウィリアムソン)教授は、組み合わせ不変性予想を解決する、驚くべき美しいアルゴリズムを予想することができました。

代数学、幾何学、量子論には(結び目について)独自の理論があります。これらの異なる理論がどのように関係しているかというのは長年の謎でした。例えば、結び目の幾何学は代数学について何を教えてくれるのでしょうか?私たちは、そのようなパターンを発見するためにMLモデルをトレーニングしました。驚くべきことに、これにより、ある特定の代数的な量(表現)が結び目の幾何学と直接関係していることがわかりました。これまで明らかではなく、既存の理論でも示唆されていなかったことです。私たちはMarc Lackenby(マーク・ラッケンビー)教授と協力し、MLの帰属手法を使って、これまで見過ごされていた構造の重要な側面を示唆する、自然な傾きと呼ぶ新しい量を発見しました。

この予想は、何百万、何千万もの例で裏づけられているが、自分の仮説を厳密に検証するよう指示するのにピザやコーヒーをおごる必要がない、というのもコンピューターの利点である。

上述の例は、DeepMindの研究者たちと教授たちが緊密に協力して(MLの)具体的な利用方法を考え出したものなので「(AIは)普遍的に純粋数学のアシスタントである」といえるものではない。しかし、ルール大学ボーフムのChristian Stump(クリスチャン・スタンプ)教授がNatureのSummaryで述べているように、これが機能するということは、そのようなアイデアに向けた重要な一歩である。

スタンプ教授は次のように記す。「どちらの結果も、その分野の研究者にとって必ずしも手の届かなかったものではありませんが、どちらも、これまで研究者が見つけられなかった真の洞察を提供しています。従って、今回の成果は、抽象的な枠組みの概要以上のものです」「このようなアプローチが広く適用できるかどうかはまだわかりませんが、Alex Davies(アレックス・デイビス)等(ら)の論文は、数学研究における創造的プロセスをMLツールにサポートさせる手法の有望性を示しています」。

画像クレジット:DeepMind

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)