機械学習(用語)

機械学習の最前線「アルツハイマー病スクリーニング」「森林マッピングドローン」「宇宙での機械学習」など

次の記事

中国の宿題指導アプリYuanfudaoのバリュエーションが1.6兆円超え、最も価値の大きいEdTech企業に

研究論文は次々に生み出され、もはやそれらすべて目を通すことは誰にもできない。特に、実質的にあらゆる業界や企業に影響を与え、論文も生み出している機械学習の分野ではなおさらだ。今回のコラムは、特に人工知能を中心とした、関連する最近の発見や論文を集めて、なぜそれが重要なのかを説明することを目的としている。

今週は、森のマッピングに無人ドローンを使うスタートアップや、機械学習がソーシャルメディアのネットワークをマッピングしたり、アルツハイマーを予測する方法、宇宙ベースのセンサーのためのコンピュータビジョンの改善、その他の最近の技術の進歩に関するニュースを見てみよう。

発話パターンからアルツハイマーを予測する

機械学習ツールは、人間が検出しにくいパターンにも敏感に反応するため、様々な方法で診断を支援するために利用されている。IBMの研究者たちが、話し手がアルツハイマー病を発症していることを予測できる(EClinicalMedicineサイト)発話のパターンを発見したかもれない。

臨床現場でこのシステムを使うには数分程度の普通の会話があれば良い。研究チームは、1948年に遡る大規模なデータセット(フラミンガム・ハート・スタディ)を使用して、後にアルツハイマー病を発症する人々の発話のパターンを識別した。統計的に情報量の多い人の精度は約71%、AUC(Area Under Curve)値では0.74となっている。これは信頼できる結果とはいえないが、現在の基礎検査は、この病気をはるかに先取りして予測するという目的には、コイン投げよりはなんとか優れている手段だ。

アルツハイマーは発見が早ければ早いほど、管理しやすくなるので、このことはとても重要なことだ。治療法はないが、最悪の症状を遅らせたり軽減させたりできる有望な治療法や実践法は存在している。健康な人に対するこのような身体に負担をかけない非侵襲的で迅速なテストは、強力な新しいスクリーニングツールになり得ることはもちろん、技術のこの分野での有用性を示す優れたデモンストレーションでもある。

(論文に、正確な兆候例などが書かれていると期待しないで欲しい。発話の特徴の並びは、日常生活で気がつくことができるようなものではない)。

ソー「セル」ネットワーク

深層学習ネットワークが学習環境の以外のデータにも適用できるほど一般化されているかどうかを検証するのは、あらゆる本格的な機械学習(ML)研究のキモとなる部分だ。しかし、完全に無関係なデータにモデルを適用しようとする試みはほとんど行われていない。おそらくそうすべきなのに!

スウェーデンのウプサラ大学の研究者たち(ウプサラ大学サイト)は、ソーシャルメディアでグループやつながりを識別するために使用されたモデルを、生体組織のスキャンに適用した(もちろん無修正ではない)。その生体組織は、結果として得られた画像がmRNAを表す多数の小さなドットを生成するように処理されていた。

通常、組織の種類や領域を表す細胞(セル)の異なるグループは、手作業で識別され、ラベルづけされてる必要がある。しかし、仮想空間の中で、共通の関心事のような類似性に基づいて構成されたソーシェルグループを識別するために作られたグラフニューラルネットワークは、細胞に対しても同様の仕事を行うことができることが証明された(トップ画像参照)。

「私たちは、最新のAI手法、特にソーシャルネットワークを分析するために開発されたグラフニューラルネットワークを利用して、組織サンプルの生物学的パターンや連続的な変化を理解するために、それらを適用しています。細胞はソーシャルグループに似ています。なぜならソーシャルグループもグループ内で共有するアクティビティに基づいて定義することができるからです」とウプサラ大学のCarolina Wählby(カロリナ・ヴェールビー)氏は語る。

これは、ニューラルネットワークの柔軟性を示すだけでなく、構造やアーキテクチャがどのような形であらゆるスケールや文脈で繰り返されるのかを示す興味深い例だ。もし願うなら「外の如く内も然り」だ。

自然の中のドローン

私たちの国立公園や林業が営まれる広大な森には無数の木があるが、書類に「無数の木」と書くことはできない。いろんな地域でどれだけ成長しているのかや、木の密度や種類、病気や山火事の範囲などを、誰かが実際に評価しなければならない。航空写真やスキャンでわかることは限られている一方で、地上での観察では詳細な情報は得られるものの非常に時間がかかるため、この評価プロセスは部分的にしか自動化されていない。

Treeswift(ツリースイフト)はドローンに森の中の飛行と正確な計測の両方に必要なセンサーを装備することで、中間的な道を歩もうとしている。歩行する人間よりもはるかに速く飛ぶことで、木を数えたり、問題箇所を探したり、一般的に有用なデータを膨大に収集することができる。ペンシルバニア大学からスピンアウトし、米国立科学財団(NSF)からSBIR(Small Business Innovation Research:小規模事業イノベーション研究)助成金(未訳記事)を獲得した同社は、まだごく初期のステージにいる。

「企業は気候変動に対抗するために、ますます森林資源に注目していますが、そのニーズを満たすための人材供給が追いついていません」とPenn(ペン)ニュースの記事の中で語るのは(ペンシルベニア大学サイト)、Treeswiftの共同創業者でCEOのSteven Chen(スティーブン・チェン)氏だ。彼はペンシルバニア大学工学部のコンピュータ・情報科学(CIS)の博士課程の学生でもある。「林業家の1人ひとりが、もっと効率よく仕事ができるようにしたいと思っています。このロボットは人間の仕事を置き換えるものではありません。その代わりに、森林を管理するための知見と情熱を持った人たちに新しいツールを提供するのです」。

ドローンがおもしろい動きをたくさんみせてくれる、また別のエリアは水中だ。外洋に出る自律型潜水艇は海底の地図を作成したり、氷棚を追跡したり、クジラを追跡したりすることに役立っている。しかし、それらは定期的に回収し、充電して、データを取り出す必要があるという小さなアキレス腱を持っている。

パデュー大学工学部のNina Mahmoudian(ニーナ・マフムディアン)教授は、潜水艇が電力とデータ交換のために簡単かつ自動的に接続できるドッキングシステムを作成した(パデュー大学サイト)。

水中左側にいる黄色の海洋ロボットは、作業を続ける前に、充電とデータのアップロードのために移動式ドッキングステーションを探してたどり着く(画像クレジット:Purdue University photo/Jared Pike)

潜水艇にはドッキングステーションを見つけ、プラグを差し込んで安全な接続を行うための、特別なノーズコーンが必要となる。ドッキングステーション自身は自律的に動く水上機もしくは、恒常的な施設である。大事なことは、小型潜水艇がさらなる任務を行う前に、充電と報告のためのピットインをすることができるということだ。もし潜水艇で失われてしまっても(海上では実際に起こり得る危険性)、そのデータがともに失われることはない。

以下の動画で、実際の様子を見ることができる。

理論上の乱気流音

一部の人がもうすぐ実現すると考えているような、自動プライベートヘリコプターの登場はまだまだ先だと思われるが、ドローンが都市生活に溶け込むようになるのにはそれほど時間はかからないかもしれない。しかし、ドローンが高速で行き交う下で生活するということは、四六時中ノイズを聞かされることを意味する。そのため翼やプロペラまわりの乱気流やそれにともなう雑音を減らす方法が常に検討されている。

炎上しているように見えるが、これは乱気流だ

キング・アブドラ科学技術大学の研究者たちは、このような状況下での空気の流れをシミュレートする、新しくより効率的な方法(Nature Research記事)を発見した。流体力学は基本的に複雑であり、ここで大切なことは計算能力を問題の適切な箇所に注ぎ込むことだ。彼らは、理論上の航空機の表面近くの流れだけを、高解像度でレンダリングすることを可能にした。一定の距離が離れてしまうと、何が起こっているのかを正確に知ることはほとんど意味がないことを発見したからだ。現実のモデルを改善する際には、すべての場所を改善する必要はない──結局のところ、結果が重要なのだ。

宇宙での機械学習

コンピュータビジョンのアルゴリズムは長い道のりを歩んできたが、その効率性が向上するにつれ、データセンターではなくエッジに配置されるようになってきた。実際、携帯電話やIoTデバイスのような、カメラを搭載した製品では、画像に対してその場でML作業を適用することが、かなり一般的になってきている。しかし、宇宙ではそれは別の話だ。

画像クレジット:cosine

宇宙空間で機械学習を実行することは、ごく最近までは、考えるまでもなく電力的に高価すぎることだった。その電力を使って、別の画像を撮影したり、地上にデータを送信したりすることなどができるからだ。HyperScout 2(ハイパースカウト2)は宇宙でのML作業の可能性を探っている。その衛星は、収集した画像に対して地上に送る前に、コンピュータビジョン技術を適用し始めている(cosineサイト)(「ここに雲がある、ここにポルトガルがある、ここに火山がある……」など)。

現在のところ実用的なメリットはあまりないが、オブジェクト検出は他の機能と簡単に組み合わせて新しいユースケースを生み出すことができる。例えば関心のあるオブジェクトが存在しない場合の省電力化から、メタデータを他のツールに渡した方がよりよく機能する場合などが考えられる。

新しきを捨てて、古きを得よ

機械学習モデルは教育された範囲の推測を行うのに優れている。整理されていないまたはろくに文書化されていない大量のデータがある分野に対して、大学院生がより生産的に時間を使えるように、AIに最初のスキャンを行わせることは非常に有用だろう。議会図書館がそれを古い新聞に対して行っているが、新たにカーネギーメロン大学(CMU)の図書館もその気になってきている(CMUリリース)。

CMUの100万点におよぶ写真アーカイブはデジタル化の過程にあるが、歴史家や好奇心旺盛な閲覧者に役立つようにするためには、写真を整理してタグ付けする必要がある。そのためコンピュータービジョンアルゴリズムが適用されて、類似画像のグルーピング、対象と場所の特定、その他の価値ある基本的な分類タスクが行われている。

「部分的に成功したプロジェクトであっても、コレクションのメタデータは大幅に改善されています。もしアーカイブが、コレクション全体をデジタル化するための資金を獲得することができれば、メタデータ生成のための可能なソリューションを適用することができます」と語るのはCMUのMatt Lincoln(マット・リンカーン)氏だ。

まったく異なるプロジェクトだが、どこかでつながっているように見えるのが、ブラジルのペルナンブーコ大学工学部の学生によるこの成果だ。彼は古い地図を機械学習できれいにする(IEEE Spectrum記事)素晴らしいアイデアを研究している。

彼らが使用したツールは、古い線画の地図を使って、それに基づく衛星写真のようなものをGAN(Generative Adversarial Network)を利用して生成するものだ。GANとは本質的に、AIが自分自身をだまして本物と見分けがつかないようなコンテンツを作成しようとする技法だ。

画像クレジット:Escola Politécnica da Universidade de Pernambuco

まあ、現在の結果は完全に満足できるものではないが、それでも期待はできる。このような地図は正確なものではないが、かといって完全に空想上のものというわけではない。それらを現代的なマッピング技術の文脈で再現することは、楽しいアイデアで、きっとそうした場所を、より身近なものとして感じさせてくれることだろう。

関連記事:米国議会図書館が機械学習で300年ぶんの新聞の画像を抽出し検索可能に

カテゴリー:人工知能・AI
タグ:機械学習

画像クレジット:Uppsala University

原文へ

(翻訳:sako)