GoogleのAutoMLで誰もが機械学習を利用できる――プログラミング不要、ビジネス利用へも

次の記事

旅の魅力を引き立てる“物語”をポケットに、音声ガイドアプリ「Pokke」提供元が数千万円を調達

今日(米国時間1/17)、Googleはいくつかの重要な発表をしたが、 AutoML Visionα版公開もその一つだ。このサービスはML(機械学習)についてまったく経験のない層も含めたデベロッパーに対して、カスタマイズされた画像認識モデルの構築を可能にする。Googleではカスタム機械学習モデルをAutoMLと名付け、画像認識以外の分野に応用を拡大していく計画だ。

現在AutoMLがサポートするのはコンピューター・ビジョン関連だけだが、近い将来Googleは機械学習が用いられる各種の分野(音声認識、翻訳などの自然言語処理、ビデオ処理等)でAutoMLのビルディング・ブロックが使えるようにしていくはずだ。

Googleによれば、AutoMLの基本的なコンセプトは、高度なプログラミングの能力を必要とせず、誰でも画像をアップロードするとGoogleのシステムが自動的に機械学習モデルを作成してくれるというものだ。

Googlによれば、すでにディズニーがこのシステムを利用してオンラインストアにおける検索機能の強化に成功している。ストアの訪問者がたとえば『カーズ』に登場するキャラクター、ライトニング・マックイーンを検索した場合、実際にその名前でタグづけされている商品だけでなく、ストア内のおしゃべりなレーシングカーの画像を横断的にピックアップできる。

このプロセスはデータのアップロードからタグづけ、MLモデルのトレーニングまですべてドラッグアンドドロップのインターフェイスで実行できる。MicrosoftもAzure ML Studioを提供しているが、Googleのサービスはこれとは全く性格が異なる。Azure MLはいまは亡きYahoo Pipesに似たインターフェイスを利用してユーザー自身がモデルを構築、訓練、評価するものだが、Googleの場合はシステム側が面倒な作業をすべて実行する。

最近の機械学習ブームで一般企業が機械学習やデータサイエンスのエキスパートを採用することはほとんど不可能になっている。需要の大きさに人材供給がまったく追いついていないのが実情だ。

GoogleのAI/ML担当チーフ・サイエンティスト、 Fei-Fei Liは今週開かれたプレスイベントで「人工知能、機械学習は依然として参入障壁が高い分野です。企業は専門的能力と大量のリソースを社内に用意する必要があり、これを実現できる企業はほんの一握りです。人工知能を活用できるデータサイエンティストが100万人いたらどんなに役立つでしょう。AIが素晴らしく役立つのに対して、カスタマイズされたモデルを作れる能力を持つ人々の数はあまりに少なく、必要とするリソースは大きいのです」と述べた。

  1. cloud-automl-screenshot-1.png

  2. cloud-automl-screenshot-2.png

  3. cloud-automl-screenshot-3.png

  4. cloud-automl-screenshot-4.png

  5. cloud-automl-screenshot-6.png

  6. cloud-automl-screenshot-7.png

  7. cloud-automl-screenshot-8.png

  8. cloud-automl-screenshot-10.png

  9. cloud-automl-screenshot-11.png

  10. cloud-automl-screenshot-12.png

  11. cloud-automl-screenshot-13.png

  12. cloud-automl-screenshot-14.png

  13. cloud-automl-screenshot-15.png

  14. cloud-automl-screenshot-16.png

GoogleによればAutoMLは市場に公開されたこの種のサービスとして唯一のものだという。正確にいえば Clarif.aiなどのシステムが同様のアプローチを用いているし、MicrosoftのCognitive Servicesもあらかじめ用意されたコンピューター・ビジョン・モデル音声認識意思決定プロセスなどをユーザーがカスタマイズすることができる(ただし現在これらのサービスはプレビュー段階)。

AutoML Visionsの利用にあたっては、デベロッパーはGoogleに申し込みをして招待を待つ必要がある。料金については明らかにされていないが、おそらくモデルのカスタマイズとトレーニングに関する料金とそのモデルにAPIを通じてアクセスする場合の料金に分かれるのだろう。

画像: Getty Images

〔日本版〕コンピューター・ビジョンに関するFei-Fei Li(李飛飛)のTED講演(2015年、日本語字幕つき)

[原文へ]

(翻訳:滑川海彦@Facebook Google+