[jp]スマートフォンは五感を拡張する? Androidを介して日英会話も数独もできるデモ
by Ryuichi Nishida on 2011年7月19日

Googleがアジア・パシフィック向けのモバイル戦略記者発表会「Google mobile revolution」を東京の六本木ヒルズで今日開催している。アジア各国から記者が集まる中、Eric Schmidtが来日してキーノートスピーチを行っている以外に特に目新しい発表はないのだが、いくつか面白いデモを披露してくれたので、その紹介をしておこう。もちろん、すべてが新しいものではないのだけれど、中にはつい最近になって実現したものもあるので、TechCrunch Japanの読者も面白くみてくれるに違いない。

音声技術の分野でGoogleでシニアスタッフエンジニアとして働くJohan Schalkwykは現在のモバイルデバイスは人間の持つ五感を拡張するものだという。マイクやカメラなどがスマートフォンには備わっていて、こういったセンサーを使うことでインターネット上の情報だけでなく物理的な世界にもアクセスできるようになる。たとえば、Googleの持つ技術では、音声認識技術Google翻訳、また画像検索のGoogle Gogglesなどがあるが、こういったものを組み合わせることでこれまでと違った体験をもたらしてくれる。単なるケータイ電話ではなくて、ウェブから得られるデータを組み合わせることで、クラウド上にある演算能力を使ってポケットの中にスーパーコンピュータを持ち歩いているといっても過言ではないだろうと彼はいう。

その一例がGoogle翻訳だろう。シニアソフトウェアエンジニアのJosh Estelleのデモでは、音声認識によって英語で「東京都庁に行きたいのですが」というのを日本語に翻訳する例を出している。文字だけでなく音声で返してくれるので、旅行でたとえばタクシーの運転手などに行き先を伝えるのに使えるのかもしれない。続いて簡単な会話をAndroidを介して英語と日本語でやりとりしている。すでにこの技術は英語とスペイン語では実現できていたが、最近になって(震災後の影響もあるのか)日本語と英語でも対応するようになったようだ。

画像をサーチクエリーとして使うGoogle Gogglesと翻訳を組み合わせたのが、ロシア語メニューから英語に翻訳するというデモだ。残念ながら映像がよく取れなかったためわかりづらいかもしれないが、英語に変換ができている。これも旅行などで使える機能だ。

Google Gogglesで興味深かったのは日本で働くプロダクトマネージャーのBrand Elisによる数独(ナンバープレース)のデモだろう。Google Gogglesで数独を撮影するとそれが数独の問題と瞬時に理解して、その回答がすぐに得られるという。もちろん、問題を解く楽しみは減るけれど、裏にあるクラウドの演算パワーを考えるとモバイルの画像検索の新しい可能性を見せてくれてるのかもしれないね。

  • Taku Yanohira

    音声認識も翻訳も網ちょっと精度が上がらないことにはね・・・