Norman Winarsky
Bill Mark

人間とコンピュータの関係性について、もしくはSiriあるいは個人用仮想アシスタント(VPA)の未来

次の記事

Facebookページの強制タイムライン化が迫る―調査によれば95%のページで好影響

features_siri_gallery_messages編集部注本稿はNorman WinarskyおよびBill Markの寄稿によるものだ。Norman WinarskyはSRI VenturesのVice Presidentであり、Bill MarkSRI InternationalのInformation Computing Sciences部門のVice Presidentだ。両人はSiri社(後にAppleによって買収)の設立にも関与しており、Normanの方は取締役も務めた。

iPhone 4Sが登場して、Siriに大いに注目が集まることとなった。これはもちろん当然のことだと言ってよかろう。音声認識および人工知能技術の両面でブレイクスルーを果たした消費者向けソフトウェアであると思う。

Siriはディルバートや、超有名コメディアン兼風刺ニュースの司会をするジョン・スチュワートの番組等、さまざまなメディアシーンで取り上げられた。11月にはGoogle会長のエリック・シュミットが上院司法委員会の場で、SiriはGoogleにとって脅威となり得る存在であるということも述べている。また、CBSのドラマ「Big Bang Theory」の中の話でもSiriが重要な役割を果たしている。さらにTumblrやTwitterにもSiriのパロディアカウントが多数登場して話題になった。

SiriがAppleおよびスティーブ・ジョブズによる偉大な成果であることは間違いない。個人用仮想アシスタント(VPA:virtual personal assistant)を世の中の大勢に知らしめることとなったわけだ。これによって私たちとスマートフォンとの関わり方が永久的な変化を被ったことになる。またSiriは単なるツールではなく、パーソナリティーを持ち、人間的な反応をするようにデザインされているのも好感が持てる。

ぼくのこと、好きかい、Siri? 身体はどこにうめれば良いんだろう?

AppleはSiriを進化させていくだろう。それは誰もが全く疑いなく信じているところだ。技術的に進化させるのはもちろんのことだが、VPA分野に新たなブレイクスルーを持ち込みもすることだろう。たとえば、近いうちにSiriのAPIを開発者向けにリリースするということは大いにあり得ることだろう。そうなれば多種多様なアプリケーションからSiriにアクセスできるようになる。近々、アプリケーションというものはボイスインタフェースが必須となり、音声に対して適切に応答することが求められるようになるだろう。音声認識機能がなかったり、妙な応答を戻すようなときに、驚き失望してしまうような時代が近づきつつあるかもしれない。

ところで賞賛のコメントや今後についての推測が流れる中、Siri開発の中核を担った私たちSRIに対する質問の声もある。曰く「今後はいったいどうなるのか」といったものだ。

毎度同じ返答をするのだが、SiriはVPAの世界で最初の一歩を記したに過ぎない。様々な可能性があるわけだが、ともかくSiriが成し遂げたことをまずは認識しておきたい。そこから次世代のVPAが進化していく道が見えてくるかもしれない。

まず、Siriは数多くの産業分野に全く新しい影響をもたらすことだろう。私たちSRIとしても、VPA技術はさまざまな分野での基本要素となっていくだろうと考えている。たとえばスマートTV、ヘルスケア、教育分野でのバーチャル教師などの分野でVPAは必須となるに違いない。VPAは単なる流行やトレンドといった範疇におさまるものではないだろう。いろいろな意味で、コンピュータが今後進化すべき「運命」ともいうべきものであるし、数十年ないしはそれ以上をかけて進化していくものでもある。SRIはVPA部門の仕事を行い、また私たちのR&D部門を担うものとして3つのスタートアップのスピンアウトを行う。いずれも既にVCからの投資が決まっており、需要の見込まれるプロダクトも準備している。私たち自身のこのような動きも、おそらくは氷山の一角なのであろう。

技術的な話をするならば、Siriは私たちの言うところの「自然言語理解」の分野について、ハードルの高さを決めるという働きも行った。昔はキーボードの代わりに音声でコンピュータに指示を与えるなどは夢物語だった。発案から30年ほどを経て、消費者の使用に耐えるようなパフォーマンスを示す音声認識システムが登場してきたというわけだ。

この分野での第一段階は、限られたボキャブラリのみで実現する音声認識システムだった。この分野で最初の実用アプリケーションはコールセンター向けのもので、こちらは多くの人にとって馴染みのあるものだろう。しかし、ボキャブラリを増やした中で、利用者に適切な回答をする音声認識プログラムを書くのはかなり大変なことだった。さらに、Siriが実現したのは音声認識の分野のみでなく、また自然言語を解釈して推論を行うことだ(人工知能研究が昨今、まさに研究対象としている分野でもある)。

Siri以降の音声認識人工知能の研究はSRIはもちろん他の機関でも進められることとなるだろう。たとえば米国国防総省においても、複雑なユースケースに及ぶシステムをどのように扱っていくかが懸案となっており、この分野に力を注いでいくことになるだろう。

こうした進化の方向性を考慮にいれて(SRIの行なっていることについて、こと細かに述べることはできない)、VPA技術はいかなる方向に進んでいくのだろうか。どのような未来が私たちを待ち受けているのだろうか。

ひとつ言えることは、次世代VPAはアシスタントと利用者の間により深い関係性をもたらすようになるだろうということだ。Siriは現在でも利用者と会話しながら処理を進めていくことができる。しかし連続した会話が行われるのはほんの短いやりとりの間に過ぎない。未来のVPAにおいて、会話はより複雑で段階を踏み、ニュアンスを解するようなものとなっていくだろう(ヘルスケアの場面で代替案を示してくれたり、休暇の予定をたててくれたり、あるいは最適な洋服を探して購入してくれたりするようになる)。

また、利用者とアシスタントとの間における会話コンテクストをより長く維持できるようにもなるだろう。話の目的をきちんと理解して、疑問に適切な回答をしてくれるようになり、必要な作業を行なってくれるようになる。利用者から次々に学んでいくことによって、使えば使うほど一層役立つように進化していく。今日Siriとの間に存する関係が、より密接なものとなっていくわけだ。VPAはさらに進化を続け、利用者が興味をもっていることについて、自律的に情報を集めるようになっていく。利用者から話しかけもしないのに、まさに利用者が興味を持ちそうなことについて話しかけてきたりするようにもなるだろう。

たとえばLisaという女性がいるとしよう。そのLisaと、Ninaという名前の個人用仮想アシスタントの会話を見てみよう。Lisaがハンドバッグを買おうとしているシーンでの会話だ。

Lisa:Nina、ハンドバッグが買いたいんだけど。
Nina:良いですね。以前はMichael Korsのものを購入しましたが、今回はどうしますか?
Lisa:Michael Korsなら良いものがあるとは思うけれど、今回は400ドル以上は使いたくないんだけど。
Nina:前回はNordstromでMichael Korsのハンドバッグをを買いましたね。Nordstromでは今もちょうどMichael Korsのセールスをやっているようです。いくつか気に入りそうなハンドバッグをお見せしましょう。
Lisa:329ドルのチョコレートブラウンのが良いわね。他にもっと安い店なんかはないのかしら。
Nina:310ドルで売っている店もいくつかあります。ただNordstromの返品ポリシーが一番しっかりしているようではあります。
Lisa:わかったわ。じゃあNordstromに行きましょう。

対話は自然で、かつ必要な情報をやりとりしていて、とても役に立っている。LisaはNinaからまさに必要な情報を入手することができているわけだ。利用者の購入履歴情報なども把握しており、またよく使う店などの情報もしっかりと理解している。

Lisaはショッピングに関してはすべてNinaに任せてしまうことも可能だろう。必要なものを、ベストな価格で手に入れることができるようになる。Ninaは今回の会話からもまたいろいろと学び、Lisaとの関係をより密なものとしていくことができる。そしてそれが将来の買い物についても役立つようになるわけだ。

少し強調しておいても良いかもしれない。VPAが学ぶことができれば、ますます便利なものとして成長していくのだ。重要性については誰もが認識しているものの、なかなか現実化されることはない。「自然に学んでいく」というのもまた以前は「夢」と考えられていたことで、実現に向けて端緒についたばかりの仕組みなのだ。利用者に適応していくVPAは究極のアプリケーションとして利用者の役に立つようになるだろう。

LisaはNinaが実力を示せば示すほどに、VPAに対する信頼感を高めることになるだろう。ただしこの信頼関係は利便性のみでなく、情報保護の観点からも重要な問題となり得ることには注意しておきたい。とくにセキュリティやプライバシーの面では注意が必要だ。ただ、能力の面で言えば、使い始めてすぐに一層使いやすくなっていくに違いない。

素晴らしい未来が待っているように思えるが、果たしてどうだろうか。

VPAと一層深く付き合って、利用者の微妙なニュアンスまで理解してくれるようになるというのはもはやサイエンス・フィクションの世界における話ではない。SRIでも実現に向けていろいろと開発を行なっているところだ。SRIおよび研究パートナーたちは膨大な時間を投入して、こうした未来的世界の現実化に向けて努力を続けているところだ。

またVPAは人間の能力を拡大するものという言い方もできるかもしれない。より快適で、労少なくしてさまざまな行動ができるようになるかもしれない。SRIではこの「拡張性」という概念についてはダグラス・エンゲルバートの時代から研究を続けている。ちなみにエンゲルバートとはマウスの発明者であり、人間とコンピュータの間の関係のあり方について研究をした人物だ。1962年に執筆した論文から引いておこう。

「人間の知性を『拡張』することで、すなわち人間の能力を向上させることで、より複雑な問題に対処することができるようになる。現実の問題をしっかりと把握して、そこにある問題に対して適切な対応ができるようになるのだ」。

VPAは今後ますます進化して一層便利になっていくことだろう。人類と機械が関係を持つについては、VPAを介するつながりが最もエレガントでかつ効率的なものであると思う。人間が長く考えていた「機械との付き合い方」を新しいものに置き換えるであろうし、エンゲルバートが50年ほども前に行った「すべてのデモの母」(Mother of all demos)のビジョンに繋がるものとなるだろう。

原文へ

(翻訳:Maeda, H)