人工知能開発のオルツはシードで6.1億円を集めて何を開発しているのか?

次の記事

Boston Dynamics、かわいい四脚ロボットがバナナの皮で転倒するビデオを公開

2015年1月にTechCrunch Japanで「人格コピーアバター」というSFぽいプロダクトに取り組むスタートアップのオルツを紹介したが、6月23日に同社が発表したところによれば4月上旬と6月の2度にわけたシードラウンドの資金調達で、それぞれ5億1700万円、9300万円の総額6.1億円を調達している。第三者増資の割当に応じたのはジャフコSMBCベンチャーキャピタル三菱UFJキャピタル。ほかにも2015年5月にプレシードとも言える時期にEast Venturesからも投資を受けている。

最初に報じた時、「人格コピー」という長期ビジョンをお伝えしたので、伝えているぼくですら実現性について保留したくなるようなプロダクトだったし、いまだにオルツ創業者の米倉千貴CEOが当初話していたプロダクトは出てくる気配もない。

ではなぜ、これほどの資金をジャフコや銀行系のファンドといった「かたい」ところから調達できているのか。

photo01

オルツ創業者でCEOの米倉千貴氏

実は2016年5月にオルツはお台場で関係者を集めた発表会をしていて、このとき具体的なプロダクトについていくつかお披露目をしている。米倉CEOの語るビジョンの実現に向けて(あるいはビジョンとは別に)、オルツは地に足のついた会話向け人工知能の要素技術を開発しているようなのでお伝えしよう。

具体的には会話のためのAIエンジン、より基礎的な語彙知識データベース、それらを実アプリに落としこむためのフレームワークなどだ。

例えば自動チャットアプリの開発プラットフォームを作るために、オルツでは対話フローとロジックを分離するアプローチを考えているという。すでに対話エンジンの世界ではMS Bot Framework、Slack BotKit、Gupshup、wit.ai(Facebook)、HUBOT、Repl-AI(NTT)などいろいろあるが、オルツによれば、これらはコードを書くプロ向けか、GUIによる初心者向けしかない。GUIのダイアグラムによる定義だけでは条件分岐を使った複雑なロジックは書けない。オルツでは「この中間を狙っている。自然言語での対話ボットを作るプラットフォーム」と説明している。

platform01

ちょうどWebページ(アプリ)がHTMLで構造を記述して、CSSでデザイン、JavaScriptでアクションを別々に定義するのと似ていると言えるかもしれない。オルツではWebアプリにおけるフロントとバックエンド(サーバー)の役割分担のようだと説明している。実際、GUIで定義した対話フローからコード実行部分はコールバックによる実装となっているようだ。

platform02

platform03

もう1つ、オルツが開発するものにはサービス業の窓口業務で使えそうものがある。「意図解釈付き会話API」(RMR:Rewitable Memory Based Retrieval)と同社が呼んでいるものだ。会話というのは流れの中で出てきた発言を記憶して返す答を変えるものだ。例えば、FAQやクイズ番組の問いに応えるようなものなら、知識データベースから答えを探してきて、同じ質問には同じ答えを返せば良い。しかし、指示代名詞を理解したり、あるいは相手の発言から関係性を推定していって言葉遣いを変えるようなことは、記憶を積み上げていかないとできない。それがRMRと呼んでいるもので目指している対話エンジンのようだ。下の1つ目の画面はRMRの記憶の側面を示すものではないが、映画チケット販売ボットの実際の返答のデモ。2つ目の画面では右側のボットの返答が会話の流れに沿っているのが分かる。画面はGoogle SheetsだがAPI経由で動かすリアルタイムのデモだった(チャットのデモの多くは事前に設定した会話でいくらでも良く見せられるので、今のところ実力のほどは不明と思うが)。

rmr02

rmr03

こうした要素技術を組み合せて「おなかすいた→ (yes/no) →(分岐してyesなら)→「何を食べる?」→ピザ、すし、そば、その他→電話、もしくは人間のオペレーター呼び出し」といった流れのボットを作れるという。作ったボットはオルツの提供する開発者向けダッシュボード上のスイッチ切り替えでSlack、Skype、LINEなどの出し先に対して提供できるようになるようだ。同義語辞書が利用可能なほか、挨拶、Wikipediaの調べ物、地図検索、乗り換え、天気、電話予約、グルメ検索など利用頻度の高いものは対話フローの中で利用できる「ブロック」として提供されるほか、ECサービス向け、ニュースサイト向け、グルメ向け、人事採用向けなど用途ごとの対話フローのテンプレも用意するという。

platform04

platform06

ほかにもオルツは以下のような要素技術を開発している。

・多階層トピック抽出

例えば「アリアハン周辺でスライムに会った」という発言からは、単にアリアハンが地名というだけでなく、これが「ドラゴンクエストIII」の話であることが分かる。トピックを階層構造としてデータベースに持つのだという。

・拡張固有表現抽出

固有表現というのは人名や地名、組織名など。人間は文脈も見て判断しているが、これを機械的にテキストから抽出するのは難しい。固有表現のジャンルとして数個程度が一般的なところ、オルツでは歌手名、政治家名、学者名、河川名、都市名、都道府県など200に対応したものを作っているという。

・関係性定量化

会話の流れから対話者の親密度や好感度、信頼度といった関係性を推定して数値化する。関係性によって言葉遣いを変えることができる。

・集合的知識検索

10億アイテムをこえる階層データベースを構築していて、これを網羅的に検索できる。API経由で利用するサードパーティーの開発者がここに知識を追加することもできる。オルツがゴミの除去などメンテをしていく。