Phroniは文章中から気になるキーワードを抽出するテクノロジー

次の記事

Pinterestがサイト誘導率でTwitterを上回った(調査結果)

Studio Ousiaの代表取締役CTOの山田育矢氏によればiPhoneのようなモバイルデバイスで文章を読んでいる際に気になった言葉を調べようと思うと7ステップもかかるんだという(下のビデオを参照)。この説明を聞いていて少し過大に言っているのだとは思ったが、確かにモバイルデバイスだと文章中のキーワードを検索するのが面倒なことは確かだ。Studio Ousiaが今日から提供するPhroniはこれを解決してくれるものだという。簡単に説明すると、文章中からキーワードを拾い出して、それにWikipediaのリンクを貼るということを自動的にしてくれるというものだ。

Phroniの技術のなかで何が特徴的なのかというと、人が調べたくなるようなキーワードを文章中から見つけ出すというところだ。このキーワードのもととなるのはWikipediaの見出し語なのだが、日本語版およそ120万語、英語版800万語の中から人が調べたくなるようなキーワードを2万3,000件ほど選び出している。

素人考えでは、Wikipediaの見出し語全部にリンクさせればいいと考えるかもしれないが、それだと文章のほとんどの言葉にリンクされてしまって、意味をなさなくなってしまう。それにたとえば「鉄の女の涙」なんて言葉がでたときにこの言葉だけだとキーワードかどうか判定しずらいが、そういったことも見つけ出してくれる。逆に2万3,000件程度であれば人間が選べばいいということもあるかもしれないが、Wikipediaは刻々と言葉が増えているので、それに対応していかなければならない。だからPhroniでは人工知能を使って日々学習しながらキーワードとなるものを選び出している。日々学習しているので、抽出する精度は上がっているのだそうだ。

Phroniは現在はAndroid版のFirefoxのアドオンとして提供されるので、現在使えるプロダクトとしては非常にニッチなものだが、今後はPhroniの技術をいろいろなドキュメントを読むツールに組み込んでもらいたいという。たとえば、電子書籍アプリに組み込んで、書籍中に現れるキーワードを自動抽出してWikipediaにリンクさせるということが可能になる。PCであればブラウザーであれなんであれ、マウス操作で簡単にキーワードのコピー&ペーストができるので、便利さを感じないだろうが、モバイルデバイスであれば価値はありそうだ。

僕はこういったコンピュータサイエンスから生み出されるものの素晴らしさもある一方で、ソーシャルな方法で(たとえばどんなキーワードを頻繁にクリックしているかというユーザーには意識させない方法も含めて)みんなでキーワードを選出するというアプローチもなくはないと思う。たぶん、そういった組み合わせが今後は生きてくるのだろうね。

一般には本日公開されたこのテクノロジーはDEMO Asiaなどの海外のいくつかのイベントですでに発表されている。Studio Ousiaは先週、ニッセイキャピタルから7,000万円を調達している。それ以前はSeed Technology Capital Partnersから3850万円を調達していて、設立時の資金を合わせると資本金は1億1,450万円となっている。

山田育矢氏は慶應大学SFC出身で、大学1年生で設立したnewrongをフラクタリスト(現ngi group)に売却しているシリアルアントレプレナーだ。フラクタリストはnewrongの持っていた技術などが評価されて2007年にセントレックスに上場している。