自然言語検索のPowerset、ミス・サウスカロライナの迷言を構文解析

次の記事

Pownceに新機能追加―依然APIは公開されず

これは、ミス・サウスカロライナ・ティーン代表Caitlin Uptonさん(18)がミス・ティーン・アメリカの晴れ舞台で簡単な質問に意味不明な答えを出した一幕を録画したもの。

Q: 最近の世論調査ではアメリカ人の5人に1人は世界地図でアメリカの位置が分からないといいます。何故と思われます?

A: 私思うんですけど、合衆国のアメリカ人にそれができないのはですね、えーと、私たちの国には、その辺にも地図を持ってない人がいるからではないでしょうか、えーと…本当に思うんですけど、やはり教育が…例えば、えー、南アフリカとか…イラクのような、そういう地域の教育がですね…なもんですから、やはり、えー、 この私たちの国における教育でアメリカをなんとか支援…、えー、南アフリカを支援していかなくてはならないかと。イラクやアジアの国々も支援して、そうして子どもたちの未来を築いていけるようにしなくてはならないと思います。

サービス公開前の自然言語検索エンジンPowersetにとってはPRの絶好のチャンスである。同社は早速彼女の回答を構文解析(parse)し、 検索クエリーで呼び出せるようにした。「教育は誰を支援するのか?(Who does education help?)」という検索クエリーを入れてみたら、「Americans」という検索インデックスが返ってきた。求めている情報の性格を考えると、実にすばらしい検索結果だ。

このテストはPowersetの検索エンジンとしての潜在力を示すものだ。キーワードがベースの検索では、このクエリーでこのコンテンツにはマッチしない。情報コンテキストの分析だけで答えは決まる。

上記例のようにインデックス数に限りがある場合、Powersetのデモはものすごく良く機能しているように見えるが、グーグルはじめ他の検索エンジン各社と伍していける実力を証明するには巨大なウェブの情報をインデックスして分析できることも示さなくてはならない。それが同社にとって最大 のチャレンジでありコストのかかる部分になっていくだろう。サービス開始に向け、Powersetにはまだ証明すべきことが沢山残されている。

[原文へ]