Powerset、新UIをローンチ―文脈解析検索を試してみよう

次の記事

アップルストアからiPhoneが消えた― いよいよ3G?

サンフランシスコの文脈解析検索エンジンPowersetにとって今日(米国5/11)は記念すべき日となった。Powersetはユーザー向けデモをローンチした。ウェブ全体へのクロールはまだない。Powersetの検索は現在のところWikipediaFreebaseのデータだけを対象としている。今回のサービスのローンチはPowersetがAllen & Coを通じて買い手を探していると報じられた翌日に行われた。

私はPowersetの実験サイトを通じて、数週間前からテストに参加している。私は先月もこれについて書いたが、今回ローンチしたサービスはこれにたいへんよく似ている

10年前にGoogleが登場したときと同じくらい画期的なサービスになるかどうか、現在のPowersetから占うのは時期尚早だ。現在PowersetはWikipediaだけを検索しているので、関連性がより高い結果を上位に表示するランキング・アルゴリズムをほとんど必要としないからだ。

しかしユーザーはPowersetが情報を素早く収集する方法としてたいへん優れていることは見てとれるだろう。情報を調べているユーザーにとって、Powersetは最終結果を得るためのステップのいくつかを飛ばすことができる効果的な手段となっている。特に必要な情報が多数のウェブページに分散しているような場合に効果的だ。

たとえば、Powersetで「when did earthquakes hit tokyo(東京を地震が襲ったのは何時か)」という検索から驚くべき結果が得られる。Googleで、あるいはwikipediaで同じ検索を行って結果を比べてみるとよい。単にそのキーワードが存在するウェブページを選択するだけでなく、Powersetはそのページのどの部分に必要な情報が存在するか、ある程度解読してくれる。

Powersetの場合、上に見られるように検索に対する答えが結果表示の見出し文そのものの中に含まれていることが多い。またPowersetはWikipediaのデータの多くを構造化して(Freebaseのデータはすでに構造化されているが)、結果に含めている。そこでBillClintonについての結果を見ると、Wikipediaに加えてFreebaseの構造化されたデータからさらに多くの情報が得られるよう適切に加工して表示していることがわかる。しかし下の例で重要なのは、データが構造化されて表示されていることよりも、ユーザーが必要に応じて検索をさらに特定の範囲に絞り込む(たとえばクリントン大統領が署名した法案、指名した最高裁判事、寝た相手、等々)ことができ、表示されたキーワードを直接クリックすることでその情報を得ることができる点だ。

Powersetは通常の検索エンジンが索引づけするのとかなり違った方法でウェブページを索引づけしている。つまり通常の検索エンジンは検索キーワードにマッチするレコードを含むコンテンツをリストアップするだけなのに対して、Powersetはマッチしたページの内容を解析してさらにその後意味のある絞り込み検索が可能なように準備している。そのため、当初の検索では使われなかったキーワードによるマッチングさえ可能になっている。

しかしウェブ全体を索引づけするのは膨大な資金を必要とする事業だが、Powersetの方式はウェブページあたりさらに大量にコンピューティング資源を必要とする。それが現在すべてのウェブページの索引づけを行っていない理由だ。同社は$12.5M(1250万ドル) (プラス、投資家から$8M(800万ドル)かそこらのつなぎ融資を受けている)の資金を調達しているだけだ。ウェブ全体を索引づけするには、新たな資金調達が必要だ。(上の段落で売却と資金調達の双方の戦略に触れていることに注意)。

Powersetが検索のやり方を根本的に変えようとしていることに関してはさまざまな批判(われわれの批判も含めて)が寄せられてきた。しかしこの遠大な野心こそ、結果の成功、失敗を問わず、シリコンバレーを今日のように偉大にしたものだ。 Powersetが革命的ななにごとかを企てていることは間違いない。

Powersetは概要紹介のデモビデオを用意しているので下にエンベッドしておいた。

[原文へ]

(翻訳:Namekawa, U)