PowersetはGoogleに迫るか?

次の記事

Audioblogger、DeadPool入り

アップデート:今朝(米国時間10/5)信頼のおける情報筋からメールを受け取った。「私はデモをみた(結構な時間を潰したんだが)。技術そのものは結構良く、ウェブ検索のクエリーにおける重要な一部分に貢献することは確かだろう。しかし、ひとつ言えるのは、ワークロードを減らす必要があるということ。索引づけの作業は従来のウェブ検索よりもはるかにコストがかかり、そのためスケーリングとパフォーマンスの面で作業が発生するということは避けられない。もちろんNDA(Non Disclosure Agreement)の神を怒らせるわけにはいかないので、あまり発言できないが……(それと、VentureBeatに記載されている資金額には誤りがある)」


私自身はまだPowersetのデモを見ていないのだが、近く公開されるこの新しい検索エンジンをテストした人々の多くは感銘を受けて「もう2度とGoogleは使いたくない」と言っているとか。

Powerset は検索の際に現在のエンジンが無視する検索語(これをファウンダーのBarney Pell は“ストップワード”と呼んでいる)を含め、ユーザーが自然言語を用いることができるようにすることを目標にしている。多くの人々と同様、私も検索エンジンを使うときには言葉の使い方を変えることを学んでしまった。重要なキーワードだけ残してあとは捨ててしまう(訳注:例えばストップワードと呼ばれている”for”、”about”、”of”や “in”などを抜いて)。こういう検索用の言葉づかいは私の日常の言葉にまで多少なり影響を与えている。急いでIMやメールやりとりするときの文章はクレージーで無意味な言葉のられつに見えるかもしれない。10年前だったら、私自身こういうやりとりの意味をつかむことができなかっただろう。現在では、すでによく知っている人々相手の場合、速いペースのビジネス・コミュニケーションの方法としてこういう言葉づかいはたいへん有効である。

そういうわけで今日の検索技術が完全から遠いものであることは分かっているが、だからといって自然言語に近づけるという方法がコンピュータに検索の目的をより良く理解させることになるとは必ずしも思っていない。率直なところ、われわれが引き続きコンピュータの理解する言葉をしゃべればいいのであって、進歩が必要なのはむしろ別の分野(ディープタグ、より優れたアルゴリズム、マルチメディア検索など)だろうと思っている。

しかし 自然言語を使用した検索が、意味と意図を伝えるうえで必要であることについて、Pell は説得力のある議論を示している。彼はこの点を説明するのに次のような例を挙げている。 “book for children”,“book by children”それに“book about children” はすべて今日の検索エンジンにとっては“book children” と同じ意味になってしまう。 Pellの議論の核心は、「books by children = 子供たちによって書かれた本」という検索をさせるには自然言語を用いる以外方法がない、というものだ。

Powerset はこの新しい検索エンジンをスタートさせるために大金を必要としている。ベンチャーキャピタリストはいつも噂の火元としてかっこうの存在だが(投資を見送ったときか、別のファンドに投資の機会を取られてしまったときが彼らから情報を引き出すのによいタイミングだ)。金銭的利害関係がないと、自然に口が緩むものである。、噂では、Powerset は投資直前の会社の価値を$20M (2000万ドル)と見積もった上で、$10M (1000万ドル)の調達をもくろんでいるという。これは大金だが、もしPowersetが第2のGoogle になるのだったらそんなことは誰も気にしないだろう。

[原文へ]