PowersetはGoogleに迫るか?

次の記事

Audioblogger、DeadPool入り

アップデート:今朝(米国時間10/5)信頼のおける情報筋からメールを受け取った。「私はデモをみた(結構な時間を潰したんだが)。技術そのものは結構良く、ウェブ検索のクエリーにおける重要な一部分に貢献することは確かだろう。しかし、ひとつ言えるのは、ワークロードを減らす必要があるということ。索引づけの作業は従来のウェブ検索よりもはるかにコストがかかり、そのためスケーリングとパフォーマンスの面で作業が発生するということは避けられない。もちろんNDA(Non Disclosure Agreement)の神を怒らせるわけにはいかないので、あまり発言できないが……(それと、VentureBeatに記載されている資金額には誤りがある)」


私自身はまだPowersetのデモを見ていないのだが、近く公開されるこの新しい検索エンジンをテストした人々の多くは感銘を受けて「もう2度とGoogleは使いたくない」と言っているとか。

Powerset は検索の際に現在のエンジンが無視する検索語(これをファウンダーのBarney Pell は“ストップワード”と呼んでいる)を含め、ユーザーが自然言語を用いることができるようにすることを目標にしている。多くの人々と同様、私も検索エンジンを使うときには言葉の使い方を変えることを学んでしまった。重要なキーワードだけ残してあとは捨ててしまう(訳注:例えばストップワードと呼ばれている”for”、”about”、”of”や “in”などを抜いて)。こういう検索用の言葉づかいは私の日常の言葉にまで多少なり影響を与えている。急いでIMやメールやりとりするときの文章はクレージーで無意味な言葉のられつに見えるかもしれない。10年前だったら、私自身こういうやりとりの意味をつかむことができなかっただろう。現在では、すでによく知っている人々相手の場合、速いペースのビジネス・コミュニケーションの方法としてこういう言葉づかいはたいへん有効である。

そういうわけで今日の検索技術が完全から遠いものであることは分かっているが、だからといって自然言語に近づけるという方法がコンピュータに検索の目的をより良く理解させることになるとは必ずしも思っていない。率直なところ、われわれが引き続きコンピュータの理解する言葉をしゃべればいいのであって、進歩が必要なのはむしろ別の分野(ディープタグ、より優れたアルゴリズム、マルチメディア検索など)だろうと思っている。

しかし 自然言語を使用した検索が、意味と意図を伝えるうえで必要であることについて、Pell は説得力のある議論を示している。彼はこの点を説明するのに次のような例を挙げている。 “book for children”,“book by children”それに“book about children” はすべて今日の検索エンジンにとっては“book children” と同じ意味になってしまう。 Pellの議論の核心は、「books by children = 子供たちによって書かれた本」という検索をさせるには自然言語を用いる以外方法がない、というものだ。

Powerset はこの新しい検索エンジンをスタートさせるために大金を必要としている。ベンチャーキャピタリストはいつも噂の火元としてかっこうの存在だが(投資を見送ったときか、別のファンドに投資の機会を取られてしまったときが彼らから情報を引き出すのによいタイミングだ)。金銭的利害関係がないと、自然に口が緩むものである。、噂では、Powerset は投資直前の会社の価値を$20M (2000万ドル)と見積もった上で、$10M (1000万ドル)の調達をもくろんでいるという。これは大金だが、もしPowersetが第2のGoogle になるのだったらそんなことは誰も気にしないだろう。

[原文へ]

“PowersetはGoogleに迫るか?” への5件のフィードバック

  1. […] シリコンバレーの検索エンジンのスタートアップ、Powersetは今までその内容について固く口を閉ざしてきた。この態度もインターネット史上もっとも急速に成長した企業、Googleの地位を狙うという野心を抱く会社としてはうなずける。しかし、PARCの開発した重要なテクノロジーのライセンスを受ける契約を結ぶことに成功したことについては、彼らもさすがに隠しておけないほど興奮したものとみえる。Powersetは、今日(米国時間1/9)、VentureBeatの独占スクープという形で、この契約の内容を明らかにした。Powersetは、Googleを倒す方法は「自然言語による検索」だと主張する。われわれはPowersetについての以前の記事でこの点について詳しく論じた。従来の検索エンジンはありふれた単語(by、for、about、of、inなど)を無視する傾向があった。Powersetはこのような単語を含めて文脈の中で意味を分析することに努力を集中している。自然言語検索で解決すべき問題についてはPowersetのCEO、Barney Pellの投稿に説明されている。簡単に言えばこうだ。Googleの検索では「book for children」、「book by children」、「book about children」はすべて「book children」と同じに取り扱われる。これに対してPowersetはそれぞれの(自然言語としての)意味に対応した検索結果を提供することを目標としている。Powersetには多くの批判が寄せられている。手始めとして、上の例で、ユーザーが検索フレーズを引用符で囲みさえすれば、Googleもそれぞれに対応した検索結果を返してくる、と指摘されている。検索エンジンの専門家Danny Sullivanは昨年、長い記事で、Powersetのコンセプトをひとつひとつ洗い出して分析し、次のように結論している。「自然言語検索とかいうのは、検索についてよく知らないか、自然言語分析に関する法螺話をまだ聞いたことがない連中相手にしか効かないセールストークだ」。われわれがPowersetについて意見を聞いた専門家も、程度の差はあれ、同じような意見だった―この問題は極め付きに解決が困難だと言っていた。しかも多くのユーザーが、望むような結果を得るために検索フレーズをどう変えればいいか、すでに学んでいる。Powersetの検索エンジンについて判断するのは現物を見るまで不可能である。しかし、彼らは、単におそろしく難しいだけでなく、たとえ解決したとしても、その市場ニーズがどれくらいあるのかわからないような問題に取り組んでいる(少なくとも2-3語の単純な検索の場合)。Googleの研究部門の責任者Peter Norvigによれば「Googleも自然言語の研究チームをいくつも持っており、私も含めて、博士号をもつ研究員を何十人も張り付けている」ということだ。もしこういう博士号を持つ研究員がGoogleを去ってPowersetに移り始めるようなことが起きたら、何か大きなことが本当に起きている兆候といえるだろう。Powersetには潤沢な資金がある。今までに$12.5M(1250万ドル)をFoundation Capital、Founders Fund、その他個人から調達しており、会社の価値は$60M(6千万ドル)以上とされている。VentureBeatのMatt Marshallはデモを見て大いに感銘を受けたようで、Powersetのチアリーダー役を買って出ている。これ私が実物を見るのを楽しみにしているサービスの一つだ。Powersetがわれわれにメールに早く答えてくれるといいのだが。われわれもファンになるかもしれない。[原文へ] Powerset […]

  2. […] サンフランシスコのPowersetは「ここ数週間のうちに、永らくお待たせしたベータ版の一般公開に踏み切る予定だ」と昨日私に告げてきた。Powersetは自然言語を理解する新しい種類の検索エンジンを開発中で、これによって現在市場を支配しているキーワードによる検索エンジンに挑戦しようとしている。 […]

  3. […] TechCrunch Japanese アーカイブ » PowersetはGoogleに迫るか? […]

  4. […] TechCrunch Japanese アーカイブ » PowersetはGoogleに迫るか? […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中