Powerset
Powerset、検索エンジンをベースにSNSをローンチへ
by Michael Arrington on 2007年6月16日


Powersetが1週間ほど前にPowerlabsという新しいサービスを発表したとき、私はMicrosoft、Googleその他が設けているような新サービスや技術のテストやプレビューをするスペース(sandbox)だろうと思った。

しかし今日(米国時間6/15)、PowersetのCOO、Steve Newcombはこのプロジェクトについていろいろと詳しい情報を明らかにした。加えて私は今日、Powerlabsのデモを直接見せてもらう機会があり、その背後にある考え方を知ることができた。

Powerlabsはまだ実用化の段階に至らない新サービスのコンセプトを宣伝するための単なるsandboxではなかった。Powerset検索エンジンに興味があるユーザーはPowerlabsにサインアップすることで事実上、プロフィールを設定することができる。いったん登録するとユーザーはPowersetの新しいサービスのアイディアを見ることができるだけでなく、評価を投票したり、独自のアイディアをコミュニティーに向けて発表したりできる。やがてユーザーはこれらの活動実績に基づいて、ポイントを、したがってコミュニティーに対する影響力を得ることができる。

今日のデモで、Powerlabが実際にローンチするときに提供される予定のアイディアをひとつ見せてくれた。これはPowersetエンジンによる自然言語検索の結果と、ビデオ検索、キーワード検索、そして面白いことにFreeweb検索 (PowersetとFeewebは共同プロジェクトを実施中)の検索結果のマッシュアップだった。右のスクリーンショット参照(クリックすると拡大する)。

Powerlabsはまだローンチしていないが、Powersetのトップページからメールを送ることによって登録することができる。登録ユーザーは頻繁にメールによるアップデートを受けることができる。これにはプレスリリースや公式ブログでの発表に少なくとも1時間先立って通知を受けるサービスが含まれる。今日のメールでPowersetはまたもう一つ、会社を買収したことを明らかにしたが、 今のところそれ以上詳しいことは発表されていない。

[原文へ]

Powerset、成長モデルのシートを公開
by Michael Arrington on 2007年6月15日

先月の記事に、PowersetのCOO、Steve Newcombが予測モデルを使って初期成長率を予想しているので、規模拡大に耐えられるようにハードウェアを準備することができるという話を書いた。データの一部を公開しているのが良いことだとも書いた。さらに一歩進めて、予測モデルそのものを公開してはどうかという提案もした。

Powersetはモデルそのものを(もちろんPowerset専用の条件は抜いてから)公開して、他のスタートアップが自社で使うために手を入れられようにするべきだ。新しいベンチャーにはまず、Excel使いはいないし、この手の仕事に割く時間もない。どんなに競争が激しくても、こういう分析をすれば、多くの善意(と、「リンクジュース」 )が忘れさせてくれるだろう。

今、Powersetがやろうとしているのが、まさにこれ。Newcombは、Powersetが数週間のうちに、モデル(Powerset固有部分を除く)を公開すると言っている。ただし、Google Docsには載らないと思う(GoogleがPowersetの標的だということを除いては、丁度いい場所なのだが。Powersetはモデルのスプレッドシートをダウンロードできるようにするか、Flashビュワーを使ってウェブで見られるようにする予定。

[原文へ]

Powerset検索エンジンのデモ、初公開
by Michael Arrington on 2007年6月12日

Powerset は開発中の独自の検索エンジンがどのように働くのか、すっかり準備が整うまで情報を固くガードしている。会社設立当初はいくらかPRを行なった(われわれの記事はここここここ)ものの、その後はプレスに対してしっかりドアを閉ざしてしまった。最近とうとうデモを見る機会があって、私は感銘を受けた。しかしこのプレス・ブリーフィングはまだオフレコの約束になっている。このデモの内容や背景説明について記事を書くためのゴーサインが早く出るようわれわれは望んでいる。

Powersetという名前に聞き覚えがない向きのために改めて説明しておこう。これは開発資金豊富な新しい検索エンジンで、自然言語による検索の実現を目的としている。2006年10月、CEOのBarneyPellがブログ記事でこの会社の中心となる理念について簡単に述べている。

数日前、Powersetはブログ記事で検索とその結果のサンプルをいくつか示した 。普通ならこういったデータは退屈のきわみなのだが、この場合には多くの人々がさらに詳しい情報を知りたいと死ぬほど熱望している。上にスクリーンショットを載せた。

問題の検索フレーズは「在職中に死んだ政治家(politicians who died in office)」というものだ。これは以前のサンプル「子供が書いた本(books by children)」対「子供向けの本(books for children)」よりずっと適切な例だと思う。この2例の場合はGoogle検索でも、フレーズを“”(引用符)で囲めばかなり関連度の高い結果が得られた。しかし「在職中に死んだ政治家」の例ではGoogleの結果は劣っていた。Googleの場合補足コンテキストが必要なようだ。引用符で囲んだ場合、Googleはたった6例しかヒットしなかった。引用符をつけないと、意図した意味が失われ、役に立たない結果となっている。(Powersetのブログ記事自体が4番目の結果であるのに注意)。それに比べてPowersetの検索結果は関連性が高く、役に立つものだった。

もちろん、任意に設定した少数の検索例のスクリーンショットを取っただけではGoogleをやっつけることはできない。しかしGoogleとは異なったアプローチによるPowersetの検索が非常に役に立つ可能性があることは示された。ローンチに期待したい。

[原文へ]

Powersetはパワーを伸ばせるのか?
by Michael Arrington on 2007年5月6日

本気のインターネットベンチャーであれば誰でも、スケールアップに合わせてハードウェアを揃えられるように早期の成長を見越しておくもの(できればソフトウェアもついていけるように)。謎の検索エンジン、Powerset以前の記事を参照)は、自分たちのヒジネスモデルについては非常に明確であり、思うところを会社ブログに何度か書いている。

ファウンダーのひとりでCEOのSteve Newcombが書いた記事では、同社がどのように予測モデルを立てたかについて、かなり詳しく立ち入っている。上のグラフはNewcombによるモデルを、競合相手のSnap.comが新サービスのSnap Preview Anywhereをリリースした時と、再ローンチした時に用したもの。

陰をつけた部分は成長予測を表し、青い線が実際の結果。よく合っていると思うが、あてはまるようにモデルをちょっといじったのではないかと想像している。

Powersetはモデルそのものを(もちろんPowerset専用の条件は抜いてから)公開して、他のスタートアップが自社のために手を入れられようにするべきだ。大部分の新しいベンチャーには、Excel使いもいないし、この手の仕事に割く時間もない。どんなに競争が激しくても、こういう分析をすれば、多くの善意(と、「リンクジュース」[*])が忘れさせてくれるだろう。

[訳注 *]: link juice.ページランクを上げてくれるおいしいリンクのこと

[原文へ]

Powerset、パワーPRキャンペーン中
by Michael Arrington on 2007年2月13日

新しい検索エンジンスタートアップ、Powersetについて調べれば調べるほど、砂上の楼閣のように不安定な構造以外の何者でもないように思えてくる。Powersetという会社の性格は奇妙で、いささか二重人格的なところがある。たとえば、ある面では強く秘密主義だ。「あのデモ」(と最近は呼ばれている)を見た人間は全員、秘密保持契約書にサインしなければならない。スタートアップにしては珍しいことだ。一方、CEOのBarney Pellは、これでもかというほど問題の成果物(未だに単に「あのデモ」とだけ呼ばれており、聞いた限りでは2007年中に実用化されるかもしれないし、されないかもしれない)のPRにこれ努めている。しかし事実として、同社は$12.5M(1250万ドル)をベンチャーキャピタルから調達しており、Yahooから10人以上の検索エンジンのエキスパートを引き抜いている。(Yahooでは検索のエキスパートたちは〔報酬の〕ストックオプションの行使期限が到来しており、新しい大きなプロジェクトに関わりたくてうずうずしていた)。

Powersetの大PRはマスコミの注目を十分に集めている。普段は冷静なMatt Marshallだが、書くたびに賞賛を繰り返している。(彼は「あのデモ」を見る機会を与えられている)。New York Timesは今年に入ってもう2度も記事を掲載した。(これこれ)。

これはたしかに注目を集めるニュースではある。ユーザーは現在の検索技術に不満を持っており、改良を望んでいる。Google自身、発足当初は難しすぎる問題に取り組んでいると批判されたものだった。そこで人々は同じようなことがPowersetについても言えるのではないかと考え、10年に1度くらいの割合で、新しい会社が既存の既得権にあぐらをかいたライバルをやっつけるようなことが起こるのでは、と期待がおこるのかもしれない。

ところがPowersetはこういうことを判断できる検索エンジンのプロからは、ほとんど成功の望みがないと評されている。

「あのデモ」を見せられた人間の話では、デモは完全にコントロールされた環境で行われたという。索引付けはNew York Timesのような高度に組織されたサイトなど、非常に限られたサンプルに対して行われ、検索の実行もPowersetの社員が行ったという。そういったセットアップをすれば、ほとんど誰でも驚くようなデモを見せることができる。デモを見たうちでも、検索の本当のエキスパートは、ほとんど、あるいは何も新しいものは見なかったと言っている。他の人々は感心しているのだが。

Powersetは、先週末サンフランシスコでベンチャーファンドからの資金調達の成功を祝うパーティーを開いた。ビデオカメラマンを従えてパーティーの木戸破りをする常習犯のSarah Meyersがこのパーティーにも取材に押しかけた。(われわれのパーティーにも来たが)。彼女がPellや他の社員をインタビューしているビデオを下にエンベッドしておいた。Pellは製品については大所高所から論じただけで、われわれが知らないようなことは何も話していない。ところが2:47と表示されたあたりで、運の悪い社員がカメラにつかまり、Meyersの質問に答える破目になった。彼の答えは「われわれはデモをやってます。ええ、books by childrenとbooks for childrenの区別がつくようなウェブを検索ができるようになると、ええ、われわれは言っているわけで。ええ、一年くらいでできるでしょう」。どう考えてもあまり期待が深まるような発言ではない。


Yahooという側面
というわけで、どうにも話のつじつまが合わない。この会社は成果物のローンチにはまだ遠すぎるのに、大PRキャンペーンをしたりパーティーを開いたりしている。しかしPellはあらゆる意味で優秀な起業家である。それなら彼はいったい何を目論んでいるのか?私はDon Dodgeがその回答を見つけたのではないかと思う。PowersetはYahooに必要なものを提供すると約束したのではないか? それでYahooの元社員を雇って開発に当たらせているのでは? Powersetが今、大々的なPRを行っているのは、製品をできるだけ素早くYahooに売りたいからだろう。Dodgeによると、

Powersetは何をすべきなのか? 簡単な答えはない。答えが簡単明瞭に思えるようになるのは10年後になってからだろう。しかし Powersetの強みは自然言語処理だ。つまり文脈の中にある単語から意味を読み取ることだ。雑誌や書籍、新聞記事には大量の自然言語が含まれている。自然言語処理の能力を、普通2、3語しかない検索文字列の解析に使うのではなくて、広告をより適切に表示するために、こういった索引づけられていないテキストを分析するのに使えばいいのではないか?

一方でYahoo’の問題は何か? ターゲットが絞れないトラフィックが多すぎることだ。YahooはトップページやYahoo Mailに大量のトラフィックがあるが、ターゲットを絞った広告に結びつける方法を欠いている。AOL、MSN、その他のポータルも同じ問題を抱えている。そこでポータルサイトは、GoogleのようなPay Per Click (PPC)広告ではなく、低価格、低マージンのCPM広告を売らざるを得ない。もしPowersetのテクノロジーがメールのメッセージの内容を判読し、文脈を理解するのに応用できるなら、効果的にターゲット広告の絞り込みができるはずで、ポータルサイトの収入は3倍になるはずだ。Powersetがポータルのトップページやユーザーのカスタマイズさらたページのコンテンツをダイナミックに分析することができれば、適切な広告を絞り込める。

Dodgeが正しいならPellは非常に賭金の高いポーカーゲームをやっていることになる。彼が勝てば、Powersetは早期に買収され、元Yahooの社員は古巣に戻れる。〔Yahooによる買収という賭けに〕負ければ、ローンチされた成果物はよほど優れたものでなければなるまい。今や多くの人間が、これまでに聞かされてきた大宣伝が根拠のあるものだったのかどうか、注意深く見守っているからだ。それが根拠に乏しいということになれば、マスコミの関心を引き付けるのは絶望的に難しくなるだろう。

[原文へ]

Powerset、ただいま沸騰中
by Michael Arrington on 2007年2月10日

シリコンバレーの検索エンジンのスタートアップ、Powersetは今までその内容について固く口を閉ざしてきた。この態度もインターネット史上もっとも急速に成長した企業、Googleの地位を狙うという野心を抱く会社としてはうなずける。しかし、PARCの開発した重要なテクノロジーのライセンスを受ける契約を結ぶことに成功したことについては、彼らもさすがに隠しておけないほど興奮したものとみえる。Powersetは、今日(米国時間1/9)、VentureBeatの独占スクープという形で、この契約の内容を明らかにした。

Powersetは、Googleを倒す方法は「自然言語による検索」だと主張する。われわれはPowersetについての以前の記事でこの点について詳しく論じた。従来の検索エンジンはありふれた単語(by、for、about、of、inなど)を無視する傾向があった。Powersetはこのような単語を含めて文脈の中で意味を分析することに努力を集中している。自然言語検索で解決すべき問題についてはPowersetのCEO、Barney Pellの投稿に説明されている。簡単に言えばこうだ。Googleの検索では「book for children」、「book by children」、「book
about children」はすべて「book children」と同じに取り扱われる。これに対してPowersetはそれぞれの(自然言語としての)意味に対応した検索結果を提供することを目標としている。

Powersetには多くの批判が寄せられている。手始めとして、上の例で、ユーザーが検索フレーズを引用符で囲みさえすれば、Googleもそれぞれに対応した検索結果を返してくる、と指摘されている。検索エンジンの専門家Danny Sullivanは昨年、長い記事で、Powersetのコンセプトをひとつひとつ洗い出して分析し、次のように結論している。「自然言語検索とかいうのは、検索についてよく知らないか、自然言語分析に関する法螺話をまだ聞いたことがない連中相手にしか効かないセールストークだ」。われわれがPowersetについて意見を聞いた専門家も、程度の差はあれ、同じような意見だった―この問題は極め付きに解決が困難だと言っていた。しかも多くのユーザーが、望むような結果を得るために検索フレーズをどう変えればいいか、すでに学んでいる。

Powersetの検索エンジンについて判断するのは現物を見るまで不可能である。しかし、彼らは、単におそろしく難しいだけでなく、たとえ解決したとしても、その市場ニーズがどれくらいあるのかわからないような問題に取り組んでいる(少なくとも2-3語の単純な検索の場合)。Googleの研究部門の責任者Peter Norvigによれば「Googleも自然言語の研究チームをいくつも持っており、私も含めて、博士号をもつ研究員を何十人も張り付けている」ということだ。もしこういう博士号を持つ研究員がGoogleを去ってPowersetに移り始めるようなことが起きたら、何か大きなことが本当に起きている兆候といえるだろう。

Powersetには潤沢な資金がある。今までに$12.5M(1250万ドル)をFoundation Capital、Founders Fund、その他個人から調達しており、会社の価値は$60M(6千万ドル)以上とされている。VentureBeatのMatt Marshallはデモを見て大いに感銘を受けたようで、Powersetのチアリーダー役を買って出ている。これ私が実物を見るのを楽しみにしているサービスの一つだ。Powersetがわれわれにメールに早く答えてくれるといいのだが。われわれもファンになるかもしれない。

[原文へ]

PowersetはGoogleに迫るか?
by Michael Arrington on 2006年10月6日

アップデート:今朝(米国時間10/5)信頼のおける情報筋からメールを受け取った。「私はデモをみた(結構な時間を潰したんだが)。技術そのものは結構良く、ウェブ検索のクエリーにおける重要な一部分に貢献することは確かだろう。しかし、ひとつ言えるのは、ワークロードを減らす必要があるということ。索引づけの作業は従来のウェブ検索よりもはるかにコストがかかり、そのためスケーリングとパフォーマンスの面で作業が発生するということは避けられない。もちろんNDA(Non Disclosure Agreement)の神を怒らせるわけにはいかないので、あまり発言できないが……(それと、VentureBeatに記載されている資金額には誤りがある)」


私自身はまだPowersetのデモを見ていないのだが、近く公開されるこの新しい検索エンジンをテストした人々の多くは感銘を受けて「もう2度とGoogleは使いたくない」と言っているとか。

Powerset は検索の際に現在のエンジンが無視する検索語(これをファウンダーのBarney Pell は“ストップワード”と呼んでいる)を含め、ユーザーが自然言語を用いることができるようにすることを目標にしている。多くの人々と同様、私も検索エンジンを使うときには言葉の使い方を変えることを学んでしまった。重要なキーワードだけ残してあとは捨ててしまう(訳注:例えばストップワードと呼ばれている”for”、”about”、”of”や “in”などを抜いて)。こういう検索用の言葉づかいは私の日常の言葉にまで多少なり影響を与えている。急いでIMやメールやりとりするときの文章はクレージーで無意味な言葉のられつに見えるかもしれない。10年前だったら、私自身こういうやりとりの意味をつかむことができなかっただろう。現在では、すでによく知っている人々相手の場合、速いペースのビジネス・コミュニケーションの方法としてこういう言葉づかいはたいへん有効である。

そういうわけで今日の検索技術が完全から遠いものであることは分かっているが、だからといって自然言語に近づけるという方法がコンピュータに検索の目的をより良く理解させることになるとは必ずしも思っていない。率直なところ、われわれが引き続きコンピュータの理解する言葉をしゃべればいいのであって、進歩が必要なのはむしろ別の分野(ディープタグ、より優れたアルゴリズム、マルチメディア検索など)だろうと思っている。

しかし 自然言語を使用した検索が、意味と意図を伝えるうえで必要であることについて、Pell は説得力のある議論を示している。彼はこの点を説明するのに次のような例を挙げている。 “book for children”,“book by children”それに“book about children” はすべて今日の検索エンジンにとっては“book children” と同じ意味になってしまう。 Pellの議論の核心は、「books by children = 子供たちによって書かれた本」という検索をさせるには自然言語を用いる以外方法がない、というものだ。

Powerset はこの新しい検索エンジンをスタートさせるために大金を必要としている。ベンチャーキャピタリストはいつも噂の火元としてかっこうの存在だが(投資を見送ったときか、別のファンドに投資の機会を取られてしまったときが彼らから情報を引き出すのによいタイミングだ)。金銭的利害関係がないと、自然に口が緩むものである。、噂では、Powerset は投資直前の会社の価値を$20M (2000万ドル)と見積もった上で、$10M (1000万ドル)の調達をもくろんでいるという。これは大金だが、もしPowersetが第2のGoogle になるのだったらそんなことは誰も気にしないだろう。

[原文へ]