Powerset
by Erick Schonfeld on 2009年4月23日append.gif この記事をBuzzurlにブックマークする

GoogleやYahooなど一般的な検索エンジンでは、統計データに基づいてウェブの解析を行う。用いるデータはリンク、キーワード、その他ページ上に現れるもので、これらデータに基づいて検査時の表示順位を決定する。一方、セマンティック検索エンジンにおいてはウェブやドキュメントに含まれる単語を解釈して、その意味に基づいて指定された検索用語に最も関連性の高い結果を戻そうと試みる。マイクロソフトは$100M(1億ドル)で買収して、セマンティック検索に力を入れてはみたが、現在のところWikipediaの検索しか行えない。Hakia、Textwiseなど、多くのスタートアップがセマンティック検索の分野で活動を行っている。そしてこのたびNetBaseが新たに参入してきた。同社は既存のアプローチ手法とは異なる方法で、ウェブ全体についてセマンティック検索を実現するのだという。

NetBaseは、これまでにも活動を行ってきた企業だ。これまではAccelovationという名前だった。過去4年間で2度のベンチャー投資ラウンドによって$9M(900万ドル)を調達しており従業員数は30名。顧客にはP&G、Caterpillar、3M、BP、Kraft、BASF、およびGoodyearの名が上がっている。Accelovationはこのたび改名を行い、同社のセマンティック検索技術のコア部分をプラットフォームとして提供して、顧客独自のサービス構築に利用してもらおうと考えている。既に科学系出版社のElsevierがIllumin8エンジンにNetBaseを採用しており、科学記事、特許、およびウェブサイトの検索に役立てている。

NetBaseは文章を統計的に処理して単語間の関連性を決定するという、洗練された言語学的アプローチを採用している。日常言語においてはこのアプローチはうまく機能しているようで、テキスト中から原因と結果を抜き出すことができる。

Powerset、骨抜きバージョン
1 コメント
by Michael Arrington on 2008年9月18日append.gif この記事をBuzzurlにブックマークする

Microsoftはこれを、最近買収したPowersetとの統合の始まりにすぎないと言い張っているが、よくできたWikipediaの切り抜きをLive Searchに組み込むことは、あの次世代検索スタートアップの当初の約束であった「自然言語検索」からはほど遠い。

代わりにわれわれが手にしたのは、Live Searchの検索結果に気合いの入った回答(このためにどうしてPowersetが必要だったのかは不明)と、よくできたWikipediaの検索結果が加わったものだ(「Wikipediaの項目はLive Searchの問い合わせの大きな割合を占めるので、見出しが一級品であることが重要だ」)。

Powersetチームによると、「将来はさらに高度な統合を計画している」とのこと。本当にそう願いたい。Wikipediaの検索結果を改善しただけでは、私の第一検索エンジンをLive Searchにしたくはならないから。

Powersetはウェブの検索を変える、と約束したのだ。その片隣だけでも見せてほしい。

[原文へ]

(翻訳:Nob Takahashi)

Barney PellとRamez Naamに直撃インタビュー!Powerset買収の真相は?年末までにLive Searchに技術導入?
by Michael Arrington on 2008年7月3日append.gif この記事をBuzzurlにブックマークする

本日行われた、MicrosoftによるPowerset社買収発表のすぐ後に、Powerset の共同創設者兼CEOのBarney PellとMicrosoftの Live SearchジェネラルプログラムマネージャーのRamez Naamにインタビューした。

Mocrosoft側としては、現在検索業界No1のGoogleに対する最も重要な差別化要素として、Powersetの自然言語検索技術を利用していくつもりである。(Microsoftの検索市場シェア拡大の為の取り組みとして最近取り上げたLive Search Cashbackに関する記事も参照してほしい)

TechCrunchITがPowersetが対Google兵器としてどの程度有効かについてさらに詳しく語っている。だがこれでいくつかの事が明らかになった−Powersetの開発を遅らせていた人的資源と、資金の不足は既に過去の話となった。Microsoftの検索レリバンスが優秀なのでレリバンス問題を気にする必要が無くなった。制限されたデータセットではあったが、ユーザー達はPowersetのβ版を気に入っていたようだ。

Naamによると、全検索の5%にはキーワード検索が効率的に対応出来ない、自然言語検索の要素が含まれているそうだ。そのため、自然言語検索で良好な検索結果を得られれば、より多くの人々が検索用のキーワードでは無く、簡単な文章で検索する様になるのでは無いかという仮説がある。同氏によると、今年の末までにMicrosoftはPowersetの技術の一部を Microsoft Live Searchに導入するそうだ。近々Microsoftから、さらに詳しい自然言語検索の導入に関する話が聞けるだろう。

下記がインタビューの全文(英文)だ。TalkCrunchでMP3版を聞く事も出来る。

Read More

Powersetの話題は一段落。マイクロソフトが買収しました。
5 コメント
by Michael Arrington on 2008年7月2日append.gif この記事をBuzzurlにブックマークする

本日(米国時間7/1)マイクロソフトは、サンフランシスコに拠点を置くセマンティック検索機能を提供するPowersetの買収を発表する。買収金額は公開されていないが、情報筋によれば以前流れた$100M(1億ドル)の額が「当たらずといえども遠からず」ということらしい。

5月に、Powersetがマイクロソフトと買収についての話し合いを行っており、他の買収候補者が名乗り出るのも期待している旨の記事を書いた。Googleが候補者だったわけだが、そのGoogleはコンテキスト検索が次世代に向けての革命的一歩であることを公式に否定した。マイクロソフトが検索マーケットにおけるシェアを伸ばすことに興味があるのは明らかで、結局この両者がくっついたことになる。

先週来、合併の時期が近いという噂がまた流れ始めていた

Powersetは最近、同社のセマンティック検索のデモサイトを立ち上げた。しかし資金の問題もあり、ウェブ全体を検索対象として魅力を十分に証明するまでには至らなかった。Microsoft傘下にはいることにより、そのようなことで心配する必要はなくなる。これからはプロジェクトを頓挫させないために官僚的組織と戦うことが必要となる。

Powersetはベンチャーキャピタルから$12.5 million(125万ドル)を調達し、他につなぎ資金として$8M(800万ドル)を転換社債で調達している。結局のところ投資家たちはホームランとまでは言わないまでもそれなりのリターンを得ることとなり、設立者および従業員たちもまとまった額を手にすることとなる。

TechCrunchでは2006年10月に初めてPowersetを取り上げ、またPowerSetはTechCrunch40企業でもあった。

Update: マイクロソフトの発表はこちら。また、Powersetのものはこちら

原文へ

(翻訳:Maeda, H)

マイクロソフトがPowersetを買収か? まだもう少し。
by Michael Arrington on 2008年6月27日append.gif この記事をBuzzurlにブックマークする

VentureBeatの報じるところによると、Microsoftが、意味検索エンジンのPowersetを$100M(1億ドル)前後で買収することに合意したという。この金額は、われわれが、同社に提示されていると以前報告した数字だ。

われわれの情報源によると、この契約は5月以来ほぼ確実だということだったが、これまで署名はされず、今でも継続中のMicrosoft-Yahoo交渉に邪魔される可能性がある。投資銀行のAllen & Co.の代表者Dave Wehner(Beboを$850M[8億5000万ドル]でAOLに売った男)が、この契約でPowersetの代理を務めている。

Powersetは昨秋TechCrunch40でデビューを果たし、先月同社の技術を世に示す展示を公開したところだ。

Powersetはおよそ$12.5M(1250万ドル)をベンチャーキャピタルから調達済みだが、これとは別に$8M(800万ドル)を転換社債またはつなぎ融資で調達したも言われている。

[原文へ]

(翻訳:Nob Takahashi)

ステルス検索エンジンBlekkoが、マーク・アンドリーセン、SoftTechらから資金調達
1 コメント
by Michael Arrington on 2008年5月15日append.gif この記事をBuzzurlにブックマークする

2008年は、検索エンジンベンチャーの年だ。今週行われたPowersetの一部公開に続いて、ステルス検索エンジンBlekko(ロゴもウェブサイトもなし、あるのはこれとたぶん何らかのテクノロジーだけ)が2ラウンド目の資金調達を行った。

同社の調達額は$3M(300万ドル)、調達後の企業価値は$23M(2300万ドル)。以前の出資者が全員参加したほか、新たにMarc AndreessenSoftTech VCWestern Technology Investmentの3者が出資した。これと同時にBlekkoはサーバーリースのために、Western Technology Investmentとの$1M(100万ドル)リース契約を完了した。

Blekkoのことはあまりよくわかっていない。設立したのは、Topixファウンダー兼CEOだったRich Skrentaだ。同社は2009年までは、一切何も一般公開する予定がないと言っている。われわれのBlekkoに関する最初の記事に詳しい背景が書かれている。

これもわれわれが追っているステルス検索ベンチャーのCuillについての記事も見てほしい。

[原文へ]

(翻訳:Nob Takahashi)

Powerset、新UIをローンチ―文脈解析検索を試してみよう
4 コメント
by Michael Arrington on 2008年5月12日append.gif この記事をBuzzurlにブックマークする

サンフランシスコの文脈解析検索エンジンPowersetにとって今日(米国5/11)は記念すべき日となった。Powersetはユーザー向けデモをローンチした。ウェブ全体へのクロールはまだない。Powersetの検索は現在のところWikipediaFreebaseのデータだけを対象としている。今回のサービスのローンチはPowersetがAllen & Coを通じて買い手を探していると報じられた翌日に行われた。

私はPowersetの実験サイトを通じて、数週間前からテストに参加している。私は先月もこれについて書いたが、今回ローンチしたサービスはこれにたいへんよく似ている

10年前にGoogleが登場したときと同じくらい画期的なサービスになるかどうか、現在のPowersetから占うのは時期尚早だ。現在PowersetはWikipediaだけを検索しているので、関連性がより高い結果を上位に表示するランキング・アルゴリズムをほとんど必要としないからだ。

しかしユーザーはPowersetが情報を素早く収集する方法としてたいへん優れていることは見てとれるだろう。情報を調べているユーザーにとって、Powersetは最終結果を得るためのステップのいくつかを飛ばすことができる効果的な手段となっている。特に必要な情報が多数のウェブページに分散しているような場合に効果的だ。

たとえば、Powersetで「when did earthquakes hit tokyo(東京を地震が襲ったのは何時か)」という検索から驚くべき結果が得られる。Googleで、あるいはwikipediaで同じ検索を行って結果を比べてみるとよい。単にそのキーワードが存在するウェブページを選択するだけでなく、Powersetはそのページのどの部分に必要な情報が存在するか、ある程度解読してくれる。

Powersetの場合、上に見られるように検索に対する答えが結果表示の見出し文そのものの中に含まれていることが多い。またPowersetはWikipediaのデータの多くを構造化して(Freebaseのデータはすでに構造化されているが)、結果に含めている。そこでBillClintonについての結果を見ると、Wikipediaに加えてFreebaseの構造化されたデータからさらに多くの情報が得られるよう適切に加工して表示していることがわかる。しかし下の例で重要なのは、データが構造化されて表示されていることよりも、ユーザーが必要に応じて検索をさらに特定の範囲に絞り込む(たとえばクリントン大統領が署名した法案、指名した最高裁判事、寝た相手、等々)ことができ、表示されたキーワードを直接クリックすることでその情報を得ることができる点だ。

Powersetは通常の検索エンジンが索引づけするのとかなり違った方法でウェブページを索引づけしている。つまり通常の検索エンジンは検索キーワードにマッチするレコードを含むコンテンツをリストアップするだけなのに対して、Powersetはマッチしたページの内容を解析してさらにその後意味のある絞り込み検索が可能なように準備している。そのため、当初の検索では使われなかったキーワードによるマッチングさえ可能になっている。

しかしウェブ全体を索引づけするのは膨大な資金を必要とする事業だが、Powersetの方式はウェブページあたりさらに大量にコンピューティング資源を必要とする。それが現在すべてのウェブページの索引づけを行っていない理由だ。同社は$12.5M(1250万ドル) (プラス、投資家から$8M(800万ドル)かそこらのつなぎ融資を受けている)の資金を調達しているだけだ。ウェブ全体を索引づけするには、新たな資金調達が必要だ。(上の段落で売却と資金調達の双方の戦略に触れていることに注意)。

Powersetが検索のやり方を根本的に変えようとしていることに関してはさまざまな批判(われわれの批判も含めて)が寄せられてきた。しかしこの遠大な野心こそ、結果の成功、失敗を問わず、シリコンバレーを今日のように偉大にしたものだ。 Powersetが革命的ななにごとかを企てていることは間違いない。

Powersetは概要紹介のデモビデオを用意しているので下にエンベッドしておいた。

[原文へ]

(翻訳:Namekawa, U)

Powersetのジレンマ―買収を狙うか、独立路線で突っ走るか?
3 コメント
by Michael Arrington on 2008年5月11日append.gif この記事をBuzzurlにブックマークする

サンフランシスコの検索スタートアップ、Powersetがまもなくローンチする。現在のところ、Powersetの検索対象はWikipediaとFreebaseに限られる。しかし数週間前にデモを見せてもらったときに書いたが、たいへん印象的なサービスとなっていた。「 このサービスをテストしてみて、私は初めてGoogleを使ったときに似た「おお!」という感覚を味わった。簡単に言えば、このサービスは検索分野においてきわめて革新的で、もしかすると革命的とさえいえそうな大きな進歩をもたらしたと思う。

しかし現在同社は難しい決断を迫られる時期にさしかかっている。会社を売るか、検索に革命をもたらしてインターネットの巨大企業となることを目指して独立でがんばるか? 独立路線にはリスクが伴うが、一方で成功すれば将来、何十億ドルという巨額の報酬が得られる。

情報源によると、Powersetは両方の道を検討しているようだ。投資銀行Allen & Co.のマネージング・ディレクター、Dave Wehner (彼はBeboを$850M(8億5千万ドル)でAOLに売った。また現在、LinkedInの巨額の資金調達を手がけている)を売却交渉の代理人に雇っている。

今日のCNETの記事によると、MicrosoftがPowersetの買収に興味を示しているらしい。われわれの情報源は「この交渉は優に1月以上続いており、最近の提示額は$100M(1億ドル)だった」と語っている。

おそらくこの値段ではPowersetもその投資家も売却に同意しないだろう。大きな疑問は、果たしてGoogleがPowersetがMicrosoftの手に落ちることを防ぐためにオークションに参加してくるかどうかだ。そうなれば価格は大きく跳ね上がるだろう。しかしGoogleは「文脈依存型検索が検索分野に革命的をもたらす」という考えを公に退けている

Googleの見解が正しいかどうかはまだ分からないが、GoogleとMicrosoftの間で起こり始めている次世代検索技術をめぐる戦争でPowersetが重要なチェスのコマになってくる可能性はある。Googleの考えが間違っていれば、現在保持している検索分野での優位制が将来ゆらいでくる危険性さえある。Googleが自分で買収してしまえば、比較的少額の投資で、PowersetがMicrosoftの手に落ちるのを防ぐことができる。突然、Googleもそうやって保険をかけておこうという気になるかもしれない。

[原文へ]

(翻訳:Namekawa, U)

Facebookはたったの$9B : Blodgetの仮評価
1 コメント
by Erick Schonfeld on 2008年4月29日append.gif この記事をBuzzurlにブックマークする

sia-25-narrow.pngプライベートカンパニーの評価を行うのは、インサイダーおよび経営情報のすべてにアクセスできるベンチャーキャピタルにとってすら非常に難しいことだ。それを外部の人間が行う場合、たとえ十分な情報が開示されていたとしても、アテモノのようになってしまうこともある。とはいえ、それがシリコンバレーに集う人々の間でもっとも人気のあるゲームのひとつであるらしい。

本日(米国時間4/28)、Silicon Alley InsiderのHenry Blodget & Co.が25のプライベートカンパニーの評価を試みた。リストのトップにあるのはFacebook。しかしMicrosoftが評価した$15B(150億ドル)を下回る$9B(90億ドル)の評価となっている。なぜか? それはもちろん$15Bの評価が高すぎるのが明らかだからだ。それでSAIはFacebookの2008年の収益見込みの$350M(3億5千万ドル)を25倍して、企業価値と見なした。これで評価額は妥当なものになったか? おそらくなっていない。ただ、実際に市場での価格表かが為されていない以上、誰でも好きな値段をつけることができる。

このことは他のSAI25リストについても同様だ。リストではWikipediaが$7B(70億ドル)、Craiglistが$5B(50億ドル)、Mozillaが$4B(40億ドル)、LinkedInが$1.3B(13億ドル)、Ningが$560M(5億6千万ドル)、RockYouが$325M(3億2500万ドル)、Sport Runnerが$250M(2億5千万ドル)と評価されている。上位5つのうち3つ(Wikipedia、Craiglist、Mozilla)が、非常に価値のある資産を持ちつつ、基本的に非営利で運営しているのは注目に値する。それら3社に対する評価は、利益の最大化を目指す観点から運営した場合に、どれだけの価値を持ち得るかというという点から為されている。もちろんこれは、利用者の反応にも影響を与える話で、そしてそれが企業価値の算出にも影響を与える。

このリストには他の25のスタートアップが掲載されており、Federated Mediaが$245M(2億4500万ドル)、Yelpが$225M(2億2500万ドル)、Meeboが$220M(2億2千万ドル)、Mahaloが$150M(1億5千万ドル)、Diggが$125M(1億2500万ドル)、Etsyが$115M(1億1500万ドル)、Powersetが$80M(8千万ドル)およびTwitterが$75M(7500万ドル)などとなっている。全体のリストはここにあり、Nasdaqに応じて20分毎に動的に更新されている(但し、Nasdaqとどのように連動しているのか、詳細には明かされていない)。

ここに掲載される評価のいくつかは、他で為されているものより価値がある。いくつかについては無価値だ。たとえばSAIは、我々がレポートした$200Mでの買収の噂と、Kara Swisherによる$60-$80Mの評価の「足して2で割る」方式でDiggを$125Mと評価している。2つの噂を足して2で割る方式が、財務分析に基づく評価と同じ価値を持つことはあり得ない。

しかしだからどうなんだ? SAIもリストが完璧じゃなく、作業中のものだと認めている。数字にあまりこだわるのは利口なやり方とは言えない。評価されているスターとアップの間の、評価の違いについて考える出発点として役に立つと思われる。Meeboは本当にTwitterが持つ価値の3倍なのだろうか? NingはSlideと同じだけの価値を持つのか? さて、アテモノゲームを始めよう。

原文へ

(翻訳:Maeda, H)

自然言語検索のPowerset、ここ数週間でローンチか
2 コメント
by Michael Arrington on 2008年4月6日append.gif この記事をBuzzurlにブックマークする

サンフランシスコのPowersetは「ここ数週間のうちに、永らくお待たせしたベータ版の一般公開に踏み切る予定だ」と昨日私に告げてきた。Powersetは自然言語を理解する新しい種類の検索エンジンを開発中で、これによって現在市場を支配しているキーワードによる検索エンジンに挑戦しようとしている。

この検索エンジンの初期バージョンは、昨日私は本社に招かれてデモを見せてもらったが、同社のPowerlabsサイトの一部ユーザーにはすでに公開されている。しかし、それを別にすれば、全体としてほとんど沈黙が守られてきた。

この初期バージョンはエンジンのコンセプトとユーザーインタフェースのデモ用で、まだウェブ全体を対象として検索が可能なところまでいっていない。現在Powersetが検索できるのはWikipediaとFreebaseだけだ。しかし、このサービスをテストしてみて、私は初めてGoogleを使ったときに似た「おお!」という感覚を味わった。簡単に言えば、このサービスは検索分野においてきわめて革新的で、もしかすると革命的とさえいえそうな大きな進歩をもたらしたと思う。

もっとも同社が現在までに成し遂げたのは2つのサイトだけを相手にしたごく小さな索引づけだという点は割り引いて考えねばならない。さらにPowersetは検索エンジンを欺こうするスパムその他の問題に対してなんら対策を講じていない(この点がGoogleをかくも偉大な検索エンジンにした)。こういった点、まだGoogleへの挑戦者と呼ぶにはほど遠い。しかし誰でも一度使ってみれば、これがウェブ全体で利用できるようになったときの潜在的な影響の大きさを感じることができるはずだ。

今のところ、Powersetではこの検索エンジンの詳しい機能をまだ秘密にしているが、2007年半ばごろにスクリーンショットが公開された頃に比べて機能は大きな前進をみていると思う。

ローンチの準備に入って、Powerset開発チームの一部のメンバーはサービスが実際にリリースされるまでヒゲを剃らないと誓いを立ている。彼らがヒゲの伸び具合をPowerstacheというサイトで公表しているのをLA TimesのJessica Guynnが報じている。

同社を巡ってはさまざまな噂が駆け巡っている。複数の情報源がPowersetは追加の資金調達を行おうと努力中だと語った。また同社は新しいCEOを雇い入れるという計画を棚上げにしたようだ。ファウンダーのBarney Pellが依然として会社を運営権をしっかり握ってしている。

Powersetは検索エンジンの分野でわれわれが目を話さず観察している3社のうちの1社だ。他の2社は Cuill (クールと発音する)とBlekkoだが、どちらもまだ完全なステルスモードだ。

[原文へ]

(翻訳:Namekawa, U)

Microsoftの政治ニュースのアグリゲータ、「Blews」は海辺で食べたアイスキャンデーを思いださせる
by Michael Arrington on 2008年3月7日append.gif この記事をBuzzurlにブックマークする

オーケー、左の写真はジョークだ。しかし、Microsoft Researchが今日(3/6)発表した新しいニュース・アグレゲーター「Microsoft Blews 」のスクリーンショットを(下参照)を見ていただきたい。子供の頃海辺で(あるいはどこにせよ)食べたあの三色アイスキャンデー「Rocket Pop」を彷彿とさせないだろうか。

それはとにかく、Blewsの話。これはニュース・アグレゲーターである。(同種のものとしては、Techmemeその他約45件ほどのライバルに加えて、こういう珍品もある)。しかし、Blewsが提供するのは、誰がどのページにリンクを張っているかをほぼリアルタイムで分析して重要性を判断し、カテゴリーを分類するという定番の機能だけににとどまらない。このサービスはもっぱら政治ニュースだけを扱うが、記事の政治的立場が保守かリベラル寄りかまで判断する。

BLEWSは記事が保守的ブロゴスフィアで受け入れられているか、リベラル寄りブロゴスフィアで受け入れられているかを基準に用いて分類を行う。記事に対する保守ブログとリベラル・ブログのそれぞれからのリンクをビジュアル化して表示する。また問題のニュース記事あるはテーマが政治的感情に訴えかける力の強さも推定する。BLEWSはまた「ものごとを両面から見る」アプローチを採用しており、読者は同一の記事に対する異なる政治的立場からの見解を知ることができる。BLEWSはこの目的を達成するため、LiveLabsの「Social Media」プラットフォームが提供するリアルタイムのフィード を利用して政治ブログ記事を収集、分析する。

ユーザーインタフェースはこんな具合。

リベラル側からのリンクは左側の青い部分(Rocket Popのラズベリーだ!)に、保守側からのリンクは右側の赤い部分(チェリー)に表示される。真ん中の白い(これはレモン)部分には記事が表示される。周囲に飛び散っている点はコメントの感情の強さを表しているのだそうだが、すごく暑い日にRocket Popから垂れる滴のように見える。

気がついてみると、開発チーム(Michael Gamon、Sumit Basu、Dmitriy Blenko、Danyel Fisher、Christian Konig)にはユーザーインタフェースやウェブデザインの専門家が1人もいない。

UIも難しいものだからいちおう脇に置いて、Blewsが用いているAI技術はなかなか面白い。単なるキーワード検索(たとえばPowerset)は別としてコンピュータ・アルゴリズムのみでテキストから感情や意味を判定するのは非常に困難だ。Microsoftはこの「感情的強度」の分析も行っているとしている。これがうまく行けば、あるいはそこそこ近い判定ができる程度でも、この技術には無数の応用の可能性がある。

ちなみに、Blewsはわれわれが12月に紹介したScoutLabsにも似ているScout Labsはブランド広告の広告主がそのブランドに対するウェブでのコメントをモニタして、そのブランドへの好感度を推測しようというものだった。

[原文へ]

(翻訳:Namekawa, U)

「Y」という属性を持つ「X」を探すセマンティック検索エンジンCircos
by Nick Gonzalez on 2008年1月29日append.gif この記事をBuzzurlにブックマークする

circos_logo.png単に情報一般を求めている場合にはキーワード検索で実にいろいろなことが分かる。しかし、「ニューヨークのソーホー地区でいちばんヒップなレストランは?」という場合のように、特質や程度について知りたい場合にはキーワード検索はあまり頼りにならない。後者のような検索は単一のウェブ運営者が掲載するコンテンツというよりウェブを横断したさまざまな人々の意見に基づいて決められなければならない。そういった点がCircosのような「属性を検索するエンジン」が新しく生まれてくる理由の一つだ。この検索エンジンでは、現在のところ、ウェブ全体から収集してきたレビュー情報に基づいてホテルとレストランを規模、雰囲気、その他の属性に関して検索することができる。将来、カテゴリーは他の分野にも拡張される予定だ。

Circosは広い意味では、急速に増えつつあるセマンティック検索エンジンの仲間に入るだろう。現在、セマンティック検索エンジンとされているのは、HakiaPowerSetKosmixSemantiNetQuinturaTrueKnowledgeなどがある。しかしCircosがいちばん近いのはKangoだろう。これはやはりユーザー・レビューに基づいてホテルを格付けしようとするサイトだ。VibeAgentも自サイトに掲載したホテルを属性に基づいて検索するためのエンジンを開発している。

ただし、Kangoは多数のユーザーレビューを収集して自動的にタグづけしていくのに対して、Circoはユーザーが興味を感じたどんな属性でもカテゴリーとして探し出すことができる。Circosのエンジンはそれぞれのユーザーレビューが検索カテゴリーに対してどれほどよく当てはまるかをAからFまでの段階で評価する。たとえば、あるレビューに「ゆったりしている」とあったら、「広い」部屋を求めている場合には高い関連性があると認められるが、「小さい」部屋を探している場合には低い関連性しか与えられない。

他の検索エンジンの場合もそうだが、Circosにとって真のチャレンジは、こういった高度なアルゴリズムを利用していない従来のホテルやレストランの検索エンジンから本当にユーザーを奪ってこられるかどうかにかかっている。現在ライバルにはこと欠かない。しかし、Circosではこのアルゴリズムがレビュー記事からさまざまな度合いの属性を自動的に抽出するという力技をすべて引き受けてくれるので、Circosの検索技術を他の分野に応用するのは非常に簡単だとしている。つまりホテルとレストランの検索が不発でも、他の分野で再度ホームランを狙うことができるわけだ。

Circosはエンジェル資金で運営されており、San Mateoに本拠を置いている。従業員は8人(うち4人はシンガポールに在住)。

[原文へ]

(翻訳:Namekawa、U)

Googleへの次の挑戦者はBlekkoだ
1 コメント
by Michael Arrington on 2008年1月4日append.gif この記事をBuzzurlにブックマークする

Open Directory Projectやオンライン・ニュース・サービス、Topixの共同ファウンダー、Rich Skrentaは世界で最初のコンピュータ・ウィルス(Elk Cloner)を書いたことでも知られているが、現在彼の人生でも最大の挑戦に乗り出している。相手はGoogle。分野は検索だ。

Skrentaは昨年6月にTopixを去り、その直後にTopix技術陣の中心メンバーだった5人と新しい会社Blekkoをスタートさせた。Blekkoは9月にBaseline Venturesと2人の元Google社員(David DesJardinsとJeremy Wenokur)、それにBlekkoのファウンダー・チームから、立ち上げ資金として$2M(200万ドル)を調達した。

Blekkoは真のスタートアップらしく、ガレージで仕事をしている(下の写真を参照)が、内容については依然、徹底的なステルス・モードで運営されている。Blekkoのウェブ・サイトにはSkrentaの娘が作ったというパペット人形の写真が置いてあるだけで、トップページといえそうなページも作られていない。まして最終成果物については一切情報がない。しかしSkrentaによると、このチームは大手と対抗できるようなフルスケールの検索エンジンを完成させるのだという。

Skrentaはメディア対応には経験を積んでおり、この検索エンジンをどうやって実現するのかについては具体的なことを語っていない。(しかし、GoogleのPageRankにはきわめて否定的で、「PageRankがウェブをダメにした。Googleがすべての悪の根源だ。GoogleはPageRankと共に没落するだろう」と語っている)。Skrentaはまた「バックエンド(索引づけと検索要求の処理)だけでなくユーザーの検索インタフェースの改良にも力を注ぐ」としている。しかしそれ以上の具体的な点に関しては「見ていてくれ」というのみだ。しかし待ち時間は相当長くなるかもしれない。Skrentaによると、プロトタイプの公開は2009年になるという。

普通なら6人の開発チームと200万ドルの資金でGoogleに立ち向かうといえば、笑われるか無視されるのがオチだ。しかしSkrentaの場合、一度ならず大きなチャンレンジで成功を収めている。このスタートアップは2008年の注目株だ。また、さまざまな推測を呼ぶことになるだろう。

検索関係の有望なスタートアップとしては他に、PowersetCuill (これについては近く何らかの発表がありそうだ)、近く公開されるWikia Search Engineなどがある。ただしいずれもまだローンチはしていない。Mahaloは急成長している(とはいえ、まだたいへん小さい)。このうちの誰かがGoogleに脅威を与える存在になるだろうか? 当分そういうことにはなるまい。しかしこの分野で巨大な成功を収めるのに大きな市場シェアは必要ではない。なにしろたった1%のシェアが軽く10億ドルの広告収入に相当するというのだから。

Crunchbase Blekko

[原文へ]

(翻訳:Namekawa, U)

グーグル研究部門トップNorvigが自然言語検索をクサす
1 コメント
by Erick Schonfeld on 2007年12月19日append.gif この記事をBuzzurlにブックマークする

googleogo4.gifグーグルは自然言語検索など当分やりそうもない。 Powersettrue knowledgeのような新興企業が注目を集める中、グーグル研究部門トップのNorvigが世の中の人みんなが検索ボックスに全文入れると思ったら大間違いだと、自然言語検索の概念をミソクソにこき下ろした。Technology ReviewのQ&Aでこう話している。:

キーワードの代わりに質問やなんかをタイプできたところで大した進歩ではないと、われわれは思いますね。 「フランスの首都はどこですか?」とタイプしても、「フランスの首都」とタイプして得られる以上の結果は得られないでしょう。

全くその通りだが、氏はこの技術にも価値はある、とも言っている。

自然言語で大事なのは、検索中のコンセプトの中で言葉の位置関係を割り出すことですよ。ちょっと具体例を挙げると、「ニューヨーク」は「ヨーク」とは違うんだけど、「ベガス」は「ラスベガス」と同じ、「ジャージー」は「ニュージャージー」と同じ時もあれば違う時も あるわけです。この自然言語的な側面に、われわれとしては力を入れているんです。こちらがやっていることの大半は単語か言い回しのレベルの話であって、文章には注力していません。 われわれにとって重要なのは正しい結果を得ることであって、インターフェイスを変えることではないのです。

つまり自然言語のアプローチはバックエンドで検索結果を改善するには便利だが、ユーザーエクスペリエンスが改善されるわけではない、と言い換えることもできそうだ。大体の人は怠け者過ぎて、検索ボックスに打ち込むと言ってもせいぜい単語1個か2個だ。大体の検索はそんなものだという実状をGoogleとYahooの人たちは知っている。

自然言語検索でがんばるスタートアップもきっとそのうち痛い目に遭って初めてその事実を知ることになるだろう。そうなる前にグーグルがこてんぱんにしなければの話だが。

[原文へ]

(翻訳:satomi)

Founders Fund、$220Mの第二のファンドを設立
1 コメント
by Michael Arrington on 2007年12月18日append.gif この記事をBuzzurlにブックマークする

サンフランシスコに拠点を置く Founders Fundは、2005年に$50M(5千万ドル)のベンチャーファンドを設立した。これまでに[上場や買収などからの]現金化を2度経験し、その他、一握りの非常に知名度の高い投資(Facebook、Powerset、Ooma、Quantcast、Slide、Geni、Causesなど)も行っている。

今日(米国時間12/17)、Founders Fundは第二のファンド「Founders Fund Ⅱ」を発表する。今回のものは、$220M(2億2千万ドル)と規模が非常に大きい。また、第一のファンドとは違い、資金は主にファンド外の投資家から調達する。この新しいファンドにより、Founders Fundは追加投資の形で比例配分投資を始めとする15から20の新規投資が可能になる。

Founders Fundによれば、新しい基金からは2、3の投資がすでに行われているとのことだが、まだ公開はされていない。

Founders Fundの共同出資者はシリコンバレーで深いネットワークも持ち、それがディールフローに役立っている(Paypal創設者で前CEOのPeter Thiel、PayPal創設者で前CEOのKen Howery、PayPal創設者で前副社長のLuke Nosek、Napster、Plaxo、Facebook創設者で前CEOまたは社長のSean Parker)。しかし、Founders Fundは他とは異なる方法での取引にも取り組んでいるという。

ほとんどのスタートアップ企業の資金需要の減少とあいまって、ベンチャーキャピタルにおける供給過剰により、起業家とベンチャーキャピタル間の力のバランスがシフトしたと、Sean Parkerは今日電話インタビューで話した。Founders Fundはそのシフトを認識し、そのため少し違った形で取引を行うように発展してきた。例えば、Founders Fundは、「Series FF」と呼ばれる特別なクラスの株を発行し、普及させた。これは企業のライフサイクルのより早い時期に起業家が資金を受け取ることを可能にするというもの。また、他の資金よりもより著しくリベラルな議決権をファウンダーや役員に与える。Founders Fundの事業に関しては、今年初めのSF Chronicleのこの記事を参照されたい。

[原文へ]

(翻訳:Megumi H.)

自然言語検索Powersetが新CEO探し
by Erick Schonfeld on 2007年11月3日append.gif この記事をBuzzurlにブックマークする

powersetlogo.png自然言語検索の新会社Powersetがますます逆境である。

Barney PellがCEOを降板、これからはCTOとしてPowerset取締役会とともに新CEO探しを担当する。もう一人のファウンダー兼COOのSteve NewcombはCEO候補には入っていない。もう会社を辞めてしまったのだ。

Web 2.0カンファレンスでは、Pell(前CEO)がPowersetの抱える検索技術について素晴らしいデモを行った。と言っても使ったデータセットには限りがあるが。これを全ウェブ相手に使ってみてどうなのか、そちらの方がずっと大きな技術的課題だが、ウェブ全体に対象を広げるのはまだこれからだ。

それにしても今回の内紛では大いに首をかしげてしまう部分も。新CEOを探し当てて業務を引き継ぐ前に何故CEOを辞め、リーダーシップに大きな穴を開けてしまうのか?(COOもいないわけだし)  たぶん社内事情による動きだとは思うが。これだけ一度に発表すれば社員にも会社の舵取りについてシグナルが伝わり、驚きは最小限に留めておける。

CEOを探しているということは、つまりはPowersetもとうとう来年辺り検索エンジンの一般公開に踏み切るところまで準備が整ったという意味かもしれない。あるいはまた、Powersetの取締役会が会社業務の進捗状況にしびれを切らし、リーダーの挿げ替えを望んだのかも。CEO交代についてPellの説明はここ。Powerset関連の過去エントリはこちら

Crunchbase: Powerset

[原文へ]

(翻訳:satomi)

Powerset、検索結果をAmazonの「Mechanical Turk」サービスで検証中
by Michael Arrington on 2007年10月22日append.gif この記事をBuzzurlにブックマークする

読者の1人が、ステルスモードの検索エンジンPowerset が、Amazonの「Mechanical Turk 」サービスを利用して検索結果に対するユーザーの反応を調査中であることに気付いた。

スクリーンショットを参照(クリックすると拡大する)。参加者に対し、一つの検索フレーズに対していくつかの結果が提示され、 適切さを5段階で評価するよう求められる。この例の検索フレーズは「revealing bikinis〔ビキニで露出〕」だ。参加者が4種類の検索結果を10分以内に評価すると、報酬として$0.02が支払われる。

このタスクはすでに終了しており、現在Mechanical TurkにはPowersetのプロジェクトは存在しない。

私はPowersetのCEO、Barney Pellと今晩(米国時間10/21)話をしてみたが、彼はPowersetがMechanical Turkを利用して検索結果に対する人間の反応を調査しているのは事実だと確認した。Pellは「検索結果はすべてがPowersetによるものではなく、Googleその他による結果も含まれており、検索フレーズに対してユーザーがそれぞれの結果をどう評価するかを調査している。このプロジェクトは継続中であり、近く新しいタスクが追加されるだろう」と述べた。

Pellによれば、PowersetはMechanical Turkを長期間にわたって利用する―正式ローンチ後も利用するつもりだという。実際のユーザーの検索内容をリアルタイムでMechanical Turkに入力し、Powersetとライバルの結果を提示して、どちらが関連性が高いかを評価してもらう。もしPowersetの方が関連性が低いと評価された場合は、システムの調整を行なっていく計画だという。

PowersetはまたAmazonのもう一つのウェブ・コンピューティング・サービス、EC2利用している。また、Powersetは最近、EC2の利用と独自にデータセンターを構築した場合とのコストをユーザーが比較できるよう、自社の成長モデルに関する内部資料の一部を公開している。

[原文へ]

TechCrunch40セッション1:検索と発見
5 コメント
by Duncan Riley on 2007年9月18日append.gif この記事をBuzzurlにブックマークする

ライブレポートを含むセッション1の模様は以下。

Powerset

mini-powerset.pngPowersetは、日常ごく普通に利用されるフレーズや文法を基に、検索クエリーやインデックスするページを理解し、より正確なウェブ検索を実行する自然言語検索エンジン。フレーズや文法を構文解析することは理論上、単にキーワードに基づいた検索よりもより良い結果を抽出する。というのも、検索エンジンは検索者の求める検索結果をより良く理解できるからだ。例えば、「オフィス内で死亡した政治家は?」という検索を見てみよう。(他の検索エンジンのように)当該フレーズで、高い順位にランク付けされたページの一群を表示する代わりに、Powersetでは、事務所内で死亡した政治家のうち一部を情報として表示する、といった具合だ。

powermouse-michael-arrington.jpg

Powersetのプレゼンが始まる。セマンティックと検索。「われわれは、ウェブを構文解析する」。自然言語検索について。

発表: Powerset labsでは、ユーザーがテク関連デモや、アイディア共有、学習エンジンをフィードすることで「検索カルマ向上」。

ソーシャル投票機能のある自然言語クエリーのデモ。その他サイトの影響がわずかに見られる。

Powermouse(スクリーンショット参照)デモ。Wikipediaから、セマンティックインデックスへと情報抽出。

TC40(「TechCrunch 40」コンファレンス)の参加者は一番にプライベート・ベータに登録できる。

まとめ:バーティカル検索として売りものになるかどうかは難しそうだが、興味深いアプローチ。TC40にとってすばらしいスタート。

Read More

自然言語検索のPowerset、ミス・サウスカロライナの迷言を構文解析
1 コメント
by Michael Arrington on 2007年9月4日append.gif この記事をBuzzurlにブックマークする

これは、ミス・サウスカロライナ・ティーン代表Caitlin Uptonさん(18)がミス・ティーン・アメリカの晴れ舞台で簡単な質問に意味不明な答えを出した一幕を録画したもの。

Q: 最近の世論調査ではアメリカ人の5人に1人は世界地図でアメリカの位置が分からないといいます。何故と思われます?

A: 私思うんですけど、合衆国のアメリカ人にそれができないのはですね、えーと、私たちの国には、その辺にも地図を持ってない人がいるからではないでしょうか、えーと…本当に思うんですけど、やはり教育が…例えば、えー、南アフリカとか…イラクのような、そういう地域の教育がですね…なもんですから、やはり、えー、 この私たちの国における教育でアメリカをなんとか支援…、えー、南アフリカを支援していかなくてはならないかと。イラクやアジアの国々も支援して、そうして子どもたちの未来を築いていけるようにしなくてはならないと思います。

サービス公開前の自然言語検索エンジンPowersetにとってはPRの絶好のチャンスである。同社は早速彼女の回答を構文解析(parse)し、 検索クエリーで呼び出せるようにした。「教育は誰を支援するのか?(Who does education help?)」という検索クエリーを入れてみたら、「Americans」という検索インデックスが返ってきた。求めている情報の性格を考えると、実にすばらしい検索結果だ。

このテストはPowersetの検索エンジンとしての潜在力を示すものだ。キーワードがベースの検索では、このクエリーでこのコンテンツにはマッチしない。情報コンテキストの分析だけで答えは決まる。

上記例のようにインデックス数に限りがある場合、Powersetのデモはものすごく良く機能しているように見えるが、グーグルはじめ他の検索エンジン各社と伍していける実力を証明するには巨大なウェブの情報をインデックスして分析できることも示さなくてはならない。それが同社にとって最大 のチャレンジでありコストのかかる部分になっていくだろう。サービス開始に向け、Powersetにはまだ証明すべきことが沢山残されている。

[原文へ]

Powerset、成長モデルを一般公開
by Michael Arrington on 2007年8月10日append.gif この記事をBuzzurlにブックマークする

新自然言語検索エンジンPowersetは、まだ、公開前のステルスモードだが、今年になってから大々的に報道されている。同社について「話題だけが先行している」(私もだが)という人たちもいるが、同社の功績をある程度認めなくてはならないだろう。プランについての姿勢がオープンなのは確かだし、新しいアイディアを試してみる意思も持っている。

例1:今後のPowersetの機能性について、ユーザーが提案やフィードバックを書き込めるようにするためのサンドボックスPowerlabsを発表。また、Powerlabsにサインアップした人たちはPowersetブログでのニュース発表より、少なくとも1時間先行してニュースを入手できる。

例2:5月、PowersetのCOOであるSteve Newcombは、同社がどのように成長予測しているかについて述べた。そして、モデルのデータを同社ブログに掲載。読者がPowersetにモデルそのものをリリースして欲しいと勇敢にもリクエストした際、Newcombは今夏公開するとその求めに応えた。彼は個人ブログのエントリ中、「モデルを公開するのは、同社がオープンで、インフォメーションへの自由なアクセスをユーザーに提供する意志があることを示すため」だと書いている。

以前に述べたように、モデリングテクニックを公開するのは、より大きな目標の一部として、だ。われわれは、秘密めいたスタートアップ企業というイメージから、ユーザーに対し、サービスへの無制限のアクセスやサービスデザインを手助けできるような仕組みを提供、そして、われわれがPowersetの内容についてどのように考えているのかを知ることができるというような完全にオープンな会社へとイメージ転換をはかるプロセスを開始。

今日(米国時間8/9)、Powersetは一連のモデルをFlashインターフェースを利用して初公開。企業固有のベースライン条件などは削除あるいは加工されているが、業界における仮定などは大方そのままになっている。

Neal Mueller(PowersetのProduct Manager)はこのモデルがどのように機能するか説明してくれた。最初のモデル一式は、ウェブのインデックスを手がけようという企業にとって、サーバーを購入、リースあるいはAmazon EC2でバーチャルサーバーを設置するという選択肢のうちどれがより適切かを検討するというもの。サイズとインデックスのリフレッシュの頻度についての仮定は変更可能。モデルは、今後を予測するものであるため、将来的なサーバーパワーそれに、ムーアの法則によるコスト削減なども推測する。

これら全ての推測はFlashインターフェースで変更可能。そして、モデルはその他のウェブサイトにも埋め込められるようになっている(もっとも、私はTechCrunchサイトにきちんと埋め込めなかったが)。

少なくともあと二つのダッシュボードモデルを公開するとMuellerは言う。一つ目はユニークユーザー予測、そして二つ目のモデルについてはまだ明らかにされていない。同社はモデルについてのフィードバックを求めている。そして、それらフィードバックを真剣に受け止めているのは明白だ。Newcombは、個人メールアドレスをホームページに掲載、フィードバックを直接教えて欲しいとリクエストしている。

[原文へ]

  • Ads by Overture
  • MediaTemple Logo
  • QuickSprout Logo
  • OpenX Logo
  • Cotendo Logo