Googleは数多くのサービスで強みを発揮しているが、人物検索の面では遅れをとっているようだ。この分野ではGoogleではなく、目的に特化した検索エンジンを使うことになる。TechCrunchの読者にとってはSpockやWink(同社はReunion.comと合併した)が念頭に浮かぶだろう。しかしこの分野に、ゆっくりではあるが着実に、ほとんど誰にも知られることなく、新しいプレイヤーが登場してきた。その名をPipl.comという。
ComScoreの12月統計データを見てみると、米国内でのユニークユーザ数はSpockの260,000に対しPiplは557,000とリードしている。但し全世界で見るとPiplは135万でSpockが238万となっている。Piplはどのようにして閲覧者を集めたのだろうか。同社CEOのMatthew Hertz曰く「口コミ」であるとのこと。単純な回答だが真相を突いてもいるのだろう。Piplを試してみれば、その良さがすぐわかるのだ。このサイトが合法的に収集して表示する内容に恐れおののく人がいるかもしれないほどだ。
Piplの情報源はFacebookやMySpace、LinkedIn、ブログでの言及記事、Flickrでの写真などにあるプロフィールのみではない。財産記録、SECのデータおよび出生記録などの公的記録からもデータを収集する。電子メールアドレスなども拾ってきて個人のサマリー情報を生成する。たとえばRoi Carthyを検索すると次のようなサマリーが生成される。
Roi Carthy is an Israeli-based entrepreneur and startup consultant…
Editor’s note: Roi Carthy is currently writing for TechCrunch…
他の検索エンジンと異なり、Piplは「ディープウェブ(Deep Web)」をも検索対象としている。少々説明を加えておこう。一般的な検索エンジンは、あるページ内で見つけたURLへのリンクを辿ってウェブを巡回する。一方どこからもリンクされていないページはディープウェブを構成する。どこからもリンクされていないページとは、動的に生成されるページなどがその好例だ。検索エンジンでディープウェブも検索結果に含めようとするならば、生成されるURLを正しく「言い当てる」必要がある。ちなみにディープウェブの規模はどの程度だろうか。実際のところは不明だが一般的には通常の検索エンジンで対象となる通常のウェブよりかなり大きい(桁違いに大きい)とされている。
Pipl内部の人々は「情報源」について口を閉ざしている。したがってPiplの仕組みについてはっきりしたことはわからない。しかし以下のことは開示されている。まずPiplのクローラーはディープウェブおよびURLで辿ることのできる情報を検索する。その際にPiplの開発したアルゴリズムが入力情報の類推も行う。そして得られた情報をデータや画像情報(Piplは他の場所に現れたメタ情報も解析する)に分類する。そして最後に先進的な言語解析およびランク付けシステムを用いて、検索対象となっている人に関連の深い情報をまとめあげる。ディープウェブにおいては、他のページからリンクされていないという性質上、ページの重要性などを判断してレーティングすることもできない。Piplで用いられる技術はいずれも非常に洗練されたものだということがわかる。
Piplはその名が示すように、名前を使って人物を検索することを目的とするものだ。しかし逆にメールアドレスやユーザ名、電話番号から名前を検索する機能もある。検索結果は「1ページレポート」として、読みやすい形で表示される。情報は正確性、関連度、および重要度に基づいて表示されるようになっていて、よくある名前(John Smith等)について検索する場合にもわかりやすく表示される。
Piplのビジネスモデルも単純明快だ。検索結果の表示時に掲載するテキストによるスポンサーリンクがそれで、バナーは表示せずルック&フィールをシンプルに保っている。すべてというわけではないがほとんどのリンクはレポート内容の提供元にリンクしている。米国外からの利用者には馴染みの薄いところが多いかもしれないが、収入源であることに違いはない。
高校時代の恋人や、長く連絡の途絶えている知人を検索する際にはPiplを試してみてほしい。とっかかりとして最善のデータを提示してくれるように思う。

[原文へ]
(翻訳:Maeda, H)




