リアルタイム検索の難問―「意識の流れ」をいかに検索するか?

次の記事

StreamAPIによるライブビデオ機能をすべてのFacebookユーザが使える

現在、ウェブ検索でもっともホットな分野はリアルタイム検索だ。つまり「たった今、何が起きているか」が表示できるような検索のことだ。Twitterの検索エンジンは、あらゆる話題について現在誰がどんなメッセージを発信しているか即座に一覧することができる。このため、急速にTwitterのユーザーに欠かせないツールとなってきた。Facebookも個々のユーザーのニュース・ストリームを検索できる機能をテスト中だ。Googleも(共同ファウンダーのLarry Pageがこの問題を特に重視しており)、リアルタイム検索に挑戦を始めている

最近はほとんど毎週、さまざまな特色のある新しいリアルタイム検索のスタートアップがローンチしている。 (CollectaOne RiotScoopler、 TopsyAlmost.atTweetmemeCrowdEyeOmgili、その他)。これらのサービスは現在インターネットで爆発的に増加しているさまざまな種類のリアルタイム・ストリームの検索を試みている。Twitter、Facebookフィード、Diggの投稿、さまざまなブログのコメント欄、RSSフィード、Flickrに投稿される写真、YouTubeの動画、bit.lyのようなサービスで短縮されたURL、等々。リアルタイム・ソースのリストは日々長くなる一方だ。

人間には時間の前後によって情報を整理しようとする本能のようなものがある。おそらくこれがリアルタイム検索の根本的な魅力の源になっているのだろう。実はリアルタイム検索と通常のウェブ検索の本質的な違いが突然はっきりと分かったのはEdoSegalの話を聞いているときだった。 Segalは数年前にリアルタイム検索サービスのRelegenceをAOLに売却した起業家で、この分野で3件の特許を持っている専門家だ。Segalによると、「人間の機能に対応させると、通常の検索は記憶を検索するのに対して、リアルタイム検索は意識の流れを検索する」のだという。なるほど、「世界をそのまま意識する」という体験だからリアルタイム検索にはこれほど強い魅力があるのだ。

しかしここから難しい問題が発生する。仮にリアルタイム・ストリーミングがWebにとって「意識の流れ」であるとするなら、それをどのように検索したらよいのか? そもそも「意識の流れ」は検索可能なのか? 「記憶」を検索するというのは自然だ。それがGoogleがやっていることである。ウェブのアーカイブを索引づけし、情報のそれぞれの断片が時間とともに獲得する外部リンクを重要性の指標として利用している。リアルタイム検索のもっとも困難な課題は、まさにこの重要性を判断する方法にかかわってくる。リアルタイム検索の特徴である「新しい情報ほど価値が高い」という基準と、検索キーワードに対する個々の情報の関連性の高さという伝統的なウェブ検索の基準とをどのようにバランスさせるかが難しい。

現在、リアルタイム検索サービスの多くは、最新のメッセージをトップに表示し、検索条件に合致する新しいメッセージがさらに投稿されると順次その上に表示していくという直接的な方法を採用している。たとえばTwitter検索もそうだ。検索キーワードを含むメッセージを最新のものから単に時間順に表示するだけだ。リアルタイム検索のスタートアップでは、Collectaもこのアプローチを採用している。ユーザーは別の基準で絞り込みすることもできるが、そうしてフィルターすると自動的に表示順序が変更され、表示のリアルタイム性は低下する。

しかし、単純に新しい順にメッセージを表示すればノイズが多くなるのは避けられない。ノイズを低減するために別のアプローチを取るサービスも登場している。たとえば、OneRiotはPulseRankと呼ばれる手法を開発した。これは時間軸の基準に加えて、リンク先のウェブページの重要性、リンクを張ったユーザーの重要性、メッセージが拡散された速度などを考慮する。こうした手法は理屈には合っているが、単純に新しいメッセージを優先する手法に比べると、突発的な重大事件などの場合、やはり速報性で劣ることになるおそれがある。

アプローチの手法はこれ以外にもある。単なるリアルタイム性ではなく、何か特定のキーワードやトピックに関して通常と変わった動きがあるかどうかを知りたいユーザーは多いだろう。突然、マイケル・ジャクソンやイランに関するメッセージが平常のレベルを上回って大量に流れ始めたら、何か注目すべて事態が起きていることになる。この場合、リアルタイム検索は一種のアラート・システムの役を果たす。

ユーザーは「意識の流れ」を深く分析したいのか? 単に大量の情報が流れ去っていくのを眺めているだけでも満足なのか? 7月のリアルタイム・ストリームについてのCrunchUpカンファレンスのパネルディスカッションで、われわれはこうした問題も取り上げる予定だ。しかし、リアルタイム・ストリームの検索には時間軸基準と同時に、内容の重要性を計るなんらかの基準も必要であることは間違いない。

(写真: Flickr/Andrew Sea

[原文へ]

(翻訳:Namekawa, U)