リアルタイム検索の難問―「意識の流れ」をいかに検索するか?

次の記事

StreamAPIによるライブビデオ機能をすべてのFacebookユーザが使える

現在、ウェブ検索でもっともホットな分野はリアルタイム検索だ。つまり「たった今、何が起きているか」が表示できるような検索のことだ。Twitterの検索エンジンは、あらゆる話題について現在誰がどんなメッセージを発信しているか即座に一覧することができる。このため、急速にTwitterのユーザーに欠かせないツールとなってきた。Facebookも個々のユーザーのニュース・ストリームを検索できる機能をテスト中だ。Googleも(共同ファウンダーのLarry Pageがこの問題を特に重視しており)、リアルタイム検索に挑戦を始めている

最近はほとんど毎週、さまざまな特色のある新しいリアルタイム検索のスタートアップがローンチしている。 (CollectaOne RiotScoopler、 TopsyAlmost.atTweetmemeCrowdEyeOmgili、その他)。これらのサービスは現在インターネットで爆発的に増加しているさまざまな種類のリアルタイム・ストリームの検索を試みている。Twitter、Facebookフィード、Diggの投稿、さまざまなブログのコメント欄、RSSフィード、Flickrに投稿される写真、YouTubeの動画、bit.lyのようなサービスで短縮されたURL、等々。リアルタイム・ソースのリストは日々長くなる一方だ。

人間には時間の前後によって情報を整理しようとする本能のようなものがある。おそらくこれがリアルタイム検索の根本的な魅力の源になっているのだろう。実はリアルタイム検索と通常のウェブ検索の本質的な違いが突然はっきりと分かったのはEdoSegalの話を聞いているときだった。 Segalは数年前にリアルタイム検索サービスのRelegenceをAOLに売却した起業家で、この分野で3件の特許を持っている専門家だ。Segalによると、「人間の機能に対応させると、通常の検索は記憶を検索するのに対して、リアルタイム検索は意識の流れを検索する」のだという。なるほど、「世界をそのまま意識する」という体験だからリアルタイム検索にはこれほど強い魅力があるのだ。

しかしここから難しい問題が発生する。仮にリアルタイム・ストリーミングがWebにとって「意識の流れ」であるとするなら、それをどのように検索したらよいのか? そもそも「意識の流れ」は検索可能なのか? 「記憶」を検索するというのは自然だ。それがGoogleがやっていることである。ウェブのアーカイブを索引づけし、情報のそれぞれの断片が時間とともに獲得する外部リンクを重要性の指標として利用している。リアルタイム検索のもっとも困難な課題は、まさにこの重要性を判断する方法にかかわってくる。リアルタイム検索の特徴である「新しい情報ほど価値が高い」という基準と、検索キーワードに対する個々の情報の関連性の高さという伝統的なウェブ検索の基準とをどのようにバランスさせるかが難しい。

現在、リアルタイム検索サービスの多くは、最新のメッセージをトップに表示し、検索条件に合致する新しいメッセージがさらに投稿されると順次その上に表示していくという直接的な方法を採用している。たとえばTwitter検索もそうだ。検索キーワードを含むメッセージを最新のものから単に時間順に表示するだけだ。リアルタイム検索のスタートアップでは、Collectaもこのアプローチを採用している。ユーザーは別の基準で絞り込みすることもできるが、そうしてフィルターすると自動的に表示順序が変更され、表示のリアルタイム性は低下する。

しかし、単純に新しい順にメッセージを表示すればノイズが多くなるのは避けられない。ノイズを低減するために別のアプローチを取るサービスも登場している。たとえば、OneRiotはPulseRankと呼ばれる手法を開発した。これは時間軸の基準に加えて、リンク先のウェブページの重要性、リンクを張ったユーザーの重要性、メッセージが拡散された速度などを考慮する。こうした手法は理屈には合っているが、単純に新しいメッセージを優先する手法に比べると、突発的な重大事件などの場合、やはり速報性で劣ることになるおそれがある。

アプローチの手法はこれ以外にもある。単なるリアルタイム性ではなく、何か特定のキーワードやトピックに関して通常と変わった動きがあるかどうかを知りたいユーザーは多いだろう。突然、マイケル・ジャクソンやイランに関するメッセージが平常のレベルを上回って大量に流れ始めたら、何か注目すべて事態が起きていることになる。この場合、リアルタイム検索は一種のアラート・システムの役を果たす。

ユーザーは「意識の流れ」を深く分析したいのか? 単に大量の情報が流れ去っていくのを眺めているだけでも満足なのか? 7月のリアルタイム・ストリームについてのCrunchUpカンファレンスのパネルディスカッションで、われわれはこうした問題も取り上げる予定だ。しかし、リアルタイム・ストリームの検索には時間軸基準と同時に、内容の重要性を計るなんらかの基準も必要であることは間違いない。

(写真: Flickr/Andrew Sea

[原文へ]

(翻訳:Namekawa, U)

“リアルタイム検索の難問―「意識の流れ」をいかに検索するか?” への10件のフィードバック

  1. […] [MISC] “Quoted” Category: Auto, Tumblr / Tag: MISC, UI / Add Comment Segalによると、「人間の機能に対応させると、通常の検索は記憶を検索するのに対して、リアルタイム検索は意識の流れを検索する」のだという。なるほど、「世界をそのまま意識する」という体験だからリアルタイム検索にはこれほど強い魅力があるのだ。 – リアルタイム検索の難問―「意識の流れ」をいかに検索するか? […]

  2. […] 名前が”リアルタイム検索”に変わったことにより、フィルタの重要成分としての時間がなお一層強調されたように思える。そして今直面している問題は、私たちが10年あまり抱え続けた問題と同じである。Erick Schonfeldが先日名前を挙げたどの会社も、昔ライブWeb検索に取り組んでいた会社と違うことはやっていないみたいだ。今の彼らも問題の最初の部分で間違いを犯しているようだし、実際にやっているのはリアルタイム検索ではなく‘最近検索’なのだ。もちろん苦労して作ったシステムであることは認めるが、問題解決のレベルという点では、昔のライブWeb検索の連中と比べて一歩も前進していない。今の連中は全員が逆時系列のビューを作り出し、Twitterに毛が生えたようなものを提供している…“毛”の部分は、ブログのデータ、Twitter以外のマイクロブログのデータ、写真、最新トレンドの上位リストの作成、といったものだ。その一部にはコンテキストがあり、一定時間内のアクティビティ数や、トレンドがヒストグラムに登場していた時間などを出力する(後者はCrowdeye)。これらはいずれも、TechnoratiやSphereが昔実験していた。また、何かへのリンク数や‘つぶやき’の数を表示するものもある。しかしこれらはすべて、スパムなど関係ないアクティビティの餌食になりやすく、ユーザ経験を劣化させ、ユーザが完成製品に期待する、真のコンテキストと良質なフィルタをもたらさない。全員が、私たちがすでにブログ検索とトピック発見で学んだことを、あらためてまた学習する必要に迫られていると思われる。 […]

  3. […] リアルタイム検索の難問―「意識の流れ」をいかに検索するか? (tags: twitter search tech) […]

  4. […] 議論はだんだん哲学的になってきて、Keenは意識と記憶)の違いを説明しろと迫った。でも幸いなことに、betaworksの投資家John Borthwickと、最近GoogleからBTに移籍したKevin Marksが話に加わったので、Keenの難しい質問を忘れることができた。 […]

  5. […] たった今、この新しい形のリアルタイム消費に関してTwitterが持っているものは、このカテゴリーを席巻できるほどに大きい。しかし、チャンスの入口は、Facebookなどがその報償を求めてやってくれば、たちまち狭まってしまう。リアルタイムのコミュニケーションと検索という体験、デジタルの川を流れる関心事や疑問に関わる情報のストリームが次々とやってくると感じさせるその体験は、Twitterが最初に作り出したものだ。しかし、こうして新しいメディアにたどり着いた今、次に来るのは何だろうか。Twitterは、金儲けの仕組みを既に持つ誰かに真似をされ、ウィキペディアでは、Netscapeのように尊敬される地位に祭り上げらるような公共事業の一例となってしまうのか。それとも、限界への挑戦を続け、存続し成長する事業となって荒波を乗り越えていくのか。 […]

  6. […] こちらではWowdを数ヶ月間利用してみている。数千人に公開されているベータ版段階であるのに、検索結果はまずまず評価できるものとなっている。本日よりWowdは一般公開となり、真のテストがいよいよ始まるわけだ。リアルタイム検索は、現在非常に注目を集めている。この分野に参入をめざすスタートアップは多数あり(Collecta、OneRiot、Topsy)、Twitter、Facebook、およびGoogleなどの大企業も虎視眈々とチャンスを狙っている。 […]

  7. […] リアルタイム検索の難問―「意識の流れ」をいかに検索するか? […]

  8. […] リアルタイム検索についてはいろいろな議論がある。中でも特に重要なのは、時系列という基準以外にどのような価値基準を設けるのかということだ。発言のコンテクストを知りたい場合もあるし、また関連発言の中から最も重要なものを見つけ出したいときもある。しかしあまり昔のものを検索結果に加えてしまえば、それはもはやリアルタイム検索とは言えなくなってしまう。各種リアルタイム検索エンジンや、あるいはTwitter自身がさまざまな方法でこの問題に対処しようとしてきた。たとえば特に重要なものをトップに表示して、あとは時系列に並べるという方法もある(これはTwitterが採用している方法だ)。Bingは通常の検索結果ページにリアルタイム検索の結果を統合し、またTwitterユーザーが最も多く参照しているリンク情報も掲載するようにしている。 […]

  9. […] リアルタイム検索についてはいろいろな議論がある。中でも特に重要なのは、時系列という基準以外にどのような価値基準を設けるのかということだ。発言のコンテクストを知りたい場合もあるし、また関連発言の中から最も重要なものを見つけ出したいときもある。 […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中