Tweetbeat
kosmix

ワールドカップの国(==チーム)別トゥウィート(つぶやき)を見れるTweetbeat

次の記事

[jp] Twitterログインも可能!LightBikeの続編「2」がでた!

Twitterの問題点は、ノイズが多すぎることだ。ノイズと信号を選り分けることは、今でもとても難しい。検索エンジンKosmixのファウンダたちは、同社の新製品Tweetbeatでこの問題に答えようとする。同製品は今プレビューバージョンで、サッカーのワールドカップに関連したトゥウィート(tweet(s), つぶやき)をすべてフィルタする。Tweetbeatは、1日に6500万トゥウィートと言われる消火ホース(firehose, Twitterの全トゥウィートがあふれ出てくる’巨大蛇口’)を全部吸い込んで、ワールドカップ関連でしかも人気が高く重要と思われるものだけを吐き出す。ニュースだけでなく、チームや選手の情報、ファンの叫びのようなものまで拾い上げる。

さらにおもしろいのは、画面左にある32のチームの旗のアイコンだ。旗をクリックすると、そのチームに関連したトゥウィートだけを見られる。たとえばファンが体にボディペインティングをするのは、ブラジルイギリスナイジェリアなどのチームだ。トゥウィートの中にチームの名前や”World Cup”という言葉がなくてもいい。Tweetbeatは、ColeやMaradonaといった選手個人の名前、そのニックネーム、チーム、それにスタジアムまで認識して、それらのトゥウィートをすべて、リアルタイムで取り出す。画面上のスライダーで、ページ上に流れるストリームの速度を調節できる。来週はiPhoneアプリケーションとデスクトップのウィジェットも提供され、MySpaceのようなサイトはそのデータを自分のウィジェットで使うことを計画している。

最初のゲームが始まる前の日(米国時間6/10)には、こんなことが分かった(英語のトゥウィートのみ):

  • 過去24時間でワールドカップは、Justin Beiberに次いで第二位の人気カテゴリーだった。
  • もっとも多くトゥウィートされているのはイギリスで、ほかのどのチームよりも40%以上多い。次位は合衆国で、ブラジルは5位だ(たぶん英語だけだから)。Twitterr上で人気最下位はパラグアイだった。
  • Twitter上で人気の高い選手は、Joe Cole、Wayne Rooney、Lionel Messiだ(ポルトガル語のトゥウィートを分析したら違う結果になっただろう。しかしRonaldo(ロナウド)が上位にいないのは、いくら英語でも、意外だね)。

Kosmixがやってるのは、Twitterのトゥウィートの消火ホースに対してセマンティック検索を適用し、それらを高速にカテゴリー分類することだ。KosmixはWebに対するそういう分類を、1000万以上のトピックとそれらの関係を分析して行った。ハッシュタグやキーワードには依存せず、関係と影響とトレンドの集まりがベースだ。協同ファウンダのAnand Rajaramanは、次のように説明している:

あるトゥウィートがあるトレンドの一部であると決めるために、Tweetbeatはセマンティックな類似性に基づいてトゥウィートのリアルタイムのクラスタ(cluster(s), 集まり)をいくつか作ります〔全トゥウィートを複数の集まりへと分類する〕。一つのクラスタに属するトゥウィートは、同じトレンドを表しています。次に、それらのトレンド表現の集まりを、トゥウィートの数や、トゥウィートした人びとの影響力スコア、クラスタの成長スピード(トレンドの広まり速度や加速度)など、いろんなリアルタイムの信号の組み合わせを使ってランク付けします。

一人一人のアクティブユーザの影響力スコアを、これもさまざまな信号を使って計算します。スコアには、フォロワーの数などの静的な要素だけでなく、リトウィートの数やリトウィートした人が誰かなど、動的な要素も加味されます。つまり、影響力の大きいユーザにリトウィートされた人は、その人の影響力スコアも高くなるのです。

彼はこの影響力スコアのことを”Krank”と呼んでいる。Kosmixは目下、このようなテクニックをワールドカップのチームと選手に対して、いわば技術のデモとして適用しているが、この夏の終わりごろには、すべてのトピックを扱える完全なバージョンのTweetbeatがリリースされる。

[原文へ]
[米TechCrunch最新記事サムネイル集]

(翻訳:iwatani(a.k.a. hiwa))