Wikipediaの人気トピックは、ペルセウス流星群、ジョン・ヒューズ監督、GIジョー
by Erick Schonfeld on 2010年3月12日

GoogleにはGoogleトレンド、Twitterにはトレンドトピックがあるように、こんどはWikipediaにもできた。LinkedInのシニア研究員でData WranglingのブロガーでもあるPete SkomorochWikipediaのトレンドトピックページを作った。トップページにはWikipediaの最近30日間のページビューがトップ25の記事と、過去24時間に急上昇した記事が掲載されている。

このひと月で人気の記事は、ペルセウス座流星、デンマークの物理学者ハンス・クリスティアン・エルステッド、映画監督ジョン・ヒューズ、GIジョー:The Rise Of Cobraなど。これはGoogleトレンドや、Twitterのリアルタイムトレンドとはかなり違っている。過去24時間のトレンドトピック(ディストリクト9、ウッドストック・フェスティバク、ウサイン・ボルト、ジーナ・カラーノ)でさえ、Googleの今日の急上昇とは大きく異なっている。そうそう、なぜペルセウスが先月のトレンドトピックだったのかは見当がつかない。ふつう夏に見えるものなので。

どんなトピックでも検索すればページビューのグラフを見ることができ、その下にはiFrame内に記事本文も表示される。Wikipediaで調べる方法としても優れている。サイトはCloudera版のHadoop上に構築されている。

[原文へ]

(翻訳:Nob Takahashi)

  • http://jp.techcrunch.com/archives/20100316big-data-freedom/ Big Dataがもたらしているデータルネッサンス–これからはデータが無限におもしろい

    [...] 今では、目標を明確に絞り込んだスタートアップは、これまでに比べてはるかに早く軌道に乗ることができる。FacebookやTwitterなどでは、ごく少人数の技術分析部門が毎日大量のデータに容易にアクセスしている。個人でさえ、Big Dataを扱うクールなプロジェクトに取り組むことができる。たとえばData WranglingのPete Skomorochは、Wikipediaのトピックのトレンド把握アプリケーションを一人で作り上げた。 [...]