1日1000万件以上の加筆を全部追跡、Datasiftのツールでウィキペディアのスパムは困難に

次の記事

コンドーム定期購入サービスを考える

wikipedia-category

リアルタイムストリームを専門に行うソーシャルデータプラットフォームDatasiftは、PR関係者やジャーナリストを慌てさせることをしでかした。Wikipediaへの変更を検索可能そしてカスタマイズ可能のリアルタイムストリームにしたのである。これにより変更や変更を加えた人々をこれまでよりもずっと容易に追跡できるようになる。ストリームは、Datasiftのこちらのページで利用可能だが、新しいサイトWikistatsにも登場した。

「Twitterでニュースが出ると、Wikipediaに掲示する場所を見つけるのにウェブ中をフィルタする。例えば、Microsoft Surfaceが発表されてから3分後には、それ用のWikipediaページが作成された。毎日約1200万の編集がされるなか、研究者や企業は、毎日作成されているコンテンツの莫大なストリームを簡単に活用し、トレンドや最新情報を見つけることが出来るようになった」と、Datasiftの創始者およびCEO(最高経営責任者)であるNick Halsteadは、ロンドンのLe Webカンファレンスの会場でわたしに語った。

Datasiftは既に、Twitterの公式再配信パートナーとしてソーシャルウェブ上のデータを分析している。これにより企業はブランド、速報のニュース、そして世論に関して耳を傾けるためのフィルタを作成することができる。そして彼らはWikipediaとも協働し、毎日サイトで行われる何百万という変更を抽出できるリアルタイムストリームを作り上げたのである。ストリームは、ここからアクセスが可能である。

同時に、Datasiftが特別に構築した新しいサイトであるWikistatsは、Wikipediaで過去24時間に人気のあった記事についてのリアルタイム情報を提供する。Datasiftよりも前からありTwitterでの会話を追跡するTweetmemeサイトと同様に、Wikistatsは自然言語処理を使ってWikipediaで作成されたコンテンツやトップ記事を取り上げる。

参考までにどれほど莫大なものかを示すと、Datasiftによれば、Wikipediaでは毎月1100万~1200万件の編集があり、平均して約7100ページが新しく毎日追加されるという。それに引き換え、ブルームバーグでは約5000本の記事が毎日配信され、ニューヨークタイムズ紙では約1000本が毎日配信される。つまり、世界最大の報道機関のうちの2社が配信する新しい記事の合計数は、Wikipediaに毎月追加される記事の数の約半分に等しいということである。

[原文へ]