ニュース

ツイートの履歴(過去2年ぶん)へのアクセスを自社データベースから提供するDataSift

次の記事

Facebookが一部の広告主にダウンストリームコンバージョン追跡を秘かに提供している

historics-icon

Twitterのデベロッパたちは長年、ツイートの履歴へのアクセスを求めてきた。でも今できるのは、キーワード検索で過去7日ぶんが得られるだけだ。DataSiftは、Twitterのデータパートナーの一つとして、デベロッパやサードパーティにTwitterのファイヤホース全体(全ストリーム)へのアクセスをリアルタイムで提供しているが、もうすぐツイートの履歴へのアクセスも提供開始する。そのアルファバージョンがすでにあるので、今日(米国時間12/7)からデベロッパは、同社のHistorical Dataサービスに登録できる。一般公開は来年の第一四半期を予定している。

DataSiftのHistoricalサービスは、アルファの段階で過去60日ぶんのツイートにアクセスできる。登録ユーザは、デベロッパだけでなく、ソーシャルメディアのモニタリング企業、マーケター、一般企業などでもよい。もちろん、Twitterのキーワード検索という’壁’はないから、自由に分析やフィルタリングしてよい。来年一般公開されたら、過去2年ぶんにさかのぼれる。DataSiftはすべてのツイートを自分のデータベースに入れているから、通常のデータベースアクセスという形でも分析が可能だ。たとえば、”TechCrunchというキーワードはあるが@techcrunchをフォローしていない人のツイートをすべて”、”イギリスの女性のファッションに関するツイート”などなど。

同社は今、一日に1テラバイトのデータを収集している。言い換えるとそれは、一日に2億5000万件のツイートだ。これまで集めた総量は、400テラバイト。部分的にHadoopを使っている同社のファウンダNick Halsteadは曰く、”これぞまさに’ビッグデータ’だから、それを扱うエンジンはできるだけシンプルにしたい。今はMapReduceを使っているが、われわれのその理想にぴったりだ”。

[原文へ]
[jpTechCrunch最新記事サムネイル集]
[米TechCrunch最新記事サムネイル集]
(翻訳:iwatani(a.k.a. hiwa))