1日2億5000万のTwitterツイートをリアルタイムで詳細分析するDataSiftが一般公開へ

次の記事

Amazon、Kindle Fireのソースコードを公開

DataSift

ビッグデータをBI(ビジネスインテリジェンス)し、とりわけTwitterの分析に特化するDataSiftが今日(米国時間11/16)、合衆国限定で一般公開された。DataSiftはTweetmemeから生まれ、1年前のTechCrunch Disrupt San Franciscoでデビューした。ファウンダはNick Halstead、そしてDatSiftは、1日に2億5000万ツイート以上というTwitterのファイヤホース(firehose==全ストリーム)を再配信する権利を持つ二社のうちの一社だ(もう一社はGnipだ)。

デベロッパや企業は、DataSiftを使ってTwitterのソーシャルデータのファイヤホースをデータマイニングする。DataSiftが特異なのは、Twitterのデータに特権的にアクセスできるだけでなく、そのデータを層別、ネット上の影響力別、そして感情別(ポジティブかネガティブか)に分類やフィルタリングできることだ。

ツイートのメタデータを使ってTwitterへの投稿を検索するので、さまざまな角度からのデータマイニングの可能性はほぼ無限だ。DataSiftが検索に用いるのはキーワードだけでなく、位置、性別、感情、Kloutのスコアに基づく影響力など、きわめて詳細だ。しかも検索対象はツイート本体だけでなく投稿内のリンク先にも及ぶ。

たとえばペットフード企業などが、Twitterのツイートを’dog lover’(犬好き)で検索したいとしよう。そうするとその企業は、データをさらに居住地域、感情、性別等々で分類できるのだ。

同社が提供するTwitterのストリームの詳細分析に、すでにかなりの数の企業が関心を示し、これまでのテストに参加してきた。ソーシャルメディアモニタリングサービスのクライアント部分や、金融サービス、保健医療、小売業、政治、テレビとニューメディアなどのWebサービスが、DataSiftのAPIを使っている。

DataSiftの利用料金は従量制と定額会員制の二本立てだが、小企業などは月額200ドルという低料金でDataSiftを利用できる。

DataSiftの望みは、Twitter自身がこのようなデータ分析〜再配布サービスを始めないことだ。Twitterとは長期契約を結んでいるが、本誌も前に書いたように、儲かりそうなサービスにTwitterが参入してこないという保証はない。あるいは、DataSiftが今後ますます好調なら、Twitterの買収の対象になるかもしれない。

ただし今のところは、DataSiftはTwitterに支援されている。Twitterのプラットホーム担当ディレクターRyan Sarverは、同社についてこう言う: “DataSiftの成長は、Twitterのリアルタイムデータに対する詳細分析に市場があり、しかもその市場が成長中であり、この種のサービスの繁栄を支えていることの証しだ…1日2億5000万のツイートを分析して企業活動の指針にするサービスへの需要が、このように増加しているのだから、今後ますます多くのデベロッパを必要とする分野になるだろう”。

なお、DataSiftは立ち上げ時点からすでに、MySpaceやいくつかのフォーラムのソーシャルデータも分析している。1〜2か月後には、Google+やFacebookのストリームデータも分析対象にしたい、と同社は言っている。

新CEOのRob Bailey(元Yahooの企業向け開発担当役員で、最近まではSimpleGeoの企業向け開発担当副社長)によれば、同社は当面、”幅よりは深さ”を優先したいという。そしてすでに同社は、今入手可能なデータの範囲内で、非常に詳細な分析結果を顧客企業に提供しているのだ。

DataSiftは最近、本社をサンフランシスコに移し、GRPとIA Venturesから$6M(600万ドル)の資金を調達した。今では、GuardianやBBCも同社の顧客だ。

[原文へ]
[jpTechCrunch最新記事サムネイル集]
[米TechCrunch最新記事サムネイル集]
(翻訳:iwatani(a.k.a. hiwa))