Twitter、ツイート保管方式の変更を中止。リアルタイム分析のプロダクトは提供間近?

次の記事

いよいよ本格的なブーム到来か:Foursquare、200万ユーザを突破

Twitter Engineering Blogに興味深い記事が投稿された。このブログには通常Twitterを利用してサービスを展開している人にとって役立つ情報が掲載される。もちろん今回の記事も、そうした人にも役立つだろう。ただ今回の記事にはそれ以上の内容が2つ含まれる。すなわちTwitterはツイートの保存にCassandraデータベースシステムを利用しないということと、リアルタイム分析プロダクトでCassandraを利用するという話だ。リアルタイム分析プロダクトについて、これまで公式にアナウンスされたことはなかった。

Twitterがデータ分析を収益源として活用していくであろうということはずっと言われていたことだ。しかしTwitterはこれまで、可能性は認めていたものの、言を左右して具体的な話はしてこなかった。しかしReadWriteWebのMarshall Kirkpatrickが証拠を挙げながらTwitterが間もなく新たな動きを見せる旨の記事を掲載(TechCrunchでもこの記事の内容に同意する)した。そしてこのたび、TwitterのRyan Kingが次のような記事を投稿した。「分析、運用、インフラストラクチャチームは、内部・外部の双方で用いるため、ラージスケールのリアルタイム分析環境をCassandraを用いたシステムに移行しつつある」。

そう、「ラージスケール」で、「リアルタイム分析」を「外部」からも利用出来るようにしようとしているのだ。

またツイートを保管する方式についての言及も、大きなニュースだと言える。以前TwitterはストレージにCassandraのシステムを用いると述べていた(MySQLを置き換える予定にしていた)。しかしこの移行を取りやめることにしたわけだ(少なくとも現在のところ)。「私たちは方針を変更することとしました」と、Ryan Kingの記事にある。「既存のMysqlベースのシステムを運用していくこととしました。新しいものに大規模な移行をするには時期が悪いと判断したのです」とのことだ。

時期が悪いというのはすなわちかつてないほどのトラフィック(一部の原因はワールドカップにある。ただこれは日曜日に終了する)が発生しており、頻繁な不具合にみまわれているということだろう。一応Twitterに真意を確認しているところだ。

尚、Cassandraとは「スケーラビリティに優れた次世代分散データベース」のことで、Apacheのオープンソースプロジェクトとして運用されている。2008年にFacebookからオープンソースとして提供された。Ryan Kingによれば、Twitterは今後もスケーラビリティが問題となる大規模プロジェクトにてCassandraを採用していくとのこと。例としては位置情報データベース、人気ツイートやトレンドを把握するためのデータマイニングプロジェクト、そして前述の解析サービスなどの名が挙がっている。「日々Cassandraを利用した開発を行っている。これまでも長らく利用し続けてきており、今後もCassandraを利用した資産は増え続けていくことになるだろう」とのことだ。

原文へ

(翻訳:Maeda, H)