Google、一日あたり20,000テラバイトのデータを処理。処理データ量は更に増加中
by Erick Schonfeld on 2008年1月10日

googleogo7.gifGoogleで日々行われているウェブのインデックス、検索結果の処理、広告掲載やその他などコンピューティングの規模についてGoogleエンジニアが近頃資料を発表した。9月の終わり時点で、Googleが処理するデータは一日あたり20,000テラバイト。この大規模なコンピューティングをこなす能力はYahooやマイクロソフトその他との競争で優位に立つ大きな理由を占めている。

Niall Kennedyは、Googleの大規模コンピューティングがどのようにして今に至ったかについて取り上げ、この大規模コンピューティング作業それぞれ(MapReduceとして知られる)にかかるハードウェアコストはおよそ$1M(100万ドル)と見積もっている。この種の作業数は2004年から2006年にかけ大幅に急増(10倍)そして、それから一年半後にもさらに増えている。以下チャートを参照してほしい。

google-mapreduce-chart.png

[原文へ]

(翻訳:Nobuko Fujieda)

  • http://jp.techcrunch.com/archives/yahoo-search-wants-to-be-more-like-google-embraces-hadoop/ TechCrunch Japanese アーカイブ » ヤフーが検索にHadoop採用、グーグルっぽく脱皮を図る

    [...] 以上のデータをグーグルから公開になったMapReduceコンピューティングのインフラ情報(下の表)と比べてみるといい。リンゴ対リンゴという等価比較にはならないが、グーグルは2007年9月現在でデータ処理量が1日20PB(2万テラバイト)、出力は圧縮データで月間1万4000テラバイトとある。: [...]