
昨年の8月に本誌は、Googleの新しい検索製品Caffeineについて書いた(製品名というよりコードネームだが)。この製品の背後にある考え方は、次のように単純だが欲張りだ: “サイズとインデクシングの速度と精度と検索対象範囲の拡大“。12月にはほぼ完成したようだが、一般供用はまだだった。そして今日(米国時間6/8)、ついにその日が来た。
同社のブログ記事でGoogleは、Webをインデクシングする新しいシステムが完成した、と述べている。とくに重要と思われるのは、”弊社のこれまでのインデクスに比べて検索結果の鮮度が50%向上し、また検索対象としてのWebコンテンツの量がこれまでで最大となった”、という点だ。つまり、検索が速くなっただけでなく、検索結果に、より最新のリソース(へのリンク)が含まれるようになった。
Googleによれば、それまでのインデクスは複数の層から成り、それらの更新のペースは一斉ではなかったが、Caffeineによる新たなインデクスは”Webを細かく分割した単位で分析し、検索インデクスをグローバルに絶えず更新していく”。つまり、インデクス更新のインターバル(間隔)というものがなくなったのだ。
Caffeineに関する数字をいくつか挙げておこう:
- Caffeineは並行処理により毎秒数十万ページを処理する…もしこれが紙のページなら、その厚さは毎秒3マイルに達する。
- Caffeineでは一つのデータベースが1億ギガバイト近い容量を占有し、新しい情報が毎日数十万ギガバイトずつ加わっている。
- これだけの情報を保存するためには、容量最大のiPodを62万5000台必要とする。そのiPodを積み重ねると、高さは40マイル以上になるだろう。
(翻訳:iwatani(a.k.a. hiwa))
