google search
caffeine

新インデクサーCaffeineの供用を開始: Google検索結果の'鮮度'が50%アップ

次の記事

Twitter、全リンクを公式短縮サービスt.coに変換へ

昨年の8月に本誌は、Googleの新しい検索製品Caffeineについて書いた(製品名というよりコードネームだが)。この製品の背後にある考え方は、次のように単純だが欲張りだ: “サイズとインデクシングの速度と精度と検索対象範囲の拡大“。12月にはほぼ完成したようだが、一般供用はまだだった。そして今日(米国時間6/8)、ついにその日が来た。

同社のブログ記事でGoogleは、Webをインデクシングする新しいシステムが完成した、と述べている。とくに重要と思われるのは、”弊社のこれまでのインデクスに比べて検索結果の鮮度が50%向上し、また検索対象としてのWebコンテンツの量がこれまでで最大となった”、という点だ。つまり、検索が速くなっただけでなく、検索結果に、より最新のリソース(へのリンク)が含まれるようになった。

Googleによれば、それまでのインデクスは複数の層から成り、それらの更新のペースは一斉ではなかったが、Caffeineによる新たなインデクスは”Webを細かく分割した単位で分析し、検索インデクスをグローバルに絶えず更新していく”。つまり、インデクス更新のインターバル(間隔)というものがなくなったのだ。

Caffeineに関する数字をいくつか挙げておこう:

  • Caffeineは並行処理により毎秒数十万ページを処理する…もしこれが紙のページなら、その厚さは毎秒3マイルに達する。
  • Caffeineでは一つのデータベースが1億ギガバイト近い容量を占有し、新しい情報が毎日数十万ギガバイトずつ加わっている。
  • これだけの情報を保存するためには、容量最大のiPodを62万5000台必要とする。そのiPodを積み重ねると、高さは40マイル以上になるだろう。

[原文へ]
[米TechCrunch最新記事サムネイル集]

(翻訳:iwatani(a.k.a. hiwa))