
Googleが最近リアルタイム検索に力を入れているのは周知のとおり。Twitter、Facebook、MySpaceのストリームが検索結果に加えられるようになり、やみつきになる最新のアップデートがオプションに加わった。しかしこうした目に見える改良の裏で、Googleはウェブの索引づけまったく新しい方式を準備していた。開発コードネーム“Caffeine”がそれだ。Googleはこの新しい検索エンジンを今年の夏からあるデータセンターでテストしていた。現在CaffeineはGoogleの全データセンターですぐにも稼働開始できる状態にあるといわれる。SEO事情に詳しい情報源によると、すでに検索処理速度の向上が確認されているそうだ。しかしGoogleの公式発表では Caffeineの稼動開始は年明け以降になる(皆が休暇シーズンを楽しめるようにという配慮もあるだろう)。
Caffeineが実戦投入されると、何がどう変わるのか? ほとんどの一般ユーザーは何も気づかないだろう。Google検索のルックアンドフィールはそのままだ。Caffeineは文字通りエンジンフードの下のアップグレードだ。つまりGoogleの索引アルゴリズムの改良である。しかしこの強力な新エンジンはGoogleの検索処理、ことに写真やビデオといった異なるタイプのコンテンツを横断的に検索する際の処理を大幅に高速化する。GoogleではCaffeineは検索のリアルタイム度を向上させるものと期待している。Googleではコンテンツの索引づけの高速化をライバルとの競争上の重要な要素と考えている。
9月にSEO企業のSummit MediaがGoogle社とは独立に行った調査によると、一般的な検索語の場合、CaffeineはニュースやSNSのコンテンツに従来より大きな重みづけをする傾向がみられたという。一方、具体性の高いキーワードの場合はそれにマッチするウェブサイトが表示される傾向があった。Summit Mediaは、1万組のキーワードを使ってCaffeineと従来のGoogle検索エンジンを比較した。その結果次のような傾向が判明したという。
- 表示ランキング自体に大きな変動はないものと予想される。全キーワード中でランキングが変わったものはごく少数だった。
- ランキングが低下したのは、コンテンツが古いアーカイブ記事だけで何年も更新されていないようなウェブサイトだった。Caffeine検索エンジンにクロールしてもらうためにはサイトの更新を頻繁に行うことが重要になる。
- ある分野が他の分野より有利になるという現象は見られなかった。
- 一般性の高いポピュラーな検索語とその他検索頻度の低いロングテールな検索語を比較すると、Caffeineはユーザーの検索意図が特定しにくい一般的な検索語に対してはニュースメディア、SNSのコンテンツを優先する傾向が見られた。
- 検索キーワードと正確に一致する文字列を含むURLはわずか5%しかなかったが、全得点〔この調査では表示順位に応じて表示結果に得点を与えている〕のうち6%が正確に一致したurlからのものだった。
Caffeineが全面稼働を開始するとGoogle検索の反応が速くなるだけでなく、ニュースやリアルタイム・フィードの内容をより強く反映したものになる。特に一般的な検索用語の場合、その傾向が強くなりそうだ。そうなると、一部のウェブサイトは表示順位を上げるためにトップページにTwitterやFacebookのストリームを表示してニュースサイトに見せかけ、Caffeineを騙そうとするかもしれない。Caffeineにこうした偽ニュースサイトと本物のニュースサイトの区別がつけばよいのだが。
〔Summit Mediaの調査レポート(要約)はこちら(PDF)〕
写真 Flickr/mararie.
[原文へ]
(翻訳:滑川海彦/namekawa01)
