アルゴリズムにしがみつくGoogleは明日の検索でピープルパワーのFacebookに負ける

次の記事

ストリーミング中のビデオ画面に対話的なコンテンツ/広告を挿入できる140Fire–究極の個人化が可能に

Googleの検索はアルゴリズムが駆動している。コンピュータがデータを切り刻み、所与のクェリに対して、あるWebページがほかのWebページに比べてより適切かどうかを判定するための、信号を探す。PageRankはGoogleの検索アルゴリズムの重要な部分で、これから判定するページやサイトを指しているリンクの数と、そのリンクに関連したテキストを調べる。検索クェリに対するWebページの適切性を判定するためにGoogleは、PageRankの結果以外にも大量の信号を使う。それも当然で、PageRankそのものは、とてもとっても、だましやすいのだ。

検索アルゴリズムをだまして、うその結果を出させたい、と誰も思わなかったら、PageRankだけで十分かもしれない。Webページを指すリンクは、そのページに対する人気や信任の投票みたいなものだ。そういう、リンクの持つ権威というものを考えた場合それは、検索結果を得るための指標としては理想的だ。だからこそ、1999年のGoogleはグレートだった。検索アルゴリズムをだましてうその結果を出させたい、という動機はまだ希薄で、また、だましの名人もあまりいなかった。

しかし今は、何もかも変わった。Googleのアルゴリズムは、不正行為の名人たちや彼らを抱えている企業によっていじめられレイプされ、無能な役立たずになってる、という感触もある。Googleももちろん、その都度対抗措置は講ずるが、それはまるで、Googleが負け続けている軍拡競争みたいだ。

今日(米国時間2/24)Googleはまた、アルゴリズムの変更を発表した。それは、これまでよりもさらに厄介なインターネットの汚染源、コンテンツファームとスクレーパー*と戦うためだ。これまた軍拡競争の一環だが。〔*: scraper, 盗用(scrape,こそげ取る)コンテンツで成り立っているサイト/ページ。〕

Google曰く, 人間なんて要らない!

今日おもしろいと思ったのは、Chromeのエクステンションのユーザたちから得られる、ブロックすべきサイトに関する’人力データ’を、検索結果の適切性を判断するためのデータとして利用することを、Googleが執拗に避けていることだ。

念のために申し上げると、このアップデートは、先週立ち上げたChromeのエクステンションPersonal Blocklistから得られたフィードバックを利用していません。

でも、新しいアルゴリズムはPersonal Blocklistエクステンションの利用結果と非常によく似た決定を導き出すと:

しかしながら、弊社が集めたBlocklistのデータを弊社のアルゴリズムが同定したサイトと比較いたしました。そしてたいへん喜ばしいことに、ユーザがエクステンションを使って表現している選好は、きわめて妥当です。Chromeのエクステンションでブロックを指定されている上位数十ほどの、もっともブロックされているドメインの84%を、今回のアルゴリズム変更は捕捉しております。このことは、エクステンションがもたらしているユーザ利益の、強力で独立的な〔==関連依存要因のない〕確証です。

このあたりは、読めば読むほど、奇怪な感じがしてくる。

エクステンションのデータに依存しないもっともな理由はある…そのユーザデータを使っていると言ってしまったら、SEO屋たちがたちまち、そのブロックするサイトに関するデータを操作し始めるだろう。もう、リンクファームなんか要らない。Mechanical turkで何千人もの人を雇ってそのエクステンションを使わせ、競合サイトをブロックすればよい。軍拡競争の、別の局面が始まる。

でも、それが理由ではないだろう。オズの魔法使いのように、Googleは、自分たちの全能で神秘の検索アルゴリズムの背後に身を隠す。検索が、Webページの上のマウスクリックを分析するような簡単なことなら、全能も神秘もすべて蒸発して消えてしまう。

もしも、ユーザデータを基に可能な限り多くのスパムを取り除けて、しかもそれらをユーザの年齢性別居住地域別、あるいは個人の好み別に分類できるのなら、アルゴリズム全能主義のGoogleにとってはさらに厄介なことになる。

Googleが、そのデータにアクセスできなかったとしたら、なおさらだ。

そして、Facebookにはそれができた。やろうと思えば。

検索の分野で今行われているもっとも興味深い実験の一つが、BlekkoのFacebookのLikeを利用する検索エンジンだ。検索結果とそれらの適切性を、フレンドがFacebookで”いいね!”したことで判定する。それはとても深いデータの集まりだと言える。

Facebookのユーザは5億以上で、その半数が毎日アクセスしている。これらの人たちがFacebookのサイトで毎日費やす時間は7000億分、共有するコンテンツの数は300億だ。リンクは共有され、コンテンツには”いいね!”(like)で投票が集まる。そして、その累積を利用した便利な検索エンジンを実験しているのが、Blekkoだ。

Googleが、そのように、”人びとの”データを利用したらどうなるか、それを想像すると、ソーシャルがGoogleにとっても今まさにいかに重要かが分かってくる。Facebookとの競争云々ではない。”人びと”のデータの有効利用なくして、検索エンジンの明日の大きな進化はない。そのことに、Googleも前向きに取り組む。Googleが今不得意な、ショッピングとか旅行などの分野はとくに、旅行やショッピングに関するフレンドたちからの深いデータが、たちまち得意な分野に変えてくれる。今のような、数ページ〜数十ページにわたる検索結果は要らない。友だちが薦める、パリの良いホテルが分かればよい。あるいは、おもしろい映画でも、そうだ。ポットや鍋も。Facebookには、そういうデータが今すでにある。

Facebookが検索に関心を示すのは、数年先かもしれない。しかし、その大きな広告収入を、無限に無視することはできない。そして、Googleにとってずば抜けて最大の脅威が、それのはずだ。

[原文へ]
[jpTechCrunch最新記事サムネイル集]
[米TechCrunch最新記事サムネイル集]
(翻訳:iwatani(a.k.a. hiwa))