Michael Markson
blekko

ハーバード大学のサイトでシアリスを売ってる?–Webスナッチャーの時代に検索はどうあるべきか

次の記事

ライブブログ:Samsung、「最新Androidタブレット」を発表 in New York

編集者注記: このゲスト記事を書いたMichael Marksonは、検索エンジンBlekkoのマーケティング担当副社長だ。その前には、彼は、ニュースサイトTopixのファウンダで事業開発担当副社長だった。

Blekko関連記事(1)(2)。〕

1956年作のホラー映画の古典Invasion of the Body Snatchers*では、架空の都市カリフォルニア州サンタミラの市民が、各人の完全なそっくりさんに置換される。その、にせものたちは、豆の莢(さや)のようなものから生まれて成長する。莢から生まれた連中の目的は、全員で力を合わせて、全人類を置換することだ。主人公の医師がカメラ(つまり映画館の観客)を見つめて、”ここは全員やられた! 次はあんたたちだ!”と叫ぶシーンを、おぼえておられるだろうか。〔*: 日本語化されたDVD「SF/ボディ・スナッチャー」は1978年のリメイク。〕

早送りしてそれから54年後の今に戻り、Webの現状を見ると、何が言えるだろうか? まさに、ここはやられた、次はあんただ、だ。まともなサイトを置換する怪物の名はWebスパム、誰もがその犠牲者になりうる。今週たまたま見たのは、超一流大学ハーバードのサイトだ。ここのセキュリティを守るためなら何億ドル出しても惜しくない、そんな貴重なサイトが、Webサイトスナッチャーたちにやられてしまった。

これが、そのページだ (クリックするとハーバードのサイトへ行く):

ご覧のように、ヘッダ部分はまともで、Belfer Center for Science at Harvard Universityとなっている。しかしページの見出しは、”buy cialis online cheap”(シアリスをオンラインで安く買えます)になっているから、医学情報のページではないことがすぐに分かる。そして文章をざっと読むと、ハイジャックの目的は明白だ: 全文850語のうち150語が、なんと”generic Cialis”と”Viagra”なのだ(シアリスのジェネリック製剤とバイアグラ)。

なぜこのサイトをねらったのか? そう、皆さんご存じと思うが、検索で結果の上位に出るのは、クェリに対して内容が適切であるだけでなく、多数の良質なほかのサイトがそこにリンクしているサイトだ。だからハーバード大学のサイトなどは、シアリスを売りたいスパマーたちにとって、おいしいカモだ。このハイジャック行為によって、スパマーが目的とするサイトの検索ランクも上がったにちがいない。

しかも、このページ内の目的リンクをやたら多くするために、リンクだらけの表まである。そのリンク先が、ユーザが”Cialis”で検索したときに上位になるためだ。”cost of viagra 50mg”、”viagra best prices”、”cialis Thailand”などのリンクテキストは、どれも同じURLを指している。

Webスナッチャーの手口は、これだけではない。もっと悪質なのは、ユーザが実際に自分が抱える健康医療問題で検索をしたときに、上位に出るサイトだ。そんなときユーザは、具体的な症状…例:膝が痛い…で検索をするから、ずばりその語句のある上位の結果を、すごく頼りにする。

ところが、そのサイトへ行ってページをよく読むと、それは本物のMayo ClinicやWebMDではない。医師が書いた記事でもない。その記事はehow.comやezinearticles.comのようなコンテンツファームが作ったもので、しろうとのライターが1語1セントぐらいのバイト料で書いている。この場合は、権威ある保健医療サイト(たとえばmayoclinic.com)が置換されたのでなく、ユーザの心と時間が強盗されたのだ。

こんなことが、なぜ起きるのか? Webは今年で15歳になる。検索のアルゴリズムも相当進化していて当然ではないか。ところが、違う。検索の楽屋裏は今、戦場なのだ。一方には、ユーザのクェリに合ったもっとも適切な情報を選別するアルゴリズムがある。しかし他方には、まさにそういう優秀なアルゴリズムを利用して、ユーザの検索に割って入り、利益を得ようとするペテン師たちがいる。そして実際の戦闘では、後者が勝つ場合が多い。

この問題は、今ではWeb全体にとって深刻だ。しかもまだ、解決のきざしがなく、悪化の一方だ。たとえばさっき挙げたeHowは、Demand Mediaという会社がやっていて、いろんな欺瞞的ページを作ることだけが同社のビジネスだ。しかも同社は最近、IPOを申請している。つまり、それだけ儲かるということ。ペテン師たちが日に日に増えるのも、当然ではないか。

では、どうやって解決したらいいのか? まず最初にやることは: アルゴリズムへの全面依存をやめること。現状を冷静に見るかぎり、アルゴリズムがどんなに優秀になってもわれわれは救われない。経済的なインセンティブがとても大きいから、彼らは必ず、より優秀なスパムマシーンを作る。特定のマシーンをやっつけても、背後にいる人間は相変わらず健在だ。

Blekkoは、このような脅威を真剣に受け止めている。そのため、ほかの検索エンジンと違って、結果のランク付けに人間が介入する。また’スラッシュタグ(slashtags)’という機能により、スパムサイトを切り捨て、目的のサイトだけを検索する。今現在は、少人数のユーザが非公開ベータでその機能をテストしている(ベータに参加したい人はtechcrunch@blekko.comにメール、またはTwitterで – @ blekkoに連絡を)。

スラッシュタグの利点の一つは、結果の中にeHowのようなサイトを見つけたら、すぐにそれをスパムとタグ付けできることだ。一度タグ付けしたら、Blekkoの検索結果に絶対に出てこなくなる。つまり、営業的な言い方としては、そのサイトはあなたにとってすでに死んでいる。

今後はソーシャルなツールも加えていくので、検索結果の質の向上にユーザが貢献する比重がさらに大きくなる。アルゴリズムだけでサイトの質を正しく判断することは、絶対にできない。質の判断が素早く正しくできるのは、コンピュータではなく人間の心だ。Blekkoは、人びとがサイトの質に関する情報を共有でき、それによって誰もが得をするような、プラットホームを提供していきたい。

Invasion of the Body Snatchersでは、映画の主人公の医師が、問題が宇宙からの侵入者でもなんでもなく、住民たちの主観的な恐慌だと教わる。しかし彼は、それを信じない。今日のWebに関しても、悪いのは検索技術であり検索のユーザだ、という説を信じてはいけない。ハーバードの例が示すように、Webスナッチャーはすでに猛威を揮っている。次の犠牲者は、あなたかもしれない。

[原文へ]
[jpTechCrunch最新記事サムネイル集]
[米TechCrunch最新記事サムネイル集]
(翻訳:iwatani(a.k.a. hiwa))