Google、次世代画像検索を実験中―画像にページランク導入へ

次の記事

iPhone用カラオケソフトのTuneWikiにBenchmark Capitalが出資か

Googleのコンピュータ科学者2人が先週北京で開かれたWorld Wide Webカンファレンスで画像検索の未来に関する論文を発表した。(pdfで下にエンベッド)。

注目すべき点は、ここで紹介された新しい画像検索テクノロジーは、画像の内容を判断するにあたって、画像に付随するテキストを利用するのではないことだ。Googleはコンピュータで写真の内容を解析し、検索キーワードと結びつけて順位を決定する。簡単にいえば、画像版のページランク・システムを実現しようというのだ。

今日、われわれが「検索」という場合、例外なくテキスト検索を意味している。いわば色といっても1色しか認識できないようなものだ。したがって画像の検索やビデオ、音声の検索の場合、実際に検索に用いられているのは音声、画像データに付随するテキストデータである。これは赤い色しか認識できないのに緑色を定義しようとするようなものだ。

現在まで、Googleその他はマルチメディア・コンテンツに付属するメタデータを改善することに 多大な努力を払ってきた。たとえば、Googleの「Image Labeler」ゲームは画像に適切にタグづけするために人力を使う試みだ。革新的な試みではある。しかし依然として「緑色が見えないのにそれを定義する」ような迂遠なアプローチだ。

もしコンピュータが現在テキストを処理できるのと同じくらい容易に、直接リッチ・コンテンツを解読して処理できるようになったら、まったく新しい巨大な検索市場が誕生することは疑いない。リッチ・コンテンツに何が含まれているか人力タグづけるために人間が重労働をする必要がなくなる。つまり今まで適切に索引づけできないので存在しないも同様だった膨大なコンテンツが一挙にネット上に登場するのだ。

PageRankの画像検索版

GoogleチームのYushi JingとShumeet BalujaはGoogleは今やテキストを超えて先に進もうとしていると主張している。発表された論文で、2人は高度な画像認識ソフトウェアを利用して画像中に何があるか判断する方法について論じている。「商用検索エンジンは通常画像が存在するページに付随するテキストのみを手がかりとして画像のランクを決定してきた。その結果、画像そのものの情報はランキング決定にあたって完全に無視されることとなっている」と2人は論じている。彼らの実験はまさにこの画像そのものから情報を抽出しようとするもので、「従来のGoogle画像検索の結果に比べて、ユーザーのまんぞく度、関連性の観点から著しい進歩が認められた」としている。


PageRank for Product Image Search – Get more documents

[原文へ]

(翻訳:Namekawa, U)