ニュース
Google / グーグル(企業)

グーグル、画像・動画内テキストの読み取り技術に特許を出願

次の記事

gOS新バージョンはGoogle Gears搭載、来週月曜CESで公開に

ロボット(コンピュータ)が画像や動画内の文字を読んで認識できる手法に対する特許を2007年7月、グーグルが出願していたことが最近明らかになった。

応用範囲を広げれば、グーグルがインデックスする画像・動画は「画像や動画本体の中にあるテキスト」で検索が可能になる。これはかつてないインデックス技術であり、大きな一歩前進となることが予想される。

Information Weekが指摘しているように、YouTube動画もゆくゆくは動画本体が映像として捉えたテキストでインデックスされることになり、そうなるとGoogle Mapsのストリートビュー機能で浮上したプライバシー問題はさらにややこしくなりそうだ。

「Recognizing Text In Images(イメージ内のテキスト認識)」と題する特許出願の全文コピーはこちらで閲覧できる。

特許の解説から何行か拾っておこう。:

「デジタルイメージには幅広い種類のコンテンツが収録できる。…例えば風景、人、町並み、その他の対象の姿かたちをデジタルイメージは描き出してくれる。デジタルイメージには時としてテキストが収まっている場合もある。デジタルイメージは、例えばカメラやデジタルビデオレコーダーで像を捉える。典型的なイメージテキスト(つまりイメージ内のテキスト)には雑多なサイズ、向き、活字面(字幅&字体)のテキストが入り混じっている。デジタルイメージの中のテキストは例えば町並みの風景(例えば市街の路上シーン)から来たものであり、そのシーンを見ると風景や立地に関する情報が分かる場合も多い。典型的な町並みの風景には例えば道路標識やビルの名前、番地、窓の看板などの一部に、テキストが含まれている」

分かり切ったことをクドクド書くようだが、グーグルが仮に静止画像や動画に写ったテキストをインデックスする手法を見つけたなら、それは検索技術の進化にとって大きな飛躍的前進となる。Google Booksのデータベースに収蔵された書籍は一冊残らず検索可能となるだろう。その次なるステップはYouTube、Flickr(あるいはPicasa Web)で、もっといろんなことが続く。未来の検索ケーパビリティはまだ本格的進化の入り口に立ったばかりだ。

[原文へ]

(翻訳:satomi)