Google、画期的書籍スキャン技術で特許を取得していた

次の記事

ShoeMoneyの商標侵害訴訟で疑惑のAdWords担当Google社員、不正を否定

Googleは書籍のスキャニングに猛烈に真剣に取り組んでいる。著者や出版社の抗議、最近のAuthors Guildとの和解手続きの遅れにもかかわらず、 この間何年もGoogleはできる限りの速さで何百万冊もの書籍をデジタル化してきた。書籍情報の電子化と索引づけにどれほど真剣かといえば、2009年3月24日付で書籍スキャニングの高速化に関する特許を取得しているくらいなのだ。

この技術は、基本的には、2台の赤外線カメラでスキャンしようとするページを撮影し、ページ表面の形状を3次元的に把握したうで、OCRソフトウェアをその形状に合わせて調整することによって認識精度を高めようとするものだ。つまり、赤外線カメラからの情報でページの3次元の形状を計算し、それにもとづいて文字の歪み具合を算出し、文字認識ソフトに伝えるわけだ。その結果、ページにいちいちガラス板を載せて平らにする必要がなくなり、スキャニングの大幅な高速化が図れることになった。

Google Book Project以外にも書籍のデジタル化プロジェクトはいくつか存在する。たとえばInternet Archiveは世界で18ヵ所のスキャニング・センターを運営している。しかしこれらのセンターのトータルでも毎日1千冊をスキャニングするのがせいぜいだという。私はInternet Archiveが利用しているテクノロジーについてよく知らないが、Googleのスキャニングの方がずっと高速なのではないだろうか。デジタル化を待つ書籍のページ数は何十億にも上る。Googleにとっては、より速く、より大量にデジタル化を進めれば、最終的には、その検索に伴って、より多くの広告が表示できることになるわけだ。さて、Googleがページめくりにどんな技術を使っているのか私には興味がある。

Buzznewsroomに感謝)

[原文へ]

(翻訳:Namekawa, U)