Google、画期的書籍スキャン技術で特許を取得していた
by Erick Schonfeld on 2009年5月4日

Googleは書籍のスキャニングに猛烈に真剣に取り組んでいる。著者や出版社の抗議、最近のAuthors Guildとの和解手続きの遅れにもかかわらず、 この間何年もGoogleはできる限りの速さで何百万冊もの書籍をデジタル化してきた。書籍情報の電子化と索引づけにどれほど真剣かといえば、2009年3月24日付で書籍スキャニングの高速化に関する特許を取得しているくらいなのだ。

この技術は、基本的には、2台の赤外線カメラでスキャンしようとするページを撮影し、ページ表面の形状を3次元的に把握したうで、OCRソフトウェアをその形状に合わせて調整することによって認識精度を高めようとするものだ。つまり、赤外線カメラからの情報でページの3次元の形状を計算し、それにもとづいて文字の歪み具合を算出し、文字認識ソフトに伝えるわけだ。その結果、ページにいちいちガラス板を載せて平らにする必要がなくなり、スキャニングの大幅な高速化が図れることになった。

Google Book Project以外にも書籍のデジタル化プロジェクトはいくつか存在する。たとえばInternet Archiveは世界で18ヵ所のスキャニング・センターを運営している。しかしこれらのセンターのトータルでも毎日1千冊をスキャニングするのがせいぜいだという。私はInternet Archiveが利用しているテクノロジーについてよく知らないが、Googleのスキャニングの方がずっと高速なのではないだろうか。デジタル化を待つ書籍のページ数は何十億にも上る。Googleにとっては、より速く、より大量にデジタル化を進めれば、最終的には、その検索に伴って、より多くの広告が表示できることになるわけだ。さて、Googleがページめくりにどんな技術を使っているのか私には興味がある。

Buzznewsroomに感謝)

[原文へ]

(翻訳:Namekawa, U)

  • http://netshin.com/archives/20090504_headline-6.html ウェブ上であらゆるファイルを変換できるサイト「Convert.Files」が超便利 他|無料動画 ネットちゃんねらー

    [...] Google、画期的書籍スキャン技術で特許を取得していた [...]

  • http://yukiyukii.wordpress.com/2009/05/06/links-for-2009-05-05/ links for 2009-05-05 « fragment

    [...] Google、画期的書籍スキャン技術で特許を取得していた (tags: google tech book) [...]

  • http://twitter.com/ActofGRB じぁるび=͟͟͞͞ʕ•̫͡•ʔ.grb

    画期的というか、技術の組み合わせだね。
    赤外線カメラを使うのかーなるほどー。
    他にも応用できそう。