Googleと新聞各社提携による新聞過去記事検索(News Archive Search)



Googleは、オンラインで検索できる新聞の過去記事の範囲を広げつつあることを、本日(米国時間9/8)アナウンスした。新聞出版社と提携し、紙面をスキャンしてGoogleのNews Archive Searchで公開している。GoogleのMarissa Mayerは本日、News Archives Searchについて壇上にてデモを行う予定。事前に何が今回のサービスの目玉となるかを教えてもらった。ひとつは記事をスキャンした際、OCRが自動的に見出しと本文を区別する。これはGoogleによる書籍スキャニング用技術の開発中に生まれたものだが、新聞紙面用に調整されて、より精度を上げている。

GoogleのNews Archive Searchを使えば数十年前の新聞記事を読むことができるし、TechCrunchで扱う人や企業について新たな発見に繋がることもある。例えば“Lord Flathead”を試してみて欲しい。これはMySpaceの共同設立者のTom Andersonが十代でウォー・ゲーム風ハッカーだった頃に使っていたハンドル名だ。

Update: TechCrunch50におけるMarissa MayerによるGoogle News Archiveのデモが終了した。ニュースアーカイブページにはGoogle AdSenseの関連広告が表示され、収益は新聞出版社と分配することになる。現在のところ数百万の記事を検索することができるが、さらに加えていく予定だとのこと。また印刷紙面を提供するサービスも考えているとのこと。Marissa Mayerによる発言を引いておく(英文)。

This is built on scanning technology we built for Google Books, but with some new features.

We’ve already started this with books and maps, now we will do it with newspapers. Viewers will see it in their original context, can pan around and search. We will widen the user base and readership of news archives.

We already have News Archive search. You will see an interface similar to Google Books search. But our engineers have built in new algorithms to figure out [things like] what is a headline. As I mouse over the page, headlines are highlighted in blue, indicatingtheir clickability. When you click on something, it centers the story, and zooms in. You can do a snapback to the original article. In the sidebar, in addition to sponsored links we have related articles you can click on.


(翻訳:Maeda, H)