Google News、小改良―依然として問題あり
by MG Siegler on 2009年5月13日

picture-91「世界の情報を整理する」というGoogleが自らに課した任務からすると、Google Newsはまったく落第だ。 公平を期するために、話を私がいつも読んでいるテクノロジー関係のニュースに限ることにする。もしかすると、他の分野のGoogle Newsの品質はもっと良いのかもしれない。が、そうだとしても大してましなわけではないだろう。この話をするのは、今日(米国時間5/11)、Google Newsがバージョンアップされ、記事の表示方法に新しいオプションが加わったからだ。実態はというと、今までのGoogle Newsが「あまり関係ない記事」を表示していたのに対して、今度の新しいオプションでは「まるきり関係ない記事」が表示される。

all XXXX news articles 〔XXXXについてのすべてのニュース〕というリンクをクリックすると、さまざまな個別コンテンツを表示するページに飛ばされる。ところがこのページに表示されるのは主要なニュースサイトの記事タイトルばかりでなく、ブログ記事のタイトル、画像のサムネール、そのテーマに関する記事の時系列の一覧、さらにはそのテーマに関する記事の引用まで種々雑多なウェブページへのリンクが含まれる。下のスクリーンショットでも分かるとおり、Googleは検索テーマに沿って正しく記事群をまとめることに失敗している。

たとえば、「iPhoneで宗教関連のアプリが禁止された」というニュースを検索するとしよう。すると、iPhoneの広告に関するデータまでが表示される。もちろんこれは検索テーマと関係ない記事だ。しかしクリックして次のエリアに行くと、あたかもその記事を直接検索したかのように、それが同じ記事であるかのように扱われている。おそらく毎日少なくとも10個ぐらいはiPhoneについての(異なる)記事が書かれているはずだ。適切な方法ではないが、GoogleがすべてのiPhone関連記事をひとまとめに表示するのであれば、それも仕方がない。しかしGoogle Newsはそうなっているわけではない。iPhone関連の記事グループがいくつも表示され、どの記事がどのグループに入るかまったくランダムで予測がつかないのだ。

picture-71

Googleが記事のグループ化を完全にアルゴリズムに頼っているところに問題がある。はるかに優れたニュース・アグレゲータであるTechmeme,がずっと以前に学んだことだが、正しい記事のグループ化にはどうしても人間の介入が必要なのだ。アルゴリズムはiPhoneに関するさまざまな記事(あるいはMicrosoftなり、下の例に挙げたようなあらゆる種類の記事)の間の区別がつかないかもしれない。しかし人間なら簡単に区別がつく。

さらにテクノロジー関係のニュースに関してGoogle Newsの最大の問題は、非常に古い記事が混じっていることだ。そのテーマに関してウェブ全体がどういう反応を示しているかを示すためだと言えないこともないだろうが、それなら少なくともその記事が、新しいニュースとして最初に報じられてから1日、あるいは2日、さらには1週間も経ってから書かれたものだということをはっきりさせてもらいたい。

picture-81

新しい時系列表示で、あるトピックがどのようにニュースなってきたかある程度はわかる。しかし〔このセクションの上部に表示される記事数のグラフ〕を見るとたいていの記事は記事数のピークをとうに過ぎている。Google Newsのトップ記事はほとんどが記事数のグラフでとうにピークを過ぎた記事ばかりだ。

こんなふうに続けていけば際限がない。Google Newsのアルゴリズムはナンセンスで、記事グループがどんな基準で何についてまとめられれているのかさっぱりわからない。見出しの下の抄録も多くは筆者名、場所をごたまぜにした意味不明のものが多い。表示されるリンクも抄録と無関係なものがある。「筆者はAustinModine。この筆者による記事がFacebookにさらにある」 など、意味のない抄録も多い。困ったものだ。

[写真: flickr/ang (3girls)]

〔注:Google Newsのタイムライン表示と記事数のグラフ表示は日本語版では現在サポートされていない。〕

[原文へ]

(翻訳:Namekawa, U)

  • http://jp.techcrunch.com/archives/20090512google-takes-steps-towards-a-more-structured-web/ Google、RDFaをサポート―構造化されたセマンティック・ウェブへ一歩を進める

    [...] RDFa規格を最初に提唱したMark Birbeckは来る6月に予定されているセマンティック・ウェブのカンファレンスで講演を行う予定だが、今回のGoogleの決定について「大きな一歩だ」と評価した。Birbeckよると、Googleはウェブページのコンテンツからアルゴリズムによって正しい文脈を引き出そうとしてきた。これは多くの場合成功しているが、われわれの記事でも指摘しているとおり、いつもうまくいくとは限らない。アルゴリズムでは正しく解析できない(少なくとも現状では)ケースが存在する。 [...]

  • http://www.kgrand.jp/index.php/2009/05/14/google%e3%80%81rdfa%e3%82%92%e3%82%b5%e3%83%9d%e3%83%bc%e3%83%88%e2%80%95%e6%a7%8b%e9%80%a0%e5%8c%96%e3%81%95%e3%82%8c%e3%81%9f%e3%82%bb%e3%83%9e%e3%83%b3%e3% Google、RDFaをサポート―構造化されたセマンティック・ウェブへ一歩を進める | KGRAND ONLINE NEWS

    [...] RDFa規格を最初に提唱したMark Birbeckは来る6月に予定されているセマンティック・ウェブのカンファレンスで講演を行う予定だが、今回のGoogleの決定について「大きな一歩だ」と評価した。Birbeckよると、Googleはウェブページのコンテンツからアルゴリズムによって正しい文脈を引き出そうとしてきた。これは多くの場合成功しているが、われわれの記事でも指摘しているとおり、いつもうまくいくとは限らない。アルゴリズムでは正しく解析できない(少なくとも現状では)ケースが存在する。 [...]

  • http://jp.techcrunch.com/archives/20090618google-flipper-is-about-to-jump-out-of-the-water/ Google Flipperがもうすぐ水面からジャンプして芸を見せてくれます

    [...] まだ実際に使ったことはないが、いいなと思えるのは、部門別だけでなく、ソースやキーワード、そしてもっと重要なのは“いまいちばん読まれている”、“おすすめ”などのカテゴリでニュースを分類できることだ。“めくる”というビジュアルな仕組みだけではGoogle Newsでよく経験するとても合格点をあげられないパフォーマンスを改善できないと思うが、良質なフィルタならできる。 [...]