Search
Knowledge Graph
knowledge

Googleが過去最大級のアップデートを発表―セマンティック検索実現へ大きく一歩踏み出す

次の記事

料理の写真を投稿するソーシャルサービスのmiilを提供するFrogAppsが2.4億円を調達

largeNewGoogleLogoFinalFlat-a

今日(米国時間5/16)、Googleはここしばらくの間でもっとも野心的かつ興味深い検索エンジンのアップデートをリリースする。一般公開は数日後になる予定だが、検索キーワードに関連ある重要な事実が検索ページの右側の大きなパネルの中に表示されるようになる。このパネルはGoogleが知識グラフ(Knowledge Graph)と呼ぶ新しいテクノロジーによって提供される。

その役割は大きくわけて2つある。1つは、検索キーワードに関連する主要な事実を表示することだ。著名人の場合なら生年月日その他経歴データ、ミュージシャンならコンサート情報、書籍、建築物、動物等々についてもそれぞれに適切な情報が表示される。2つ目の役割は、ユーザーが検索キーワードで何を意味しているのか明確化するのを助けることだ(Wikipediaの「曖昧さ回避」のページの役割)。ユーザーはこの機能を使って、たとえばkingsを検索した場合、アイスホッケーのL.A.Kingsを検索したいのか、あるいはバスケットのSacramento Kingsを検索したいのかGoogleに知らせることができる。

Googleはこの知識グラフを可能にするセマンティック〔意味論的〕テクノロジーを長年にわたって研究してきた。今週行った私の取材に対してGoogleが答えたところでは、今回ローンチされることになったテクノロジーはここ2年の開発努力の成果だという。

今回のプロジェクトではGoogleは構造化された知識の巨大なデータベースの開発に大いに努力した(2010年にGoogleは有力なセマンティック・データベースのスタートアップFreebaseを買収している)。現在、Googleの知識グラフ・データベースには5億件に上る人物、場所、物事の情報が蓄積されている。さらに重要な点は、この知識ベースにはこれらの対象の相互関係に関する35億件の属性や定義情報が収められていることだ。

“文字列ではなく物事そのものへ”

昨日、GoogleフェローのBen Gomesが私に説明してくれたところによると、Googleはユーザーが入力したテキストが実際に何を探そうとしているものなのか的確に理解することができるようになろうとしている(Gomesは「文字列ではなく物事へ」と表現した)〔訳注〕。これを実現するためにGoogleは自他の無料データベース(Wikipedia、WorldCIA Factbook、自社のFreebaseやGoogle Books、その他通常クローラが収集してくるデータ)に加えて有料の商用データベースも利用しているという(どのデータベースと協力関係にあるのかは明らかにされなかった)。

ではこの知識ベースは実際にどのように機能するのかみてみよう。Googleは現在通常の検索キーワードを理解するのは極めて巧みになっているが、それでも曖昧さが回避できない場合がある。たとえば、ユーザーがandromeda〔アンドロメダ〕と入力した場合、連続テレビ番組か、アンドロメダ星雲か、はたまたスウェーデンのプログレ・メタル・バンドのことなのか判別がつかない。このような場合にGoogleは右側のパネルに候補を示し、どれを検索しているのか選択できるようにする。 ユーザーが自分の探している対象をクリックするとそれに応じて再検索が実行され、メインの検索結果ページがリロードされる。

そこで、ユーザーがテレビ番組のKingsを選べば、検索結果に番組の画像、Wikipediaの項目、オンライン・ストリーミングで視聴できるエピソードなどが示される。探しているのがバスケットのSacramento Kingsであれば最近の試合結果その他、このチームに関する情報が表示される。

しかし以上は知識グラフの機能の一方に過ぎない。もしユーザーがGoogle知識ベースが十分に理解しているテーマについて検索したとすると、関連する情報の要約が自動的に編集されて右パネルに表示される。たとえば有名な建築家のフランク・ロイド・ライトについて検索したとしよう。ライトの経歴を調べるのにいちいちWikipediaの項目をクリックしなくとも、右パネルに生年月日を始めとする経歴データが表示される。Gomesによれば、Googleは過去の検索データから、特定の人物、場所、事件などに関連してどんな情報が検索されやすかったかを把握している。そこでそうした知識に基づいて右パネルの要約情報が編集されるわけだ。

Gomesによれば現在検索結果にGoogleマップスの地図が含まれるくらい頻繁にこれらの要約が表示されるだろうという。Googleは具体的な数値は明らかにしなかったが、今回のアップデートはGoogleがユニバーサル検索に移行したよりもはるかに大がかかりなアップデートだという。つまりGoogle歴史上でも最大級の改良ということになる。

また右パネルの要約記事には、関連する情報も表示される。たとえばフランク・ロイド・ライトの場合、ライトの経歴に加えて主要な建築作品やロイドの検索に伴って頻繁に検索される事項へのリンクもリストアップされる。さらに要約記事には、人物であれば家族、バンドであればメンバーやアルバム、テレビ番組ならディレクターの名前など知識を深めるのに役立ちそうな情報も含まれる。Googleによればこれは「ユーザーがそのテーマに関して自然に知識を深めていくのを助ける」ことになるという。

Googleはきわめて多様なソースから情報を収集してくる。Googleの要約は多くの場合、そのテーマに関するWikipediaないし
似たようなデータベース記事の簡単な要約と元記事へのリンクから構成される。その他のテーマの場合、Google自身の知識グラフ・データベースからその場で編集された内容となる。この場合はいちいち元データへのリンクは表示されない。

もしGoogleの知識グラフが生成した内容に誤りがあればユーザーはほんの数クリックするだけでそれを報告できる。

将来の展望

Googleはここ数年、セマンティック検索機能を少しずつ追加してきてはいた(MicrosoftもPowersetの買収以降同様の努力をしている)。Google Labsの閉鎖にともなってお蔵入りとなったGoogle Squaredもウェブから情報を抽出して表の形に整理して表示するというなかなか興味深いなプロジェクトだった。おそらくこのテクノロジーも今回発表された知識グラフの中に生かされているのだろう。いずれにせよ、今回のアップデートはGoogleのセマンティック検索の実現に向けての過去最大の野心的プロジェクトであるのは間違いない。

Gomesは「知識グラフの構造化データにアクセスすることでGoogleのアルゴリズムは検索キーワードをより良く理解できるようになった。次の課題は『暖かい気候の野外で開かれるレディー・ガガのコンサートは?』というような複雑な質問に答えられるようになることだ」と語った。今回のアップデートは検索キーワードに関連する情報の表示の改良に関するものであり、自然言語理解に関するものではないことに注意する必要があるだろう。

今回のアップデートがユーザーの検索行動にどんな影響を与えることになるのか、どんなリンクがクリックされやすくなるのか興味深い。おそらくWikipediaのトラフィックにはマイナスの影響が及ぶだろう。同時に「曖昧さ回避」機能の実装のおかげで、Googleにリンクを表示してもらったサイトには大きなトラフィックが流れ込むことになるかもしれない。

〔訳注〕 記事原文では "strings to things"と書かれているが、ビデオでJack Menzel は「動物は動物という存在であり、建物は建物という存在だ。単なるランダムな文字列ではない(not just random strings of characters)」と説明している。またAmit Singhal上級副社長によるブログ記事のタイトルも「知識グラフを紹介する―文字列ではなく物事へ(Introducing the Knowledge Graph: things, not strings)」となっている。日本版記事ではこれらGoogle側の情報に合わせた訳文とした。

[原文へ]

(翻訳:滑川海彦 Facebook Google+

“Googleが過去最大級のアップデートを発表―セマンティック検索実現へ大きく一歩踏み出す” への2件のフィードバック

  1. 下谷二雄 より:

    壮大なスケールですね。

  2. 中尾豊 より:

    物ではなく「コト」を検索結果に

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中