twine
radar-networks
microsoft bing

セマンティック検索エンジンの完成を目指すレース始まる: シード選手はBing, Google, そして謎のT2

次の記事

TwitterとFacebookだけをニュースソースにして記事を書くとどうなるか–フランスで5人の記者たちが実験を開始

昨日(米国時間1/21)Bingが、料理のレシピー検索のための、すごく便利な機能をリリースした。たとえば”Chicken”で検索すると、“チキンのレシピー”に絞られた結果が出て、左側のカラムにさまざまなフィルタ指定が現れる。そこでさらに結果を、評価ランク、料理の種類(菜食、スペイン料理、合衆国南西部料理など)、利便性(お手軽、家族向き、お楽しみなど)、機会(結婚式、バレンタインデーなど)、主材料、コース、料理の仕方などで絞り込める。Bingは、こうやって結果を段階的に絞り込む指導的検索に強いが、しかしこれを一歩進めると、セマンティック検索の領域に踏み込む(Webをいろんな角度からインデクシングし検索すること)。料理レシピーはその端緒にすぎないし、またセマンティック検索に挑戦しているのはBingだけではない。Googleをはじめ、EvriHakiaRadar Networksなどがセマンティック検索の実現に取り組んでいる。それは、セマンティックなフィルタリングをWeb上のあらゆるカテゴリーに持ち込むための競争だ。

実はBingのレシピー検索はT2にとてもよく似ている。T2はRadar Networksが非公開で開発したセマンティック検索エンジンだ。同社は現在、Twineという自動運転のセマンティックブックマーキングのアプリケーションを提供しているが、本当の志(こころざし)はもっと大きい。T2をまだ見たことのない人は多いが、CEOのNova Spivackが以前デモを見せてくれたときに撮ったスクリーンショットの一つが上の画像だ(Web上にスライドもある)。T2で”chicken”を検索すると、やはり、料理の難度、種別、主材料、食餌療法目的、機会別、などなどで結果を絞り込める。レシピーはたまたま、T2の得意技の一つなのだ。世界中の30万ものレシピーのセマンティックなインデクスを持っているから、それはたぶん〔料理レシピーに関する〕最大のセマンティックインデクスだろう。同社はこのほか、ビデオゲーム、映画、音楽、旅行、健康、スポーツ、などなどのカテゴリーについてもセマンティックな検索インデクスを構築中だ。

話がややこしくなるのは、ここからだ。T2の立ち上げは昨年末の予定だった。遅れの原因の一つは、セマンティック検索の難しさだろう。しかし、ほかの理由もある。Radar Networksが“あそこに”M&Aされそうだという噂が、飛び交っている。検索の世界のM&Aで“あそこ”と言えばGoogleかBingだ。Spivackは噂について何も言わないが、T2は順調であり、まだどこにも技術をライセンスしていないと言っている。今週初めに彼は、どういう意味か分からないが、“Googleのカフェテリアは今でもいいね”とトゥウィートした直後に、“けったいな”会議につきあわされたとトゥウィートした。そしてBingがレシピーの機能を立ち上げたあと彼は、謎のようなトゥウィートを送った:

1年後にGoogleとBingは「多面的検索」の優劣をめぐって激しく戦っているだろう。お楽しみに。

この曖昧なトゥウィートの真意は不明だが、Spivackは検索サイト会社のCEOだから、Googleやそのほかの大手検索エンジンの連中と会って、彼のセマンティック検索技術のライセンスや、そのものずばりの会社売却に至るまで、いろんなことを話し合ったと取るのが妥当だろう。いずれにしても、GoogleとBingの両者がセマンティック検索に真剣な関心を持っていることは確実だ。レシピーの検索を見るかぎり、BingのほうがGoogleよりも先にいるのかな。

セマンティック検索は両者とも、作るか買うかを決めなければならない。Bingのレシピー検索はパートナー〔Radar Networks?〕からのフィードとタグを使っているだけで、セマンティックインデクスは使って/作っていない。だからこの世界の本当の主役はRadar Networksで、同社は2006年以来総額$24M(2400万ドル)の資金を調達している。4つの特許を持ち、出願中は20以上ある。Radarがやっていることは要するに、Web上の各ページに対する巨大な構造化データベースを構築することであり、それによってページに含まれている情報を、明確に定義されたいくつもの“切面(facets, ファセット)”に分解する。レシピーの場合それは、材料、料理所要時間、料理の難度、等々々々といった切面だ。ビデオゲームなら、タイトル、デベロッパ、キャラクターなどなど。しかも構造化データベースだから、ビデオゲームの”Star Wars”から”“Star Wars”のレシピーにジャンプできる。関連項目がすべて、セマンティックインデクスの中で互いにリンクされている。

Radarは、いろんなカテゴリーにまたがってそういうインデクスを構築中だ。各カテゴリーにそれ自身のオントロジー、つまりそのカテゴリー内のものごとを記述する切面の集合が必要だ。Radarはオントロジーも自分で作っているが、同時に、Webマスターたちが貢献できるようにオントロジーのSourceForgeも作りたいと考えている。Radarが作ったツールを使うと、Webマスターは自分のWebサイトに関する切面オントロジーを作ってRadarに提供できる。たとえば映画に関するサイトなら、WebマスターはRadar製のブラウザプラグインを使ってタイトル、出演者、監督、リビューなどをマークする。するとRadarはそのテンプレートをそのサイト全体に適用する。GoogleやBingが同じやり方をするなら、Webマスターたちは自分のセマンティックインデクスを訓練してより深いリンクを作り、SEOの効果を上げていくことに、本気で取り組むだろう。

というわけで、レースはもう始まっている。

〔訳注: “セマンティック(semantic)”とは“意味的”という意味だから、この記事に説明されている複数の事項を横断リンクする(主にグラフ構造の)ヨコヨコの関係プラス、“概念とそのインスタンス(のそのまたインスタンス)”というタテタテのリンク(主にツリー構造)が重要です。それがないと、“被害者数万人規模の自然災害”から“ハイチ地震”が出てくるとは限らないし、“巨大海洋生物”から“大王イカ”が見つかるとは限りません。いずれにしてもセマンティックインデクス(あるいはセマンティックタグ集合)作りは、基本的な部分で、優秀な人びとによる人海戦術を避けて通れません(人間の主観が入ることも避けられない)。〕

[原文へ]
[米TechCrunch最新記事サムネイル集]

(翻訳:iwatani(a.k.a. hiwa))