radar-networks

キーワードサーチは限界に到達しようとしているのか?

次の記事

Skypeが中途半端な携帯電話向けサービスのテストを開始

keyword-search-slide.png

Webが多くのデータで膨らむのにしたがって、これまでの主力だった全てのデータを精査していく―キーワードサーチ―検索方法はいずれ限界を迎え、ワンクリックで望みの検索結果が配達される事はなくなるだろう。実のところ、一部の人々はキーワードサーチの検索結果は既に上記のNova Spivack氏の表が示すように、減衰状態に陥っているとしている。Spivack氏はセマンティックWebの新興企業Radar Networks の創設者、CEOであり、現在彼等の進めるセマティックサーチがこの問題を解決できると提言している。Googleを使って何かを検索するときに、「1年前よりも、現在の方が検索結果を得るのに時間がかかる」という感覚を経験したことがある人なら、彼の主張の一部が事実だという事に気づくはずだ。

internet-user-chart-tiny.png彼曰く「キーワードサーチも悪くはありません。しかし、爆発的な情報量の増加が続く場合には、私達にはより有効な検索手段が必要なのです。」現在、約13億人の人々がインターネットを利用し、約1億個のWebサイトが全世界で活動中だ。この先、さらに多くの人々がWebに参加すれば、Web上の情報量はそれを求める人々に対応するために飛躍的な増加を続けるだろう。新しい参加者自身も、個人情報や、社会情報を載せずにはいられなくなるだろう(FaceBook、MySpace、Wikipediaなど)。

ある時点で、何十億というページの全てを精査する「キーワードサーチ」の検索方法は効果的では無くなるだろう。これは、ことわざで言うところの「干草の山から1本の針を見つけ出す=至難の業」と言うことだ。そしてこの干草は1秒ごとにその大きさを増している。

いずれ、「キーワードサーチ」の検索エンジンは検索結果として、干草の山を私達に送りつけてくるでしょう。しかし私達が実際に探しているのは、その中に有る1本の針なのです。キーワードサーチ式の検索方法の問題点として、Googleの採用しているような「引用数の多いサイトのみが上位検索結果に表示される」という点があります。膨大な量の検索結果を渡されても、あなたが探しているページ―あなたが探している1本の針―は他のページからの引用は多くないかもしれない、そのために検索結果の最初のページには表示されないかもしれないという事が起こりえるのです。

では、我々はどのようにして現行の「キーワードサーチ」やGoogleのランキング以上の検索方法を手に入れることが出来るのだろうか? これまでに、多くの検索方法が代替手段として挑戦されてきた、「ソーシャルサーチ」、「タグ」、「自然言語処理」、「統計」、「オープンサーチ」、「セマンティックサーチ」、「人工知能」。これらの検索方法は、大なり小なり問題を抱えている。例えば「タグ方式」の場合、検索結果が見難い上に、結果に一貫性が無い。「自然言語処理方式」の場合は検索に高度な解析能力が必要とされ、検索結果を見積もることも難しい上に、組織的なデータでは無い。ただ、「セマンティックサーチ方式」がこの中では最も有望な代替方法かもしれない。しかし、この方式を採用するには、基本的に現存する全てのWebページを書き直す必要がある。

Spivack氏はこのキーワードサーチの問題の解決方法について、今月の初めにアムステルダムにて開催されたNext Web conferenceにおいて解説した。この解説は、私にとって今までで最も明快なセマンティックWebの解説だった(参考までに、彼のスライドショーを下に貼って置く)。セマンティックWebは、(もし大規模に導入された場合)コンピューターがWeb上の膨大なデータの中から「セマンティック=意味」を抽出することを補助する標準規格でしかない。既存の乱暴なソフトウェアによる検索の代わりに、データの中に知能を埋め込むのだ。Spivack氏曰く「利用者が必要なデータは、データ自身によって運ばれてくる」との事だ。間抜けなソフトウェア、賢いデータ。これこそが、例え何十億というWebページが作られてもそれらを検索することが出来る解決法だ。

Spivack氏の発言のポイントは


賢いDataをWebの代わりに使う。

あなたはWebをデータベースへと変化させ、自分の持っているデータすらもその一部とするのです。そして、あなたのデータが WordWide Detabase (WWD)の一部となるのです。セマンティックWebが、WebページからWebページに移動するように、あなたをデータからデータへと移動させるでしょう。

セマンティックWebの導入までには多くの障害がある。しかし、セマンティックWebにはそれだけの努力を払う価値があるだろう。間違いなく言えるのは、検索エンジンは進化する必要があり、GoogleやYahoo、Microsoftも同様に進化が必要だということだろう。もちろん彼等には、セマンティックサーチに限らず、これらの提案や、複数の提案のコンビネーションの中から最も効率的な方法を採用してもらってかまわない。

問題は、彼らがキーワードサーチの検索方法に執着せずに、次世代の検索方法に進むことが出来るかどうか?ということだ。

[原文へ]

(翻訳:E.Kato)

“キーワードサーチは限界に到達しようとしているのか?” への4件のフィードバック

  1. […] original article « SQLインジェクションが止まらない、50万ページ以上が改ざん 第二世代iPhoneはデザイン変更、3G、GPS搭載、やや厚め – Engadget Japanese » […]

  2. […] 2. キーワードサーチは限界に到達しようとしているのか?(4/26) […]

  3. […] キーワードサーチは限界に到達しようとしているのか? もうだいぶ前の記事ですが、ソーシャル検索の将来を考える上で非常に有益な記事だと思うので紹介します。 現在GoogleやYahoo!などが採用しているキーワードサーチは限界が来て、セマンティックやソーシャルな検索に切り替わるのではないかという話です。 Web上の情報量が多くなりすぎて、探しづらくなっているというのが原因とのことです。 実際に少しずつ切り替わっていくと思いますが、キーワードサーチがなくなる事は当分なさそうです。なぜかというと、言葉の意味を調べるなどの最大公約数的な検索を行う場合は、キーワードサーチはすごく有効な手法だからです。 このように使い続けられる部分もありつつ、一方でキーワードサーチだとなかなか目的の情報にたどり着けないので、他の検索方法を用いるという流れになっていくのではないでしょうか。 セマンティックとソーシャルを組み合わせることで、より精度の高い検索エンジンを作ることができるようになっていくと思います。 […]

  4. […] 検索の次の重要課題は、Web上に散乱しているバラバラのデータに、一定の有意義な構造を持たせて提示することだ。たとえばデータベースという構造なら、あらゆるデータに便利なラベルがついていたり、しるしがついていたり、種類別に分類されていたりする。Web上のデータの爆発的な増加に伴って、従来のキーワード検索は限界に近づきつつある。膨大なデータに意味を持たせる一つの方法が、それらに構造を与えることだ。Googleはこの問題に、Google LabsのプロジェクトGoogle Squaredで取り組もうとしている。このプロジェクトは今朝(米国時間5/12)、Marissa Mayerが同社のSearchologyのブリーフィングで言及していた。 […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中