新検索エンジンWolfram Alphaをテスト―可能性は感じられたがまだ限界多し
  • 5 コメント
by Erick Schonfeld on 2009年5月18日 append.gif この記事をBuzzurlにブックマークする

みんなが大騒ぎしているWolfram Alphaだが、この新しい検索エンジンについてはGoogleのSergey Brinさえ注目している。月曜日には一般公開される予定だが、こちらにどういうことができるか機能の一部を紹介したスクリーショットが公開されている。

ここ数日、私はWolfram Alphaのテストを続けている。結論からいえば、たしかに感心したが、驚くほどではなかたったというところだ。Wolfram Alphaの開発はあきらかにごく早期の段階にある(だからアルファと名づけられている)。潜在的な能力は画期的だと思われる。少なくともステルスモードで開発され、話題になったものの ローンチと同時につまづいた Cuilのようなことにはなるまい。しかし、Wolfram Alphaをめぐっては、例によって「Googleのライバルか」と報道が過熱している。またWolfram側でもセマンティック処理のためにスーパーコンピュータを購入したことを発表した。ここは真剣かつ公平な評価が必要だろう。Wolframでは公式ブログで「今までもっとも洗練されたアルゴリズムの開発に成功した」と主張している。当然、期待はきわめて高くなる。

Wolfram Alphaはウェブのページを評価して検索フレーズにもっとも適合する結果を返してくるタイプの普通の検索エンジンではない。むしろ、Wolframはデータベースに膨大なデータ解析して蓄積し、質問に対してこの絶えず成長するデータベースから独自のアルゴリズムによって答えを生成する。このアルゴリズムは著名なコンピュータ科学者であるStephen Wolframが自分で開発した数学アプリケーション、Mathematicaをベースにしている。Wolfram Alphaが回答を見つけた場合、その内容は目を見張るようなものである場合がある。科学者、技術者、数学ファンはWolfram Alphaが大いに気に入るだろう。この検索エンジンは通常の演算はもちろん、回帰分析、軌道計算、流体力学まで処理可能で、さまざまな分野の詳しい専門的情報が利用できる。ところが残念ながら、初歩的な平凡な質問に対しては最適な回答ができない場合が多い。

たとえば、あまり有名でない人名の検索が苦手だ。私は自分の名前で試してみたが、なんとオクラホマ州Erickとドイツのザクセン州のSchonfeldという2つの町の間の距離が回答として返ってきた(5248マイルだそうだ)。

Techcrunchを検索したが、何もヒットしなかった。上場企業の検索はもう少しうまくいき、Googleの場合、株価と財務情報が得られた。Facebook を検索すると、Alexaによるサイトのトベージビューや毎日の訪問者数などのデータが返ってきた(もっともAlexaはこの種の情報に関して最良のソースとはいえないのだが)。「Facebookの会社価値はいくら?(How much is Facebook worth?)」と入力すると、すっかり戸惑ってしまい、「Wolfram Alphaはあなたの入力をどう処理していいかわかりません」と表示されたのはおかしかった。実のところ、この質問への答えは(コンピュータに限らず人間でも誰一人)知らないのだが。

答えが出る質問の場合はどうか? 「髪の毛は1日にどれくらい伸びるか?(How fast does hair grow?)」と入力してみると、0.4 mm/日、という答えが返ってきた。おまけに、5nm/秒、100mm/年という数字も表示された。「ニューヨーク市から月までの距離」については「ただ今現在、250,842マイル」だそうだ。Wolfram Alphaは「生命、宇宙、その他すべての意味」は「42」だということも知っていた(これはユーモアSF、Hitchhiker’s Guide to the Galaxy に出てくるエピソード。Google検索でも分かる)。〔以下英文〕

Even when Wolfram does have an answer, it is not always the best one. For instance, a search for “new york state unemployment” brings up a 4.5 percent unemployment rate from 2006 (see screen shot above). That answer is completely useless if you want to know the current unemployment rate in New York State, which is 8.1 percent and which turns up as the first result on Google. I chose this search because Google recently added some basic structured data to searches for U.S. unemployment and population. Google pulls these results directly from the Bureau of Labor Statistics, whereas Wolfram can only compute information based on the data it has already ingested.

When I do a search for “New York versus California,” Wolfram Alpha comes up with a wealth of trivia, including population, state capitals, the dates they joined the Union, their locations highlighted on a map, land area, highest points, lowest points, number of households, number of businesses, median household income, and more. All of this information is great, but is it the best information? Much of the data is from 2002. The population numbers are from 2006. Search for “New York state population” on Google and you get a July, 2008 estimate pulled straight from the U.S. Census Bureau.

Of course, Google doesn’t provide all of the other contextual data in one convenient search result, but its answer for that one variable is better. All Wolfram has to do, though, to beat Google is update its data, right? That is easy enough. It is already an amazing resource and it will only get better over time. But there is a question of scale and approach here. Wolfram needs supercomputers to “compute” its answers. It is not searching for answers that are already out there. Supercomputers are expensive and generally don’t scale cost-effectively. Beyond that is the issue of whether Wolfram can ingest enough data fast enough to always be up to date, versus finding the best, most current answer to any query on the Web. To put it another way, can Wolfram Alpha ever become smarter than the Web? That simply does not compute.

Finally, it is not as though Web isn’t evolving as well. Wolfram needs to store all of the data it sifts through in its own databases because that is how it imposes structure on the data. The Web is messy and unstructured. Yet there is a general movement afoot to impose structure on the data found across the Web. Everyone from semantic search startups to Google itself is making the Web more computable by categorizing the information on it in a way that computers can understand and manipulate more easily. Of course, to the extent that happens, Wolfram Alpha can take advantage of it as well.

In search, whoever can come up with the best answer wins. As promising as it is, that isn’t Wolfram Alpha yet.

[原文へ]

(翻訳:Namekawa, U)

Leave Comment

Commenting Options

Create an avatar that will appear whenever you leave a comment on a Gravatar-enabled blog.

Trackback URL
  • Ads by Overture
  • MediaTemple Logo
  • QuickSprout Logo
  • OpenX Logo
  • Cotendo Logo