今週、
Xeroxは検索市場への参入を発表した。製品は「FactSpotter」と呼ばれる文書検索ソフトウェアで、通常のキーワード検索に比べて一段と進歩した技術だという。
FactSpotterは文書から柔軟に意味を抽出する「テキスト・マイニング」技術に加えて、ユーザーが日常言語で検索を行なえる言語エンジンを備えている。FactSpotterは単にキーワードを検索するだけでなく、そのキーワードが含まれている文脈も解析する。
Xeroxによると、FactSpotterは文書に使用されているフォーマット、タイプ、保存されている場所、言語を選ばず、しかも人間が考え、話し、質問するのと同様の方法で内容を精査し、数千もの関連性の低い結果を返すのではなく、ひとにぎりのもっとも関連性の高い結果だけをハイライトするという。
XRCEの構文解析と意味論研究グループのマネージャー、Frederique Segondは「このツールは文書の内容を深く掘り下げ、そこに含まれているコンセプトとそれらの相互関係を抽出することができるので非常に正確な検索が行なえる。つまり文脈を十分理解しながら検索するので、ユーザーに対して関連性の高い文書を示すことができるだけでなく、特定の文書のどこに求める情報が存在するか、その正確な場所をハイライトすることができる」と述べた。
これらはいずれも魅力的に聞こえるが、FactSpotterは近い将来われわれがブラウザで検索できるような場所に提供されることはなさそうだ。Xeroxは来年、FactSpotterを有料の「Xerox訴訟支援サービス」の一環として提供する予定で、広く一般に公開する考えはない。そんなことをしている間に、またスティーブ・ジョブズのような人間が現れて、コンセプトをそっくりさらっていって〔過去にそうやってMacintoshを作ったように〕今度は新しいGoogleを作ったりするのではないだろうか。歴史は往々にして繰り返す。
[原文へ]




