apache solr
apache lucene
apache

Webアプリケーションに検索機能を提供するApache Lucene/Solrが大型アップデート

次の記事

AppleのiPad Mini発表イベントは10月23日との有力情報

Apache Solr logo

本日(米国時間10/12)Apache Foundationが、検索ツールセットLuceneと、このツールを使った検索プラットホームSolrの大型アップデート、バージョン4.0をリリースした。中でもとくに目立つのは、Solrが新機能の増設により、より使いやすく、スケーラブルで、よりカスタマイズしやすくなったことだ。

両者は連携的に開発が行われているが、Luceneはアプリケーションに検索機能を容易に導入するためのJavaライブラリ、Solrはユーザ(企業等)がWebサービスとして動かす検索エンジン本体だ。後者は言うまでもなくLuceneを検索の中心的機能として使っている。

Luceneを1999年に創ったDoug Cuttingは、今ではApache Hadoopの作者として有名だ。今ではAOLやLinkedInをはじめ、多くの企業がLuceneを使って自社のWebサービス内の検索機能を構築している。Solrは2004年にYonik Seeleyが作り、カスタムの検索エンジンとして使ったり、あるいはアプリケーションの検索機能としても利用できる(Luceneで検索を構築するよりは簡単)。

Solr/Luceneの今日のアップデートは、とくにスケーラビリティに重点が置かれている。Search Engine Hubによると、とりわけ、スケールアップ(単体能力アップ)よりもスケールアウト(サーバクラスタ拡大)に力点が置かれている。

GoogleやAmazon.comなどがやったことによって、最近はスケールアウトに人気がある。能力増大のために、スケールアップはより強力なサーバを使うことだが、スケールアウトはサーバの台数を増やす。費用効率は後者のほうが良い、と言われているが、サーバのクラスタはセットアップも管理も難しく、とくにデータの分散化が多くの課題をもたらす。

今回のバージョン4.0では、Solrサーバのクラスタをより容易に構築し管理するための一連のツールが新たに導入された。たとえばインデクシングシステムを新しくして、分散環境でもほぼリアルタイムで検索結果が出るようにした。

最初から分散環境を前提とするLucene利用のオープンソース検索エンジンにElasticSearchがあるが、今回のアップデートでSolrはそれと競合することになる。

4.0のそのほかの新機能としては、新しくなったWeb UI、スペルチェッカー、位置データ〜地理的データサポートの改良、などがある。またユーザによるカスタマイゼーションとコントロールが、よりやりやすくなった。

Seeleyが作ったスタートアップLucidWorksは、Solrの商用サポートを提供している。

Apache Solr 4.0 admin screenshot

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))