Google、「Code Search」をお披露目
by admin on 2006年10月6日

codesearch_logo_sm.gifGoogleは「Code Search」を今日(米国時間10/5)スタート。これは、一般公開されているコードを収集しインデックス化することで実現した「ソースコードの検索エンジン」。「新しいこのコード検索エンジンはクロールによって見つけられるどんなコードも検索可能」とGoogleは言う。しかし、私が試みたところ、私自身のサーバーでホストしているコードを見つけられなかった。しかし、このような点は必ず改善されるだろう。他のライバルサイトであるKrugleやKodersに比べて、Googleのコードインデックスはかなり幅広い。例えば、Google Code Searchはopenssl.orgといったオープンソースサイトにあるzipやtarballファイルの内容もインデックスする。一方、その他のサイトはsourceforgeとそれ以外の複数の集中レポジトリからの結果を表示するようだ。

Google Code Searchで最初に気づくのは、検索の際に検索フィールドに正規表現(regular expression)を入力して利用できるということ。それに、豊富なサーチオプションがあり、検索条件を更に絞り込むことができる。Google Code Searchのホームページには、うまくまとめられた「利用に関する手引き」が用意されている。

Google Code Searchを「Krugle」と「Koders」両方と比較検討するためテストをしてみた。テスト用の検索は、“md5 in C”。CでのMD5ハッシュアルゴリズムのインプリメンテーションを見つけるのが目的だ。Googleでは、サーチクエリーでインプリメンテーション言語を特定可能。一方、Krugle、Koders双方共、ドロップダウンメニューからの言語選択が必要だった。KrugleとKodersは、他言語によるインプリメンテーションを結果に含んでいたことからみて、検索結果の言語によるフィルターもあまりうまく機能していないようだ。ここでの問題は、ユーザーが見つけたいと思っているのがシンプルなmd5のインプリメンテーションだというのを検索エンジンは知らないこと。だから、検索エンジンは文字列(ストリング)が合致する結果を自インデックスから表示し、ある結果はとてもお粗末なものになる(例えば、MD5ライブラリーを呼び出す関数など)。3検索エンジン中から、私は、出来の良い純粋なMD5インプリメンテーションは見つけられなかった。見つけられたのは”md5″をストリングに含む多数のヘッダファイルと関数だけだった。

これら全ての検索エンジンは、デベロッパーがコード検索に利用する手っ取り早いサービスになるには道のりは遠い。とりわけ、大半のデベロッパーが普通の検索エンジンを利用して、目的の結果を見つけるのに明敏なスキルがあることを考えるとなおさらだ。”drop-down menu in ajax”というようなフレーズで検索すると、使い物になるような検索結果は何もないだろう。だから、“コード内で、どの特定のストリングを探したいのか分からない”といったデベロッパーにとって検索は難航するだろう。今までの実績からいって、Googleこそがこれらの課題を解決するサービスを提供するのにふさわしいであろう。Googleのメイン検索エンジンとソースコードデータを組み合わせることで、よりよい検索結果につなげられる(例えば、MSDN からのコードサンプルをむしろ簡単にインデックスするのは想像できる)。このことは、更なる技術革新が必要な同分野のスタートアップ企業にとっては悪いニュースのよう。しかし、ここしばらく、新サービスでホームランがなかったGoogleにとっては良い知らせだ。

[原文へ]

  • http://8-p.info/ カトウ

    regular expressions の訳語は「通常表現」より「正規表現」が一般的だと思います。
    あと、「原文へ」のリンクに余計な “E” がついてます。

  • EditorJP

    カトウさん、修正いたしました。どうもありがとうございます。今後ともどうぞ宜しくお願いいたします。

  • http://jp.techcrunch.com/archives/allthecode-launches-new-code-search/ TechCrunch Japanese アーカイブ » AllTheCode、新しいコード検索エンジンをローンチ

    [...] AllTheCode は今日(米国時間2/6)、新しいコード検索エンジンをローンチ、Krugle、Koders 、Google Code Searchといった既存のサービスの仲間入りをした。われわれはGoogle Codeが新しくスタートしたとき、コード検索サービスの現状について書いた ことがある。そこで独自のテストをしてみたところ、どの検索エンジンも満足できる結果を返してこないことが判明した。今日、AllTheCodeの検索エンジンに対しても同じテストを実行してみたが、結果はまちまちだった。たしかにAllTheCodeは適切な関連がある結果も返してよこすが、ユーザーはプログラミング言語の種類などによる絞り込みが一切できない。ローンチと同時に発表されたプレスリリースによると、AllTheCodeの検索結果の表示ランキングはそのコード・スニペット(コード断片)が実装された回数によるということだ。コード検索エンジンとして、これは常識的にみて納得がいく基準だが、前回テストしたときに他の検索エンジンになかった機能である。前回の記事で行ったテストのひとつは、MD5アルゴリズムを実装するコードの検索だった。AllTheCodeの検索結果の最初のページはほとんどがJavaによるコードだった。プログラミング言語でフィルターする手段を探したが見つからなかった(サイトが言うところによると、今だけJavaの検索結果を返しているらしいが)。プログラマーが実際に利用するに当たっては、各種の検索エンジンを併用してみるほうがいい。現時点ではどれかがはっきり特に優れているということはない。逆にいえば、検索エンジンの分野では、まだ誰にもマーケットのリーダーにのし上がれるチャンスが残っていることになる。[原文へ] AllTheCode [...]

  • http://jp.techcrunch.com/archives/20080714google-now-displaying-code-search-results/ TechCrunch Japanese アーカイブ » Google、コード検索の結果をメインページに表示

    [...] Google、「Code Search」をお披露目 [...]