URLとコンテンツに高速でタグ(カテゴリー、実体情報など)を付けるSpeedi.ly–URLの分類整理を自動化
by Michael Arrington on 2009年11月21日

Keith Teareが今日(米国時間11/20)のリアルタイムクランチアップ(RealTime CrunchUp)に現れて彼の最新プロジェクトSpeedi.lyを見せてくれた。

Speedi.lyは一体何をするのか? たった一つのことを、とても上手に、しかも十分なスケーラビリティを伴ってやる。Speedi.lyはURLからコンテンツを取り出して、それを分析する。分析を非常に高速に行い、そのコンテンツのメタデータを出力する。言語やカテゴリー(トピック、キーワード)などだ。で、このメタデータを得るという仕事こそが、Robert Scobleの言うSuperTweet〔仮訳: 超つぶやき〕なのだ。

以下は、Skype/eBayの買収をめぐる本誌の記事をSpeedi.lyが分析した結果だ:

Speedi.lyは、これはテクノロジに関する記事だと正しく判断している。人間の介入はいっさいなく、いきなりあてがわれたコンテンツを分析してこの結果だから、悪くない。実体(entity, entities, エンティティ)欄はあるが、今はまだ空白だ。ここもすぐに、出力されるようになるだろう。〔entities欄にはたぶん、Skype、eBay、VoIP、企業買収、などの実体項目が入るのだろう。〕

次の例は、SF Chronicle〔新聞: サンフランシスコクロニクル〕のこの記事を、正しくスポーツのカテゴリに入れている。

なぜこれが役に立つのか? TwitterやFacebookなどの上では毎日大量のURLが受け渡しされているが、それらにはメタデータがまったく付いていない。Topsyなどの検索エンジンはつぶやきやステータスメッセージなどのテキストをいちいち自分で読んでコンテキスト…カテゴリーなど…を判断しなければならない。

DiggやDeliciousでは人間がURLの山をカテゴリー分けしている。しかしSpeedi.lyのようなサービスを使えば、即座にページを格付けすることすらできるだろう。

自分で試してみたい人はhttp://classify.speedi.ly/funへ行って、login:customer、password:logmeinで入れる。すごい!と感心するほどのものではないが、こういうものの利用価値…とくに企業での利用…が分かる人にはよーく分かるだろう。

Speedi.lyのようなことを狙っているサービスは、ほかにもある。今週本誌が取り上げたFacteryは、共有されているURLを見て、その中心的な事象を取り出す。そしてThompson ReutersのOpenCalaisには18000人の顧客がいる。

今日の午後Keithにインタビューしたときのビデオが、下にある。すでに一社と契約して、そこのURL分析をやっているそうだ。

楽屋裏情報: ファウンダのKeith TeareLouis Monierはぼくの友だちで、仕事上の関係もある。KeithはTechCrunchの株主だ。

[原文へ]
[米TechCrunch最新記事サムネイル集]

(翻訳:iwatani(a.k.a. hiwa))

  • http://tyudon.com/blog/?p=5724 URLとコンテンツに高速でタグ(カテゴリー、実体情報など)を付けるSpeedi.ly–URLの分類整理を自動化 « とっても! ちゅどん(雑記帳)

    [...] URLとコンテンツに高速でタグ(カテゴリー、実体情報など)を付けるSpeedi…. URLとコンテンツに高速でタグ(カテゴリー、実体情報など)を付けるSpeedi.ly–URLの分類整理を自動化 [...]

  • http://f.daccot.com/2010/02/28/1850/ タグとカテゴリーってどこが違うのさ? at 適宜覚書-Fragments

    [...] えー。なんじゃそれ。総論というかやりたいことは分かる(一応認識が隔絶している訳ではないことは分かった)けど、そんなの手間暇かけるの嫌だよ。URLとコンテンツに高速でタグ(カテゴリー、実体情報など)を付けるSpeedi….なんてのを見ると、こんな面倒くさいこと人間のするこっちゃないわと思って機械にやらせることを考えるまっとうな神経の人もいるんだと安心したり…。でも、現実的な話、わざわざ人間にやらせるのはコンテキストから妥当な要素を抜き出すっていう部分は機械がいまいち苦手だからなんだろうなあと察しがつくし、しょうがないのかなあと溜息ついたりもする訳で…さあ、どうしたもんかねえってことで文頭に戻る。orz [...]