The Huffington Post
Adaptive Semantics

1日10万のコメントをフィルタ〜分類するためにHuffington PostがAdaptive Semanticsを買収–技術の多面的応用を目指す

次の記事

ペロリと舌を出せば顔認識エンジンが作動してブックマーク登録。そんなブラウザを本気で開発している人はいないと思うよ

大手ブログニュースサイトHuffington Post…各専門分野のプロフェッショナルブロガー3000名あまりを擁す…が、初めて企業買収をした。小額のキャッシュで買ったその会社は、別のブログやメディアサイトではなく、Adaptive Semanticsと呼ばれる純粋な技術系(アプリケーションサービス)企業だ。この、人が二人しかいない会社は、Huffington Postが毎日10万件にものぼるコメントをモデレートするために使っているセマンティック分析エンジンJuLiaを提供する。

買収の前から、Huffington PostはすでにAdaptive Semanticsの唯一最大の外部投資家で、2009年4月に20%の株式を購入した。Adaptive Semanticsの二人のファウンダElena HaliczerとJeff ReveszはHuffington Postの社員になって、同社のソーシャルニュースとコミュニティ技術のR&Dを監督する。買収価額は公表されていない。

“弊社にとってテクノロジはきわめて重要だ”、CEOのEric Hippeauはそう言う。”今回のケースでは、テクノロジが弊社のコンテンツにとって意味を持つ。モデレーションを超効率的にやってくれるのだ”。毎月300万にも達するコメントをモデレートするためには、ツールを使った自動化しかほかに方法はない(ただし約30名のプロフェッショナルな人間モデレータも仕事をする)。

Adaptive Semanticsの技術を、CNN、Newsweek、Disqusなどもオンラインのコメントをモデレートするためにライセンスしている。これらの企業は、別のソリューションを探さなければならないかもしれない。”契約は尊重するが、契約の更新はあり得ないだろう”、とHippeauは言う。ほかのニュースサイトやニュースサービスに技術をライセンスすることを、同社のビジネスにするつもりはない、ということだ。

Reveszによれば、JuLiAは”人間が監督する機械学習(supervised machine learning)”を利用し、不適切なコメントやスパム、口汚い言葉などを選り分ける。人間モデレータたちが数百のコメントに手作業でタグを付け、それをセマンティック分析エンジンに食べさせて、すべてのコメントに対しそのタグ付け基準を適用していく。それは現在進行形のシステムで、エンジンは毎日日を追うごとに優秀になる。汚い言葉や憎悪の発言を検出するだけでなく、いろいろなトピックのエキスパートと思われる人を、コメントの内容から見つける。

コメントのモデレーションと読者のお行儀を正すことだけでなく、このシステムのセマンティック分析技術は、読者の中から(今後の)良質な寄与貢献者(コントリビュータ)を選り分ける手助けもする。”この技術には、応用対象応用分野が限りなく多数あると確信している”、とHippeauは言っている。

Huffington Postは何よりもまずソーシャルなニューズネットワークだと自称しているが、したがってその成功は読者がさまざまな形で参加することにかかっている。それはたとえば、コメントを残す、記事をTwitterやFacebookからWeb全域的に共有する、といった参加の形だ。そのために同社は最近、読者褒賞バッジというものを始めた。褒賞の対象、すなわち優れたコメントを見つける仕事を、JuLiAが助ける。たとえば、アフガニスタンやイラク、Hillary Clintonなどに関する記事に大量のコメントを寄せる人は、「外交政策賞バッジ」をもらうかもしれない。これはあくまでも仮定の例だが、JuLiaのような意味的分類技術(==セマンティック分析技術)によって、複数の部門別の賞を設けることが可能になるのだ。

また、記事のレコメンデーションにも利用できる。”Huffington Postは同社のソーシャルグラフを多面的に活用したいと願っている”、Haliczerはそう語る。”人と人がつながり、そして、人とコンテンツがつながる。そのようなコンテンツグラフを見れば、人びとにコンテンツをレコメンド(recommend, 推奨)できるようになる”。Huffington Postが今後この技術をどう扱うにせよ、今回それを自社で所有したいと願ったことは、相当に重要と思われる。

[原文へ]
[米TechCrunch最新記事サムネイル集]

(翻訳:iwatani(a.k.a. hiwa))