%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%81%AE%E8%A6%81%E7%B4%84%E3%82%92%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E4%BD%9C%E3%82%8BTextTeaser%E3%81%8C%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E3%81%AB%E3%81%AA%E3%81%A3%E3%81%A6%E5%86%8D%E5%87%BA%E7%99%BA

テキストの要約を自動的に作るTextTeaserがオープンソースになって再出発

テキストの要約を作るためのAPI TextTeaserは、昨年10月に本誌TechCrunchも紹介したが、これからはオープンソースになってGitHubで入手できる。作者のJolo Balbinによると、オープンソースにすることを決めたのは、とくにAPIのスケーラビリティの問題にぶつかったからだ、という。

そこで彼はAPIを取り下げ、TextTeaserを書きなおして、その自動要約プロセスの高速化を図った。そしてデベロッパには二つのプランを提供する。ひとつは、記事1000件の要約につき12ドル。もうひとつは企業向けに、記事を保存する専用のサーバを提供して月額料金250ドルだ。このプランでは記事を要約するたびにTextTeaserがテキスト中のキーワードを学習し、それによってその後の要約結果を改良する。

“この場合はユーザがTextTeaserを教育して、自分好みの要約ツールへと育てる。ユーザはカテゴリや記事のソース(出所)を教えてやることによって、要約のクォリティをアップする。今後は、各キーワードに重要度の重みをつけたい”、とBalbinは説明する。

GistなどのニューズリーダーアプリがTextTeaserを統合している。Balbinは、金融や医療や法務などの専門的なドキュメント向けに最適化していきたい、と言っている。これらの分野のドキュメントは、長くて難解であることで悪名高い。

TextTeaserの仕事ぶりを見てみたい人は、この“The Hunger Games”の要約や、Balbin自身のブログ記事をご覧あれ。

画像: Flickr/Mo Riza; Creative Commons 2.0のライセンスによる

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

広告

blog comments powered by Disqus

コメント

Atsuhiro Teshima
単語学習では、なぜか国際展開を全然しないiKnowがレベル高いと思うのでこちらにも頑張って欲しい。英…
名無し
単語を見る→知ってるか知らないかを判別する→それを繰り返して→知ってる単語を増やすという流れですよね…
そーみ
覚えてもすぐ忘れそう。まあ、繰り返しが大切だね。
Ichiro Mizoguchi
なぜにmikan という名前なんでしょうか。学習効果高そうなので、名前付けの理由気になりますねぇ。