%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%81%AE%E8%A6%81%E7%B4%84%E3%82%92%E8%87%AA%E5%8B%95%E7%9A%84%E3%81%AB%E4%BD%9C%E3%82%8BTextTeaser%E3%81%8C%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E3%81%AB%E3%81%AA%E3%81%A3%E3%81%A6%E5%86%8D%E5%87%BA%E7%99%BA

テキストの要約を自動的に作るTextTeaserがオープンソースになって再出発

テキストの要約を作るためのAPI TextTeaserは、昨年10月に本誌TechCrunchも紹介したが、これからはオープンソースになってGitHubで入手できる。作者のJolo Balbinによると、オープンソースにすることを決めたのは、とくにAPIのスケーラビリティの問題にぶつかったからだ、という。

そこで彼はAPIを取り下げ、TextTeaserを書きなおして、その自動要約プロセスの高速化を図った。そしてデベロッパには二つのプランを提供する。ひとつは、記事1000件の要約につき12ドル。もうひとつは企業向けに、記事を保存する専用のサーバを提供して月額料金250ドルだ。このプランでは記事を要約するたびにTextTeaserがテキスト中のキーワードを学習し、それによってその後の要約結果を改良する。

“この場合はユーザがTextTeaserを教育して、自分好みの要約ツールへと育てる。ユーザはカテゴリや記事のソース(出所)を教えてやることによって、要約のクォリティをアップする。今後は、各キーワードに重要度の重みをつけたい”、とBalbinは説明する。

GistなどのニューズリーダーアプリがTextTeaserを統合している。Balbinは、金融や医療や法務などの専門的なドキュメント向けに最適化していきたい、と言っている。これらの分野のドキュメントは、長くて難解であることで悪名高い。

TextTeaserの仕事ぶりを見てみたい人は、この“The Hunger Games”の要約や、Balbin自身のブログ記事をご覧あれ。

画像: Flickr/Mo Riza; Creative Commons 2.0のライセンスによる

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

広告

blog comments powered by Disqus

コメント

Shun Usami
mikanの先行登録を開始しました。毎週10名の方が抽選で、mikanの先行インストールできます。詳…
Ichiro Mizoguchi
『家にいることを感知したらスリープして電池を節約する』はなかなかいいアイデアですね。猫飼ったことない…
Kenshin Fujiwara
手前味噌ですが、フォローアップ記事書きました↓関西で米国式のアクセラレータを立ち上げみて学んだことh…
フォロー

新しい投稿をメールで受信しましょう。

Join 118 other followers