Pluggd

Pluggd、podcastを分節化して検索可能に

次の記事

Attensa 2.0、OutlookのRSSフィードとマルチメディアに対応、しかも無料!

Seattle based podcast discovery and management service シアトルに拠点を置くpodcastの検索・管理サービスPluggd は今週末、DEMOで重要な新機能を発表する。この機能は、音声認識とセマンティック分析(意味論的解析)を統合し、ユーザーがトピックを検索すると、ユーザーの嗜好と関連するオーディオファイルに飛ぶことができるようにするもの。単なる音声認識だけの技術ではない。これはマルチメデイアコンテンツをさらに細かく分節化して、われわれが利用するメディアをいっそうコントロールしやすくするという。最近登場したトレンドの実例としていちばん説得力があるサービスだ。ユーザーは単に自分が望む内容が利用できればよいわけでない。自分が望むような方法で利用したいのだ。

“Hear Here”と呼ばれる新機能は、今週末の時点では単一のテスト用ファイルだけを用いてデモされる。しかしCEOのAlex Castroによれば、「開発チームのメンバーはAmazonやMicrosoftのような巨大分散コンピューティング環境を相手にした経歴があるのでスケーリング(については問題ない)。むしろいちばん困難な部分―関連性の判定を最初に取り組んだ、ということだ。Pluggdの目標は今年中に数十万のpodcastを、オリジナルの製作者の手助けを一切借りずに解析し、検索可能にすることだ。 Castroは音声認識技術の研究を17歳の頃から始め、ベル研究所Bell Labsでも続けてきた。

TechCrunchでは、Pluggedがこの6月にスタートしたとき最初に紹介した。この会社の基本的なサービスのセットもなかなか素敵だが、今回のこの機能がベストだ。 Pluggdはすでに10万人のユーザーを持ち、月間のユニーク訪問者の数は計画をはるかに上回る伸びだという。社員は常勤6人、パート6人の体制。エンジェル資金をいくらか集めたが、さらに資金調達の努力中。この新機能では膨大なデータ処理をしなければならないので、そのための資金が必要とされている。

新しい機能がどのように動くのか紹介する。 オーディオファイル中の特定のテーマに関連した部分だけを聞きたい場合、ユーザーは検索語を入力する。Pluggdはその検索語が出現する位置だけでなく、そのファイル中で検索語に関連ある単語 の出現も検索する。ファイル中の関連性の度合いは時系列上のヒートマップとして表示される。すなわち、いちばん関連性が高い部分は赤で、少し関連性がある部分は緑で、まったく関連性がない部分は青で表示される。時系列上で関連性が示された点にカーソルを乗せると、ユーザーの指定したトピックに関連性ありとPluggd側で判断した単語が表示される。

ユーザーがその関連性が表示されたポイントでクリックすると音声が再生される。またファイルのその部分にタグづけしたり説明を書き込んだりして共有するオプションもある。 Castroはこの(関連性解析)データをPluggedサービス内に囲い込むつもりはなく、無料で提供するつもりだという。まず最初にこの機能はオーディオファイルを対象とするが、やがて同一技術を利用してビデオファイルにも対象を広げようと計画している。Podzingerサービスはpodcastにすでに音声認識を用いているが、ユーザーの検索語を意味論的に解析してはいない。Blinkxはvideo分野でやや似たサービスを行っているが、Pluggdは音声認識だけでなく、さらに検索結果の質を高める工夫がされている。

Castroによれば、他のベンダーからライセンス提供を受けた音声認識エンジンをさらに強化するために言語モデルを社内で開発したそうだ。Pluggdは常時ウェブをクロールして収集したサンプルに基づいてどんな単語がいつも相互に関連して用いられているかを探索・発見している。音声認識された結果は、このプロセスに送られて関連性を判断される。たとえばpodcastでRoyalsを検索すると、PluggdはbaseballやKansas Cityという単語も関連があると判断して表示してくれる。(訳注:メジャーリーグの球団カンザスティ・ロイヤルズがあるため)

短いビデオクリップの使用が爆発的に普及していること、Google Videoに(アップロードすると)パーマリンクのURLが自動的に割り振られること、ローンチは数ヶ月先だというのにViddlerに大きな関心が集まったこと、Hummer Winbladが投資しているWidgetboxマーケットプレースの人気、など、コンテンツを分節化して利用する傾向は大きな流れになっている。これは当然だ。コンテンツの分節化―あるいは呼び方はどうでもいいが―はユーザーのウェブの使い勝手を大幅に改善する。Pluggdの新しい検索機能はまさにここ何年にもわたってマルチメディア検索においてセールスポイントにできるたぐいのテクノロジーだろうという気がする。

[原文へ]

“Pluggd、podcastを分節化して検索可能に” への2件のフィードバック

  1. […] Pluggdが見せていた新テクノロジーの「HearHere」は、音声認識とセマンティック分析(意味解析)を使って音声ファイルの中からキーワードや関連する項目を探しだし、ヒートマップ(温度分布図風にデータを図式化したもの)に表示して、ポッドキャストの聞きたいところまでスキップできるというもの。さらに詳しい内容と画面イメージはPluggdについてのこの記事に書いた。 […]

  2. […] 最近取り上げた、PluggdのHearHereプロジェクトも市場に出る時には同じようなことをやるつもりらしい。これまで見たポッドキャスト広告の戦略はこうしてコンテンツを解析するものから、地域ターゲティングするものまでいろいろだ。 […]

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中