video search
text
spoken word
mobento

ビデオのスピーチを検索するMobentoは聞き取りに人を使わないのが自慢

次の記事

Microsoftがブラウザ選択画面の提供を2800万のユーザに対し怠る–EUが調査を開始

mobento-lead

それは2006年に始まったが、しかし今でもビデオ中の音声(言葉)のインデクシングは技術的チャレンジだ。たとえばTechCrunch DisruptのファイナリストにはKoemeiがいた。そして今日(米国時間7/17)登場するMobentoは、検索語が話されているビデオを見つけるだけでなく、その言葉が現れるタイムラインも教えてくれる。

ファウンダのSumner Murphyは過去に起業経験もある技術者だが、その彼にとってもオーディオのインデクシングは新しいチャレンジだ。ニューヨークとロンドンを行ったり来たりしているMurphyは、それまでニューヨークでコンサルタント企業を経営し、主に教育方面のWeb開発を手がけていた。Mobentoも対象は教育で、“教育と技術の交差”を会社のビジョンとしている。同社のFAQには、“テクノロジは今よりももっと強力に教育に奉仕できるはず”、と書かれている。創業は2011年の12月で、Murphyは3名のデベロッパとデザイナを起用してサイトを作った。今はスタンフォード大学の講義やKhan Academyのビデオ教材、TEDの講演ビデオなどを中心に250本ほどのビデオをインデクシング済みだ。

私個人のユーザ体験から言うと、だいたい同社の宣伝どおりに使える。たとえば”water”を検索した結果の一つがこれだ〔画面右側に”water”が見つかったビデオのサムネイルが10本ほど表示される〕。タイムライン上のブルーのラインをクリックすると、話者が”water”と言った瞬間が再生される。

Murphyは今旅行中だが、メールで、Mobentoは2012年1月にシード資金を調達したが額と投資家は非公開である、と言ってきた。投資家は、AngelListにも載っていないそうだから、見当もつかないね。

Koemeiのような書き起こしサービスではない。また音声聞き取りに人力を使わない。翻訳は自動的に行われ、インデクシングもすべて機械生成だ。音声の品質が良ければ、有意キーワードの90%を取り出せるそうだ。しかも今後は、もっと改良されるとか。

Mobentoはこれを、初出のテクノロジと言っているが、しかしこれと完全に同じものではなくても、ビデオの音声をインデクシングする試み(や書き起こしサービス)は過去にもあった。それらは、企業用ものもあれば、研究段階プロジェクトもあり、あるいはGoogleには、テキストに書き起こしてからインデクシングする取り組みがあった。そのほかHuluには字幕検索があり、ビデオ検索のあるビデオプラットホームLimelightがあり、失敗例もあった。でも競合について質問するとMurphyは、“現在のところ他の誰もこのような種類の検索を提供していない。ただしYouTubeやGoogleのような、メタデータ〔タグなど〕を使うビデオ検索ならあるが”、と答えるのみだ。むかつく男ね。念力移動でも発明したのでないかぎり、ほかの人たちの努力も、認めたほうがいいわよ。無視するんじゃなくて。と言ってみたけど、インタフェイスがとてもユーザフレンドリであることは、過去の作にはなかったかもね。

さらにまたMobentoは、Web全体を検索しない。自社でインデクシングした特定のビデオライブラリだけだ。同社は、ビデオプロバイダたちと提携して彼らのビデオも検索対象にしたい、と考えている。Sumnerの説明では、“TEDやKhan Academyのような良質な教育ビデオを提供しているところと提携したい”、という。“収益はほかのビデオコンテンツオーナーにうちの技術をライセンスすることから得たい。彼らのビデオライブラリが、より効率的に検索できるようになるからね”。

サービスのソフトロンチは金曜日(米国時間7/20)だ。Sumnerによると、今、そのほかの教育関連サイトともコンテンツの利用について話し合っているそうだ。それも、今後のお楽しみね。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))