TC50:Scobleが、VideoSurfは「最悪じゃない」と言明

次の記事

TC50: BirdpostとCloset Couture,鳥のためのSNS二つ

ビデオ検索は未解決の問題だ。VideoSurfは、この問題に本格的画像認識テクノロジーを応用することによって、テキストベースの検索手法で得られる以上に意味のある結果を探しだす。TechCrunch50のデモで、このスタートアップは、番組『アントラージュ』の一シーンを探すところを見せた。番組を絞り込むと、登場人物全員のサムネイルが表示され、左上から重要度の順に並べられる。人物をクリックすると、登場する全シーンと、関連するシーンが表れる。

検索は、キーワードからでもガイドに従っても始められるが、すぐにビジュアルな方式に切り替わる。サムネイルをクリックすると、ビジュアルな目印に従ってシーンの中の正確な時点に飛んでいく。関連するビデオ断片のサムネイルも表示される。VideoSurfはビデオの全フレームに自動的にタグとメタデータを追加しており、これが検索結果の元になる。気に入ったシーンをクリックすれば鑑賞できる。あるいは、特定の時間を共有したければ、タイムスライダーを使って、丁度見せたいシーン友人や家族に送ることもできる。

TC50のジャッジのひとり、Robert Scobleが、彼の(そして多くの聴衆の)感想をこうまとめた、「ようやく、最悪じゃないサイトが出てきた。」

エキスパートパネル Q&A

Bradley Horowitz: この分野で多少の経験があります。コンピュータの画像認識についてMITで学びました。ところでたとえばMentosの動画を探す際、Mentos自体を認識する必要はありませんね。人々がMentosについての動画であると説明を加えます。VideoSurfにはそのようなソーシャルを利用している面が見受けられませんが、動画検索に、何か特別な技術を用いているのでしょうか。

CEO Lior Delgo: 人々がタグを付けたりするとは言っても、すべてのフレームを確認したりするわけではありません。私たちは従来は存在しなかったフレーム毎にタグデータ付けが必要であると考え、その方向で進んでいます。全フレームにタグを付けてくれと人にお願いするのは簡単ですが、そんなこと自分でやる気にはならないでしょう。私たちの用いているのはこれまでに存在しない新しい技術です。歴史上初めて動作しているものなのです。

Joi Ito: 動画を確認していくという話がありましたが、どのようにして行い、正確性はどの程度あるのでしょうか。

CTO Dr. Eitan Sharon: 収録されている場面全てのデータを取得し、一意的で重要な瞬間を認識します。また人物の解析も行います。同じ人物は同一人物として認識されますので、登場シーンをまとめて閲覧することもできます。顔認識のシステムも利用しています。

Ito: もちろん監視システムにも使えるわけですね。「Scoble sex」なんてものを探したら何が見つかるんでしょう。

Michael Arrington: 何も見つからないね。

Scoble: それぞれの動画を処理してインデックス化するのにどのくらいかかるのでしょうか。

Sharon: リアルタイムよりははるかに高速です。

Scoble: ストリーミングでも利用できますか。

Sharon: リアルタイムで十分対応できます。

Sheryl Sandberg: まず最初にデータを理解するところから始めています。AdSenseが機能しているのも、コンテンツに対する深い理解があるからです。テキストによるコンテンツには存在しても、他のコンテンツには存在しないものもあるのです。本当に動画にメタタグを付すことが可能なら、それはエキサイティングなことです。コンシューマのウェブサイトから始めるのも良い考えだと思います。

Horowitz: 一般の人がPageRankに着目するときに、われわれはリンク関係に注目します。ウェブ内のどこに存在しているのかというコンテクストが重要なのです。ドリルダウン以上のことを目指しているのでしょうが、現在のところは見あたりませんね。

Arrington: コンピュータが画像の中に何があるかを教えてくれるようになると非常に便利ですね。

Horowitz: Picassaは見ましたか? 我々は先週顔認識を立ち上げました

Delgo: 収集可能な情報が増えれば、よりものごとの関係性を表現できるようになるでしょうね。

[原文へ]

(翻訳:Nob Takahashi、Maeda, H)