ビデオストリーミングの高画質化+中断のないスムーズ化にMITの研究者がニューラルネットワークを併用

次の記事

米保険大手のエトナ、顧客2300万人にApple Watchを提供か

MITのコンピューター科学と人工知能研究所(Computer Science and Artificial Intelligence Lab, CSAIL)は、途中でぶち切れない、スムーズなストリーミングビデオを志向している。そのためにMohammad Alizadeh教授のチームが開発した人工知能システム‘Pensieve’は、その都度正しいアルゴリズムを選ぶことによって、中断のない最良の再生を確保する。

その方法には既存の技術の改良も含まれ、たとえばその一つYouTubeの適応ビットレート(adaptive bitrate, ABR)は、モザイクなどで画質を落とすことによって、スムーズな再生を維持しようとする。MITのAIは、今デバイスがどんなネットワーク条件に遭遇しているかによってアルゴリズムを切り替え、えんえんとひとつだけの方法を使い続けた場合の弱点を抑える。

そのアルゴリズム切り替え法によると、ストリーミングビデオの中断は10〜30%少なくなり、画質は10〜25%向上した。ビデオを長時間見るときには、これぐらいの改善でも相当大きな効果を感じるだろう。

  1. pensieve-overview.jpg

  2. pensieve-outperforming-existing-approaches.png

  3. pensieve-neural-network-detailed-diagram.jpg

しかもCSAILのPensieveは、完全にアルゴリズムだけに頼るのではなくニューラルネットワークを使用し、ストリーミングの最終的な画質に応じてNNにごほうび(reward)を与えることによって、NNを鍛えていく。それにより、どんな場合にはどんなアルゴリズムとその変数セットを選ぶか、ということをNNが学習していく。たとえばビデオをバッファリングするときのアルゴリズムの選択にも、固定的なルールには従わないというのが、このシステムの大きな特長だ。

チームによると、システムの振る舞いをエンドユーザーが(好み等に応じて)カスタマイズすることもできる。たとえば再生時に、画質重視、スピード重視、データの現状保全重視、などから選ぶこともできる。

Pensieveはオープンソースのプロジェクトとして来週ロサンゼルスで行われるSIGCOMMで発表される。チームは、もっと大量のデータセットで訓練すれば画質もスピードも大幅に向上する、と期待している。また今後は、通常のビデオよりもビットレートがものすごく高いVRビデオも使って、Pensieveの性能を上げたい、と彼らは考えている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))