Software
machine translation
applied mathematics

ディープラーニングシステムの主要要素(モデルなど)の再現や入れ替えを容易にして研究を促進するGoogleのTensor2Tensorが一般公開

次の記事

Apple Musicに年間9800円のプランが密かに登場

Googleは、研究者たちがディープラーニングに関する研究開発結果の再現を容易にできるためのオープンソースのライブラリTensor2Tensorリリースした。これにより、モデルやデータセットやそのほかのパラメータの新しい組み合わせを誰もが手早く試行でき、ディープラーニングシステムの能力の拡大に貢献できる。AIの研究では変数(変項)の数が膨大で、しかも新しい開発が次から次と登場してくるため、たとえば二つの異なるセットアップを比較する、といったことが簡単にはできなかった。そのことが研究者たちの悩みであり、研究の進歩の足を引っ張っていた。

Tensor2Tensorライブラリは、AIの研究におけるベストプラクティスの保存、伝播、改良などを容易にする。それはハイパーパラメータ、データセット、モデルのアーキテクチャ、学習レートの減衰方式などの、重要な要素を装備している。

このライブラリのいちばんありがたいところは、こういった要素を個々にモジュール的に入れ替えられることであり、従来のような全取っ替えは必要ない。モデルの教育訓練では、新しいモデルやデータセットを任意に持ち込めるので、従来のように何もかも最初から再訓練という手間はなくなる。

研究ツールの外部一般公開では、Facebookも最近ParlAIをオープンソースにした。それは、よく使われるデータセットをあらかじめパッケージして、ダイアローグ(ユーザーとアプリケーションの対話的トランザクション)の研究の便宜を図るツールだ。

それと似てGoogleのTensor2Tensorにも、同社の最近の研究プロジェクト“Attention Is All You Need”や“One Model to Learn Them All”などで使われたモデルが含まれている。公開はGitHub上で行われているので、一般研究者の利用も迅速簡便にできる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))