機械学習
データサイエンティスト
チーム支援
コード共有

CometMLは「機械学習のためのGitHub」になることを狙う

次の記事

子どもたちを食事に呼ぶためにAmazon Echoを使える…家庭内の増設需要をねらうか?

Comet.mlは、データサイエンティストと開発者たちが、自身の書く機械学習モデルのモニタリング、比較、そして最適化を簡単に行えるようにする。このニューヨークを拠点とする企業は、本日(米国時間4月5日)そのプロダクトの提供を始めた。同社はTechStarsが支援するAmazon Alexa Acceleratorプログラムを修了し、230万ドルをシードラウンドで調達した。このラウンドを主導したのはTrilogy Equityパートナーズで、他にTwo Sigma Ventures、Founders Co-Op、Fathom Capital、 TechStars Ventures、そしてエンジェル投資家たちが参加した。

このサービスが提供するのは、機械学習(ML)実験コードとその結果をまとめることのできるダッシュボードだ。さらに、このサービスでは、実験のハイパーパラメーターを調整することで、モデルを最適化することも可能だ。モデルを訓練する際に、Cometはその結果を追跡し結果のグラフを提供する。それだけにとどまらず、コードの変更を追跡して、後から取り込むことを許し、実験のさまざまなバージョンの異なる側面をすべて後から比較できるようにする。

開発者たちは、簡単に自らの機械学習フレームワークとCometを統合することができる。たとえ使っているのがKeras API、TensorFlow、Scikit Learn、Pytorch、あるいは単にJavaコードであっても関係ない。使い始めるためには、開発者は単にCometMLのトラッキングコードをアプリに追加し、いつものように実験を実行するだけだ。このサービスは、モデルをどこで訓練するかとは完全に無関係であり、もちろんその結果はチームメンバーと共有することができる。

理想としては、これによってデータサイエンティストは既存のワークフローと開発ツールを使い続けることができる筈で、それらに加えて、実験の効果をよりよく把握できる新しいツールが追加されたということである。

CometMLの共同創業者兼CEOのGideon Mendelsは「私たちは現在のMLチームが、10年から15年前に見かけたソフトウェアチームのように見えることに気が付きました」と語る。現代のソフトウェアチームは、GitHubのようなバージョン管理を提供するツールを使ってコードを共有しているが、MLチームは依然として電子メールでデータやコードを共有している。「主な課題は作業者の規律ではなく、ツールの状況なのです」とMendelsは語る。「現在使えるGitHubのようなツールは、ソフトウェアエンジニアリングのための素晴らしいソリューションですが、MLチームにとってはそうでもありません。ここでもコードが主要なコンポーネントであることには変わりがないのですが、それがすべてではないのです」。

Mendelsによれば、そのクローズド・ベータ期間中には、約500名のデータサイエンティストたち(いくつかのトップテクノロジー企業からの参加を含む)がサインアップしたということだ。これまでのところ、これらのユーザーたちはプラットフォーム上で約6000のモデルを構築している。

将来的には、CometMLチームは、より優れていて正確なモデルが開発できるように、開発者たちに対してより多くのツールを提供する予定だが、Mendelsによれば、そのためには同社はこの最初のバージョンを投入する必要があったのだという。

CometMLは、試してみたいすべての開発者が利用できるようになった。GitHubと同様に、公開プロジェクトを幾つでも作成できる無料枠があり、プロジェクトをチーム間でプライベートに保つ有料枠が提供されている。

[ 原文へ ]
(翻訳:sako)

画像:Pete Saloutos/Getty Images