トレーニングデータ
データ生成

機械学習プロジェクトのためのトレーニングデータを生成するSuperb AI

次の記事

看護師を雑用から解放するAmazon AlexaとGoogleアシスタント

機械学習プロジェクトで開発を行う際の大きな課題の1つは、アルゴリズムをトレーニングするために、十分な数の関連データを用意することだ。この部分を助けようとしているのが、Y Combinator Winter 2019クラスのメンバーのSuper AIである。このスタートアップは、タグ付けプロセスをスピードアップするためにAIを使用して、各企業がプロジェクトの要件を満たすためにカスタマイズされたデータセットを作成する作業を支援する。

スタートアップのCEO兼共同創業者であるHyun Kimは、AIと機械学習をアプリケーションに組み込もうとしている企業にとっての大きな問題の1つは、モデルをトレーニングするための適切なデータセットを手に入れるところにあると言う。「Superb AIは、AIを使って、ハイテク大企業向けにカスタマイズされたAIトレーニングデータを作成します。私たちが一緒に働かせていただいているお客さまは、ご自身で行うよりも何倍も速く機械学習機能を製品の中に組み込むことができています」と、KimはTechCrunchに語った。

Kimと彼の共同創業者たち(CTOのJung Kwon Lee、機械学習エンジニアのJonghyuk LeeとMoonsu Cha、そしてAPACのセールス&オペレーション責任者として韓国のソウルに住むHyundong Lee)が、このデータの問題に気が付き、それを解決するための会社を立ち上げることを決心したのは、全員がこの業界で働いているときだった。

従来は、機械学習プロジェクトに取り組んでいる会社は、データをタグ付けするために人間の労働者を雇っていた。しかしそれはたとえデータを所有していたとしても、費用がかかり間違いも多いものだった。当時AIプロジェクトに関わったり、大学で研究を行ってたりしたKimと彼の共同創業者たちは、課題の中のタグ付け作業にAIを投入するアイデアを思いついた。

「時間がかかり間違いを起こしやすい手作業に依存する代わりに、Superb AIは独自の深層学習AIを利用して人間を助けて、画像や動画のラベリングの速さを最高10倍まで高めることができるのです」とKimは説明した。同社はまた、作業を始めるためのデータそのものを持っていない企業のために、データソースを探す手助けも行う。

Kimは、プロセスから人間を完全に排除しようとしているのではく、人間の作業者と人工知能基盤を組み合わせることで、タグ付けの正確性を高めようとしているのだと語る。彼はこれにはいくつかのステップがあると語る。まず、各ピースを個々に自動化するために、トレーニングデータをできるだけ多くのコンポーネントに分割する。データが複雑すぎて、AIツールがタグ付けを自動化できない場合は、彼らは「ヒューマンインザループ」(作業プロセスへ人間を組み込むこと)と呼ばれる代替アプローチを採用する。人間がデータにラベル付けすることによって、AIは時間が経つにつれて学習し、最終的にはますます多くのプロセスを人間から引き継ぐことができるようになる。

共同創業者たちは、シリコン・バレーで足がかりを築くために、Y Combinatorに参加することを決心した。シリコン・バレーでなら祖国の韓国よりもさらにマーケットを広げることができるからだ。「それは間違いなく、私たちに変革をもたらしました。私たちがYCのパートナーや他の起業家から得た知識と経験の量は、本当に信じられないほどのものです。また、広大なYCネットワークのおかげで、初期の顧客をシリコン・バレーで見つけることができました」とキムは語った。

昨年10月にローンチした同社は、共同創業者たちを含めて最大13人の従業員を擁している。Kimによれば、同社はシード投資で30万ドルを調達し、すでに製品から同額の収益を生み出しているという。

[原文へ]
(翻訳:sako)