Googleの画像認識/分類API、Cloud Vision APIが誰でも使える公開ベータへ

次の記事

Appleがホームボタン取り換えで動かなくなったiPhoneにiOSアップデートを提供、エラーについて謝罪

短期間、小規模なプレビューをやったあと、Googleは今日(米国時間2/18)、Cloud Vision APIの公開ベータを発表した。このAPIを使ってデベロッパーは、画像認識や分類の機能を自分のアプリケーションに持たせることができる。

Cloud Vision API 2

Googleの技術は、画像からテキストを取り出す、といった基本的なこともできるが、しかしその真価は、画像中の物を実際に認識できることにある。それはGoogle Photosの画像検索でも使われており、花とか食べ物、動物、各地の目標物などを見分ける。GoogleによるとこのAPIのアルゴリズムは、数千種類の物を認識できるよう訓練されている。

このAPIでいちばんおもしろいのは分類機能だと思うが、でもこのサービスは不適切なコンテンツを指摘することもできる。だからたとえば、写真中心のアプリケーションをPG級(保護者同伴必須)に指定したければ、Cloud Vision APIでそれを指定できる。また、集めた写真の中のハッピーな人だけを見たければ、このAPIの感情分析機能を利用できる。

料金は使い方によって異なるが、たとえば画像中に特定のラベルを見つけたいなら、1000画像あたり2ドルだ。単純な文字読み取りなら、1000画像あたり60セントとお安い。

  1. cloud-vision-1.png

  2. cloud-vision-2.png

ベータ中は数量制限があり、一人が1か月あたり最大2000万画像までしか扱えない。すでにプレビューの時点でこのサービスを実装した企業も数社あり、たとえばYik Yakは、このAPIを使ってテキストの取り出しと画像の特徴検出をやっている。

このVision APIは、MicrosoftのProject Oxfordなどと競合することになる(後者は現在プレビュー)。Project Oxfordには、コンピュータビジョンの機能や、顔認識、感情分析などの機能がある。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa