Computer Vision

  • 自動運転車を混乱させる“罠”を考えたパフォーマンスアーチストJames Bridle

    自動運転車を混乱させる“罠”を考えたパフォーマンスアーチストJames Bridle

    自動運転車に何ができるか、については、本誌もこれまでさんざん書いてきたけど、ときには、できないことの方がおもしろいこともある。技術というものは、その能力とともに、限界を知ることもきわめて重要だ。というわけで今回は、このパフォーマンスアートから教訓をいただこう。 続きを読む

  • あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

    あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

    あれはヒメハジロかな? それともオオバン? アビじゃないの? ではなるべく近くで写真を撮り、鳥の種を確認するアプリMerlinに見せよう。数秒で教えてくれるから、まるでそれは、鳥類学者になりたいきみのためのShazamだね。 続きを読む

  • GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

    GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

    ぼくの世代〔John Mannes, 1995/11生〕は、ほぼ全員がInstagramにはまっている。でもぼくは、2015年にこのプラットホームを去った(ごめんなさい)。理由は単純で、どの写真をポストするか、なかなか決められないこと、そして、簡潔で魅力的なキャプションを考えるのに、いつも苦労するからだ。
    でも、ぼくと同じ問題を抱えているひま人は、Google TensorFlow〔昨年オープンソース化〕… 続きを読む

  • IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

    IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

    人間は何かが起きたのを見たり聞いたりした時、すぐにそれを言葉で表現できる。「青いシャツの女の子が、野球選手の投げたボールをキャッチした」とか「犬が海辺を走っている」とか。私たちにとっては簡単なしごとだが、コンピューターにとっては恐ろしく大変だ ― 幸い、IBMとMITが協力して、それを少しやさしくする方法を検討している。 続きを読む

  • この検索エンジンは、自分の顔を検索結果と交換する

    この検索エンジンは、自分の顔を検索結果と交換する

    ウェーブのかかった長い髪の自分を想像したことはあるだろうか。きっと素適だろう。しかし、大枚をはたいてサロンに行ったり、Photoshopに何時間も費やすことなくいろんな髪型を試すにはどうすればいいだろうか。必要なのは自撮り写真とDreambitだけ。顔を交換できる検索エンジンだ。 続きを読む

  • 顔認識システム、百万人の顔データベースに大苦戦

    顔認識システム、百万人の顔データベースに大苦戦

    遍在するビデオカメラと高度な顔認識技術によって可能になる恐怖の監視国家を心配している人は多い ― しかし最新の研究によると、最高のアルゴリズムでも、百万人以上の顔を区別するとなると絶対確実からはほど遠いようだ。 続きを読む

  • Apple、iPhoneに顔認識と物体認識を導入

    Apple、iPhoneに顔認識と物体認識を導入

    何年か前にレストランで撮ったあの写真を覚えているだろうか?バーで友達に見せたい、あのすてきなデザートは? これまでは何千枚もの写真をスクロールして探さなくてはならなかった。iOS 10の新しい写真アプリで、Appleは高度なコンピュータビジョン技術を駆使して、写真の発見やグループ分けを容易にした。 続きを読む

  • Movidius、今度はFathomを発表―どんなデバイスもUSBスティックでニューラルネットワークが利用可能

    Movidius、今度はFathomを発表―どんなデバイスもUSBスティックでニューラルネットワークが利用可能

    数週間前にFLIRと提携してBostonスマート・サーマルカメラを発表し、大きな注目を集めたMovidiusが再び重要な製品を発表した。 同社はサーマルカメラでも使われたMyriad 2プロセッサのメーカーだが、新たな応用分野を発見した。Fathom Neural Compute Stickと名付けられたスティックはUSBをサポートするあらゆるデバイスにニューラル・ネットワークによるコンピューティング能力を… 続きを読む

  • このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる

    このニューラルネットワークは、白黒写真に正しい色の「幻覚」を起こさせる

    機械が支配する未来は、歴史から白黒写真を排除してしまうかもしれない。必要なのは、バークレーのコンピュータ科学者、Richard Zhangの作ったこのシステムだけだ。魂のないシリコンの感性があらゆるモノクロ写真に色の「幻覚」を起こさせる。 続きを読む

  • GoogleのProject Tangoを支えるMovidiusのビジョンプロセッサ、バージョンアップしてSDKを提供

    GoogleのProject Tangoを支えるMovidiusのビジョンプロセッサ、バージョンアップしてSDKを提供

    Movidiusは、まだ見慣れない名前だと思うが、今年の初めにGoogleがProject Tangoのスマートフォンとタブレットを発表したときに同社の名前がちらっと登場している。このプロジェクトは、モバイルデバイスが高度な3Dの知覚を持つと何ができるかを探求するためのGoogleのテストベッドで、Movidiusはそのための特殊なビジョンプロセッサを提供している。 続きを読む

  • ビデオからベストショットの写真を作るVhotoは写真が下手な人に朗報

    ビデオからベストショットの写真を作るVhotoは写真が下手な人に朗報

    写真は、われながらへたくそだ。ぼくは、世界最悪の写真家として有名だ(実際にそういう賞がある)。でもVhotoという新しいiOSアプリは、そんなぼくを救ってくれるかもしれない。 Vhotoは独自の技術を使ってビデオの中の最良の画像を見つけ、それをスチール写真にする。タグをつける、シェアする、ほかの人の写真を見つける、などのソーシャルな機能もある。 続きを読む

  • ビデオ: GoogleのProject Tangoで室内を3D撮影するとこうなる

    昨日はGoogleの3D感知型スマートフォンProject Tangoについてお伝えし、そこに使われている視像プロセッサや、それが携帯電話の未来にもたらす意味について論じた。 そして今回お見せするのは、実際にTangoのプロトタイプデバイスを使ってMatterportが作った3Dの室内マップだ。 続きを読む

  • Googleが野心的AIプロジェクト、タンゴを発表―3Dカメラとセンサーでスマートフォンが空間を認識する

    Googleが野心的AIプロジェクト、タンゴを発表―3Dカメラとセンサーでスマートフォンが空間を認識する

    今日(米国時間2/20)、Googleのスカンクワークスこと先進テクノロジー・プロジェクト(Advanced Technology and Projects)グループはプロジェクト・タンゴ(Project Tango)と名付けられた画期的3Dセンサーを装備したAndroidベースのスマートフォンのプロトタイプとデベロッパー・キットを発表した。 この3Dセンサーとカメラを組み合わせたシステムはモーショントラッ… 続きを読む

  • Webカメラにいろんなことをさせたい…とひらめいたFlutterがまずジェスチャーで音楽アプリを制御

    Webカメラにいろんなことをさせたい…とひらめいたFlutterがまずジェスチャーで音楽アプリを制御

    今ラップトップを使ってる、音楽を聴いてる、メールの返事を書いてる、コードを書いてる、ブログを読んでる、etc., etc.。突如電話が鳴る、そしていつもの緊急行動が始まる: ブラウザを最小化する、音楽アプリを最大化して、あせってポーズボタンや音量コントロールを探す…相手が切らないうちに電話に出れるか、はたして?。ということが、よくあるよね。Y Combinator’sのほやほや卒業生Flut… 続きを読む