Computer Vision

  • 自動運転車からは見えない歩行者を影で予見するシステムをMITが開発

    自動運転車からは見えない歩行者を影で予見するシステムをMITが開発

    どの点を見ても自動運転車の能力はまだ人間ドライバーを超えてはいない。でも、最終的には自動運転車に搭載された技術が、コーナーの向こう側を見るなど人間には推測すらできないことをやってのけるかもしれない。 続きを読む

  • 蜘蛛の目の原理を借りて奥行き感知カメラを超小型化へ

    蜘蛛の目の原理を借りて奥行き感知カメラを超小型化へ

    彼らは、巧妙な捕食動物として獲物を正しく見つけて、そっち方向へ正しく進み、正しく獲物を捕らえる。どうやっているのだろう?。節足動物の例に漏れず彼らもまた、非常に不可思議なおもしろい方法でそれをやってのける。 続きを読む

  • 物の裏側をレーザー光の反射から像として求めるカーネギーメロン大らの研究

    物の裏側をレーザー光の反射から像として求めるカーネギーメロン大らの研究

    未来の自動運転車やそのほかのマシンインテリジェンスシステムは、視線の向かう先には見えないものからでも詳細な画像データを集められるだろう。 続きを読む

  • 写真に写ってるものを音声で聞けるマイクロソフトのSeeing AIアプリ

    写真に写ってるものを音声で聞けるマイクロソフトのSeeing AIアプリ

    Seeing AIは、目の不自由な人が視覚データをオーディオに変換できるアプリだが、今回便利な機能がひとつ増えた。 続きを読む

  • コアラを感知するドローンが絶滅危惧動物の個体数推移の調査に貢献

    コアラを感知するドローンが絶滅危惧動物の個体数推移の調査に貢献

    ドローンを早朝に飛ばして、外気の寒いところと、木の中の、コアラの体温で温かいところとの明瞭なコントラストの撮像を求めた。 続きを読む

  • サッカーのゲームをテーブルの上の拡張現実の3D映像で見る

    サッカーのゲームをテーブルの上の拡張現実の3D映像で見る

    ワールドカップのシーズンなので、機械学習の記事もフットボールを取り上げないわけにはいかない。その見事なゲームへの今日のオマージュは、試合の2Dビデオから3Dのコンテンツを作り、すでに拡張現実のセットアップのある人ならそれをコーヒーテーブルの上でも観戦できるシステムだ。まだそれほど‘リアル’ではないが、テレビよりはおもしろいだろう。 続きを読む

  • 即答せよ! このシステムは問題に答える顔を見て人間であることを確認する

    即答せよ! このシステムは問題に答える顔を見て人間であることを確認する

    ボットとの戦いに終りはない。しかし、誰もが密かに想像しているスカイネットのようなシナリオでは終わらないことを望みたい。ちなみに、今重要なのはスパムを退治することで、組織的殺人を防ぐことではない。それでも、機会はますます賢くなり、単純な顔認識だけでは人間の識別に十分ではないこともある。今や機械は顔を作ることもできる —— しかし、質問に答えるときの顔を作るのは不得意のようだ。 続きを読む

  • Facebookの全身トラッキングの研究からはAR/VRへの大きな意欲が感じられる

    Facebookの全身トラッキングの研究からはAR/VRへの大きな意欲が感じられる

    ARとVRのエンターテインメントとコミュニケーションの両方の目的で、Facebookが大きな投資をしていることは、今や誰もが知っている。そしてその新しい研究は、顔を変えたり置き換えたりするだけでなく、全身を対象とするARアプリケーションに同社が取り組んでいることを示唆している。 今日のブログ記事では、 AIカメラのチームが、VRまたはARで全身の置換や追跡を明らかにねらっていると思われる成果を紹介している。 続きを読む

  • ポルノサイトが人工知能でビデオをタグづけ――PornHubのシステムは出演者、場面を認識する

    ポルノサイトが人工知能でビデオをタグづけ――PornHubのシステムは出演者、場面を認識する

    新しいテクノロジーを採用するのが速いのはポルノビジネスだという説がある。PornHub〔閲覧注意〕はこれが必ずしも伝説ではないことを示そうとしている。このサイトではこれまでは人力でビデオの分類、タグづけを行っていた。しかし毎日8000万の訪問者がある巨大サイトにアップされるビデオを手作業でタグづけするのは大変な作業だ。 続きを読む

  • GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か

    GoogleがコンピュータービジョンアプリFabbyを作ったAIMatterを買収、広告技術のイノベーションに利用か

    【抄訳】 Googleがベラルーシで生まれたコンピュータービジョンのスタートアップAIMatterを買収した。同社は、画像の検出と処理をモバイルデバイスの上で高速に行うニューラルネットワークベースのAIプラットホームおよびSDKと、その技術の概念実証のような写真/ビデオ編集アプリFabbyを作っている。 続きを読む

  • この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する

    この顔認識システムは、映画の観客が喜んでいるかどうかを追跡する

    映画制作がアートと同じくらいサイエンスになってきた今、映画会社は観客の反応を測定するためにかつてない方法を必要としている。喜んでくれたのだろうか? どのくらい…正確には?42分の時点で? カリフォルニア工科大学とDisney Researchは、表情認識ニューラルネットワークを使って、観客の反応を知り、予測しようとしている。次世代のニールセンレーティングの基盤になるかもしれない。 続きを読む

  • VarCityは、オンラインで集めた画像から都市の3Dマップを作る

    VarCityは、オンラインで集めた画像から都市の3Dマップを作る

    今や世界中の主要都市では、いつでもあらゆる角度から写真やビデオが撮影されている。理論的には、十分な数が集まれば道路や建物の配置がわかる ―― 待て、理論的に? いや実際に、だ。VarCityというプロジェクトがスイスのチューリッヒを再現するデモを見せてくれた。 複数年にわたるこの取り組みは、数多くのオンライン資源 ―― ソーシャルメディア、公開ウェブカメラ、車載カメラ、空中写真など ―― から得た画像を収集・分析して都市の3Dマップを作っている。ある意味でGoogleストリートビューの逆だ。地図を写真で図解するのではなく、写真に基づいて地図自体を作る… 続きを読む

  • 自動運転車を混乱させる“罠”を考えたパフォーマンスアーチストJames Bridle

    自動運転車を混乱させる“罠”を考えたパフォーマンスアーチストJames Bridle

    自動運転車に何ができるか、については、本誌もこれまでさんざん書いてきたけど、ときには、できないことの方がおもしろいこともある。技術というものは、その能力とともに、限界を知ることもきわめて重要だ。というわけで今回は、このパフォーマンスアートから教訓をいただこう。 続きを読む

  • あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

    あの鳥は何だろう?と思ったら写真を撮って鳥認識アプリMerlinに見せよう、数秒で分かる

    あれはヒメハジロかな? それともオオバン? アビじゃないの? ではなるべく近くで写真を撮り、鳥の種を確認するアプリMerlinに見せよう。数秒で教えてくれるから、まるでそれは、鳥類学者になりたいきみのためのShazamだね。 続きを読む

  • GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

    GoogleはTensorFlowによる画像キャプションモデルをオープンソースに、物認識から状況認識への進化をねらう

    ぼくの世代〔John Mannes, 1995/11生〕は、ほぼ全員がInstagramにはまっている。でもぼくは、2015年にこのプラットホームを去った(ごめんなさい)。理由は単純で、どの写真をポストするか、なかなか決められないこと、そして、簡潔で魅力的なキャプションを考えるのに、いつも苦労するからだ。 でも、ぼくと同じ問題を抱えているひま人は、Google TensorFlow〔昨年オープンソース化〕の画像キャプションモデルを利用すれば、そのくだらない第一世界問題に終止符をうてるだろう。ぼくも、それが楽しみだ。右の、“A per… 続きを読む

  • IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

    IBMとMIT、視覚と聴覚を人間のように理解するAIを共同研究

    人間は何かが起きたのを見たり聞いたりした時、すぐにそれを言葉で表現できる。「青いシャツの女の子が、野球選手の投げたボールをキャッチした」とか「犬が海辺を走っている」とか。私たちにとっては簡単なしごとだが、コンピューターにとっては恐ろしく大変だ ― 幸い、IBMとMITが協力して、それを少しやさしくする方法を検討している。 続きを読む

  • この検索エンジンは、自分の顔を検索結果と交換する

    この検索エンジンは、自分の顔を検索結果と交換する

    ウェーブのかかった長い髪の自分を想像したことはあるだろうか。きっと素適だろう。しかし、大枚をはたいてサロンに行ったり、Photoshopに何時間も費やすことなくいろんな髪型を試すにはどうすればいいだろうか。必要なのは自撮り写真とDreambitだけ。顔を交換できる検索エンジンだ。 続きを読む

  • 顔認識システム、百万人の顔データベースに大苦戦

    顔認識システム、百万人の顔データベースに大苦戦

    遍在するビデオカメラと高度な顔認識技術によって可能になる恐怖の監視国家を心配している人は多い ― しかし最新の研究によると、最高のアルゴリズムでも、百万人以上の顔を区別するとなると絶対確実からはほど遠いようだ。 続きを読む

  • Apple、iPhoneに顔認識と物体認識を導入

    Apple、iPhoneに顔認識と物体認識を導入

    何年か前にレストランで撮ったあの写真を覚えているだろうか?バーで友達に見せたい、あのすてきなデザートは? これまでは何千枚もの写真をスクロールして探さなくてはならなかった。iOS 10の新しい写真アプリで、Appleは高度なコンピュータビジョン技術を駆使して、写真の発見やグループ分けを容易にした。 続きを読む

  • Movidius、今度はFathomを発表―どんなデバイスもUSBスティックでニューラルネットワークが利用可能

    Movidius、今度はFathomを発表―どんなデバイスもUSBスティックでニューラルネットワークが利用可能

    数週間前にFLIRと提携してBostonスマート・サーマルカメラを発表し、大きな注目を集めたMovidiusが再び重要な製品を発表した。 同社はサーマルカメラでも使われたMyriad 2プロセッサのメーカーだが、新たな応用分野を発見した。Fathom Neural Compute Stickと名付けられたスティックはUSBをサポートするあらゆるデバイスにニューラル・ネットワークによるコンピューティング能力を与える。 続きを読む