音声認識 / Voice Recognition(用語)

人間の声などをコンピュータに認識させて、言葉を文字列に変換したり、発声している人を識別する技術。

  • グーグルがコンタクトセンターの音声技術をアップデート

    グーグルがコンタクトセンターの音声技術をアップデート

    Contact Center AIはGoogleのさまざまな機械学習ツールを使って仮想エージェントを作り、人間エージェントの仕事を助ける。今日(米国時間7/24)同社はこのツールのアップデートをいくつかローンチし、その中には特に、音声認識機能の改良がある。 続きを読む

  • GoogleのProject Euphoniaは発話障がい者の話し言葉の認識を目指す

    GoogleのProject Euphoniaは発話障がい者の話し言葉の認識を目指す

    GoogleはProject Euphoniaというプロジェクトで、発話障がいのある人の話し言葉に関する研究をしている。音声のサンプルを収集してAIで認識するためのモデルの構築を目指す。 続きを読む

  • 会話型アプリケーション開発のためのAIプラットホームをCiscoがオープンソース化

    会話型アプリケーション開発のためのAIプラットホームをCiscoがオープンソース化

    エンタープライズのいろんなユースケースに音声を持ち込む取り組みが至るところで行われており、CiscoはMindMeldのツールセットでデベロッパーにそのための方法を提供している。 続きを読む

  • Google I/Oはアクセシビリティ強化に全力、聴覚障害者にも電車でYouTubeを見るにも便利

    Google I/Oはアクセシビリティ強化に全力、聴覚障害者にも電車でYouTubeを見るにも便利

    開幕したGoogle I/Oでは長い時間がアクセシビリティ改善関連に充てられた。ライブ・キャプションはビデオの発話とテキストを相互変換する機能でAndroid Qで実装される。 続きを読む

  • Googleの新音声認識はオフライン化されて高速に、Pixelで利用可能

    Googleの新音声認識はオフライン化されて高速に、Pixelで利用可能

    音声認識は最近のスマートフォンの標準的機能だ。人工知能を利用した分析は驚くほど正確なこともあればひどい混乱に陥ることもある。しかし最大の問題は返事が返ってくるのが遅れることだ。 続きを読む

  • BMW、車載システムにAlexaを導入――音声だけでなくビジュアルも

    BMW、車載システムにAlexaを導入――音声だけでなくビジュアルも

    BMWが数日中にAmazon Alexaのドライバー向けサポートを開始しようとしている。私は、車内でAlexaを使うとは一体どういうことなのかを実際に体験するため、ドイツ、オーストリア、アメリカ、イギリスでのオフィシャルローンチ(その他の地域でも近日中にローンチ予定)を前に、ミュンヘンへ飛んだ。 BMWでデジタル・プロダクト担当SVPを務めるDieter Mayは、今年の初めに、同社の車内デジタルアシスタントは、「カップホルダーに入ったEcho Dot」を凌駕するものでなければいけないと語っていた。つまり、デジタルアシスタントが車内での体験や… 続きを読む

  • 人間が犯す言葉の聞き間違いをAIは正してくれるか?答はノーだ

    人間が犯す言葉の聞き間違いをAIは正してくれるか?答はノーだ

    昨日(きのう)(米国時間5/17)までの二日間、ヤニー/ローレル(yanny/laurel)論争に加わらなかった人は、本当に幸せ者だ。でも、それもそろそろ時間切れ。口コミで広まった合成音声がAIへの誇大な過信にぶつかり、そしてその結果は、この俗世のすべてがそうであるように、幻滅だった。 続きを読む

  • 音声認識とAIで会議のノートを取るVoiceraがモバイルの同業Wrappupを買収

    音声認識とAIで会議のノートを取るVoiceraがモバイルの同業Wrappupを買収

    Voiceraは、会議などで人間がノートを取ることを今後永遠に不要にしたいと考えている。同社のビジョンはAIによる音声認識システムが、ノートを取るだけでなく話者を認識し、会議の要点や行動案件を要約できることだ。今日(米国時間4/18)同社は、類似のスタートアップWrappupを買収したことを発表した。ここもAIによるノート取りアプリで、Voiceraのビジョンにぴったり符合している。 続きを読む

  • アイルランドのスタートアップSoapBox Labsは、子供のための音声認識技術を開発している

    アイルランドのスタートアップSoapBox Labsは、子供のための音声認識技術を開発している

    アイルランドのスタートアップであるSoapBox Labsは、自らが「世界で最も正確で使いやすい子供のための音声技術」と呼ぶ技術の開発に邁進している。その技術はサードパーティーのハードウェアならびにアプリ開発者たちに提供される予定だ。その応用範囲は、読みと言語発達を支援する教育アプリ、家庭内で子供の声で制御するIoT機器、スマートトイ、そしてAR/VR体験などに広がっている。 2013年にPatricia Scanlon博士(元ベル研究所の研究員で音声認識技術で約20年の経験を持つ)によって創業された、この若い会社は、現在 Amazon Ech… 続きを読む

  • 超音波を使えば、「音」を発せずに音声認識デバイスを騙すことができる

    超音波を使えば、「音」を発せずに音声認識デバイスを騙すことができる

    セキュリティ関連技術を研究する中国人研究者が、「音」を発せずに音声認識システムを作動させる方法を開発した。人間には聞こえず、しかしマイクでは検知できる高周波音を用いるのだ。このしくみを用いて、人間には音が聞こえない状況で、さまざまなコマンドを発することに成功したのだそうだ。メジャーな音声認識アシスタントのすべてを操作することができたとのこと。 続きを読む

  • Alexaを支える技術Amazon Lexが開発者に開放された

    Alexaを支える技術Amazon Lexが開発者に開放された

    Amazonの仮想アシスタントAlexaを支えているテクノロジーであるAmazon Lexが、今朝(米国時間20日)のロイターの記事によれば、プレビュー段階を終了したということだ。自然言語理解技術を自動音声認識技術を組み合わせたこのシステムが、最初に紹介されたのは11月にラスベガスで開催された、AmazonのAWS re:Invent会議のことだった。 その時Amazonは、例えばチャットボットのような会話型アプリケーションを作りたい開発者たちが、そのようにLexを使うことができるかを説明した。 例として同社がデモしたのは、ユーザーが声だけを… 続きを読む

  • MITが音声認識機能を低電力チップに収めることに成功、音声が聞こえたときだけ本体部が動き出す

    MITが音声認識機能を低電力チップに収めることに成功、音声が聞こえたときだけ本体部が動き出す

    MITが今日(米国時間2/13)、音声認識チップの開発を発表した。その発表によると、このチップを使うと各種応用製品の音声認識処理の部分の電力消費量が90〜99%節減される。音声技術は今やモバイル製品のほとんどに実装されており、中でもとくに、Siri, Alexa, Google Homeといった音声アシスタントアプリの人気がそのニーズを急増させている。このチップによりそれらの関連回路やソフトウェア部品が大幅に単純化されそうだ。 続きを読む

  • ザッカーバーグが作ったホームAIのJarvisは、あなたの音楽の好みを学習する

    ザッカーバーグが作ったホームAIのJarvisは、あなたの音楽の好みを学習する

    2016年、Mark Zuckerbergは野心的な個人的プロジェクトを設定していた。照明の制御、訪問者の監視、家電の操作など、自宅での作業を自動化するための人工アシスタントを構築することだ。ZuckerbergはFacebook上で、ある意味「想像していたものよりも簡単」だったと述べている – この記事を読んでいる人のそれなりの割合が、そんなことはAmazon Echoのような既存のデバイスでできるのだから驚くほどのことでもないと考えることだろう。 続きを読む

  • Amazon AIがローンチ、Alexaのような音声アプリが開発可能に

    Amazon AIがローンチ、Alexaのような音声アプリが開発可能に

    Amazonは本日、ラスベガスで開催している 開発者イベントre:InventでAmazon AIプラットフォームのローンチを発表した。Amazonが何年もかけて開発した機械学習の知性を社外の開発者でも利用できるようにする。最初の段階では3つのツールを提供するが、今後新たなツールを追加していく計画だという。 続きを読む

  • Amazon Alexaは2016の大統領選挙戦に関する事実確認もすることができる

    Amazon Alexaは2016の大統領選挙戦に関する事実確認もすることができる

    友人たちと大統領選挙に関して議論した際に、ヒートアップしてしまったことはないだろうか?グッドニュースだ:いまやAlexaは2016年の選挙に関して、候補者の主張そのものに対する事実確認(fact check)をすることができる。対象にはクリントンとトランプの発言だけではなく、コメントの内容がチェックされた、他の候補者や政治家のものも含まれている。 続きを読む

  • マイクロソフトの音声認識技術、「人間並み」に到達

    マイクロソフトの音声認識技術、「人間並み」に到達

    マイクロソフトリサーチ(Microsoft Research)にとっては、おめでたい日となったことだろう。研究を続けてきた音声認識技術が、ついに人間レベルに到達したのだ。具体的にいうならば単語誤り率(word error rate)が5.9%となったのだ。これはプロの口述筆記者と同じレベルとなる。 続きを読む

  • 楽曲認識アプリのShazam、10億ダウンロードでようやく黒字化

    楽曲認識アプリのShazam、10億ダウンロードでようやく黒字化

    モバイルおよびデスクトップ用の音声検索・楽曲認識アプリ「Shazam」のダウンロード数が先ごろ10億件に達したと、Billboardが米国時間の9月29日に報じた。ロンドンに拠点を置くShazam Entertainment Ltd.は、ついにようやく黒字に転じたことも発表した。これはデジタル形式での音楽売上に対するコミッションと音楽ストリーミングサイトへのトラフィック誘導による収入に加えて、新たに注力していた広告収入の成果とみられる。 続きを読む

  • Amazonの新しいFire TV Stickはクアッドコア搭載、Alexa対応のリモコンも付属

    Amazonの新しいFire TV Stickはクアッドコア搭載、Alexa対応のリモコンも付属

    ゆっくりと、しかし着実に、Amazonは音声認識AIソフトウェア「Alexa」の機能を、数ある自社製ハードウェア製品に組み入れつつある。数週間前、Amazonはこの音声アシスタント機能を米国で提供中のTVストリーミング向けハードウェアソリューションに導入すると発表した。ここでいうハードウェアには上位機種のFire TVから、より小型でドングルベースのFire TV Stickなどが含まれる。 続きを読む

  • AppleがSiri経由の音声制御に対応したiOS 10向けアプリの一部を公表

    AppleがSiri経由の音声制御に対応したiOS 10向けアプリの一部を公表

    Appleは、近々リリース予定のiOS 10に含まれる、Siri経由の音声制御に対応したアプリの一部を本日(米国時間8月31日)発表した。先日のWWDCで発表された通り、新たなiOSにおける最大の変更点のひとつこそ、ユーザーが声を使ってアプリとやり取りができるようになるということだ。近いうちにiOSユーザーは、テキストメッセージの読み書きや写真の検索、Uberといったアプリでの車の手配、ワークアウトアプリの一時停止、友人への支払、サードパーティーのVoIPアプリを使っての電話など、たくさんのことをSiriにお願いできるようになる。 既にS… 続きを読む

  • Ok, Googleは便利だ―命令リストを見て使いこなそう!

    Ok, Googleは便利だ―命令リストを見て使いこなそう!

    音声認識は便利だ。なんといっても人間はしゃべる動物なので直感的だ。 とはいっても現在の音声認識にはまだそれほど直感的でない部分がある。前回は間違いなく正しい返事をしてくれたのに今回はうまくいかない。これは大抵の場合、使用したキーワードが前回と違っていたり、必要なキーワードを抜かしていたりするのが原因だ。 続きを読む