音声

 

  • 3D
    交通騒音も路上と室内では違う…3D空間内の複雑な音響編集を助けるResonance AudioをGoogleが発表

    交通騒音も路上と室内では違う…3D空間内の複雑な音響編集を助けるResonance AudioをGoogleが発表

    拡張現実(augumented reality, AR)は、コンピューターとの対話を三次元化するという展望により、徐々に伸びつつあるが、すでにいろんなプラットホームを提供しているGoogleは、その三次元空間に視覚だけでなく五感のすべてを持たせたいようだ。 今日(米国時間11/6)Googleは、同社のVR Audio SDKをベースとして、より総合的な空間オーディオプロダクトResonance Audioをモバイルとデスクトップ両用に作っていることを発表した。 続きを読む

  • AmazonのAlexaデバイスが声で個人を識別できるようになった…Echoの各人利用が可能

    AmazonのAlexaデバイスが声で個人を識別できるようになった…Echoの各人利用が可能

    Amazon Echoの最大の盲点のひとつが解決した。ついに、やっと、今日(米国時間10/11)から、声を聞き分ける機能が加わったのだ。家族のいる家庭では、声を認識してEchoの利用を個人化できる。ショッピングリストや音楽の選択などを、個人別にできるのだ。 続きを読む

  • Deepgramがディープラーニングを利用する機械書き起こしサービスを無料で公開、データの獲得をねらう

    Deepgramがディープラーニングを利用する機械書き起こしサービスを無料で公開、データの獲得をねらう

    オーディオデータを機械学習で処理するDeepgramが今日(米国時間10/10)、同社の機械書き起こしサービスを無料で公開した。これからはTrintのようなサービスにお金を払って自動化書き起こしという汚い仕事をやらせなくてもすむわけだ。無料化の秘密は、“データの取得”にある。 続きを読む

  • Googleの機械学習式音声生成システムWaveNetが、Google Assistantに導入される

    Googleの機械学習式音声生成システムWaveNetが、Google Assistantに導入される

    Googleは昨年、新しい音声生成の方法であるWaveNetを発表した。これは大量の単語ライブラリや、堅苦しくなりがちな簡易手段に頼らない手法だ。WaveNetは、機械学習を使いサンプル毎に音声を生成する。その結果は私に言わせれば「気味が悪いほど良くできた」ものだ。これまではラボの中で提供されていたが、今やこの技術は、最新版のGoogle Assistantに導入されている。 この技術の背後にある基本的なアイデアは、文法や音調のルールを手でコーディングして単語や文を生成するのではなく、機械学習システムを使ってスピーチのパターンを見出し、そ… 続きを読む

  • XMOSのマイクロフォン配列技術でAlexaをどんなデバイスにも、リビングの壁にも、実装できる

    XMOSのマイクロフォン配列技術でAlexaをどんなデバイスにも、リビングの壁にも、実装できる

    音声でコマンドを入力するサービスシステムAmazon Alexaは、その専用実装デバイス(Amazon Echoなど)が、ユーザーの声をはっきり聞き取れる位置、たとえばコーヒーテーブルの上やカウチのそばなどにないといけない。テレビの近くにあったりすると、アニメのキャラクターが “Alexa!”と言っただけで、おかしなものがAmazonに注文されたりする。ノイズを無視して、ご主人である人間の声だけを聞き分ける高度な技術が必要だが、それは意外と難しい 続きを読む

  • 今やAmazon Echoは8機種もある!、便利な比較一覧表を作ってみた

    今やAmazon Echoは8機種もある!、便利な比較一覧表を作ってみた

    どのAmazon Echoを買うべきだろう? 今日(米国時間9/27)新しく発表されたEcho 2, Plus, Spot, Connect, それともButtonsか? 続きを読む

  • AI
    Amazon MusicがAlexaの機能を搭載

    Amazon MusicがAlexaの機能を搭載

    Amazonが、Amazon MusicにAlexaの機能を組み込んだ。iOS版およびAndroid版の双方に実装され、音声コントロールが行えるようになったのだ。Amazonの発表によれば、使えるのはアメリカ、イギリス、ドイツ、およびオーストラリアだとのこと。 続きを読む

  • テレビに映ってるアニメのキャラがAmazon Echoに命令して大量のランダムな買い物を

    テレビに映ってるアニメのキャラがAmazon Echoに命令して大量のランダムな買い物を

    Amazon Echoを持ってると、こんなやばいこともある、という例。起動する言葉さえ分かってればだれでもEchoに命令できるから、テレビに映ってるアニメのキャラクターでも、あなたの家のEchoを操作できる。20年の長寿を誇るアニメ番組South Parkで、まさにそれが起きた。 続きを読む

  • Walmart、Googleと音声ショッピングで提携――Amazon Alexaの独走に“待った”

    Walmart、Googleと音声ショッピングで提携――Amazon Alexaの独走に“待った”

    本日(現地時間8/23)WalmartとGoogleは、音声アシスタント「Google Assistant」を通じた音声ショッピングに関するパートナーシップを結んだと発表した。今後消費者は、WalmartのEasy ReorderサービスとGoogle Express(Googleの宅配サービス)を併用し、何十万種類もの商品をスマートスピーカーに話しかけるだけで購入できるようになる。 さらにこのパートナーシップを受け、GoogleはGoogle Expressの会費を廃止し、サイトに登録されている各小売店の最低購入金額さえ満たせば、商品を1〜3… 続きを読む

  • Microsoftの音声認識システムが人間と肩を並べ始めた

    Microsoftの音声認識システムが人間と肩を並べ始めた

    米国時間8月20日、MIcrosoftはその会話型音声認識システムが、これまでで最も低い5.1%のエラーレートに達したことを発表した。この記録は、Microsoft Artificial Intelligence and Researchの研究者グループが昨年達成した5.9%のエラー率を下回るもので、テキストを数回聞き返すことができるプロのトランスクライバーたちと同等の正確さだ。 両研究は、Switchboardコーパスの録音を認識することで行われた。これは1990年代初頭から、音声認識システムをテストするために研究者たちが使用してきた、約24… 続きを読む

  • AI
    Monsterが音楽専用の音声アシスタントをヘッドフォーンの新製品に搭載、Siriの音楽無能が契機

    Monsterが音楽専用の音声アシスタントをヘッドフォーンの新製品に搭載、Siriの音楽無能が契機

    Monsterは必ずしも革新的なテクノロジー企業ではないけど、でも同社製のヘッドフォーンにMelodyと呼ばれるヘルパーアプリを載せることによって、今大流行の音声アシスタントの世界へ足を踏み入れた。 MonsterのElementsヘッドフォーンに搭載されているMelody音声アシスタントを作っているSpeak Musicは、基本的にその機能を、Siriが音楽サービスをApple Musicしかサポートしていない、という音楽的欠点を補うために設計した。 続きを読む

  • AmazonがあらゆるサードパーティデバイスにAlexa機能を持たせるべくSDKを無料オープンソースで公開

    AmazonがあらゆるサードパーティデバイスにAlexa機能を持たせるべくSDKを無料オープンソースで公開

    Amazonは、同社の仮想アシスタントAlexaを、Echoなど同社自身のハードウェアだけでなく、もっといろんなデバイスに載せたい、と考えている。そこで同社は今日(米国時間8/17)、AlexaのSDKを一般公開することによって、商用デバイスのメーカーたちがAlexa機能のある製品を作れるようにした。そのツールセットAlexa Voice Service Device SDKを利用すれば、各種のデバイスに完全なAlexaの能力を持たせて、音声認識だけでなくメディアのストリーミング、タイマーやアラーム、通知、天気予報、そしてAlexaのR… 続きを読む

  • Amazon、Alexaスキルの報酬対象を拡大――有料スキル・広告掲載は未だ非サポート

    Amazon、Alexaスキルの報酬対象を拡大――有料スキル・広告掲載は未だ非サポート

    本日(現地時間8/16)アマゾンは、Amazon EchoをはじめとするAlexaデバイス上で使える「スキル」(アプリのようなもの)の開発者向けに、新たな報酬プログラムを導入すると発表した。同社によれば、今後は5種類以上のカテゴリーで高パフォーマンス・高”エンゲージメント”のスキルに対して報酬が支払われるとのこと。なお、ゲームカテゴリーでは過去に似たプログラムを通じて開発者に報酬が支払われており、新プログラムでも同カテゴリーは報酬対象に含まれている。 ゲーム開発者向けの報酬プログラムは今年の5月に密かにリリースされ… 続きを読む

  • GoogleのCloud Speech APIが大幅アップデート、対応言語が増え、言葉にタイムスタンプを付着

    GoogleのCloud Speech APIが大幅アップデート、対応言語が増え、言葉にタイムスタンプを付着

    2016年にローンチしたGoogleのCloud Speech APIは、話された言葉をテキストに書き起こす。このAPIが今日(米国時間8/14)、大幅にアップデートされた。 中でもいちばんおもしろいのは、これまでの89言語に加えて新たに30の言語が加わったことだろう。ただしこれらの数字には、英語とスペイン語とアラビア語の地域的な変種が複数含まれている。今回新たに加わったのは、ベンガル語、ラトビ(ヴィ)ア語、スワヒリ語などで、Googleによると、それらを話す人は約10億人いる。 続きを読む

  • 家庭のテレビをスマートホームのモニタシステムにしたいAmazonの野心、まずささやかにFire TVのリモコンの完全音声化から

    家庭のテレビをスマートホームのモニタシステムにしたいAmazonの野心、まずささやかにFire TVのリモコンの完全音声化から

    AmazonのFire TVはすでに音声でテレビをコントロールできるが、そのためにはリモコンを手に持つ必要がある。そこで今回AmazonのセットトップボックスはEchoの助けを借りて、ユーザーが自分の腕や指を動かさなくてもリモートコントロールができる方法を身につけた。 今日(米国時間8/1)からユーザーは、AmazonのスマートホームハブAlexa/Echoに命じるだけで、番組を選んだり、チャンネルを変えたり、ボリュームを調節したり、アプリを開いたりできる。 続きを読む

  • Firefoxブラウザーが音声検索、大型ファイル共有、そしてノート取り機能を実験的に実装

    Firefoxブラウザーが音声検索、大型ファイル共有、そしてノート取り機能を実験的に実装

    Firefoxは、再起を期している。ブラウザーの中核的部分に注いできたリファクタリング努力がようやく報われようとしているし、マーケットシェアの減少はまだ(とくにデスクトップで)続いているものの、今のFirefoxは、これまでの長年の鈍重さから抜け出てダイエットに成功し、快速になっている。そして今日(米国時間8/1)は、そんなFirefoxを試してみるのによい日だ。というのも彼らは今日、音声検索、ノートを書く機能、そして大きなファイルの転送/共有機能という三つの新しいテストパイロットの実験をローンチしたからだ。これらの実験的事業は、Te… 続きを読む

  • 新しいAppleの広告は、The RockとSiriの掛け合いでボイスファーストインターフェイスの有用性を伝える

    新しいAppleの広告は、The RockとSiriの掛け合いでボイスファーストインターフェイスの有用性を伝える

    目に見えないインターフェイスの使い方を、あなたは他人にどのように教えているだろうか?Appleにとって、Siriが最初の大規模大衆向け音声アプリケーションとなったときから、それは常にマーケティング上の問題として居座り続けている。 Appleはそれを教えようと何度も挑戦してきた。もしSiriを起動して何も話かけずにいたら、画面にSiriからの助言(「こんな風に話しかけてください」)を表示する。テレビスポット、ツールチップ、App Storeのプロモーション、そして読んだことがあるかどうかは知らないがインタビューなどで、どれほどの努力がSir… 続きを読む

  • 現代自動車とKiaの車に、Kakaoが音声認識技術を搭載する

    現代自動車とKiaの車に、Kakaoが音声認識技術を搭載する

    韓国のハイテク企業であるKakaoが、その配車事業をスピンアウトする計画を発表してから1ヶ月も経たないうちに、今度は韓国第2位の自動車メーカー現代自動車ならびにその子会社であるKiaとの間に、車載のハンズフリーシステム搭載に関する契約を結んだ。 Kakaoは、韓国内のスマートフォンの95%以上にインストールされているトップメッセージアプリ、カカオトークを運営していることでよく知られている。しかしそれはチャットの枠を越えて他の領域にも手を伸ばしていて、AIもそのうちの1つだ。 9月には、同社のAIテクノロジーである”Kakao I… 続きを読む

  • Google Analyticsに音声(+自然言語)で質問できるようになる…まず英語から

    Google Analyticsに音声(+自然言語)で質問できるようになる…まず英語から

    自分のWebサイトやアプリの利用状況を知りたくなったら、これからはGoogle Analyticsに直接尋ねることができる。 “先週はモバイルとデスクトップでどれだけトラフィックが違ったかな?”とか、“昨日の新規ユーザーは何名だっただろう?”、“先週はどこの国の人がいちばん多かったか?”、などなどを知りたくなったら、これまでのようにAnalyticsのダッシュボードを開いてチャートを操作しなくてもよい。 単純に、クェリをタイプしたり、大きな声で言うだけでよいのだ。… 続きを読む

  • Amazon Alexaのスキルが15000を突破、わずか半年で倍増、競合製品を圧倒

    Amazon Alexaのスキルが15000を突破、わずか半年で倍増、競合製品を圧倒

    【抄訳】
    Amazonの音声プラットホームAlexaの‘スキル’が、15000を超えた。それらが、EchoスピーカーやEcho Dot、Echo Showなどのデバイスの上で、多彩な‘芸’を披露する。Amazonの2月の発表では10000だったが、それ自体は昨年9月に比べて3倍増だった。 続きを読む

  • Mediumの会員は記事の朗読を聴けるようになる、プロの声優たちを起用

    Mediumの会員は記事の朗読を聴けるようになる、プロの声優たちを起用

    広告収入に依存しない高品質な読み物ブログを目指すMediumが、その‘有料’の魅力と価値を高めるべく、各記事の音声バージョンの提供を開始する。有料会員オンリーの記事はすべて音声化され、そのほかの記事は、同社のスタッフが選んだ記事など、良質な記事が音声でも提供される(それらも、聴けるのは会員のみ)。 続きを読む

  • 音声アシスタント製品をパートナーに任せるMicrosoft、Harman Kardonの次はHPとIntelが参加

    音声アシスタント製品をパートナーに任せるMicrosoft、Harman Kardonの次はHPとIntelが参加

    今週初めには、スピーカーの名門メーカーHarman Kardonが、Microsoftの音声アシスタント・システムCortanaを載せたAmazon Echo対抗製品Invokeを発表した。サードパーティのCortana製品はそれが初めてだが、いつまでも‘唯一’ではない。今日(米国時間5/10)Microsoftは、HPが同様の製品を作ることで同社と契約した、と発表した。Intelもこのゲームに参加し、Cortanaが動くデバイスの参照設計を近くローンチする、と約束した。 続きを読む

  • Harman KardonのCortana搭載スピーカーが発表前にリーク、Skypeできることが売りか

    Harman KardonのCortana搭載スピーカーが発表前にリーク、Skypeできることが売りか

    Microsoftは、Google HomeとAmazon Echoがやってるパーティーに自分も参加したい。このEchoそっくりさんは、スピーカーの名門Harman Kardonが作り、Microsoftの音声プラットホームCortanaが載っている。発売は今秋、発表は今週のようだ。 アップデート: MicrosoftとHarman Kardonはこのことを確認した。発売は2017年の秋である。 続きを読む

  • API
    Google AssistantのSDKをデベロッパーに提供、製品のプロトタイプへの使用は自由で無料

    Google AssistantのSDKをデベロッパーに提供、製品のプロトタイプへの使用は自由で無料

    Googleは前から、Assistantをさまざまなハードウェア企業やデベロッパーから成る大きなエコシステムへ公開したい、と言っていた。今日(米国時間4/27)同社はその方向へ大きく一歩前進し、Google AssistantのSDKをローンチした。デベロッパーはこれを使って、自分のハードウェアにAssistantの知能を組み込める。たとえばスマートミラー(鏡)とか、Google Home的な器具や装置、絶対禁酒を誓った人が秘かに楽しむロボットのバーテンダー(上図)など、何でも好きなものを作れる。 続きを読む

  • Google Homeはキッチンで一層便利になった…より親切なレシピ機能に

    Google Homeはキッチンで一層便利になった…より親切なレシピ機能に

    Google HomeとAmazon Echoは、手が濡れたり汚れたりしていることの多いキッチンでとくに便利だ。でもこれまでは、Google Homeにレシピを尋ねると、それを嬉々として教えてくれるけど、しかしあなたがアメリカの大統領で世界最強の記憶力の持ち主でもなければ、話が終わったときに材料の半分以上を忘れているだろう。しかし今日(米国時間4/26)からは、Google Homeで500万のレシピにアクセスできるだけでなく、それらを一歩々々たどって、質問することもできる。 続きを読む

  • Amazon Echoの優れた音声認識機能をそのほかのデバイスメーカーも利用できる

    Amazon Echoの優れた音声認識機能をそのほかのデバイスメーカーも利用できる

    Amazonは、Echoの優秀な音声コマンド認識機能を支えている技術を、サードパーティのデバイスメーカーにも使わせる気だ。たとえばそれは、騒音の多い部屋でもユーザーの音声を拾えるためのマイクロフォンの配列や、起動語を認識するAmazon独自のソフトウェア、大きな開けっ放しの部屋でバックグラウンドノイズを減らし、エコーを相殺する技術、などだ。 続きを読む

  • MatrixのVoiceボードがあればRaspberry Piで動くAlexaを作れる

    MatrixのVoiceボードがあればRaspberry Piで動くAlexaを作れる

    Matrix Labsが、Raspberry Pi用の音声認識AIのクラウドファンディングに成功した。これがあれば誰でも、自分ちの地下室でAlexaを作れるだろう。Rodolfo SaccomanとBrian Sanchezが初めて作ったボード製品Creatorは、Raspberry Piの上部にフィットし(上図)、8つのマイクロフォン、温度センサー、紫外線センサー、圧力センサー、3Dの位置センサーなどがついている。しかし、もっとシンプルなVoiceは、直径3.14インチのボード上にオープンソースの音声認識プラットホームVOICE RECOGNI… 続きを読む

  • API
    Voysisは各業界の専門知識を事前に訓練された音声AIを使いやすいAPIで提供し、音声AIのTwilioを目指す

    Voysisは各業界の専門知識を事前に訓練された音声AIを使いやすいAPIで提供し、音声AIのTwilioを目指す

    【抄訳】
    音声による人工知能は、売上増や顧客体験の向上に寄与すると分かっていても、そのセットアップは容易ではない。そんな状況を変えようとするVoysisは、自然言語の入力を解析するAIプラットホームを提供し、eコマースやエンターテインメントなどさまざまな専門分野で効果的に音声入力を利用できるようにする。Voysis自身がSiriやAlexaになるのではなく、デベロッパーがユーザー企業のお店の優秀なアシスタントや、ビデオ店の頭の良い販売員を作る手助けをするのだ。 続きを読む

  • Baiduが音声アシスタントのRaven Techを買収してAI色を一層強める

    Baiduが音声アシスタントのRaven Techを買収してAI色を一層強める

    Baiduがこのほど、音声アシスタントを開発している中国のスタートアップRaven Techを買収して、AIへの進出をさらに一歩前進させた。Baiduは、Ravenの技術と製品と60名のスタッフすべてを買収したことを確認した。 Baiduは1か月前に、以前Microsoftにいた、AIのエキスパートとして著名なQi Luを雇用し、COOとGroup Presidentの座に据えた。Raven Techの買収額は公表されていないが、同社はMicrosoft Venture AcceleratorとY Combinatorの出身であり、DCM Ventur… 続きを読む

  • MITが音声認識機能を低電力チップに収めることに成功、音声が聞こえたときだけ本体部が動き出す

    MITが音声認識機能を低電力チップに収めることに成功、音声が聞こえたときだけ本体部が動き出す

    MITが今日(米国時間2/13)、音声認識チップの開発を発表した。その発表によると、このチップを使うと各種応用製品の音声認識処理の部分の電力消費量が90〜99%節減される。音声技術は今やモバイル製品のほとんどに実装されており、中でもとくに、Siri, Alexa, Google Homeといった音声アシスタントアプリの人気がそのニーズを急増させている。このチップによりそれらの関連回路やソフトウェア部品が大幅に単純化されそうだ。 続きを読む