音声認識 / Voice Recognition(用語)

人間の声などをコンピュータに認識させて、言葉を文字列に変換したり、発声している人を識別する技術。

  • 現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達

    現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達

    現場作業の内容・状況をリアルタイムに遠隔地と共有可能できる「コネクテッドワーカーソリューション」を手がけるFairy Devices(フェアリーデバイセズ)は2月24日、シリーズBラウンドにおいて、総額約10億2000万円の資金調達を発表した。引受先および借入先は、商工組合中央金庫、DG Daiwa Ventures、みずほ銀行、りそな銀行、信金キャピタル、ダイキン工業、ユナイテッド、横浜キャピタル。 続きを読む

  • Pindropとの連携でデジタルレコーダーのTiVoに音声認識機能が帰ってくる

    Pindropとの連携でデジタルレコーダーのTiVoに音声認識機能が帰ってくる

    TiVoのデバイスに新しい音声認識機能が搭載される。これはアトランタを拠点とするスタートアップでコンシューマデバイス用の音声認識とパーソナライズ技術を提供するようになったPindropとの連携によるものだ。 続きを読む

  • コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    Serenadeの共同創設者マット・ウィートホフ氏がQuoraの開発者だったころ、手が反復性のストレス障害と診断され、プログラムコードのタイピングができなくなった。そこで彼ともう1人の共同創設者トミー・マクミリアム氏は、AIを使って手を使わずに口述でコードが書けるツールを開発しようと決意。そうしてSerenadeが誕生した。 続きを読む

  • マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    Cortana(コルタナ)はコンシューマー向けの音声バーチャルアシスタントとしては失敗したかもしれないが、Microsoft(マイクロソフト)はMicrosoft 365の一部として「パーソナル・プロダクティビティ・アシスタント」として再ブランド化し、ビジネスの現場ではCortana、あるいは少なくともそのブランドが存続することになった。 続きを読む

  • アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンはAlexaデバイスのユーザーがもっとルーチンを使いやすくなる機能を提供する。ルーチンは数年前からある機能で、Alexaユーザーは複数のタスクをまとめて自分で選んだコマンド1つで実行できる。 続きを読む

  • 子供の言うことが理解できない音声アシスタントは授業での使用は困難

    子供の言うことが理解できない音声アシスタントは授業での使用は困難

    パンデミック発生前、新規のインターネットユーザーの40%以上は子どもたちだった。現在推定で子どもたちのスクリーンタイム(画面を見ている時間)は60%以上長くなっており、12歳以下の子どもについては、1日あたりのスクリーンタイムが5時間を超えている。(これにはメリットもあるが同時に危険性も伴う) 続きを読む

  • マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    Microsoftは米国時間8月25日、Microsoft 365の利用者全般に向けた新しい音声文字起こしサービス「Transcribe in Word(トランスクライブ・イン・ワード)」を開始したことを発表した。現在、この機能は、Wordのオンライン版で使用できる。他のプラットフォーム用のものは、後日追加される。 続きを読む

  • ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    著作権のある音楽を検出するには、音響指紋と呼ばれる技術に頼らざるを得ない。現在、そのツールで先駆者的な存在はAppleが所有するShazamだ。北京とデュッセルドルフに拠点を置く創設5年目のスタートアップACRCloudは、Audible MagicやNielsenが所有するGracenoteなどと競合しながら、このサービスを提供している。 続きを読む

  • マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資

    マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資

    MicrosoftのベンチャーキャピタルであるM12が南カリフォルニアのアーバインに本拠を置く音声認識のチップメーカーであるSyntiantの資金調達ラウンドをリードした。参加した投資家には著名なベンチャーキャピタルが多数含まれている。Syntiantは音声認識の半導体の新興メーカーだ。 続きを読む

  • アップルとカーネギーメロン大学が聞いて学ぶシステムを公開、よりスマートな家電開発目指す

    アップルとカーネギーメロン大学が聞いて学ぶシステムを公開、よりスマートな家電開発目指す

    Apple(アップル)とカーネギーメロン大学のHuman-Computer Interaction Institute(ヒューマン・コンピューター・インタラクション研究所)の研究者で作るチームが、周囲の音を聞いて学ぶ埋め込み型AIのためのシステムを披露した。 続きを読む