音声認識 / Voice Recognition(用語)

人間の声などをコンピュータに認識させて、言葉を文字列に変換したり、発声している人を識別する技術。

  • コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    Serenadeの共同創設者マット・ウィートホフ氏がQuoraの開発者だったころ、手が反復性のストレス障害と診断され、プログラムコードのタイピングができなくなった。そこで彼ともう1人の共同創設者トミー・マクミリアム氏は、AIを使って手を使わずに口述でコードが書けるツールを開発しようと決意。そうしてSerenadeが誕生した。 続きを読む

  • マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    Cortana(コルタナ)はコンシューマー向けの音声バーチャルアシスタントとしては失敗したかもしれないが、Microsoft(マイクロソフト)はMicrosoft 365の一部として「パーソナル・プロダクティビティ・アシスタント」として再ブランド化し、ビジネスの現場ではCortana、あるいは少なくともそのブランドが存続することになった。 続きを読む

  • アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンはAlexaデバイスのユーザーがもっとルーチンを使いやすくなる機能を提供する。ルーチンは数年前からある機能で、Alexaユーザーは複数のタスクをまとめて自分で選んだコマンド1つで実行できる。 続きを読む

  • 子供の言うことが理解できない音声アシスタントは授業での使用は困難

    子供の言うことが理解できない音声アシスタントは授業での使用は困難

    パンデミック発生前、新規のインターネットユーザーの40%以上は子どもたちだった。現在推定で子どもたちのスクリーンタイム(画面を見ている時間)は60%以上長くなっており、12歳以下の子どもについては、1日あたりのスクリーンタイムが5時間を超えている。(これにはメリットもあるが同時に危険性も伴う) 続きを読む

  • マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    Microsoftは米国時間8月25日、Microsoft 365の利用者全般に向けた新しい音声文字起こしサービス「Transcribe in Word(トランスクライブ・イン・ワード)」を開始したことを発表した。現在、この機能は、Wordのオンライン版で使用できる。他のプラットフォーム用のものは、後日追加される。 続きを読む

  • ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    著作権のある音楽を検出するには、音響指紋と呼ばれる技術に頼らざるを得ない。現在、そのツールで先駆者的な存在はAppleが所有するShazamだ。北京とデュッセルドルフに拠点を置く創設5年目のスタートアップACRCloudは、Audible MagicやNielsenが所有するGracenoteなどと競合しながら、このサービスを提供している。 続きを読む

  • マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資

    マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資

    MicrosoftのベンチャーキャピタルであるM12が南カリフォルニアのアーバインに本拠を置く音声認識のチップメーカーであるSyntiantの資金調達ラウンドをリードした。参加した投資家には著名なベンチャーキャピタルが多数含まれている。Syntiantは音声認識の半導体の新興メーカーだ。 続きを読む

  • アップルとカーネギーメロン大学が聞いて学ぶシステムを公開、よりスマートな家電開発目指す

    アップルとカーネギーメロン大学が聞いて学ぶシステムを公開、よりスマートな家電開発目指す

    Apple(アップル)とカーネギーメロン大学のHuman-Computer Interaction Institute(ヒューマン・コンピューター・インタラクション研究所)の研究者で作るチームが、周囲の音を聞いて学ぶ埋め込み型AIのためのシステムを披露した。 続きを読む

  • 会議や講演の音声をAIで自動的に文字起こしする「Smart書記」が8500万円を調達

    会議や講演の音声をAIで自動的に文字起こしする「Smart書記」が8500万円を調達

    音声自動文字起こしサービス「Smart書記」を手がけるエピックベースは3月12日、複数の投資家より総額で8500万円を調達したことを明らかにした。 続きを読む

  • 音声アシスタントの聞き取り精度を大幅に向上させるAudioTelligenceの「音の自動焦点」機能

    音声アシスタントの聞き取り精度を大幅に向上させるAudioTelligenceの「音の自動焦点」機能

    ケンブリッジ大学の資金援助で設立されたスタートアップAudioTelligenceは、「音の自動焦点」機能でシリーズA投資約9億2000万円を獲得した。 続きを読む