音声認識 / Voice Recognition(用語)

人間の声などをコンピュータに認識させて、言葉を文字列に変換したり、発声している人を識別する技術。

  • AI翻訳機「ポケトーク」が音声を翻訳し本体とウェブブラウザーに文字表示を行う「ハンズフリー翻訳(β版)」を新搭載

    AI翻訳機「ポケトーク」が音声を翻訳し本体とウェブブラウザーに文字表示を行う「ハンズフリー翻訳(β版)」を新搭載

    AI(人工知能)翻訳機の「ポケトーク」を手がけるソースネクストは、「ポケトーク W」、「ポケトーク S」、「ポケトーク S Plus」に「ハンズフリー翻訳(β版)」を追加しました。ハンズフリー翻訳(β版)は、リアルタイムでポケトークから音声をクラウドサーバに送り、クラウドサーバから翻訳結果をポケトーク本体や専用サイトに配信する仕組みです。専用サイトのURLやパスワードなどを相手に伝えることで、翻訳内容を共有することも可能です。 続きを読む

  • 議事録自動作成用AIツール26種類をまとめた「議事録作成AIカオスマップ」が公開

    議事録自動作成用AIツール26種類をまとめた「議事録作成AIカオスマップ」が公開

    人工知能(AI)を搭載したサービスの資料請求ができるAIポータルメディア「AIsmiley」を運営するアイスマイリーは3月8日、議事録自動作成用AIツールをまとめた「議事録作成AIカオスマップ」を公開した。掲載数は合計26サービス。 続きを読む

  • 現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達

    現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達

    現場作業の内容・状況をリアルタイムに遠隔地と共有可能できる「コネクテッドワーカーソリューション」を手がけるFairy Devices(フェアリーデバイセズ)は2月24日、シリーズBラウンドにおいて、総額約10億2000万円の資金調達を発表した。引受先および借入先は、商工組合中央金庫、DG Daiwa Ventures、みずほ銀行、りそな銀行、信金キャピタル、ダイキン工業、ユナイテッド、横浜キャピタル。 続きを読む

  • Pindropとの連携でデジタルレコーダーのTiVoに音声認識機能が帰ってくる

    Pindropとの連携でデジタルレコーダーのTiVoに音声認識機能が帰ってくる

    TiVoのデバイスに新しい音声認識機能が搭載される。これはアトランタを拠点とするスタートアップでコンシューマデバイス用の音声認識とパーソナライズ技術を提供するようになったPindropとの連携によるものだ。 続きを読む

  • コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達

    Serenadeの共同創設者マット・ウィートホフ氏がQuoraの開発者だったころ、手が反復性のストレス障害と診断され、プログラムコードのタイピングができなくなった。そこで彼ともう1人の共同創設者トミー・マクミリアム氏は、AIを使って手を使わずに口述でコードが書けるツールを開発しようと決意。そうしてSerenadeが誕生した。 続きを読む

  • マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に

    Cortana(コルタナ)はコンシューマー向けの音声バーチャルアシスタントとしては失敗したかもしれないが、Microsoft(マイクロソフト)はMicrosoft 365の一部として「パーソナル・プロダクティビティ・アシスタント」として再ブランド化し、ビジネスの現場ではCortana、あるいは少なくともそのブランドが存続することになった。 続きを読む

  • アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供

    アマゾンはAlexaデバイスのユーザーがもっとルーチンを使いやすくなる機能を提供する。ルーチンは数年前からある機能で、Alexaユーザーは複数のタスクをまとめて自分で選んだコマンド1つで実行できる。 続きを読む

  • 子供の言うことが理解できない音声アシスタントは授業での使用は困難

    子供の言うことが理解できない音声アシスタントは授業での使用は困難

    パンデミック発生前、新規のインターネットユーザーの40%以上は子どもたちだった。現在推定で子どもたちのスクリーンタイム(画面を見ている時間)は60%以上長くなっており、12歳以下の子どもについては、1日あたりのスクリーンタイムが5時間を超えている。(これにはメリットもあるが同時に危険性も伴う) 続きを読む

  • マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始

    Microsoftは米国時間8月25日、Microsoft 365の利用者全般に向けた新しい音声文字起こしサービス「Transcribe in Word(トランスクライブ・イン・ワード)」を開始したことを発表した。現在、この機能は、Wordのオンライン版で使用できる。他のプラットフォーム用のものは、後日追加される。 続きを読む

  • ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud

    著作権のある音楽を検出するには、音響指紋と呼ばれる技術に頼らざるを得ない。現在、そのツールで先駆者的な存在はAppleが所有するShazamだ。北京とデュッセルドルフに拠点を置く創設5年目のスタートアップACRCloudは、Audible MagicやNielsenが所有するGracenoteなどと競合しながら、このサービスを提供している。 続きを読む