音声認識 / Voice Recognition(用語)
人間の声などをコンピュータに認識させて、言葉を文字列に変換したり、発声している人を識別する技術。
-
現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達
現場作業の内容・状況をリアルタイムに遠隔地と共有可能できる「コネクテッドワーカーソリューション」を手がけるFairy Devices(フェアリーデバイセズ)は2月24日、シリーズBラウンドにおいて、総額約10億2000万円の資金調達を発表した。引受先および借入先は、商工組合中央金庫、DG Daiwa Ventures、みずほ銀行、りそな銀行、信金キャピタル、ダイキン工業、ユナイテッド、横浜キャピタル。 続きを読む
-
Pindropとの連携でデジタルレコーダーのTiVoに音声認識機能が帰ってくる
TiVoのデバイスに新しい音声認識機能が搭載される。これはアトランタを拠点とするスタートアップでコンシューマデバイス用の音声認識とパーソナライズ技術を提供するようになったPindropとの連携によるものだ。 続きを読む
-
-
コーディングは口述の時代へ、Serenadeが2.2億円のシード投資を調達
Serenadeの共同創設者マット・ウィートホフ氏がQuoraの開発者だったころ、手が反復性のストレス障害と診断され、プログラムコードのタイピングができなくなった。そこで彼ともう1人の共同創設者トミー・マクミリアム氏は、AIを使って手を使わずに口述でコードが書けるツールを開発しようと決意。そうしてSerenadeが誕生した。 続きを読む
-
マイクロソフトがビジネス向けCortana新機能を発表、iOS版Outlookはメール音声読み上げや各種操作が可能に
Cortana(コルタナ)はコンシューマー向けの音声バーチャルアシスタントとしては失敗したかもしれないが、Microsoft(マイクロソフト)はMicrosoft 365の一部として「パーソナル・プロダクティビティ・アシスタント」として再ブランド化し、ビジネスの現場ではCortana、あるいは少なくともそのブランドが存続することになった。 続きを読む
-
アマゾンAlexaの「ルーチン」を家族や友人などと共有可能に、サードパーティーも共有可能ルーチンを提供
アマゾンはAlexaデバイスのユーザーがもっとルーチンを使いやすくなる機能を提供する。ルーチンは数年前からある機能で、Alexaユーザーは複数のタスクをまとめて自分で選んだコマンド1つで実行できる。 続きを読む
-
-
子供の言うことが理解できない音声アシスタントは授業での使用は困難
パンデミック発生前、新規のインターネットユーザーの40%以上は子どもたちだった。現在推定で子どもたちのスクリーンタイム(画面を見ている時間)は60%以上長くなっており、12歳以下の子どもについては、1日あたりのスクリーンタイムが5時間を超えている。(これにはメリットもあるが同時に危険性も伴う) 続きを読む
-
マイクロソフトがウェブ版Word用の音声文字起こし機能と音声認識機能を提供開始
Microsoftは米国時間8月25日、Microsoft 365の利用者全般に向けた新しい音声文字起こしサービス「Transcribe in Word(トランスクライブ・イン・ワード)」を開始したことを発表した。現在、この機能は、Wordのオンライン版で使用できる。他のプラットフォーム用のものは、後日追加される。 続きを読む
-
ショートムービーから著作権音源を自動検出する技術を擁する中国のACRCloud
著作権のある音楽を検出するには、音響指紋と呼ばれる技術に頼らざるを得ない。現在、そのツールで先駆者的な存在はAppleが所有するShazamだ。北京とデュッセルドルフに拠点を置く創設5年目のスタートアップACRCloudは、Audible MagicやNielsenが所有するGracenoteなどと競合しながら、このサービスを提供している。 続きを読む
-
-
マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資
MicrosoftのベンチャーキャピタルであるM12が南カリフォルニアのアーバインに本拠を置く音声認識のチップメーカーであるSyntiantの資金調達ラウンドをリードした。参加した投資家には著名なベンチャーキャピタルが多数含まれている。Syntiantは音声認識の半導体の新興メーカーだ。 続きを読む
-
アップルとカーネギーメロン大学が聞いて学ぶシステムを公開、よりスマートな家電開発目指す
Apple(アップル)とカーネギーメロン大学のHuman-Computer Interaction Institute(ヒューマン・コンピューター・インタラクション研究所)の研究者で作るチームが、周囲の音を聞いて学ぶ埋め込み型AIのためのシステムを披露した。 続きを読む
-
会議や講演の音声をAIで自動的に文字起こしする「Smart書記」が8500万円を調達
音声自動文字起こしサービス「Smart書記」を手がけるエピックベースは3月12日、複数の投資家より総額で8500万円を調達したことを明らかにした。 続きを読む
-
-
音声アシスタントの聞き取り精度を大幅に向上させるAudioTelligenceの「音の自動焦点」機能
ケンブリッジ大学の資金援助で設立されたスタートアップAudioTelligenceは、「音の自動焦点」機能でシリーズA投資約9億2000万円を獲得した。 続きを読む
-
AIを使った音声テキスト変換アプリOtterがNTTドコモなどから戦略的投資10億円獲得
AIを使った音声のテキスト変換アプリOtter.aiにNTTドコモが巨額投資を行い、英語での会議の議事録を自動作成し翻訳するサービスで日本市場への参入を目指す。またベルリッツと共同で英語教育にもこの技術を役立てる考えだ。 続きを読む
-
自然言語理解APIを開発するヘルシンキの「Speechly」が2.4億円を調達
独自の音声言語理解技術を開発しユーザーの複雑な意図を理解することを目指すヘルシンキの「Speechly」が、約2億4000万円のシード資金を調達した。 続きを読む
-
2020年はAI利用の対話型音声広告がブレーク、Instreamaticに注目
これまで音声広告を収益化する方法を発見するのは困難だったが、Pandoraがテスト中のInstreamaticはユーザーがストリーミングに挿入される広告と音声で会話する機能を提供する。 続きを読む
-
Pandoraが対話できる音声認識広告のテストを開始
音楽ストリーミングのPandora(パンドラ)は、リスナーの声に反応する新型広告のテストを開始した。この新しい広告では、質問の後に音が鳴り、リスナーは「イエス」と答えるよう促される。その後、広告は質問に即した製品やブランドの詳細を説明する。たとえば、ウェンディーズの広告では、お腹が空いているかどうかをリスナーに尋ねる。「イエス」と答えると、何を食べたらよいか、お勧めのメニューを広告が教えてくれるといった具合。 続きを読む
-
GoogleのAI音声認識の自動文字起こしがPixel 3/3aでも利用可能に
10月のPixel 4の発表イベントでデモされたRecorderはユーザーの音声を録音するだけでなくAIを利用して認識しリアルタイムでテキストを生成するもので、驚くほど誤りが少なかった。 続きを読む
-
GoogleがProject Euphoniaの包括的な音声認識を支えるAIの詳細を発表
アクセシビリティに向けた新たな取り組みの一環として、Googleは5月のI/OでProject Euphonia(プロジェクト・ユーホニア)を発表した。 続きを読む
-
グーグルがコンタクトセンターの音声技術をアップデート
Contact Center AIはGoogleのさまざまな機械学習ツールを使って仮想エージェントを作り、人間エージェントの仕事を助ける。今日(米国時間7/24)同社はこのツールのアップデートをいくつかローンチし、その中には特に、音声認識機能の改良がある。 続きを読む
-
GoogleのProject Euphoniaは発話障がい者の話し言葉の認識を目指す
GoogleはProject Euphoniaというプロジェクトで、発話障がいのある人の話し言葉に関する研究をしている。音声のサンプルを収集してAIで認識するためのモデルの構築を目指す。 続きを読む