発声スキル
Alexa

Alexaが囁き、タメ、そして感情豊かな喋りのスキルを身に付けた

次の記事

Microsoftがプライバシー部門にオバマ時代のFTCの元委員をスカウト

これからAmazonのAlexaの声は、より人間臭く聞こえるようになるだろう。今週Amazonは、仮想アシスタントのための新しい発話スキルセットを追加したことを発表した。これによって、囁いたり、強調のためのタメを入れたり、速さや、高さや、声の大きさなどを調整したりすることができるようになる。その上彼女は不適切な言葉に「ピー音」を被せることさえできる。人間そのものではないにせよ、たしかに賢くみえる。

これらの新しいツールは、Alexaアプリ開発者に、Speech Synthesis Markup Language(SSML:音声合成マークアップ言語)という名前の標準的なマークアップ言語の形式で提供される。この言語によってAlexaのスピーチパターンをアプリケーションの中にコードとして埋め込むことが可能になる。これにより、Alexaプラットフォーム上での音声アプリケーション(”Skill”)の作成が可能になる。開発者はSkillのテキスト処理に際し発音や、イントネーション、タイミング、そして感情を制御できる。

Alexaは今日でも、既に多彩な個性を持っていて、人びとがその音声アシスタントを好きになる役割を果たしている。AppleのSiriがそのユーモラスな反応で人びとを驚かせたことを思い出そう、Alexaは彼女自身に対する質問に対して反応し、ジョークを話し、「愛してる」に答え、もしお願いすれば歌さえ歌ってくれる。しかし彼女の声はまだ時折ロボットのように響く、特に彼女が、本来途中で自然な息継ぎをしたり声のトーンを変えるべき長いフレーズやセンテンスを読み上げている最中に、それは顕著だ。

Amazonが説明しているように、開発者はこれらの新しいツールを使ってAlexaにETのように話させることもできるだろうが、ポイントはそこではない。開発者がツールを意図通りに使用できるようにするために、すなわちAlexaの発言パターンを人間らしくできるようにするために、Amazonは速さ、高さ、そして音量に対して開発者が適用できる変化量に制限を加えている(おそらく高音のきしむような叫び声は出せないと思われる)。

囁き、ビー音、強調、代替(Alと書いたものをアルミニウムと発音するなど、Alexaに書かれたもの以外の発音をさせる)、韻律といった合計で5つの新しいSSMLタグが提供される。最後のものは、音量、高さ、および速さを制御することだ。

これらの変更が実際のAlexaアプリでどのように機能するかを示すために、Amazonは新しいタグを使用するクイズゲームテンプレートを用意しているが、これを使って開発者たちは、Alexaの新しい声のトリックをテストすることが可能だ。

こうしたタグに加えて、Amazonは、イギリスとドイツの開発者たちに向けて”speechons”を導入した。それは、Alexaがその対話をより魅了的でパーソナルなものにするための、特別な言葉やフレーズたちだ。米国内では既に、 “abracadabra!”、 “ahem”、 “aloha”、 “eureka!”、 “gotcha”、 “kapow”、 “yay”、その他沢山の、speechconsが利用可能になっている。

これらが新しい市場へ登場することにより、Alexa Skill開発者たちは、地域特有の表現を使うことができるようになる。例えば米国ならば”Blimey”(びっくり!)とか“Bob’s your uncle”(大丈夫だよ)など、ドイツなら“Da lachen ja die Hühner”(大笑い)や、”Donnerwetter”(なんてこった)といったものだ。

現在、市場には1万2000以上のAlexa Skillが存在しているが、どれくらいの開発者が新しい音声タグを使うかは不明だ。

結局のところ、このAlexaの人間化は、アクティブな開発者コミュニティに存在に依存している。これは、Amazonにとって、使いやすい巧妙な仕掛けを構築すること以上に必要とされることだ。開発者たちが単なる興味だけで触れるだけでなく、Amazonの音声コンピューティング基盤上で運用できる実際のビジネスを作り上げるために、アプリコミュニティを支援することができなければならない。

[ 原文へ ]
(翻訳:Sako)