Latest

Alexaのスキルのデベロッパーは8つの声を使い分けられるようになる(当面アメリカ英語のみ) |

Megan Rose Dickey

これからは、デベロッパーが作るAlexaの音声アプリは、Alexaの声でなくてもよい。Amazonは今日(米国時間5/16)からデベロッパーに、テキスト→音声変換サービスAmazon Pollyで使われている声の中から8つを無料で提供する。ただし当面はアメリカ英語だけで、Amazon PollyのWebサイトによると、女声5名、男声3名だ。

Amazon Pollyが最初に紹介されたのは2016年11月のAmazon re:Inventデベロッパーイベントで、その後着実に能力を高めている。このテキスト音声変換サービスは今では、ささやき声やスピーチマーク、音色の変化、ダイナミックレンジの圧縮、などの機能を提供しており、これらにより声がより自然に聞こえる。

今回Alexaデベロッパーに提供されるのはアメリカ英語だけだが、このスピーチエンジンは今では20あまりの言語をサポートしている:

Australian EnglishNicoleRussell
Brazilian PortugueseVitóriaRicardo
Canadian FrenchChantal
DanishNajaMads
DutchLotteRuben
FrenchCélineMathieu
GermanVickiHans
Marlene
IcelandicDóraKarl
Indian English

Raveena

Aditi

ItalianCarlaGiorgio
JapaneseMizukiTakumi
KoreanSeoyeon
NorwegianLiv
PolishEwaJacek
MajaJan
Portuguese – IbericInêsCristiano
RomanianCarmen
RussianTatyanaMaxim
Spanish – CastilianConchitaEnrique
SwedishAstrid
TurkishFiliz
UK EnglishAmyBrian
Emma
US EnglishJoannaMatthew
SalliJustin
KendraJoey
Kimberly
Ivy
US SpanishPenélopeMiguel
WelshGwyneth
Welsh EnglishGeraint

でも、複数の声が使えると、ゲームやお話などではAlexaがもっと楽しくなる。ほかにも、いろいろ、奇抜な使い方があるだろう。

今、自分が作るスキルで複数の声を使ってるデベロッパーは、mp3のファイルをアップロードするなど、面倒なことをいろいろしなければならない。

Amazon Pollyを使うなら、デベロッパーはStructured Speech Markup Language(SSML)という言語を使い、その“voice name”タグで声を指定する。指定するだけだから、自分でmp3を録音することに比べると、超楽である。

Amazonはこれまでも、Pollyの用途を広げようと努力してきた。最近ではWordPress用プラグインを提供し、テキストによるブログを簡単にポッドキャストに変身できるようにした。

もちろん今回のAlexaのスキルAPIへの提供も、その努力の一環だ。ライバルのGoogle Assistantとの競合、というねらいもある。

(Googleは先週のデベロッパーカンファレンスで、Wavenetが生成する6つの声を発表したが、その中には歌手のJohn Legendの声もある。その展開は今年後半からだが、たぶんAssistantのデベロッパーにもその声の利用を売り込む気だろう。)

[原文へ](翻訳:iwatani(a.k.a. hiwa

NewlyRead is proudly powered by NewsAPI.org