Google 新技术,机器语调超自然与人无异

robot-2167836_960_720-624x390

Google 人工智能(AI)技术再进化,该公司宣布能让机器人说话语调不再生硬,听来和人类难辨真假。

PhoneArena、Quartz、每日邮报报导,Google 博客宣称,开发出第二代文字转语音系统“Tacotron 2”,能让机器说话声音没有怪异、不自然之处,听来几乎和人类一模一样。机器会依据语意学决定正确发音,文章略有拼写错误也能顺利读出,而且就连绕口令都难不倒。

(Source:Google)

Google 人员表示,外界认为 Tacotron 2 表现类似专业人员。民众给 Tacotron 2 的平均意见分数(Mean Opinion Score)是 4.53 分,只略低于专业人员录制声音的 4.58 分。

Tacotron 2 包括两个深度类神经网络,第一个网络会把文字转成声谱图,用图像表达音频,接着把声谱图输入 WaveNet 系统中,机器会照图发出相应声音(Tacotron 2 与人类声音对照点此)。

不过 Google 表示,Tacotron 2 仍有许多地方需要改进,包括无法读出部分难字,无法即时合成音频;机器声音没有情绪,不能传达快乐或悲伤的感觉。

尽管如此,此一技术仍大有可为,目前 Google 虚拟语音助理已用 WaveNet 技术发声,若能进一步采用 Tacotron 2,可让 Google 助理如虎添翼。