人工智能能听懂“方言普通话”吗?中国首个给机器人“听”“说”能力打分的标准来了

u=1876904433,3470763672&fm=173&app=25&f=JPEG

带方言口音的普通话人工智能能听懂吗?在嘈杂的环境中,知道要“听”哪些声音而忽视另一些声音吗?“听”到不同表述方式,能够理解吗?

随着智能音箱、人机互动家电等应用人工智能的产品进入人们生活,大家对机器“听”人讲话并给出回应已经不陌生。但是,到底怎样“听”才算“听得懂”,却并无统一标准。

不过,这一局面有望改变。解放日报·上观新闻记者9月12日获悉,由上海企业平安好医生与智能语音识别技术公司云知声共同起草的《中文语音识别难度分级认证规范》讨论稿(以下简称《认证规范》)已经完成,并在中国人工智能产业发展联盟(AIIA)2018年联盟会员大会的标准化与推广工作组专项讨论会议上进行了标准框架汇报,得到专家认可。这是国内首个关于中文智能语音识别难度的标准规范,有望为形形色色人工智能产品的“听”“说”能力打分,避免“假智能”滥竽充数。

近年来,国内人工智能语音领域各大厂商深耕技术研发,中文语音识别率提升至90%以上,云知声在医疗等垂直行业识别率则达到97%以上。随着智能语音识别技术的飞速发展,智能家居、智慧车载、智慧医疗、智慧教育等领域均广泛应用智能语音交互解决方案,实现了人机互动,也因其便利性吸引了大量用户。艾瑞咨询发布的《中国智能家居行业研究报告》数据显示,2017年,我国智能家居市场规模就达到3342.3亿元,同比增长24.8%,这也意味着智能语音识别技术的应用前景广阔。

然而,由于缺乏应用层面的统一标准规范,企业在研发及推广相关产品时,缺乏足够的市场公信力,而用户选择相关产品时,也没有权威的技术指标加以参考。标准缺失成为制约行业发展的主要障碍之一。在国际上,IBM、Microsoft、AT&T等跨国公司对语音技术的研究已持续多年,并积极参与语音技术领域的标准制定,以期在激烈竞争中处于技术的制高点。中国虽已开始推广架构、接口等技术层面的标准,但应用层面的标准规范长期空白,不利于中国智能语音识别技术及产业的发展。

2017年12月,平安好医生与云知声合资成立上海澔医智能科技有限公司,共同探索以智能语音识别等技术为基础的家庭智慧医疗服务终端建设。针对企业及行业发展需要,平安好医生与云知声经过半年多的联合研究,根据中文语音的自身特性,起草了《认证规范》框架。

《认证规范》将中文语音识别难度分为L1-L4四个等级,并分别从声学和语言学两个维度确定了信噪比、普通话水平、说话习惯、语言句式等十余个影响因素,对智能语音交互类产品在实际应用场景下的识别率提供了定级依据。因此,这一《认证规范》的推出,有望为我国智能语音识别技术及产业发展,提供切实可行、可加以全面推广的技术标准。

中国人工智能产业发展联盟是由中国信息通信研究院牵头会同中国电子技术标准化研究院、国家工业信息安全发展研究中心等单位,以及全国300余家人工智能相关企业、机构等共同发起组建,在行业内具有较高权威性和公正性。针对《认证规范》讨论稿,相关专家一致认为,该规范切中产业发展痛点,针对应用层面的中文智能语音识别技术的难度和能力提出了分级评价的关键参数体系,对于产业应用推广具有重要意义。