您当前的位置是:  首页 > 新闻 > 国内 >
 首页 > 新闻 > 国内 >

同传、速记、话务员将下岗 专家谈智能语音的下一个时代

2016-11-08 10:30:03   作者:   来源:CTI论坛   评论:0  点击:


  最近,毕马威会计事务所在一份报告中预测:到2030年,银行的许多服务性工作岗位将消失,取而代之的是类似苹果公司Siri的智能语音系统。不管这一预测是否准确,智能语音技术进入我们的生活,已是事实。它在哪些领域能够取代人的工作?其应用前景如何?在发展过程中,还存在什么技术瓶颈?记者采访了上海交通大学和科大讯飞的专家。
同声传译将由机器来做
同声传译将由机器来做
  在近日举行的锤子手机发布会上,讯飞输入法有一段惊艳表现:在罗永浩讲完一大段不太标准的普通话后,这款软件几乎一字不差地记录下来,标点符号也基本正确。谈及准确率高的原因,科大讯飞上海分公司总经理程苏表示,讯飞输入法具有语音识别和语义识别功能,不但能把普通话、方言、外语的语音准确记录下来,还能通过语义识别技术进行“句读”,较为准确地使用标点符号。
  与手机语音输入相比,会场语音记录的难度更大。因为在会场上有许多噪音,需要通过加混响、去混响等技术降低噪音,辨识出演讲者的语音,再把这些语音转换成文字。目前,国内这种产品已经成熟,能取代速记员。“按照‘每个字记录得是否准确’这个标准,速记员的准确率通常不超过80%,而讯飞的准确率达到95%。”程苏说。
  他还透露,今年底,讯飞将发布一款能替代同声传译的产品。“届时,会场上将有两块屏幕,一块显示中文,另一块显示英文,让大家对机器同传的准确率一目了然。”据介绍,要实现机器同传,除了语音识别、语义识别技术外,还需机器翻译、语音合成两种技术。在专业性不强的会议上,机器同传已能取代人工,节省许多会务费用。而在专业会议上,这种系统需要前期接受大数据训练,标注出专业术语,这样在现场就能应付自如了。
  据介绍,语音识别结合机器翻译的实用性很强。通过一些手机软件,用户能将多种外语以及我国少数民族语言的语音译成汉语,在一些交流场合,不再需要翻译人员的帮助。
科大讯飞工作人员在展示一款语音产品。
科大讯飞工作人员在展示一款语音产品。来源:新华社
  从“感知”向“认知”迈进
  话务员、窗口服务员的工作也正在被智能语音系统取代。例如,拨打中国平安服务热线“95511”后,用户会听到语音提示,让他说出自己要办理的业务,说出后直接跳转到相应服务,不再需要按键。又如,中国移动的一些营业厅已引入语音交互机器人,让它们为用户办理各种业务。
  尽管如此,上海交通大学计算机系教授、思必驰联合创始人俞凯表示,智能语音系统目前还只能取代部分语音交互服务岗位。其原因,是现实交流场景中,人们听到的大多是“非配合式语音”——表达得并不清晰,讲述的是复杂问题,常常需要多次交互,才能理解对方的意思。在这种场景下,目前的智能语音系统远没有达到应付自如的程度。为此,这一领域的科研人员正在从“感知”向“认知”阶段迈进,即在基本解决了语音识别问题后,着力增强这种系统的智能,使它们能更好地理解人类的自然语言。
  苹果公司的作为,就反映了这一趋势。去年,该公司收购了英国公司VocalIQ,希望提高语音助手Siri的智能水平。在剑桥大学做科研时,俞凯参与创办了VocalIQ。这家公司开发的自然语言数据库能存储、学习用户的语音信息,实现对用户指令的准确识别,并给出相应的回复。“苹果手机刚推出Siri那阵子,很多人喜欢和Siri开玩笑,因为它时常答非所问。”俞凯说,只有借助更先进的语言认知系统,Siri才会变得更有用。
苹果手机Siri的智能有望升级。
苹果手机Siri的智能有望升级。来源:环球网
  物联网时代,语音是刚需
  随着智能语音系统的认知能力越来越强,它的用途越来越广。另一方面,随着物联网时代的到来,智能语音交互将逐步成为人们生活中的“刚需”。俞凯分析说,我们已经历两个互联网时代——PC(个人电脑)互联网、移动互联网,在第一个时代,我们用键盘、鼠标输入信息;在第二个时代,通过手指触摸、虚拟键盘输入信息。由此可见,语音输入不是“刚需”,尽管一些智能语音软件的准确率很高,但用户比例还是比较低的。然而,人类即将迎来硬件物联网时代。在这个时代,许多智能硬件没有屏幕,即便有,在一些场景中也会离用户比较远,语音交互就会成为最便捷的操控方式。
\
  为了满足这一未来需求,国内外很多企业正在垂直领域发力,开发具有更多智能功能的语音产品。科大讯飞、思必驰开发的车载系统,就是一个典型的垂直领域。在汽车里,驾驶员无法用手操作设备,语音操控的需求很大。据介绍,思必驰去年推出了可纠正、可打断的交互系统,用户能随时打断语音助手、纠正自己的错误。如在车上拨打电话时,用户说出号码后,语音助手重复这个号码时,用户可以打断它并进行修正(如说“不是135,是136”),而系统能理解这句话的意思。“我们希望在车载通话、听音乐等垂直领域不断取得突破,同时通过高校科研,提高系统在开放领域的语言认知水平,迎接物联网时代的到来。”俞凯说。

专题