首页>>厂商>>语音识别与合成>>科大讯飞

讯飞语音引领车载导航新世代

2009/06/09

  语音技术与车载导航设备的结合是大势所趋,既是用户实际与迫切的需求,又是导航产品的必然发展方向,市场空间极为广阔。在不远的将来,语音车载导航技术以及整车语音技术的应用水平,将成为衡量高端车型的一个重要标准。未来,语音技术在汽车上的应用将更为普遍,成为汽车的一项基本配置和功能。科大讯飞作为全球领先的智能语音技术提供商,以从语音合成到语音识别全面领先的核心技术为车载导航提供“能听会说”的完整的、交互式语音解决方案,正携手广大汽车与车载设备厂商共同引领语音导航新世代的来临。

语音导航是汽车产业发展的必然

  从全球汽车产业发展状况来看,语音技术在车载导航中的应用是一种新的趋势。目前,雷克萨斯与奥迪都正专注于改善语音识别在其所产车型上的应用效果,奥迪于近期推出了新的升级版软件来更新其MMI,使其用户体验更加友好、准确、便捷。同时,更多整车厂商也在为车载导航产品积极寻求适合的语音技术提供商和解决方案。特别是从长远发展考虑,语音合成与语音识别必将融合为交互式的语音应用,因此厂商对于语音技术提供商具备合成与识别全面技术优势与提供完整解决方案的能力高度关注,而这也正是科大讯飞与厂商建立普遍合作占据市场主导地位的核心优势所在。

  传统的车载导航产品,是用眼睛看的方式获取相关信息,对汽车驾驶者而言存在一定的安全隐患。而车载语音导航系统则从根本上变革了信息获取方式,变看为听,并以说的方式进行设备操控,使车载导航更具人性化,使驾驶者、乘车者出行更安全、方便。

  当前,将车载导航设备与语音技术结合也成为了国内各厂商普遍关注的增加产品亮点和竞争力的一条重要途径。对于车载导航来说,有了语音合成,无论是千变万化的道路名称,还是随时到来的路况信息,都能随时播报;有了语音识别,目的地设定、路况信息查询,只需说出命令即可完成操作。“合成+识别”的理念和解决方案,真正实现了交互式的语音导航系统,从根本上解决了安全隐患,提升了汽车驾驶乐趣。

语音应用的技术难点

  语音技术在车载导航中的应用存在两大难点:语音合成方面技术难点在于语音合成的技术水平与质量。语音识别方面的技术难点主要表现在对众多口音和方言的支持、对车内噪音环境的适应和处理,以及命令中关键词的提取上。

  中国地大物博,方言有几千种,部分方言与普通话差别甚大,基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。

  对于中文语音识别应用中经常面临的方言口音、复杂信道和背景噪声等问题,依据从实际业务系统中收集的涵盖不同方言和不同环境噪声的海量语音数据,采用最新的区分性训练方法进行语音建模,从而使语音识别产品在复杂应用环境下可以拥有良好的一致性效果表现。

  “随意说”的难点在于核心命令词的提取、语意分析。该技术使用户可以自如地以自然语言与智能语音信息服务系统进行交互,经过引擎的自然语意分析理解而得到用户的意图,再反馈给用户对应的需求信息,从而引导用户达到其预想的目标。

  另外,在车辆使用过程中,发送机的运转声、空调噪音、窗外环境的噪声和风噪等各类噪音会对车内的语音识别效果形成一定的影响。总而言之,解决应用技术难点的核心在于语音技术供应商在核心技术、语音资源库等方面的长期积累、研究。

科大讯飞为业界提供完美解决之道

  目前国内已推出的具有语音功能的导航产品中绝大部分应用的都是科大讯飞的语音合成技术,实现信息语音播报、语音操作提示等功能,并对于语音识别技术在导航产品中的应用与厂商共同合作进行预研和应用探讨。

  作为中国最大的智能语音技术提供商的科大讯飞,在智能语音技术领域有着长期的研究积累,并在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。科大讯飞中文语音合成技术在近年来历届国内、国际权威机构的评测中,主要关键技术指标均名列第一,并被信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。科大讯飞中文语音合成技术2005年在业界首次超过普通人口语水平(普通人口语自然度得分4.0分,讯飞中文语音合成技术自然度达到4.3分)。2003年,科大讯飞获迄今中国语音产业唯一的“国家科技进步奖(二等)”,2005年获中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。

  2006年、2007年、2008年连续三届英文语音合成国际大赛(Blizzard Challenge )荣获第一名。2008年获国际说话人识别评测大赛桂冠。科大讯飞已实现了从中文到英文等多语种,从语音合成到语音识别的全面技术领先。

  经过多年的研究,公司积累了大量的方言数据库,语音合成技术已经达到不仅能生成标准流畅的普通话,而且可以支持四川话、河南话、湖南话、东北话等几乎全部的主流方言,语音识别技术支持接近普通话的方言,有效解决了语音技术的应用难点。

  语音识别技术的应用对硬件设备及软件系统的支持能力会有更高的要求:其一,在硬件配合上,需要更高性能的处理器,区别于一般性能的高品质麦克风和适合录音数据传送的音频电路,以此来保证识别引擎接受数据的完整性和可用性;其二,在导航软件上,需要软件开发商在搜索引擎的接口中加入便于语音识别系统可以调用的数据和命令菜单,以此来实现分类信息搜索、POI搜索和交叉路口搜索等功能。

  语音导航的操作非常简单,不过需要具备两个前提:第一,需要导航软件厂商将车载设备可以支持的命令词内容信息告知用户(这些内容可能是在导航菜单界面的功能名称,也可能是用户自行设置的目的地名称及手机联系人的名称等);第二,车载设备商可以在方向盘或车载导航仪上安装一个语音识别启动按键,通过按动识别键启动语音控制系统,用户对着识别麦克说出自己的需求,系统通过识别用户的语言,实现用户的需求。

  语音技术在车载导航中的应用,当关闭车窗时,只要是普通话或与普通话相近的方言,讯飞语音一次性识别正确率都可以达到90%以上。此外,语音识别功能的成本已经大大降低,加入的硬件和软件授权费都在厂商和用户的接受范围之内,与语音车载导航的高性能、高附加值相比,可以说是微不足道。

  在实际使用中,如用户需要语音导航仪寻找当前所在位置附近的加油站,按动识别键后直接对着麦克风说“导航到附近加油站”,语音导航仪会将搜索到的附近加油站的位置和具体信息通过图形显示和语音回馈给用户。

  当用户需要查询某一位置时可以说出此POI的名称,如“家乐福超市”,识别系统便会结合搜索引擎按照由近至远的方式为用户列出附近的家乐福超市的位置信息;另外,用户也可以说出希望去往的某个交叉路口的名称,如“深南大道和农林路交叉口”等找到目的地。

  随着智能语音识别技术的不断完善,数据资源的不断积累,用户可以不拘于固定的语言表达方式而用较为自然的语音进行命令输入,如“导航到某某地”这样的命令也可以说成“我想去某某地”、“某某地在哪”或“带我去某某地”等多种表述方式,语音系统都可以正确识别并处理。

  总而言之,科大讯飞之所以能够为业界提供完美解决之道,受到厂商的普遍青睐,核心技术的全面领先、长期的研究积累是根本原因,科大讯飞的先发优势和资源积累形成了短期内难以仿效的竞争优势,树立了牢固的市场领导者地位。

市场前景分析

  一项统计表明,中国的车载导航市场前景广阔:日本的汽车车载导航安装率高达59%,欧美市场为25%,而中国车载导航安装率尚不足2%。中国地大物博、交通情况复杂的特点也决定了导航设备在中国的应用更具必要性与现实意义,且中国导航产品具有突出的性价比优势。

  随着语音技术与车载导航的结合,将进一步增强汽车的安全、娱乐和舒适功能。语音系统可以实现CD、MP3、收音机功能控制,也可以实现语音点歌搜索:用户只要说出歌手或歌曲名称,或者哼唱一段歌词,车载MP3就会搜索到你想要听的音乐。车载设备通过蓝牙与手机连接后,只要对其说出人名或号码,手机就会进行自动拨号。另外,通过声控可以实现车内温度、亮度等调节,使驾驶者能够真正享受到车内舒适生活。除了语音识别技术,语音合成系统可以实现对汽车油量、电量、胎压以及速度的播报及声控结果的反馈确认等。

  未来,语音系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,真正成为车载设备综合控制终端,解放驾驶者的双手,为改善行车安全、提升车载娱乐价值、促进车载信息化发挥举足轻重的作用。

  目前,随着中国汽车工业的快速发展和汽车保有量的增加,智能语音技术在车载导航设备上的创新应用,为汽车用户多增添了一份安全感和舒适感,亦对整个产业链的拓展、发展具有重要意义,为汽车制造和设备厂商提供了新的、广阔的增值空间。以语音技术应用为标志的车载导航新世代正在来临,科大讯飞与合作伙伴携手,正昂首阔步引领未来。

CTI论坛报道


相关链接:
讯飞语音牵手中兴通讯 共同打造TD无线座机 2009-06-08
讯飞语音助城商银行征战新市场 2009-05-15
科大讯飞语音技术带来手机行业变革 2009-05-13
讯飞语音让MP3开口说话 2009-04-30
科大讯飞即将推出新一代语音合成芯片XF-S4041 2009-04-29