凤凰网站消息:熟练中文输入法的人可能很难体会“一指神功”的痛苦,而中文输入法的困难,也被视为华人地区推动计算机普及的障碍之一。但这种痛苦将随着中文语音输入法的逐渐成熟而得到纾解,只要动动嘴巴,就能轻松驾驭计算机。
现行的计算机键盘是为输入英文而设计的,因此利用键盘输入中文,不管是注音、大易、仓颉,都必须熟记对应的按键,才能提高输入的速度。若非工作需要,一般人可能懒得花时间学习输入法,对老年人或儿童而言,多少也有学习上的困难。而随着计算机CPU速度加快及语音辨识技术的进步,目前的语音输入法不仅辨识率提高,而且可应用在各种应用软件中,还可用语音来操控窗口指令,可说是最自然的人机接口。
当然,计算机并不是真的能听懂你所说的话,而是利用语音辨识核心引擎去比对你的声音,再从数据库中找出相对应的字词,若是CPU速度快、内存较大,这个过程所花的时间就相对减少。而要进行语音输入,声卡及麦克风是不可少的配备,声卡在一般计算机中都早已安装好,而语音输入软件包也大都会附上一只麦克风,不需要再添购额外的装备。而每个人的声音特征都不相同,因此多人使用同一套语音输入软件时,得各自建立自己的语音模型,这样辨识率才会高。
ViaVoice 7.0练3句马上认得你
IBM在语音辨识技术上有不错的成绩,由此衍生出来的软件包“ViaVoice快乐颂”系列产品已推出到7.0版。在ViaVoice最新的版本中,只要练习三句话,就能立刻上手,而且一开始就内建有6万个字汇,使用者可视需求自行再增加6万4千个字汇。而软件会在你的使用过程中,了解你的习惯用语,而逐渐提高辨识率。因此,经常使用,训练人机一体,语音输入就更能驾轻就熟。
在ViaVoice 7.0中也有语音命令功能,可以口语执行激活程序、切换窗口等命令,并提供宏功能,可建立自己的语音命令。同时,ViaVoice 7.0也新增了语音浏览功能,可在浏览器中以语音来点选画面中的超级链接,用嘴巴就可以漫游网际网络。此外,语音合成功能也是新增的功能,计算机不仅能听也能说,开启这个功能可以朗读计算机中的中文文件或网页内容。
在IBM之外,国内也有厂商专门开发语音辨识技术。声硕科技的“说亦通2000”适用在所有的应用软件上,在未经训练的情况上即可有85%以上的辨识率,并内建有专业词库,如法律规章、时事新闻、计算机通讯等,让语音输入软件在专业领域使用时也能有高辨识率。此外,“说亦通2000”还有口音训练系统,为使用者量身制作个人语音模型,并有独创的语音计算器,加减乘除也可用说的。
语音情人听得懂Y世代用语
在“说亦通2000”之外,声硕科技也针对学生族群开发出“语音情人”的语音输入产品,以约二千名15到25岁男女的声纹模型为基础,再加入Y世代常用语汇,以符合年轻人的使用习惯。虽然少了专业词库,但“语音情人”的售价比“说亦通2000”便宜许多,同样也附一只麦克风,在市场上成绩不错。
但是,语音输入真是万灵丹吗?其实,语音输入法仍有其限制,不管业者标榜的辨识率有多高,但就是无法达到百分之百的地步。在这种情况下,语音输入仍需要以选字或其它输入法来辅助。IBM及声硕科技都将语音辨识引擎授权给其它软件业者制作相关产品,像是翔威、人因科技、蒙恬与新颖等公司,都有语音输入软件问世,而且不少都加上手写功能的辅助,可满足使用者不同的需求。此外,目前的中文语音输入只听得懂中文,若中、英文夹杂,就无法正确辨识,这也是业者努力改进的方向。
然而,语音辨识的技术不只是应用在中文输入上,声硕科技与证券业及电信业者合作,开发自动语音总机系统。IBM则看好携带式设备及IA家电,计画将语音辨识技术应用在嵌入式软件上,执行语音命令的动作。
2000/07/11 凤凰卫视
| 双节流行3G视频新业务——化身(AVATAR) 2009-09-17 |
| Ditech语音转换文本技术将打造新型移动服务 2009-09-14 |
| 科大讯飞嵌入式语音新产品发布会在深圳举行 2009-09-07 |
| 英国科学家成功开发识别多种语言唇读技术 2009-09-07 |
| Convergys定制式语音鉴权方案获市场领袖奖 2009-09-02 |