首页 > 新闻 > 专家观点 >

2016语音技术产业一览之辅助技术

2016-05-30 09:21:23   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦): 人类的听、说、看的能力是上苍赐予我们的礼物,而听力受损,语言障碍和部分或全部失明是人类每天都要面临的挑战。语音识别技术正在帮助解决大多数情况下的这些问题。
  这些帮助改善“听、说、看”能力的技术被人们寄予厚望,尤其在老龄化日益严重的今天。随着年龄的增长,越来越多的人开始发生这些类型的障碍。
\
  更具体地说,根据美国疾病控制和预防中心(CDC)的数据,美国每年大约有750000人中风,又根据美国心脏协会(AHA)的数据,由此每年造成的死亡人数为129000.其他的数据则声称美国每年中风数高达100万。中风在AHA的人类死亡原因中位列第五。根据美国国家失语症协会和阿德勒失语症中心的数据,目前美国的失语人数分别是100万和200万。根据美国国家失语症协会的数据,每年有超过80000的美国人被诊断为失语症。根据疾病防治中心的说法,目前有超过1000万的美国人患有认知障碍。医疗保健的支出在美国和世界各地都呈上升趋势,所以有更多的人比以往任何时候都更加需要获得“听、说、看”辅助设备。
  历史最悠久、最公开的语音技术是语音合成技术,世界著名的物理学家和作家斯蒂芬·霍金利用这种技术进行交流。卡内基梅隆大学消费者科学教授Alan Black说,霍金使用的是某些30年前开发的基本系统,这些系统是为了那些失去了他们的声音和那些从来没有声音的人们而开发的。
  通过使用一个嵌入在他的脸颊中的小传感器激活,霍金“类型”字符和数字通过一个语音生成设备(SGD)产生出经过合成过的语言。霍金的设备是由now-defunct Speech Plus。开发的。这家公司是目前这类设备的最大制造商,位于美国的匹兹堡。它是基于DynaVox公司的LLC系统,一家Tobii科技公司。
  霍金的设备使用了一个具有美国口音的机器人声,而霍金是英国人,DynaVox公司和其他公司提供各种各样的声音,以便可以合成个性化的语言。
  租赁你自己的声音
  进一步的几个步骤使辅助语音系统利用你自己的声音录音,这样复制的演讲听起来就像个人在使用设备。
  这样的设备在市场上最著名的就是影评人罗杰·艾伯特(Roger Ebert)使用的了,他是第一个使用语音合成器发出伊利诺伊英国口音的人。艾伯特因为癌症切除了他的下巴,从而失去了说话的能力。
  艾伯特最终被CereProc CereVoiceMe的声音克隆服务所吸引。起初他不喜欢它,因为他不认为这个声音听起来像他自己的声音,尽管它来自于30年代的电视节目和广播节目录音。艾伯特不认为声音是他自己的原因是因为你录制的声音不同于你所听到的声音。当你说话的时候,是头骨和鼓膜振动的合成。听录音时,只听到通过鼓膜振动的那部分。
  那些知道正在失去讲话能力的人们往往会利用今天不同公司所提供的语音克隆技术记录几个小时自己的声音。通常,更多的记录时间可以使自己的声音更自然的再现,也会因为更多的词形变化和其他说话时的细微差别而原音重现。当然,更强大的解决方案所需费用也更高。
  Lingraphica最近增加了即时消息和电子邮件功能,这给它的7英寸minitalk模型机和13英寸笔记本电脑模型机带来了每日新闻摘要。
  “这是一个非常有趣的时代,而我们公司有着独特的优势,”Lingraphica公司创新、销售和营销部门副总裁Michelle Hart-Henry根据前面提到的健康数据评论道。该公司为语言障碍提供设备和语言治疗解决方案,致力于解决那些康复问题。
  “中风的发病率增长,而存活率也增加了,”Hart-Henry说。“同时,人们正越来越相信中风六个月后恢复的可能性。”
  随着新生代的增长,这样的认知问题也将继续增加,Hart-Henry补充道。“他们需要这些设备。如果他们没有这样的需求,他们的孩子们也会有。他们希望处于不断发展的技术之巅。”
  超出了公司的传统产品,Hart-Henry期望她的公司和其他公司为语言障碍群体提供技术和环境以及其他科技设备,让人们在日常生活中得到使用。
  通过电话帮助听障群体自由沟通
  尽管今天的消费者使用智能手机的时间远远超过了使用普通电话,但对于许多人来说,电话仍然是重要的,尤其是当与朋友和家人交流的时候,RogerVoice的CEO Olivier·Jeannel如是说。这家公司提供了帮助听力受损群体在电话沟通时的解决方案。
  利用与谷歌语音的接口,为这些客户提供了字幕服务。产品的市场相对较小,根据Jeannel的说法,有听力损失的百分之一和有深度或听力完全损失的千分之一的人群才会用到这项服务。
  利用RogerVoice的产品和服务,耳背的人可以使用电话联系亲人,在这里电话仍然是主要的通信工具---- 百分之九十的电话都是打给朋友和家人的,Jeannel说。
  虽然帮助听力受损人群沟通的技术是基于提供字幕服务,一个不同的技术则来自于MotionSavvy UNI,它结合了手势和语音识别技术,将手语翻译成语音。该技术有望在2016年中期实现。
  Ava,一项使用语音技术的字幕工具,预计也将在2016年的某个时期首次亮相。
  新的、更强大的技术帮助视力受损群体
  视障需要朗读文本的技术,今天这个功能可在大多数操作系统上实现,Black说。应用程序有能力跳过广告并提供基于屏幕文本的快速语音交流。
  Nuance的TALKS软件应用程序将文本转换为可理解的语音,这个应用程序是与Nuance ZOOMS的紧密集成,屏幕放大器应用程序使得低视力用户手机可以访问手机屏幕上的内容。
  还有一些为盲人服务的先进技术,从简单的阅读屏幕上的文字到对于在屏幕上的图片内容进行描述。
  Conversant的创始人兼首席执行官ChrisoMaury,四年前逐渐视力减弱,他很不满意当时他在市场上看到的技术和产品,因为他想要的不仅仅是语音。“我想构建我想要的东西。”
  所以他发明了SayKit软件开发工具包(SDK),一个面向C语言和Swift框架的,增加了与iOS应用程序的会话交互。SDK使用会话语音,使应用程序用户可以简单地说“搜索…”,而不是提供更少的自然语音指令。
  “这将是未来的客户互动,”Maury说。
  Conversant最近与Target联合发布了一个应用程序,名为Say Shopping,它使用户能够说出他们想要的产品。这款应用程序搜索Target的整个产品目录,使用户能够听到关于产品的详细信息和用户评论。客户可以订购产品。Conversant正与Target一起研发如何为购买杂货的顾客服务。
  根据Maury的说法,此应用程序已经被下载它的人群中的一半以上的人所使用。
   声明:版权所有 非合作媒体谢绝转载
分享到: 收藏

专题