您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

2022年语音技术行业现状之辅助技术

2022-04-21 10:27:04   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦):根据美国疾病控制中心(CDC)的数据,大约10%的美国成年人和近22%的65岁以上的成年人患有某种形式的残疾--影响他们的视力、听力、行动能力、沟通能力、认知能力等。满足这些人的需求为语音辅助技术提供商提供了巨大的机会,而且随着越来越多的人拥有笔记本电脑、平板电脑和智能手机,这些技术只会蓬勃发展。
  根据PewResearch的数据,超过十分之六(62%)的残疾成年人拥有台式机或笔记本电脑,相比之下,81%的非残疾成年人拥有这些。残疾人拥有智能手机的比例为72%,而非残疾成年人的这一比例为88%。
  凭借这种渗透水平,增加对这些设备的访问并提供更好的全方位生活体验的辅助技术的商机是显而易见的。
  除了商业机会之外,《美国残疾人法案》等立法禁止公司忽视这一人群。
  美国残疾人协会在“Centering Disability in Technology Policy”报告中指出“互联网、设备、应用程序的可访问性必须是围绕技术政策和公民权利的任何对话或工作的首要任务,”该报告是与美国残疾人协会与民主与技术中心共同开发的。
  在语音领域,当前的大多数辅助技术都旨在帮助有听力或视力障碍的人,或者对灵巧性有挑战的人。
  年度回顾--为听障人士提供帮助
  美国国家耳聋和其他交流障碍研究所报告说,大约2%的45至54岁的成年人患有致残性听力损失。55至64岁的成年人的比率增加到8.5%,65至74岁的人增加到近四分之一,75岁以上的人增加到一半。此外,美国12岁以上的人中约有13%的双耳都有一些听力损失。
  新奥尔良Joseph-Ford Enterprises High Level Speech &Hearing Center首席执行官Lana Joseph-Ford表示,尽管正在创建一些音乐程序以将其纳入助听器技术,但它们根本没有完成这项工作。问题在于,随着人们开始变老并开始失去听力,高频声音往往会首先出现。调高助听器、收音机、电视等设备的音量并不能弥补损失。
  Joseph-Ford表示,当前这一代助听器采用了旨在隔离某些声音、提高信噪比、提供更好质量并使用户能够听到更高频率声音的技术。大多数助听器只有一个驱动器。
  “技术发生了变化,”她解释道。“其实进步很大。它将继续显着推进。不过,这项进步的有趣之处在于对非处方助听器的拟议裁决。”
  虽然大多数助听器背后的技术已得到显着增强,但最大的变化发生在成本领域。10月,美国食品和药物管理局提出了政策变更,以改善数百万美国人获得助听器技术的机会并降低其成本。最终确定后,该规则将允许此类助听器直接在商店或在线销售给消费者,无需进行体检或听力学家验配。
  听力困难的人也从语音识别、字幕、转录和语音合成准确性方面的坚实进步中受益匪浅。随着人工智能的新注入,语音转文本和文本转语音技术在电话、会议和在线视频内容的字幕以及屏幕阅读器和类似技术中发挥着关键作用,在准确性和速度方面远远优于人类。
  年度回顾--对灵巧性挑战者的帮助
  另一类残疾人是行动不便的人,他们难以操作鼠标、键盘和类似设备。根据6Degrees公关公司Captjur的首席执行官BobBilbruck的说法,在全球范围内,属于这一类别的人数达数百万。
  “它可能是任何失去肢体或手的人。它通常适用于身体残疾的人,但也适用于患有震颤或其他类型疾病的人,他们可能无法像你或我那样轻松地使用电子设备。”
  对于患有此类精细运动障碍的人来说,滑动、敲击或单击鼠标等任务可能具有挑战性,因此让他们能够通过语音命令和控制设备和应用程序的技术的价值怎么强调都不为过。虚拟助手,如亚马逊的Alexa和谷歌助手,为他们提供了这种能力,并且由于越来越多的语音技术供应商,其中许多命令和控制能力,以及所有必要的唤醒词、身份验证和数据存储功能,现在正在嵌入设备本身,使它们更快、更可靠、更安全。
  尽管许多最知名的语音供应商在这一领域非常活跃,但也有许多新的条目采用了创新技术。6Degrees就是其中之一。
  该公司与受伤战士项目和许多其他非营利组织和倡导组织密切合作,帮助有灵活性障碍的人们在日常活动中导航。
  6Degrees的MyMove基于运动的控制器将运动转换为控制智能设备,取代鼠标点击或手指滑动或轻敲。
  Bilbruck说:“该解决方案非常直观,它使用蓝牙连接并且不需要设置,这使得行动不便的人非常容易使用。”6Degrees正在研究如何将MyMove与增强现实、虚拟现实、元宇宙和类似技术集成。
  年度回顾--为视障人士提供帮助
  视力障碍是当今世界大部分人口的一个限制因素。事实上,世界卫生组织估计全世界有2.85亿人视力受损,其中3900万人被认为是盲人。
  一些针对视障人士的新技术利用了智能手机技术。其中包括:
  • NavCog是一款仍在开发中的应用程序,旨在通过集成的信标和传感器帮助指导建筑物中的视障人士。
  • Supersense是一款智能手机应用程序,它使用人工智能来识别和描述通过智能手机摄像头看到的物体。该应用程序可以读取任何物体上的文字和笔迹,从餐厅菜单到路牌。
  • TapTapSee是一个应用程序,它可以读取笔迹和货币面额,同时还可以命名已识别的对象。
  • Be My Eyes是一款免费的智能手机应用程序,可通过视频通话将视力受损用户与视力正常的志愿者联系起来,以获得各种帮助。
  语音技术的供应商,如屏幕阅读器、字幕、转录、听写、语音搜索、语音合成等,多年来一直在解决这个市场问题。该领域的创新一直很强劲,预计还会增加。
  展望未来
  无论参与辅助技术市场,许多供应商都完全致力于为老年人和残疾人服务,许多供应商直接与残疾人合作,让他们参与设计过程。
  例如,谷歌最近推出了Project Relate,这是一款可供残疾人使用的应用程序,可以将口语实时转录为文本,使用计算机语音为他们说话,并使用语音命令与谷歌助手进行交流。
  谷歌现在正寻求在现实世界中测试这项技术,并呼吁残疾用户改进该应用程序。谷歌正在寻找说英语的人,他们的语言难以理解,以测试该应用程序。参与者将被要求录制一系列短语,以帮助该应用从他们的个人语音模式中学习,然后在他们开始使用该应用后提供反馈。
  谷歌此前曾与加拿大唐氏综合症协会合作,收集患有唐氏综合症的成年人的语音样本,以训练其语音算法,这是一项名为Project Euphonia的计划的一部分。
  苹果、微软和其他供应商也推出了类似的举措。
  声明:版权所有 非合作媒体谢绝转载
  作者:PhillipBritt
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-2022-State-of-Assistive-Technology-151337.aspx
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业