您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

2022年语音技术行业现状之人工智能

2022-04-21 10:14:28   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦):语音技术每年都在突飞猛进地发展。2021年也不例外,创新的速度比预期的要快,这在很大程度上要归功于人工智能(AI)的进步。这一进展派上了用场,尤其是在COVID-19危机持续到2022年以及消费者和企业越来越依赖嵌入到由人工智能驱动的应用程序、平台和设备中的语音的情况下。
  “基于语音的解决方案结合了自然语言处理(NLP)以实现语言理解和情感认知,已被用于解决大流行期间出现的心理健康问题。”ETS人工智能实验室执行主任Narmeen Makhani说:“对客户服务解决方案的需求不断增加,加上劳动力短缺和供应链问题,也加速了企业采用和依赖基于人工智能的会话座席。这些座席帮助增强了客户体验,提高了客户支持和语音识别工具的效率和定制化。”
  事实上,对话式AI座席已成为大多数公司的主流。Makhani说,基于人工智能的语音技术的进步,例如设备上自动语音识别(ASR)、无文本模型和大型语言模型,为银行、医疗保健和教育领域开辟了新的可能用例。
  Read Speaker北美总裁Matt Muldoon对此表示赞同。“随着酒店、汽车和客户服务等垂直行业更广泛地采用语音技术,智能家居控制、体验营销和游戏等,其他垂直行业正在认识到在向用户提供的产品中利用人工智能支持的语音技术的好处,”他指出。
  Five9产品管理执行副总裁Callan Schebella表示,过去几年人工智能的进步“是爆炸性的”。现在你可以用语音识别来做一些几年前只能在实验室里才能做到的事情。“
  “人工智能正在加速[Alexa和Siri等语音助手]的功能,因此,随着时间的推移,Alexa和其他语音助手只会变得更聪明,”Netomi的创始人兼首席执行官Puneet Mehta认为。“与此同时,对于公司而言,保护性人工智能正被广泛采用,以通过自动化日常任务来降低业务成本、提升客户服务并节省员工时间,使他们能够承担更多创造性任务。”
  Gridspace的首席执行官Evan Macmillan对此表示赞同。“商业客户越来越了解对话式人工智能的可能性,并从全栈人工智能优先产品公司寻求最佳解决方案,”他说。“企业也在以创纪录的速度将语音工作负载转移到云端,这为对话式人工智能和新流程自动化打开了大门。”
  年度回顾
  去年是人工智能和语音技术的关键一年,几项突出的发展证明了这一点。一方面,Meta(Facebook)、谷歌和NVIDIA都加入了虚拟世界的潮流,推动了语音AI、计算机视觉、自然语言理解(NLU)和虚拟现实(VR)方面的创新,以创建能够识别语音和与用户交流。
  麦肯锡发现,如今56%的企业至少在一项业务功能中使用人工智能,高于2020年的50%。近三分之二的企业计划在未来三年内增加对人工智能的投资。
  Gartner的一项调查发现,36.3%的客户服务领导者计划到2023年部署人工智能。
  市场增长--由对语音激活系统、语音虚拟助手和语音设备的需求增加推动--继续飙升。
  “随着智能电器变得越来越普遍,企业利用人工智能来提高语音技术的准确性,更多的消费者将倾向于在日常生活中使用它。该研究还表明,由于语音和语音设备成本的下降、软件开发的增加以及对具有语音功能的虚拟助理智能扬声器的持续需求,市场将得到显着采用,”Muldoon说。
  然而,对于一些人来说,采用人工智能语音技术一直很困难,主要是由于缺乏基础设施、技术限制和缺乏教育。
  “许多人并没有完全掌握人工智能的全部好处及其在工作场所的使用。像大多数新兴技术一样......人工智能对许多人来说似乎很复杂,而且它仍处于起步阶段,”Mehta说。
  Makhani认为,语音技术的准确性仍然是最大的挑战,尤其是对于非母语人士和儿童以及在有背景噪音的情况下。
  “此外,许多主流的、基于人工智能的语音设备继续倾听用户的声音。需要继续解决在保护用户隐私的同时始终保持响应的挑战,以确保在人工智能的广泛使用中满足道德标准,”Makhani说。“随着人工智能技术变得越来越人性化,虚假内容将会激增。由于现在在某些地区可以大规模创建虚假内容,这可能会产生可怕的结果。从积极的方面来说,这项技术也可以用来识别虚假内容。”
  数据隐私问题也继续成为2021年的头条新闻。
  “在利用人工智能时,网络安全和数据隐私仍然是公司面临的最大风险,”Muldoon警告说。“公司需要明确传达他们如何保护客户的隐私和数据,以帮助消费者更放心地使用这些解决方案,这有助于提高采用率,并帮助公司将AI扩展到其他业务功能以简化运营。”
  企业仍在适应由COVID引起的变化,语音技术可以帮助也可以阻碍。
  “随着远程工作和虚拟活动被认为是新常态,公司仍在努力解决如何更好地与消费者和客户建立联系和互动。语音到文本的用例--从交互式笔记到市政厅字幕--通过使信息可搜索、可访问和可操作,使组织能够最大限度地发挥其音频和视频文件的潜力。但是需要持续的教育来最大限度地发挥这种潜力,”Verbit首席营收官兼总经理ArielUtnik说。
  另一个持续的难题?在人工智能方面,企业往往会迷失方向。
  “为了新技术而采用人工智能等闪亮的新技术可能很诱人,但提出一个有凝聚力的战略对许多公司来说是一个问题,”Mehta说。“从小处着手,衡量,看看是否能在六个月内开始看到影响。”
  展望未来
  大多数专家预测人工智能和语音未来会发生令人兴奋的事情。
  “在未来五年内,每个主要品牌都将拥有一个用于客户服务的人工智能语音渠道,就像每个品牌都有一个网站一样,”Schebella预测道。“就像在1990年代和2000年代初,当组织急于建立在线业务时,企业将有望拥有一个智能的对话界面,以满足客户对参与的期望。”
  Mehta看到越来越多的公司转向人工智能来提高客户旅程的效率。“今天的人们需要真正轻松的支持和互动,虽然这主要通过聊天和消息传递,但正如我们所期待的那样,支持、销售和营销方面的免提语音互动将会有巨大的增长,”他说。
  Makhani认为,大型类语言模型以及多语言模型将变得更加普遍、易于访问并与常规技术集成。
  “它们将从大型科技公司手中的主要研究用途转向工业用途。初创公司和去中心化倡导者将积极加速大型模型的广泛可用性和使用。ASR和NLU将继续模糊人类和虚拟化身之间的界限,从而促进沉浸式娱乐并加速现实世界的应用,例如虚拟世界中的教育和健康诊断。”
  Makhani继续说,语音助手将在课堂内外的教育中发挥更大的作用。
  “此外,世界各国政府的隐私法规将收紧人工智能,包括捕获和存储语音,尤其是关于未成年人的语音,从而加速设备上ASR、设备上模型部署和无文本模型的使用,”Makhani补充道。
  Interactions的首席营销官Jim Freeze对人工智能如何在2021年成为围绕医疗创新的对话中不可或缺的一部分感到兴奋--他预计这一运动会滚雪球。
  “随着大流行的后果越来越使医院系统不堪重负,管理人员正在转向对话式人工智能作为解决方案,”Freeze说。“我预计这种对话式人工智能在医疗保健领域的趋势将持续到2022年。”
  期望人工智能变得更聪明,更能感知周围环境,以检测当地环境。
  “这将具有许多功能--抑制耳机中的噪音、警告我们周围的事件、在没有云帮助的情况下在本地执行自然语言控制等等。语音AI最终将使用多个传感器,根据声音检测和处理做出与上下文相关的复杂决策,”Knowles的AISonic边缘处理器高级总监Vikram Shrivastava预测。
  最后,依靠语音在游戏和虚拟世界中传播。
  “全球估计有32.4亿游戏玩家,游戏开发者可以利用语音技术在不依赖配音演员的情况下创建更好的角色声音,并通过使用该技术增强可访问性功能,确保各级玩家都能获得最佳体验,”Muldoon说。“此外,随着虚拟世界的新采用,人机交互将变得更加无缝,并模糊现实与虚拟之间的界限。在这个空间中,作为个人,我们可以与我们喜欢的人和物品进行动态交互。在虚拟世界中,人工智能和语音技术对于确保人们拥有积极的体验至关重要。”
  声明:版权所有 非合作媒体谢绝转载
  作者:Erik J.Martin
  原文网址:
  https://www.speechtechmag。com/Articles/Editorial/Features/The-2022-State-of-Artificial-Intelligence-151338.aspx
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业