您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

2021年语音技术产业状况——人工智能的现状

2021-03-01 09:42:19   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦):在过去的几年里,语音技术似乎以光速发展。随着人工智能(AI)以更强的能力进一步渗透到该行业,2020年尤为关键。自冠状病毒危机爆发以来,这些能力肯定受到了考验。这场危机迫使全球数百万人在家工作、购物和娱乐,并日益依赖由人工智能驱动的语音技术支持的创新应用程序、平台和在线解决方案。
 
  Cogito的信号处理和机器学习主管JohnKane说,人工智能和语音终于达到了一个新的高度。
  “这个行业正在经历重大的胜利,比如能够准确地从语音中识别文本,创造出听起来自然的计算机声音。”他说:“新产品现在可以分析语言的非言语特征。言语中的许多意义来自于说话的方式,而不仅仅是所说的话。而语音技术读取和分析这些特征的能力是该行业向前迈出的一大步。”
  Orbita首席执行官Bill Rogers也同意这一观点。
  “如今的机器学习算法可以预测并提出建议,从而实现与人类水平的自动对话。这方面的高级应用包括结合生物标记来理解人类的情绪,并从语调模式和基于语音识别的用户识别中得出结论,”他解释道。
  其他人也同意,后一点尤为重要。
  “在同理心和同情心对成功互动至关重要的时代,语音技术的门槛已经提高,”Interactions的研究与创新总监Michael Johnston坚持说。“现代人工智能系统不仅提供日常自动化,而且已经开始依靠客户和座席之间的对话,并以许多新的方式增加价值,例如提供个性化建议和呈现相关信息和内容。”
  最新的统计数据强调了语音和人工智能的重要性:
  • Allied Market Research预计,未来7年,全球虚拟助理市场将增长37.7%,到2027年将达到443亿美元。
  • 根据insightSLICE的数据,到2030年,全球语音和语音识别市场预计将达到430亿美元。
  • 据谷歌统计,全球27%的在线用户使用语音搜索;eMarketer显示,几乎40%的美国互联网用户和三分之一的总人口使用语音;据Perficient统计,目前55%的智能手机用户使用语音搜索。
  • 根据New Vantage的研究,10家企业中有9家以上正在对人工智能进行投资。
  年度回顾
  如果不优先考虑COVID-19以及它如何迫使人工智能迎接挑战,就不可能评估2020年。
  毫不奇怪,冠状病毒是人工智能采用和语音技术创新的主要催化剂。广泛的社会隔离以及对远程通信和连接的需求将会话人工智能推向了中心舞台,“Rogers说。
  例如:传统的联络中心越来越多地转向对话式人工智能,以确保业务连续性。
  Johnston说:“在一个充满不确定性和混乱的时代,为客户提供一致、有效服务的能力可能比以往任何时候都更为重要。”
  医疗保健组织和提供者也令人印象深刻地采用人工智能和语音技术来清除冠状病毒的障碍。
  Just AI首席执行官兼创始人Kiril lPetrov说:“以人工智能为动力的聊天机器人和虚拟助理站在对抗COVID的最前线,帮助筛选和分类患者、进行调查、共享信息,并在人们无法离开家的时候实现远程医疗。”
  使用语音分析和护理协调团队,高危患者也能够更频繁地联系,从而推动实时数据和参与。
  Cosán集团创始人兼首席营销和发展官DavidHunt说:“随着疫情的持续,人们对心理健康的担忧增加,人工智能技术已经被用来提高患者的参与度,监测心理健康的变化。”
  总的来说,2020年让商界领袖意识到,消费者习惯将继续快速演变。
  “越来越多的公司认识到,人工智能可以帮助应对这些变化,继续提供优质的客户体验,从而帮助公司与客户建立更好的关系。”Read Speaker北美区总裁Matt Muldoon说:“公司已经开始利用人工智能开发出更感性、更高质量的声音,品牌也使用了更多的交互式语音广告,让他们能够直接与消费者交谈。”
  2020年的其他亮点也很重要:
  • 自动语音识别通过不断增加的递归神经网络传感器的应用,实现了又一个飞跃,从而提高了准确性,减少了计算量。
  • FacebookAI的wav2vec2.0吸引了大量的关注。Kane说:“wav2vec2.0是音频和语音的一项创新,不需要自动语音识别,它为下游的音频和语音分类任务提供了强大的原材料。”
  • 引入OpenAI的GPT-3,以实现自然语言的预测和生成。
  • 语音克隆得到改进,AI的本地化功能证明了这一点。“他们的合成语音克隆可以被训练说六种语言。这项新功能允许将数字语音翻译成其他语言,这将使本地化更加容易,”Petrov说。
  展望未来
  业内专家看好未来几个月相关技术的快速扩张。
  “到2021年,我们将看到越来越多地使用会话人工智能来替代人类智能的增强。”Johnston预测:“我们还将见证对话人工智能从语音和文本渠道不断扩展到富媒体和多模式交互,智能虚拟助理将能够通过语音和文本的视觉媒体组合向客户呈现信息。”
  Muldoon预测,由于流感大流行而改变的消费者习惯可能会加速人工智能和语音技术的应用,特别是在今年上半年。
  “我们将开始看到支持语音的人工智能能力的扩展。”他说:“随着越来越多的模型继续被构建,将会有机会创造出更强大的交互,几年后,人工智能将成为完成任务的第二种方式,而不是支持性角色。”
  Kane预计,由于无监督的表征学习,诸如声音事件检测和语音情感识别等分类问题的准确率会有显着的提高。
  Kane说:“今年可能是交互式会话数据得到应有的研究和开发关注的一年,我们看到了更多关于交互式语音合成的学术研究,以帮助语音助理等强大应用。”
  其他人则希望,人工智能的进步将在智能手机上带来更好的语音文本转换功能。
  “现在,当我们要求手机通过语音创建信息时,我们会看到很多错误。但随着创新的继续和算法的日益强大,我们将受益于这一应用的准确性提高,这也将影响智能说话者扩大他们对人类语言的理解,以及更广泛地与用户交谈的能力,”Rogers建议。
  Wolters Kluwer的应用数据科学主管John Langton认为,我们可以预期,今年人工智能和其他技术(如面部识别和语音识别)之间的协同效应将会增强。
  “为了改进整合,我们现在可以使用情感计算作为额外的信号到语音输入,在回答消费者问题时推断用户意图,”他说。
  许多人同意,人工智能也将继续在医疗保健领域提供更好的患者护理服务。
  “我们将观察到为患者提供更加个性化的护理,为提供者提供更加高效和有效的手术。此外,远程医疗的迅速采用,加上消费者对语音智能家居技术的广泛使用,将可能推动交流医疗AI机器人的发展,”Hunt说。
  声明:版权所有 非合作媒体谢绝转载
  作者:Erik J.Martin
  原文网址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业