您当前的位置是:  首页 > 资讯 > 文章精选 >
 首页 > 资讯 > 文章精选 >

人工智能和语音技术在Enterprise Connect 2022上盛行

2022-04-02 09:16:14   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦):Jon Arnold的第五期“语音和语音识别市场现状”向Enterprise Connect 2022与会者传达了一条信息:无论是好是坏,对话式AI都改变了客户参与度。
  Arnold开始了他的“语音技术在今天的发展方向是什么”会议,他解释了为什么企业正在驾驭从聊天机器人到虚拟助手再到对话式AI的进化浪潮。
  Arnold的结论是,谈到语音识别技术,“人工智能带来了各种新事物……这是一个正在发生的空间……它不会消失,也不应该消失。”他在聊天机器人和对话式人工智能虚拟助手之间建立了对比;聊天机器人是事务性的、封闭式的、结构化的、算法的,并且可以复制预先存在的对话,而虚拟助手是对话式的、开放式的和非结构化的。
  虽然Arnold说与去年相比没有太大变化,但他指出企业语音技术生态系统正在兴起。生态系统包括纯玩儿家(Deepgram、Dubber、LumenVox、Otter.ai、Rev.ai、Speechmatics、Verbit)、主要平台(AAWS-Amazon Lex、Google、IBM-Watson Assistant、Microsoft-Azure Cognitive Services)和UCaaS提供商(Avaya、Cisco Webex、Dialpad AI、Microsoft Teams、Zoom)。
  “如果你不了解这些公司,你应该知道,”Arnold说,并补充说翻译和转录是他们产品中的标准组件。
  语音技术在企业中的应用
  到目前为止,大多数企业用例都围绕客户服务、联络中心和客户体验展开。Arnold提供的数据展示了语音技术的前五个领先用例,这些用例超越了以客户为中心的交互:网络会议转录、客户体验和分析、字幕和隐藏式字幕、教育、学术和研究转录以及医疗转录。其他显示出最大商业影响的用例是消费电子产品、合规性、法律转录和媒体监控等等。
  Arnold还强调了以下四个重点关注协作和生产力的核心企业应用程序:用于会议的语音转文本应用程序、虚拟助手、用于会话分析的自动语音识别和实时翻译。
  Arnold通过讨论如何使工作场所更具包容性,解释了语音转文本对于会议、转录和视频字幕的重要性。“突然之间,虚拟桌面环境对任何人和每个人都非常强大”,它可以让残疾人使用其他人拥有的相同工具和信息流。
  虚拟助理会记笔记,因此您不必这样做,“数字助理将成为您的私人秘书。”最重要的是,Arnold解释说搜索功能将语音转换为数据流。一旦语音可搜索,就可以更轻松地筛选语音数据并自动执行与会议相关的任务。
  Arnold说最大的商业影响是围绕网络会议转录。“人工智能已经将语音识别的质量提高到了在复制人类语音方面提高了95%的程度。”他继续以亚马逊的Alexa或苹果的Siri为例。“你可以与那个虚拟助手交谈,而不是[对着助手]吠叫,他可以为你做事、回应,甚至在他们认为你需要知道的事情时提示你,比如你的会议即将开始,要迟到了。”
  理解虚拟助手所说内容的下一层是自动语音识别(ASR)--虚拟助手可以自动识别语音,因为它已经通过机器学习编程来理解并用它做一些事情。然后你有对话分析的ASR,这是你试图理解助手所说的下一层。Arnold解释说,“这是我们了解上下文、意图和理解一个人说话时的意思的地方。”他补充说,仅仅捕捉措辞是不够的--你必须知道一个人想说什么。
  人工智能和语音技术的发展方向:超越协作
  在解释语音技术的发展方向时,Arnold强调了沉浸式模型和元宇宙。当我们的工作日在物理世界开始和结束时,增强现实即将出现。Arnold以Cisco Webex Hologram为例,它可以通过提供真实人物的逼真的实时全息图来营造一种共存感。这种全息图、虚拟投影图像、人的虚拟投影的想法,这样你就可以和你的队友在房间里,“这是突破性的东西,”Arnold说。“人工智能的可能性变得越来越有趣,因为眼镜正在将虚拟元素带入您的工作流程。”
  Microsoft Mesh for Teams,或者如Arnold所指的那样--微软对虚拟世界的大力推动--是沉浸式模型的另一面。“这是微软进入后PC世界的举措,因为他们知道PC在某些时候会消失,”Arnold说。“有趣的是人和化身的混合......所以虚拟世界和物理世界越来越接近......越来越难以关心差异。”
  Meta在工作场所协作空间中已经完全虚拟化,因为“它是另一个具有这些技术用例的应用程序,”Arnold说。这有点游戏化,因为化身类似于木偶并且腰部被切断,但Arnold认为这是一种有趣的工作方式,人们可以通过这种方式有效地工作。Meta几乎完全处于虚拟世界中,Arnold告诉与会者,如果你愿意尝试一下,“你可能会惊讶于你当时能做多少事情。”
  Arnold解释说,元宇宙的想法是关于利益的。“你将赌注押在人们想要社交的地方,以及从那里开始,他们想要在哪里工作和做生意。”
  Arnold指出,英伟达在GPU方面占上风,这使计算机处理速度更快,“因为这就是人工智能的全部意义所在,”他说。Arnold解释说,特别是对于人工智能,“你需要很大的马力”,而缺乏马力是一种后备力量。例如,“只有在PC能够以足够快的速度处理大规模的数据变化以提供良好的体验之前,元宇宙才能运行。”Arnold指出,下一代计算机将专门用于支持诸如马力之类的东西,无论元宇宙采取何种形式,“声音将是采用的核心。”
  人工智能采用:需要牢记的注意事项
  Arnold还谈到了人工智能如何走向正确和错误的方向。他设定了许多相反的结果--有意跟踪与无意监控,损害隐私的技术与提高生产力的技术,自动化工作的技术与激发员工创造力的技术,以及增强用户信任的技术与削弱信任的技术。
  “那些整天运行的桌面设备,捕捉旁白,突然成为顶级监控技术,”他说,并强调企业必须注意这一点。“不是因为它可以做什么,而是因为员工如何看待你正在尝试做的事情。”Arnold解释了为什么企业必须透明地将这项技术用于正确的目的,因为“你不想损害隐私”。
  他建议企业将精力集中在识别深度造假上,而不是验证什么是真实的,因为随着创新而来的是好人和坏人。“技术是中立的,但人工智能偏见会使事情复杂化。”
  人工智能现在正在推动各种形式的技术,包括协作等企业用例。Arnold指出,身临其境的合作即将到来,“大玩家正在实现它”。他补充说,“人工智能走到哪里,语音技术就会紧随其后。”同样,他在这个空间中的最后念头也以一句话结束。“消费者走到哪里,企业就跟到哪里。”主要参与者都在押注这些新模型会成功--所以要做好准备。
  声明:版权所有 非合作媒体谢绝转载
  原文网址:
  https://www.nojitter.com/ai-speech-technologies/ai-speech-tech-prevail-enterprise-connect-2022
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业