您当前的位置是:  首页 > 新闻 > 文章精选 >
 首页 > 新闻 > 文章精选 >

新技术与人类的声音

2018-02-05 10:35:24   作者:   来源:CTI论坛   评论:0  点击:


  CTI论坛(ctiforum.com)(编译/老秦):科技已经赶上了人类最基本且是最强大的能力:我们的声音。
  如何解释数字助理Siri、谷歌助理、Cortana、Alexa和最新进入者三星的Bixby的快速崛起?这些系统依靠语音指令而不是触摸控制设备或应用程序,为我们提供了近乎无缝的访问方式来进行服务、购物等一系列令人眼花缭乱的活动。
  所有这些,我能说的是…关于时间。在多少年科技巨头们都用非直观的导航、让人麻木的界面和梦魇般的下拉来接入他们的设备之后,他们终于采用了人类声音的简单性、优雅和力量来达到相同的目的。(他们会持续多久,谁也说不准。但以后会更多。)
  与此同时,在生活中,从播放我们最喜欢的曲子,到订披萨,再到召唤优步(Uber),一切都只是语音指令。
  还有很多其他的功能即将问世,包括声控电冰箱、洗衣机、真空吸尘器,当然还有汽车。市场研究公司IHS Markit表示,事实上,到2020年底,预计将有超过70亿的消费者设备由语音激活的数字助理管理。
  工程奇迹
  当我们停下来思考人类的声音有多显着时,难怪苹果、亚马逊和微软这样的公司将其作为他们技术的门户。也许唯一的问题是,是什么花了这么长时间?
  我们的声音是工程学的奇迹,代表着大脑、肺、喉、舌头、上颚、脸颊和嘴唇之间复杂的相互作用。其结果是人类独有的一种独特的工具,它使人类文明进步了数万年。
  人类语言的错综复杂使我们与地球上其他生物相距甚远。虽然我们倾向于把它看作是自然发展的东西,但我们能有效地、连贯地、有说服力地说话的能力实际上是在多年的倾听、接触和实践中习得的。
  使用语音来传达思想、方向和命令,使得它成为当今访问技术的高效工具。从某种意义上说,我们的声音已经成为了终极的免提装置,我们不需要太多的努力。我们的大脑可以快速地将想法转化成清晰的文字,然后将它们传输到设备上,这就消除了浏览菜单、键入命令或用手指滑动屏幕的耗时、容易出错的可能。
  人类语言和技术发展之间的相互作用也使得今天的数字助理非常准确,尽管偶尔会出现一些有记录的小故障。我的一位工程师朋友和语音识别专家说,最新一代助理的复杂算法和强大的处理能力使他们能够通过高级学习和情景知识来填补空白。这意味着,他们通常能比人类更了解人类的说法。
  我们该何去何从?
  这是非常令人惊奇的事情,而且它也很好地解释了为什么科技巨头们会扎堆冲进语音设备领域。当然,如果仅仅几十年的技术真的赶上了数百万年的发展,我就想知道未来会是什么样子。
  我想知道这是否涉及到了我们声音的本身。
  也许下一代的技术--例如自动驾驶汽车--将完全绕过语音,直接进入我们的大脑,因此在我们能够清晰地表达它们之前,我们就能够理解指令。对我来说,这似乎有点可怕,但我确信,仅仅使用语音指令就能从互联网上购买产品的想法,似乎在几十年前就已经过时了。
  但我认为,这一切还需要几年的时间。与此同时,让我们愉快地使用最基本、最强大的人类能力--我们的声音--来引导我们的生活。就像我之前说的,是时候了。
  关于作者
Holger Reisinger
  Holger Reisinger拥有奥地利萨尔茨堡大学应用科学和技术经济和信息管理硕士学位,超过21年从事IT和电信行业的经验,他是一个充满激情和富有远见的工作新方法方面的演讲者。作为一名成功的IT&T高管,拥有成功的领导力、销售、全球营销和运营方面的经验,Holger Reisinger在过去的十年里一直致力于VoIP的业务发展。
  声明:版权所 有非合作媒体谢绝转载
 
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

相关阅读:

专题