首页 > 新闻 > 国内 >

人机交互变革,将引领智能硬件创新

2015-03-19 14:26:42   作者:陈述   来源:搜狐IT   评论:0  点击:


  多点触控技术是具有开创性、革命性的发明。iPhone手机凭此技术,在短短几年时间内,引领手机从按键时代进入触控时代。单就中国手机市场来看,智能手机占比已经超过90%,而智能手机的人机交互方式,基本以触控为主。

  当智能手机创新面临乏力时,Google、苹果等巨头开始智能硬件创新探索。一方面在于设备形态上的创新,如推出谷歌眼镜、苹果手表等产品,另一方面是在人机交互的方式上变革,如从iPhone 4S开始,苹果力推Siri智能语音助手,语音控制技术在国内外得到热捧。

  一、人机交互未来发展三个发展趋势:多元化、智能化、人格化

  人机交互的历史可以追溯到18世纪中期的珍妮纺纱车,即从第一次工业革命,人们就开始了系统思考人机交互的问题。20世纪之后,人机交互的问题,从工业领域进入到生活领域,这与计算机的发明与普及有很大关系。进入21世纪,随着传感器的普及与应用,人机交互出现了本质性变化,正朝着三个方向发展。

  一是多元化。键盘和鼠标控制在与计算机的交互上应用广泛,触控主要是在平板电脑和智能手机的操作上,随着智能终端种类越来越多,人们对交互体验要求越来越高,交互方式也越来越多元化,人机交互体验更加自然、直接。当前并存的几种交互方式是:键盘、鼠标控制,触控,语音控制,体感控制,眨眼及眼球控制,甚至是脑波控制。可以看出,只要是能够向机器传递出信息的方式,人们都在进行探索。

  二是智能化。人机交互的第一阶段是人适应计算机,计算机的功能是固有的,交互的意义就在于通过一定的指令获得相应的反馈。而到了第二阶段,则是计算机逐步适应人。比如传感器的发展,使得人的各个器官都可以与机器进行交互;再比如,在下班路上让家里的空调自动开启,让机器人帮我们做家务,让汽车自动驾驶等服务,正在陆续实现并在生活中应用。

  三是人格化。接着上面向人提供更多服务来谈,为你提供服务的也许没有一个机器人的实体,但会让你感觉到是在与人交互。典型的例子如siri、微软小冰等语音助理软件,它们没有实体,而是通过大量的语言、语义的学习,更加了解人的思维、文化等,在你提出问题时,它尽可能的去理解你的意思,提供相应的答案。从交互体验来讲,人们更需要的是,与同伴或者助理之间或亲密或轻松的交互氛围,基于人工智能的交互方式正向这种人格化的方向发展。

  三个发展趋势现在已有雏形,在接下来的一段时期内,将会继续深化。能够顺应这三种趋势进行人机交互变革的企业,将会在未来发展中掌握主动权。

  二、一段时期内,语音控制将是人机交互的核心,引领智能硬件创新

  包括手机在内的智能硬件面临创新困境,人机交互方式变革是一个较好的切入点。从对操作个性化、方便快捷的智能化角度看,无论是键盘还是触控都远远不能与语音相比,语音才是人类沟通和获取信息最自然的便捷手段和方式。在未来一段时期内,语音控制方式将是人机交互的核心。输入法中加入语音输入基本已经成为标配,基于IM软件的智能机器人越来越活跃,语音助理软件、语音搜索也被苹果、Google等企业应用。

  致力于语音控制研究与实践的企业及机构较多。2014年9月业内成立的“智慧语音联盟”,将整合产业链上下游的语音技术和资源优势,共同完善终端语音生态系统。这里面有我们耳熟能详的企业,包括中兴、Nuance、Audience、高德、百度、中国科学院自动化所等。Nuance曾是苹果语音助手siri的技术提供商;Audience是音讯芯片解决方案厂商,相关产品在三星、LG、小米等手机有所应用。需要特别强调的是中兴和百度。

  中兴看准的是用户对语音控制需求的快速膨胀,遂将智慧语音定位为战略级技术,在人机交互上解放双手。应用智慧语音的星星系列产品,与苹果siri不同,是系统级的语音手机,能够用于多种场景,包括拨打电话、驾车、出国旅行、办公记录等。试想,当你行驶在高速路上需要导航时,只需说出目的地手机就能迅速做出反应并给出路线图,是不是更安全、更方便呢。事实上,中兴发布的星星2号手机已经可以实现这一功能,带来了优秀的全语音操控的驾驶模式体验。当然,此类的应用还有很多,比如出国游,对于多数国内游客而言语言不通是最大的障碍,而现在用户只需要对着星星2号说出想要表达的句子或单词,手机能快速准确的实现翻译,仿佛有“同声翻译”陪伴左右。

  中兴通讯终端CEO曾学忠表示:在星星2号上,中兴已经实现了系统级别的语音控制,基本实现了对话式的操控体验。在语音操控方面,我们要做的是突破人机之间语言的障碍,通过一步步研究的深入,对交互技术的深入,从产品设计、功能设定、场景应用等方面,深入到心理、语义、语调、行为乃至情感层面。声控只是最终的表现,中兴要挖掘潜藏在背后的人机交互的深层。而在产品布局方面,未来3-5年,中兴将建立起语音操控的平台,以智能手机为中心,将语音操控的人机互动模式辐射到穿戴、智能家居、汽车等不同领域,推动物联网、车联网的发展和完善。最终,在以语音操控为核心的人机交互领域,中兴将成为行业领导者、规则的制定者。

  而百度语音是基于深度学习,以百度大脑为基础的。百度大脑是百度在人工智能时代的核心智能平台。在语音识别、语义理解上,百度具有较大的优势。百度公司CEO李彦宏在今年两会提案中,还提出建立“中国大脑”计划,让大家在语音识别、视觉识别和自然语言理解上进行技术创新。百度同时也在打造开放的语音平台,深度融合百科知识、地图路线、问答结果、天气等中间页服务,向不同行业提供不同的模板。

  曾有人说,打电话拨号就好,为什么要对着电话说“打电话给XX”呢?并认为语音控制只是噱头,其实这是没有找对应用场景,在大量的生活领域甚至是工作领域,都有需要解放双手的场景。比如,你正在洗菜为家人准备晚饭,忽然想电话问问女儿何时到家,但双手沾满了水腾不出来,这时候星星2号就体现出优势了,“打电话给女儿”两个字就能让你顺利拨打电话而不用停下手中的活,诸如此类场景还有很多。可以想象在未来的智能生活中,智能汽车需要更加彻底的选择语音控制,触控、手势和眼睛都不理想;智能电视会给触控留下生存的机会吗?如果是的话,仅停留在部分遥控器上;智能手表、眼睛等可穿戴设备,太小的屏幕和特殊的位置,语音控制的优势更加明显。

  当前,语音控制确实存在一定的问题,如语音识别的准确性和交互的人性化等,但不要低估它五到十年的未来。随着语音控制交互方式更加智能化、人格化的发展,其潜力将会被不断激发出来。

分享到: 收藏

专题