您当前的位置是:  首页 > 新闻 > 国际 >
 首页 > 新闻 > 国际 >

Google更新云端语音API 录音档也能直接搜寻关键字!

2017-08-21 14:44:20   作者:   来源:CTI论坛   评论:0  点击:


Google更新云端语音API 录音档也能直接搜寻关键字!
  Google更新云端语音API(Google Cloud Speech API),除了新增时间标记功能,可识别的语音档案长度也从80分钟增加到3小时,并一口气新增30种可识别语言,让第三方开发商能在更多类型的服务中应用Google的语音识别技术。
  可在录音档中搜寻关键字、直接跳到关键字出现的段落
  「语音」很可能是继打字之后,未来人类和电脑沟通的主要方式,其不仅解放我们的双手,互动速度也更快。Google在去年发布这款能将语音转成文字的云端语音API,并将该功能整合进多款自家服务中,如语音助理、语音搜寻、翻译、听写输入等功能。
  而这次更新的其中一个新功能,对常听录音档的人相当必备。过去只有文字档才能搜寻特定字词,现在,在Google云端语音API新增「以字为单位的时间标记」的功能后,语音档也能做到相同的事,即可在语音档中搜寻特定字词出现的位置、直接跳到该段落,且录音档播放的同时也能立即显示已识别的文字。
  支援档案长度增加到3小时,可用于客服中心和自动产生影片字幕
  此外,Google云端语音API可支援的语音档案长度,也从原本的80分钟增加到3小时。Google产品经理DanAharon表示,支援更长时间的语音档案,也能拓展该技术能应用的场景,例如客服中心可用此分析客服电话内容,或是用于自动生成影片字幕。
  语音转文字支援「表情符号」
  在支援语言方面,这次Google更一口气新增30个语言,迄今共支援119种语言。Google表示,他们和母语人士合作,请他们念常用的句子,训练机器学习模型识别新语言的单字和音调。
  特别的是,Google云端语音API不只能识别说话的「内容」,还能识别出「表情符号」。例如,只要念出「眨眼表情符号」或「微笑表情符号」,就会出现和。不过,该功能目前仅支援英语,其他语言将在未来陆续开放。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题