Yobe获180万融资用AI解决噪音环境下的语音识别难题

　　近日，美国语音技术公司Yobe宣布，获得了来自Clique Capital Partners的180万美元种子轮融资。此前，Yobe曾于2016年获得美国国家科学基金会SBIR项目的79万美元资金支持。

　　Yobe想解决的，是语音领域目前的一个困境，语音助手可以识别出用户在讲什么，准确度也不错，但假设有人和用户同时说话，其识别率就会大大降低，这被称为“鸡尾酒会问题”。就像在一场宴会上，背景过于嘈杂，语音识别就难以正常工作。

　　为此，Yobe建立了一个声音驱动系统，可以在嘈杂环境中，利用AI识别用户的生物特征，进而判断并分离特定的声音，自动提高这一特定声音的音量，帮助语音识别引擎更好地工作。

　　2017年6月，Yobe公布了一段非常简短的技术介绍视频

　　在应用上，Yobe计划将技术授权给芯片或智能硬件制造商，第一步的推广会从声控设备开始。CEO Ken Sutton认为，特定声音识别技术的应用场景很广，可以用于会议转录，帮助司法或鉴定，制造更好的助听器，以及完善声纹识别技术。

　　Sutton表示，目前技术研发已经完成，下一步将简化产品并投入市场。新产品会在一个月内上线，将开发布会进行现场演示。

　　与Yobe想解决的问题类似，今年4月，Google曾在博客上发文称，正试图复制“人类大脑专注于某个声源，同时可过滤掉其他声音”的能力。Google的技术主要集中在视频处理上，让用户在一段视频中选择一个人脸，利用视觉组件观察这个人的嘴，从而创建出其个人语音轨迹。当然，谷歌的技术难度在于分离数段声音，而Yobe主要完成的，更类似于AI降噪。

　　锤子的坚果3就声称利用了“AI通话智能降噪技术”，其供应商大象声科是基于计算机听觉场景分析，通过深度学习技术，来实现和噪音环境下语音增强。大象声科表示，这项技术是世界第一款芯片级单音轨实时语音提取方案，已经开始在手机通讯行业实现商用。

　　作为一项利用了AI的产品，计算资源占用和性能之间的平衡或许是Yobe最需要做好的。而以单一辅助技术作为出发点，在开拓市场之后，Yobe是给自己寻找一个好买家，还是以此为切入点进入更广的语音领域，也是我们接下来会关注的。

专题