销售咨询热线:
售后服务热线:4000-830-188

Yobe获180万融资 用AI解决噪音环境下的语音识别难题

【来源】:互联网 【作者】:匿名 【时间】:2018-05-23 【阅读】:
      近日,美国语音技术公司Yobe宣布,获得了来自Clique Capital Partners的180万美元种子轮融资。此前,Yobe曾于2016年获得美国国家科学基金会SBIR项目的79万美元资金支持。
  Yobe想解决的,是语音领域目前的一个困境,语音助手可以识别出用户在讲什么,准确度也不错,但假设有人和用户同时说话,其识别率就会大大降低,这被称为“鸡尾酒会问题”。就像在一场宴会上,背景过于嘈杂,语音识别就难以正常工作。
  为此,Yobe建立了一个声音驱动系统,可以在嘈杂环境中,利用AI识别用户的生物特征,进而判断并分离特定的声音,自动提高这一特定声音的音量,帮助语音识别引擎更好地工作。
  在应用上,Yobe计划将技术授权给芯片或智能硬件制造商,第一步的推广会从声控设备开始。CEO Ken Sutton认为,特定声音识别技术的应用场景很广,可以用于会议转录,帮助司法或鉴定,制造更好的助听器,以及完善声纹识别技术。
  Sutton表示,目前技术研发已经完成,下一步将简化产品并投入市场。新产品会在一个月内上线,将开发布会进行现场演示。
  与Yobe想解决的问题类似,今年4月,Google曾在博客上发文称,正试图复制“人类大脑专注于某个声源,同时可过滤掉其他声音”的能力。Google的技术主要集中在视频处理上,让用户在一段视频中选择一个人脸,利用视觉组件观察这个人的嘴,从而创建出其个人语音轨迹。当然,谷歌的技术难度在于分离数段声音,而Yobe主要完成的,更类似于AI降噪。
  锤子的坚果3就声称利用了“AI通话智能降噪技术”,其供应商大象声科是基于计算机听觉场景分析,通过深度学习技术,来实现和噪音环境下语音增强。大象声科表示,这项技术是世界第一款芯片级单音轨实时语音提取方案,已经开始在手机通讯行业实现商用。
  作为一项利用了AI的产品,计算资源占用和性能之间的平衡或许是Yobe最需要做好的。而以单一辅助技术作为出发点,在开拓市场之后,Yobe是给自己寻找一个好买家,还是以此为切入点进入更广的语音领域,也是我们接下来会关注的。