会名题字:中华人民共和国国务院原副总理 邹家华
WWW.usaredants.com
成立于1990年
ENGLISH 亚游集团亚游新闻政策解读行业要闻亚游党建分支机构活动预告会员服务会员推介园区招商联系我们
您现在位于:亚游集团 > 资讯 > 会员推介 > 正文

为城市装上慧听的“耳朵”,讯飞谛听可精准拾取30分贝超小音量

    2020-09-25 01:36:59

作为人们感知外界环境的一个重要通道,听觉在视线障碍、不利光照条件等情况中可起到视觉无法替代的作用,是视觉的重要补充。目前,许多场所都要求同步录音录像,音频与视频的有效结合能发挥出更大的作用。
在实际应用中,由于噪音、混响、场地限制等复杂因素的影响,同录系统配置的麦克风往往无法高质量精准拾取音频,对于低音量的声音更是拾取困难。
如何真正“耳听八方”?近期,某科技博主的一支关于拾音器的评测视频引发关注。视频中,科大讯飞的谛听系列产品和德国森海塞尔、美国舒尔的同类产品同台竞技,讯飞谛听在超小音量拾取和降噪方面表现出彩。
谛听名称来源于古代传说中的神兽,它天耳神通,尤善倾听。而讯飞谛听系列产品配备了32路麦克风阵列,通过全自动声源定位、自适应波束形成和混响抑制技术及基于深度学习的噪声抑制和语音自动增益调节算法,可实现室内说话人自动定位、噪声与混响抑制、音量自动调节等功能,从而达到精准拾音的目的。

全方位无死角
精准拾取“轻声絮语”


一般人说话的音量大小在50分贝左右,一只蚊子飞过的声音大约40分贝。评测视频显示,在模拟30分贝悄悄话的场景下,森海塞尔拾音稳定,内容清晰,舒尔拾取的声音小且难以分辨说话内容,讯飞的谛听系列产品拾取的内容清晰,且音质听感较好。

这主要由于科大讯飞采用了自主研发的全自动声音定位技术,只要有轻微的声音,它便如聚光灯一样迅速定位声源,并对来自其他方位的混响和噪音进行抑制。在实际应用中,32个麦克风组成的阵列可做到全天候、全方位、无死角精准拾取低至30分贝的超小音量。
自动声源定位技术和自适应波束形成技术还使得讯飞谛听具备“人声跟踪”功能。波束如同枪手枪击猎物一样,可自动“瞄准”运动的声源。这意味着,无需预设和限制区域,讯飞谛听都能实时跟踪和拾取声音。

多重噪音抑制
自动优化听音效果


在环境噪音、干扰噪音、电流噪音等噪声以及室内混响和回音的影响下,如何能获取高保真、清晰音频?这对拾音器的抗噪性和灵敏度提出了更高要求。

讯飞谛听拥有独特的拾音算法,依据时域、频域和空域的信息,能有效增强语音并显著抑制噪音对目标语音的影响。它首先通过声音定位技术拾取语音,进行语音增强,实现初步的降噪效果。然后通过波束形成和基于深度学习的语音增强算法和对非方向性和方向性的噪声进行抑制,最后输出时,自动调节音量大小,并根据人耳的听觉特点优化,使声音更加饱满。

在评测视频中,评测者分别模拟了环境噪音为70分贝和90分贝的情况,结果显示即使是90分贝的极端噪音环境,谛听都有效抑制了噪音,对话内容依旧清晰。


7×24h守护
为城市装上慧听的“耳朵”


如果说摄像机是“眼睛”,拾音器便是“耳朵”。拾音技术的落地应用已展现出前所未有的勃勃生机。例如,工业界的检测师通过声音辨别机器是否运转正常,民警通过汽车声音辨别是否违法鸣笛,商铺利用全量的音视频采集来防止偷盗,法院庭审过程中同步录音录像,保证办案过程公正可追溯。 

利用人工智能技术为行业或某一特定职业人群进行赋能,是科大讯飞技术落地的体现之一。讯飞谛听系列产品未来可广泛应用于安防、交通、高质量会议等关键场所和重点部位。

值得一提的是,讯飞谛听除了拾音功能外,还可以起到预警作用。基于各类声音在时域、频域的特征,结合模式识别的分类方法对异常事件如高声喊叫、违规交谈等自动预警,缓解人工保障难度大等问题。此外,7×24h不间断稳定拾音,能满足更多现实的需求。产品还可与同录厂商无缝对接,同步录音录像,使得音视频质量更高、更具实用性。

谛听系列产品,无疑是科大讯飞21年来始终坚定核心技术自主创新的体现。凭借“中文语音技术应由中国人做到最好”的信念,2018年至今,科大讯飞已获得30项人工智能国际竞赛的冠军,涵盖语音识别、语音合成、机器阅读理解、手势识别、图像识别等诸多领域。今年7月,科大讯飞A.I.研究院联合中科大语音及语言信息处理国家工程实验室在DCASE 2020挑战赛的声音事件定位与检测任务中摘得桂冠! 

未来,科大讯飞将继续坚持核心源头技术研发创新,力争占据拾音技术高点,用A.I.赋能各行各业,用人工智能技术全面提升行业信息化和安全水平,建设美好世界。

注:“精准拾取低至30分贝的超小音量”2020年通过科大讯飞股份有限公司硬件中心检测实验室检测,报告编码WT20200121004。
责任编辑:陈平
版权所有: 亚游集团官网 @1990-2020