您的位置 首页 制造

根据麦克风阵列的声源盯梢体系

随着科技的发展,声源定位技术在越来越多的地方发挥着重要的作用,在多个领域有着广泛的应用。声源目标跟踪技术可以应用在视频录制、安防监控、鸣笛抓拍等场景中,在这些场景中,针对目标对象的语音信号,可以应用阵

作者 / 王宇威 雍洋 孙新 西安交通大学 信息与通讯工程系(陕西 西安 710000)

*本项目取得“2018年瑞萨杯”信息科技前沿专题邀请赛的最高奖“瑞萨杯”奖。

摘要:跟着科技的开展,声源定位技能在越来越多的当地发挥着重要的作用,在多个范畴有着广泛的运用。声源方针盯梢技能能够运用在视频录制、安防监控、鸣笛抓拍等场景中,在这些场景中,针对方针方针的语音信号,能够运用阵列信号处理的常识,将麦克风依照特定阵列放置在空域中,运用空间不同方位点的声源对麦克风阵列呼应的时延相位差错,对声源进行测向,完结低本钱的声源定位盯梢功用。

  本著作便是依据麦克风阵列的声源盯梢体系,将6路麦克风依照线型摆放,并接入瑞萨SK-S7G2单片机的6路ADC中,单片机将采样值经过阵列信号处理中波达方向(DOA)估量等算法,取得声源的来波方向。然后用单片机去驱动云台,上面搭载摄像头或许高指向性麦克风,能够完结用户特定的盯梢需求。

  咱们结合瑞萨单片机的性能与实践测验作用,选用了周期图法进行视点估量,运用频率采样型的FIR滤波器完结了对人声信号的切片,并对得到的视点成果进行低通滤波、设定阈值、非线性束缚等处理,处理了环境噪声、室内混响等要素带来的问题。此外,咱们将阵列置于云台上,进一步前进了盯梢的精度,云台的驱动选用步进办法,完结了实时盯梢。终究,咱们将一切算法移植到瑞萨单片机上,制作了GUI界面,并添加了噪声练习功用,使之成为一个完好的体系。

0 导言

  当今社会,人们对主动操控的需求越来越高,而其间一个重要的分支便是方针盯梢技能。伴跟着人工智能的热潮,经过图像识别来进行方针盯梢是现在的干流做法,可是神经网络算法的复杂度极高,不行能在一般的MCU上完结,只能借助于一些高性能的芯片如FPGA,这样就会需求较高的本钱。其实在一些特定场合,能够经过或许只能经过声源定位的办法进行方针盯梢,而其间用到的阵列信号处理技能经过改善和优化之后,能够将算法移植到一般的MCU中进行完结,然后能够确保盯梢作用的一同下降产品的本钱。

  现在跟着网络的遍及,网络公开课越来越受欢迎,而网络公开课的录制就需求对讲课的教师进行摄像盯梢,在这种场景下,就能够运用阵列信号处理中的DOA技能对声源进行估量,然后使云台滚动,盯梢摄像方针。除此之外,现在的城市中,为了削减噪音污染,有不少的制止鸣笛区。在这些鸣笛区中,为了精确地抓拍到违章鸣笛的车辆,就必须要用到声源定位,这儿就需求阵列麦克风进行波达方向估量,才干精确地找到违章车辆。在这些场景下运用DOA估量来完结方针盯梢是完全能够满足要求的,而且能够在单片机上完结,而且能够最大极限地节约核算资源。

1 著作规划与完结

  1.1 体系计划

  先用六阵元线阵的阵列麦克风进行拾音,然后运用Renesas(瑞萨)SK-S7G2单片机的ADC进行采样,采样率8000Hz,采样完毕之后对采样数据进行DOA估量(波达方向估量),把估量出来的视点与当时云台的视点比较,来确认是否滚动云台以及滚动方向,然后使摄像头或许高指向性麦克风对准声源,完结声源盯梢的意图。

  1.2 理论剖析及核算

  1.2.1 阵列信号处理根本模型

  阵列信号处理(Array Signal
Processing)作为信号处理的一个重要内容,其意义是指将一批传感器依照特定阵列流型放置在空域中,对空域信号进行采样,得到信源的空域采样数据并进行处理。

  在传统的阵列信号处理中,首要处理的是窄带信号,窄带信号是指带宽远远小于中心频率的信号,而且假定信号源坐落阵列的远场,因而能够运用平面波传达理论,以为信号平行入射,各阵元接纳到的信号之间没有起伏差异,只存在传达延时形成的相位差异。最常用的是均匀线阵,其远场模型如图2所示。

  其间θ为信号入射方向角,d为阵元距离。为“避免混叠”,阵元距离一般取入射信号的半波长。记信号波长为λ,阵元个数为N ,阵列等效孔径为:

依据麦克风公式1.jpg

  能够将麦克风阵列和单片机ADC结合起来看作进行空间采样的设备,阵列每接纳一次数据便是在空间的一次采样或许快拍(snapshot),阵列信号便是由快拍组成的向量序列。均匀线阵是在空间的一条直线上均匀采样,它对应于时刻序列的均匀采样。因为阵元距离
为空间采样距离, 即为空间采样频率,而为阵列信号的空间频率。与奈奎斯特采样定理类似,为避免空域混叠,对空间采样频率有必定的要求:

  依据麦克风公式2.jpg(3)

  12.2 频率切片

  传统阵列信号处理的模型与算法都是建立在窄带信号的条件下,可是语音信号的频率规模为300~3400
Hz,带宽较大,所以不能对语音信号直接进行处理,要先经过频率采样型的FIR滤波器进行频率切片,然后对切片之后的数据进行处理。频率采样滤波器由一个梳状滤波器和一个谐振器组成。 

依据麦克风公式3.jpg 

  频率采样型结构中谐振器的极点刚好各自抵消梳状滤波器的零点,其系数便是滤波器在依据麦克风公式4.jpg处的呼应。为了避免滤波器不安稳,能够将梳状滤波器的零点和谐振器的极点一同向圆内移一点,就能够确保滤波器的安稳,即:

  依据麦克风公式5.jpg(7)

  频率采样型结构的作用便是一个“滤波器柜”,想要滤出信号的某个频率重量,只需在对应的那一路后边接抽头,输出即为该频率重量的时域信号。所以只要把语音信号以200
Hz为距离切片,得到各个频率重量的窄带信号,对窄带信号进行处理之后再相加即可。

  1.2.3 DOA(波达方向估量)

  (1)DOA估量的根本模型

  在前面模型的基础上,在只要一个声源的情况下,阵列麦克风各个阵元接纳到的信号为:

  依据麦克风公式6.jpg

  完结DOA的算法有许多种,有周期图法,Capon算法,Music算法等等,其间,周期图法是在视点和频率方向的二维查找,相对稳健,即便在有混响的情况下也能找到方向,而且该算法能够移植到单片机中进行完结,而Music算法的仿真作用较好,其主瓣窄,旁瓣小,但算法复杂度较高,且极易遭到混频搅扰的影响。在进行了实践试验验证之后,综合楼室内混响带来的差错,咱们挑选了相对稳健的周期图法,下面简略介绍一下周期图法。

  (2)周期图法

  依据麦克风公式7.jpg

  周期图法是经过算出每个视点入射信号的功率,然后找出最大值所对应的视点,便是声响信号入射的视点。做法是先对收集的N次快拍求均匀估量自相关矩阵:

 依据麦克风公式8.jpg

  这种办法较为稳健,从仿真成果来看,尽管主瓣较宽,但在精度要求不是非常严厉的情况下能够运用,特别在有混频搅扰的情况下,周期图法也能较为精确地估量出视点。且该算法的复杂度较低,易于在单片机上完结,所以咱们就挑选了周期图法,而且选用了6阵元的线阵,因为声速v=340
m/s,人声频率在300~3400 Hz之间,其间f=1700 Hz对应的半波长λ = 0.5*v/f = 0.1 m = 10 cm,阵元距离为10
cm。

  1.3 体系优化

  1.3.1 频率切片

  传统阵列信号处理的模型与算法都是建立在窄带信号的条件下,可是语音信号的频率规模为300 Hz-3400
Hz,带宽较大,所以不能对语音信号直接进行处理,要先进行切片。可是各个频率重量的功率有很大差异,假如对300 Hz~3400
Hz都进行切片的话会形成核算资源的糟蹋,咱们在试验往后发现正常人声在600 Hz~1200 Hz内频率重量的功率最大,所以咱们在这个规模内进行切片,以200
Hz为距离,共切四片。

  1.3.2 成果滤波

  为了前进体系的安稳性和精确性,咱们进行了成果滤波,分为两个阶段:习惯噪声和线性束缚滤波。

  (1)噪声自习惯

  在开端进行DOA估量且云台盯梢之前,需求先对电路噪声及环境噪声进行习惯。进入噪声习惯形式之后,经过麦克风收集当时的电路及环境噪声,核算其功率,然后设定一个适宜的阈值。在之后的核算中,若功率大于阈值,则视为有用的声响,不然视为噪声,不核算视点。这样能够有效地滤除底噪的搅扰,当人中止说话时,摄像头不会因为噪声的搅扰而随意摇摆。

  (2)线性束缚

  为了前进体系的安稳性以及减小放射径的影响,咱们选用了线性束缚的办法,这样能有效地减小骤变以及放射径的影响,即:

  终究视点=0.8 前次视点+0.2 当时核算视点

  因为每一秒会核算出15次成果,所以不免会有一些核算出来的成果不太精确,这样运用了线性束缚之后,即便有一些视点不太精确也不会形成较大的影响,大大地前进了体系的安稳性。

  1.3.3 云台方针盯梢

  云台的操控是经过单片机串口给解码器发指令来完结的,而且选用了步进的办法操控。在云台和麦克风阵列摆放联系的问题上,咱们采纳的计划是阵列固定在云台上面,跟从云台一同滚动,云台依据DOA的估量成果不断向0°方向挨近。

2 参赛感触

  本次竞赛咱们的著作得到了不少评委教师的必定与认可,而且摘得了本次竞赛的最高奖瑞萨杯奖,我以为是因为咱们著作的以下一些亮点:首要,咱们的著作的处理器只运用了组委会供给的开发板,在咱们的不断改善与优化下,悉数的算法与操控都在瑞萨单片机上完结,把单片机的核算资源、内存都运用到了极致。这样就大大下降了本钱,增加了把该著作变成产品推向商场的可能性。其次,咱们的体系的安稳性很好,咱们运用了噪声自习惯、线性束缚、成果滤波等办法增加了体系的安稳性,而且在不同的环境下都进行了测验。还有一点,便是实践运用价值较高,现在的商场对声源定位的需求越来越高,能够在网络视频主动录制、鸣笛抓拍等场景中有广泛的运用。

  这次的竞赛,咱们收成的不只仅是瑞萨杯这个奖项,更多的是在竞赛过程中才能的前进。在这个过程中,咱们不只在理论常识上得到了前进,着手才能也有了很大的前进,处理问题的才能也得到了很大的前进,意志力也得到了训练,在行将升入大四,开端更多地触摸科研任务之际,这次竞赛也给了咱们许多前行的动力和决心。

  参考文献:

  [1]McCowan I A.,Robust Speech Recognition using Microphone Arrays[D].
Queensland University of Technology,Australia,2001.

  [2]梁玉杰. 依据超格点DOA的室内无线传感器网络定位技能研究[D]. 上海:上海交通大学,2015-4-7.

  [3]Jacob Benesty,Jingdong Chen,Yiteng Huang,Microphone Array Signal
Processing[M]. 北京:国防工业出版社,2015.

  [4]张小飞,陈华伟,仇小锋. 阵列信号处理及MATLAB完结[M].北京:电子工业出版社,2014.

  [5]姚天任. 数字信号处理[M]. 北京:清华大学出版社,2011.

  本文来源于《电子产品世界》2018年第12期第48页,欢迎您写论文时引证,并注明出处。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/bandaoti/zhizao/130768.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部