改进的互功率谱相位时延估计方法
第26卷第1期电子与信息学报vol26N01
2004年1月JournaIofEkchonics&In协rmationTechnologyJan2004
改进的互功率谱相位时延估计方法・
马晓红陆晓燕殷福亮
(大连理工大学电子与信息工程学院大连116024)
摘要:互功率谱相位是一种常用的时延估计方法.该方法在弱噪声和中度以下混响的环境下.可以获
得比较精确的时延估计值;但在低信噪比和强混响的环境下,该方法的性能急剧下降.制埘这一问题.本文
提山了一种改进的互功率谱相位时延估计方{击.计算机模拟结果表明.改进后的方法即使在低信噪比和强混
响的环境下,也可以获得令人满意的时延估计值.
关键诃t传声器阵列,互功率谱相位,时延估计
中圈分类号:TN91123文献标诅码,A文章编号,1009-5896(2004)01.0053.07
TimeDelayEstimationbyUsingModifled
CrosspowerSpectrumPhase【[1echnique
MaXiao_hongLuXia0一yanYinnl—liang
(schDof。,凹fecf伸ⅡⅡndm,。西19.,D820dn矾l呲o,nc^,Do“Bn116024,0h饥o)
AbstractTheCrosspowerspectfumPhase(csP)techniqueisawellknowntimedelay
esti士n毗ionmethod.A
envhoⅡmen“矗weaknobeandmediumr神吣eratIonrelativelyprecisetimedelayestimationcanbeachievedbyusingitin
theTheperformancedeEradesshaTply
iⅡtheenvironmentoflowSNRandstro“greverb盯ationThemodmedCSPalgorithm
isproposedinordercoimprovetheperfor玎1anceofCSP.Theweighti“gfunctionof恤e
proposedCSPme“odchangeswiththev盯iationofSNR,andthetimedclayofarrivalls
accomplishedviaaweightedfunctionofframesofCSPeomputersimulationresuItsindicate
如attheproposedmethodWilI舀vesatjsfactoryvalueoftimedelayestimationeveninthe
environmento“owSNRandstrongreverberation
KeywordsMicropIIonearra“eros8po、他rspectrumph船e,Timedelayestimation
1引言
在电话会议、视频会议等系统中.可以通过传声器阵列声源定位方法来确定说话人的位置,
以控制摄像机和传声器阵列波束对准正在说话的人【“.在现有的传声器阵列声源定位方法中,
基于时延估计的定位方法精度相对较高,在实际中可以实时实现【2J,因而倍受关注.基于时延
估计的定位方法由时延估计和声源定位两部分组成M1.时延估计方法的精度和鲁棒性是关系
到声源定位精确与否的关键因素.此外,时延估计技术还可以广泛用于雷达、声纳、地震勘探
和生物医学信号处理等领域.
时延估计方法大致可以分为三种:广义互相关法(Gcc)、最小均方(LMs)自适应滤波法
和互功率谱相位法(csP).由于互功率谱相位法在性能上优于前两种方法h…,因此本文只对
该方法进行性能测试。互功率谱相位法对两路输入信号进行了白化处理,从而锐化了相关函数
的峰值,使算法本身具有一定的抗混响和噪声能力.但随着信噪比的降低和混响的增强,其性
能急剧下降。为了提高CSP法抗噪声和抗混响的能力,将其固定的互功率谱加权函数改进为随
信噪比而变的加权函数;将原来由一帧互功率谱相位的峰值决定时延估计值,改进为由多帧互
12002—07-22收到.2002.12.16改回
电子与信息学报第26卷
功率谱相位加权后的峰值来定出时延估计值,从而进一步锐化相关函数的峰值,大大提高了该
算法的性能.本文给出了计算机仿真实验结果,验证了新方法的有效性.
2传声器信号产生模型
常用的传声器信号产生模型有理想模型和实际模型两种.前者只考虑环境噪声,而不考虑
多径反射噪声;后者既考虑环境噪声又考虑多径反射噪声.
2.1理想模型
间距为D的两个传声器ml和m2接收到的信号妣(£)(i=1,2)可以表示为
乳(t)=dis0一t)+扎。J(t)
这里s(£)为声源信号,
之间的时延。(1)n。是声波传播的衰减因子,n是声源传播到传声器所需要的时间,n;』(£)为环境噪声,且s(t),”¨(t)和n2,(t)之间彼此不相关。d=n一见为两个传声器信号
2.2实际模型
间距为D的两个传声器m1和m2接收到的信号戤(t)(i=1,2)可以表示为
z。(t)=o。s0一矗)+m0)=&。s0一n)+札;,(£)+n。且(t)
=^,(t){s(t)+蛳(t)=∑c{,s(£一啊)+M(£)
,=0(2)
这里符号“+”为卷积算子,m(t)为千扰成份(包括各种环境噪声和房间多径反射噪声),n。,(t)表
示第i个传声器的环境噪声,n。R(±)表示第t个传声器的多径反射噪声。h,(t)=∑暑octJ6(t一勺)
是由IMAGE模型【7J定义的房间脉冲响应函数,o{,(i=l,2,j=0,1,…,o。)为多径反射的衰
减因子,c。o=o,,Ro=t“=1,2)是与直接到达传声器的声源信号有关的参数.由于声源信
号直接传播到传声器所经过的路径最短,并且多径反射的衰减因子与声源信号传播的距离平方
成反比,因此对于所有的J>0,有t,>n,q,<啦0=1,2)。
3基于互功率谱相位的时延估计法阳,8]
由理想模型可知,两个传声器接收信号叨(t)和。2(t)的互功率谱函数G12(u)为
G12(u)=xl(u).磁(u)=nln2s(u)s+(u)e一,“(7・一7z)
+dls(u)e—J。71』、譬,(u)+n2S’(u)eJ。下2Ⅳ1,(u)+Ⅳlj(u).Ⅳ;,(u)(3)
由于s(t),n“(t)和n2,(t)之间彼此不相关,因此式(3)的后三项为零。式(3)简化成如下形式:
G12(u)=xl(u).琏(u)=aln2s(u)S+(u)e一’。ln一72’(4)
为了锐化互相关函数的峰值,需要对互功率谱函数进行女u权,这样两个传声器接收信号zl(t)
和z2(t)的互相关函数_R12(r)可以表示为
1r十。。
R,。(7)2寺上。。蚓“)x-(。)弼(“)∥Ⅶ
加权函数妒12(u)=1/IG・2(u)1.(5)
4互功率谱相位时延估计法性能分析由实际模型可知,两个传声器接收信号z1(£)和z2(t)的互功率谱函数G12∞)为
第1期马晓红等z改进的互功率谱相位时延估计方怯
01n2s(u)s’(u)e~,“(71一n)
+血1s(u)e一。“71Ⅳ;(u)+旺2s+(u)e。。nⅣ1(“J)十Ⅳ1(“J)M(u)
由式(2)可知
Ⅳi(u)=肌f(“J)+ⅣtR(u),t=1,2
式中M,∞)和Ⅳ{R∞)分别为n;,(t)和n,R(t)的加窗傅里叶变换,将式(7)代入式(6)可得
G12(u)=Q102s(u)s’(u)e一’“(71一托)+口1s(u)e—J“7-[畅(u)+Ⅳ;R(u)]
+血2s‘(u)e5“吨IⅣ1J(“J)+Ⅳ1R(u)]+IⅣ1,(u)+Ⅳ1R(u)】【畅(“J)+Ⅳ;R(u)](8)
由于声源信号5(t)与环境噪声n1』(t)和n2f(t)之间彼此不相关,因此式(8)可简化成如下
形式
G12(u)=nln2s(u)s+(叫)e一,“(’l一72)
+dlS(“J)e一’。71Ⅳ;R(u)+d2S’(u)e’。r2Ⅳ1兄(u)+Ⅳ1R(u)婀R(u)
在弱混响的情况下,由于cl,和c2J(j=1,2,一,o。)远小于d1和02,因此式(9)的后三
项应近似为零.于是互功率谱函数G12∞)可以近似表示为
G12(u)=x1(u).砖(u)≈。1。2S(u)s‘(u)e—J。(九一吨)(10)
比较式(4)和式(10)可以看出。在弱噪声和弱混响的环境下,实际模型中两个传声器信号
之间的互功率谱函数与理想模型中的近似相等,这说明互功率谱相位时延估计法虽然是针对理
想模型提出的。但在弱噪声和弱混响的环境下,它仍具有比较好的时延估计性能.但在强噪声
和强混响的环境下。式(9)的后三项不能近似为零.从而式(4)和式(9)有较大的差异,使得互
功率谱相位时延估计法的性能下降.
5改进的互功率谱相位方法
在实际环境中,往往存在较大的环境噪声和较强的混响.使得式(9)的后三项变得较大。
这样用1G12(∽)l来近似ls∞)12也会有较大的误整。使互相关函数R12(r)的峰值不再明显,从
而大大影响了CSP法的性能.
针对CSP法在中度以上环境噪声和强混响环境下性能下降这一问题.对其进行了两方面的
改进。
5.1csP加权函数妒12∞)的改进
在csP方法中.由于用lGl2(u)I代替Is¨)12,因此在高信噪比的情况下.两者之间的差
值较小,估计出的时延精度较高;而在低信噪比的情况下,两者之间将会有较大的差值,估计
出的时延精度较低.
随着信噪比的下降。ls∽)12在G12∞)中所占的比例也下降.为此将csP的加权函数
妒12(u)改为
妒12(“J)=1/1G12(u)1“(11)
电于与信息.学报第26卷
这里0.5茎AS1,它是随着信噪比而变化的量。即
-={薰t一-。,,c一・一一。,,ca—a,,+-・
加权以后的互功率谱函数Gi2∞)为
G:2(u)=妒12(“J)G12(u)口<口0口。曼口≤盯1盯>盯1(12)其中盯表示信噪比,口o,盯1,^o和Al是按实际情况确定的常数,且A1>Aof131
在式(11)中,若取A=1,则为csP法;若取A=075,则为另一种形式的csP法【….
5.2多帧CSP加权
加长输入语音信号的长度可以提高算法的抗噪能力,因此为了进一步突出互相关函数的峰
值,对两个传声器信号之间的互功率谱函数进行加权平滑,即当前帧的加权平滑互功率谱G恐
为
rGl:,m=1
m=2
m>3G墨:{o.5(GA+G趋),【&oG窘+a1G:垆-1’+n2G:妒。’,(m为帧数)(14)
这里。。=口(m—i)/l∑::o口(m一☆)l,£=o,1,…,2,其中∥(m)表示第m帧的信噪比.
对G恐求傅里叶反变换,即可得传声器1和2间的互相关函数
冗12(r)=IFFT(G恐)
R12(T)的峰值位置即为传声器1和2间的时延f15)
6计算机模拟结果
两路输入语音信号首先经过100Hz到8kHz的带通滤波器变为带限信号,然后以16kHz的
采样率进行采样,并将采样值以16位二进制数表示.帧长为512点(相当于32ms的语音数据
长度),采用半重叠的汉宁窗(Hanning).针对视频会议系统的实际情况.盯。和01分别取为
10dB和30dB,A1和Ao分别取为1和0.7.
为了检验本文方法的性能,我们在不同的信噪比和混响环境下进行了计算机模拟,其中房
间混响的脉冲响应函数由1MAGE模型r『』产生.由于互相关函数的峰值尖锐程度体现出该方
法估汁时延的精度,因此仿真结果由互相关函数来表示.图1中横坐标Ⅳ表示采样点,纵坐标
R(Ⅳ)表示互相关函数值,正确的互相关函数峰值应出现在第6个采样点处.图1示出了不同
信噪比情况下,CSP法和M-CSP法的性能比较.其中图1(a)和图1(b)信噪比为30dB(弱噪
声),图1(c)和图1(d)信噪比为10dB(中度噪声).图1(e)和图1(f)信噪比为odB(强噪声).
比较图l(a)和1(b)可以看出,在信噪比比较高的情况下.两种方法互相关函数的峰值都
比较尖锐,时延估计的精度都比较高.比较图1(c)和1(d)可以看出,当倍噪比降低时。csP
法的互相关函数峰值开始拓展,而且出现比较多的干扰峰值;而M-CSP法的互相关函数峰值
仍很尖锐;此时两者均给出了正确的时延估计值.比较图l(e)和1(f)可以看出,在信噪比比
较低时.CSP法的互相关函数峰值已经完全淹没在干扰峰值中,给出了错误的时延估计值;而M—CSP法的互相关函数峰值还是比较尖锐,仍可给出正确的时延估计值.
第1期马晓红等:改进的互功率谱相位时延估计方法57
图1不同信噪比环境下两种方法的性能比较
(a)信噪比为30dBCsP法估计的互相关函数;(b)倍嘬比为30dBM—CSP法估计的互相关函数
(c)倌噪比为10dBCsP法估计的互相关函数I(d)信噪比为10dBM・csP法估计的互相关函数
(e)信噪比为0dBcSP法估计的互相关函数;(f)信嗓比为0dBM—csP法估计的互相美函数
图2示出了信噪比为10dB,3种不同混响情况下,CSP法和M-CSP法的性能比较.
其中图2(a)和图2(b)混响为50ms(弱混响),图2(c)和图2(d)混响为300ms(中度混响),图
2(e)和图2(f)混响为ls(强混响).
比较图2(a)和图2(b)可以看出,在中度噪声和弱混响的环境下,csP法的互相关函数的
峰值已经扩展;而M—CSP法互相关函数的峰值比较明显;此时两者均给出了正确的时延估计
值.比较图2(c)和图2(d)可以看出,在中度噪声和中度混响的环境下,CsP法互相关函数的
峰值无法辨认,并给出了错误的时延估计值;而M-csP法互相关函数的峰值比较明显,仍可给
出正确的时延估计值.比较图2(e)和图2(f)可以看出,在中度噪声和强混响的环境下,csP
法互相关函数的峰值无法辨认,给出错误的时延估计值;而M—esP法互相关函数的峰值也开
始扩展,但仍可获得正确的时延估计值.
为了比较CsP法(^=1及A=0.75)和M-CSP法的性能,在不同信噪比和混响情况下,
对100组数据(每组55帧)进行了实验.表1给出了分别用两种方法进行时延估计时,可以正确估计出时延的平均百分比.
电子与信息学报第26卷
0
0
0
So
《0
0
0
图2信噪比为10dB,不同混响环境下两种方法的性能比较
(a)混响为50ms(弱混响)csP法估计的互相关函数;(b)混响为50ms(弱混响)M-csP法估计的互相关函数;
(f)混响为1s(强混响)M-csP法估计的互相关函数(c)混响为300nls(中度混响)csP法估计的互相关函数;(d)混响为300ms(中度混响)M—csP法估计的互相关函数(e)混响为1s(强混响)asP法估计的互相关函数;
衰1csP法和M-csP法的正确率(%)比较
实验环境
lOdB0dB
4909
4545
727310dB,50ms62.2763.22818210dB,300ms54555515745510dB.1s45.4544557182CSPM.CSP^=l^=07594557091727385.4590.9l{9636
由表1可以看出,在不同噪声和混响的环境下,M—CSP法正确估计出时延值的百分比均
高于CSP法.
由模拟实验结果可以看出,M—CSP法在强噪声和强混响环境下,始终具有比较尖锐的峰
值和比较高的正确率.因此用于时延估计时具有较高的精度.其性能明显优于CSP法.就计算
量而言,M-CSP法比CSP法多计算了每帧信号的能量,这在传声器阵列声源定位系统中是有
音无音检测阶段的附带产品,对整个传声器阵列声源定位系统而畜并没有额外增加运算量.此外,用M—CSP法估计一对时延只需3次FFT,因此完全可以在实时系统中实现.
第1期马晓红等t改进的互功率谱相位时延估计方法
7结论
为了提高cSP法抗噪声和抗混响的能力,本文提出了一种M-CSP时延估计法。该方法的
CSP加权函数随信噪比而变;原来由一帧CSP的峰值决定时延估计值,改进为由多帧csP加
权后的峰值来定出时延估计值.计算机仿真实验结果表明,M—CSP法比原CSP法在性能上有
很大提高。
参
¨
2考文献cameraWa“gH,CImP.VoicesourcelocalizationforautomaticconferenciⅡg.ICASSP’97,Munich,Germ锄y’199718卜190.Brandsteinpointin焉8ysteminvideo—MSApractic出methodologyforspeeclls01Irceloc“izationwithmicrophonearr”s.
fPhDDisserta-∞”叩u把r,却eBc^,帆dLo叼ud9e,1997,11(2):9卜126.3BrandsteinMS.AframeworkforspeechsourceIocallzatioⅡusinEsensorarrays
tionI,BrownUniversity,1995
4SilvermanHF.KirtmanSEAtwo-stagealgorithmfordeterminingtalkerlocationfromlinear
microphoⅡe
5arraydata∞"巾“ter,却eec^Jond上。叼u“ge,1992,6(2):120~152OmologoM,SvaizerP.Acousticeventlocalizationusi“gacrosspowerspectrump11勰ebaSed
techniqueICASSPl94,AdeIaide,SouthAustralia.1994273276.
omologoM,SvaizerP.AcoIlstic
AllenJB,Ber“eyDAsource6locatioⅡinnoisyandreverberantenvironmen£usmgCSP缸alyeis.ICASSP’96,Atlanta,Georgia,USA,1996:921—-924.7Imagemethodforemci鲫tIysimulatingsmallroomacoustics,o“r%nl
0,^co“sticdsDc‘e坷o,^meric口,1979,65(4):943—950
8omologoM,Svaiz盯P.Useofthecross_power—spectrumphaseinacollsticevent10calization
佃EE竹onson却eec^ondA¨d妇Proce5sin吼1997}5(3):288—292
9RabinkinD,etol
onADSPtoGrallt社MIP.9314625implementationofsourcelocation1lsingnlic呻phoⅡe盯raystheNSF,July1996.R印ort
马晓红
陆晓燕
殷福亮女,1967年生,副教授,博士生,主要从事语音信号处理和阵列信号处理的理论与应用研究工作.女,1978年生.硬士生,主要从事语音信号处理和阵列信号处理的理论与应用研究工作男.1962年生,教授,博士生导师,主要从事数字信号处理、语音倌号处理和阵列信号处理的理论与应
用研究工作.
改进的互功率谱相位时延估计方法
作者:
作者单位:
刊名:
英文刊名:
年,卷(期):
被引用次数:马晓红, 陆晓燕, 殷福亮大连理工大学电子与信息工程学院,大连,116024电子与信息学报JOURNAL OF ELECTRONICS & INFORMATION TECHNOLOGY2004,26(1)19次
参考文献(9条)
1. Rabinkin D A DSP implementation of source location using microphone arrays 1996
2. OMOLOGO M;Svaizer P Use of the cross-power-spectrum phase in acoustic event localization[外文期刊]1997(03)
3. Allen J B;Berkley D A Image method for efficiently simulating small room acoustics 1979(04)
4. OMOLOGO M;Svaizer P Acoustic source location in noisy and reverberant environment using CSPanalysis [外文会议] 1996
5. OMOLOGO M;Svaizer P Acoustic event localization using a crosspower spectrum phase based technique
[外文会议] 1994
6. Silverman H F;Kirtman S E A two-stage algorithm for determining talker location from linearmicrophone array data[外文期刊] 1992(02)
7. Brandstein M S A framework for speech source localization using sensor arrays 1995
8. Brandstein M S A practical methodology for speech source localization with microphone arrays1997(02)
9. Wang H;Chu P Voice source localization for automatic camera pointing system in videoconferencing
[外文会议] 1997
本文读者也读过(2条)
1. 崔玮玮. 曹志刚. 魏建强. Cui Weiwei. Cao Zhigang. Wei Jianqiang 声源定位中的时延估计技术[期刊论文]-数据采集与处理2007,22(1)
2. 江南. 黄建国. 黄清 基于互相关函数的频域实现时延估计器[期刊论文]-仪器仪表学报2004,25(z1)
引证文献(19条)
1. 杜要锋. 尹雪飞. 陈克安 一种修正的近场声源定位时延估计方法[期刊论文]-电声技术 2010(2)
2. 田孝华. 李睿. 王维康 有效估计塔康测距信号多径时延的方法[期刊论文]-电子与信息学报 2010(9)
3. 白志茂. 黄高明. 徐琴珍. 杨绿溪 基于信息典型相关分析的时差测向[期刊论文]-信号处理 2010(2)
4. 马晓红. 李瑞. 殷福亮 基于信号相位差和后置滤波的语音增强方法[期刊论文]-电子学报 2009(9)
5. 李从清. 孙立新. 戴士杰. 李洙梁 机器人听觉定位跟踪声源的研究与进展[期刊论文]-燕山大学学报 2009(3)
6. 张丽艳. 殷福亮 一种适用于混响环境的麦克风阵列语音增强方法[期刊论文]-信号处理 2009(5)
7. 张丽艳. 殷福亮. 李细林 基于语音建立信号的ROTH加权时延估计方法[期刊论文]-数据采集与处理 2009(2)
8. 王毅. 吴长奇. 胡双喜 TDOA中几种时延估计算法的比较[期刊论文]-无线电通信技术 2008(1)
9. 李丽芳. 刘庆华 脉冲噪声下的时间延迟估计方法研究[期刊论文]-电声技术 2008(8)
10. 王波. 王树勋. 赵彦平 基于麦克风阵列的时延估计新方法[期刊论文]-吉林大学学报(信息科学版) 2008(3)
11. 梁立涛. 韩峰. 樊昕. 甘世明 相干干扰对时延估计的影响研究[期刊论文]-探测与控制学报 2007(6)
12. 刘庆华 室内噪声环境下语音信号时延估计[期刊论文]-声学与电子工程 2007(2)
13. 石杰. 相敬林. 陈韶华. 梁峰 七元非典型声强向量阵对舰船的被动定向和尺度估计[期刊论文]-电子与信息学报2007(6)
14. 石杰. 相敬林. 罗建. 韩鹏 声强向量法与时延估计法共用同一基阵实现舰船体积目标定向[期刊论文]-兵工学报2007(5)
15. 吴景田. 何培宇. 邓方. 徐自励. 潘帆 基于时延估计波束形成预处理的实时语音盲信号分离研究[期刊论文]-四川大学学报(自然科学版) 2006(1)
16. 马晓红 传声器阵列语音增强中关键技术的研究[学位论文]博士 2006
17. 于大刚 说话人个数时变的语音盲分离研究[学位论文]硕士 2006
18. 基于典范相关分析的时差测向技术研究[期刊论文]-电路与系统学报 2005(5)
19. 安良 水声测量校准技术的研究与开发[学位论文]硕士 2005
本文链接:http://d.g.wanfangdata.com.cn/Periodical_dzkxxk200401009.aspx