自适应小波阈值语音增强新方法
第46卷第4期2006年7月
文章编号:1000-8608(2006) 04-0561-06
大连理工大学学报
Journal of dalian university of technology
Vol . 46 No . 4Jul . 2006
自适应小波阈值语音增强新方法
马晓红 1
宋
辉2
殷福亮1
116024;
(1. 大连理工大学电子与信息工程学院 辽宁大连2. 清华大学电子工程系 北京100084)
摘要:针对单一小波阈值语音增强方法降低语音可懂度这一问题 提出一种基于自适应小
波阈值的语音增强新方法. 根据噪声帧频谱的平整度判断出噪声的类型 即是白噪声(含频响曲线比较平整的有色噪声) 还是频响曲线不平整的有色噪声. 由于不同类型的噪声具有不同性质的Lipschitz 指数 对两种不同的噪声类型分别采用不同的自适应小波阈值对带噪语音信号进行增强处理. 用计算机仿真和实际环境录制的语音数据对该方法的性能进行了测试 实验结果表明在两种实验数据情况下 该方法均具有较好的噪声抑制能力.
关键词:语音增强; 自适应小波阈值; 小波变换中图分类号:TN 912. 3
文献标识码:A
O
引言
示. 利用噪声频谱的平整性对带噪语音信号的背景噪声类型进行判别 用以指导阈值处理部分的软阈值函数; 同时对带噪语音信号进行小波变换 得到带有噪声的小波系数; 然后根据噪声的类型分别选用相应的自适应阈值对含噪小波系数进行处理 得到小波系数的估值; 最后对这些估值进行小波反变换得到重建信号.
语音信号经常会受到背景噪声的干扰 导致语音处理系统无法正常工作. 解决这一问题的有效方法是对带噪语音信号进行增强处理 从中提取尽可能纯净的原始语音. 语音增强的目的有两个:一是抑制背景噪声 改善语音质量; 二是提高语音的可懂度. 现有的语音增强方法较多 大体上可以分为两大类:一类是时域方法 如基于参数和模型的方法[1~3]; 另一类是频域方法 如谱相减法[415]1短时谱幅度估计[6]1对数谱幅度估计[7] 以及基于马尔柯夫模型滤波算法[8]等.
小波分析又称为多分辨率分析 是一种有力的时-频分析工具. 它既可以分析信号的概貌 又可以分析信号的细节; 用软阈值函数处理小波系数是较为广泛的一种小波语音增强方法 该方法对所有尺度的小波系数采用单一阈值进行处理 而不考虑输入噪声的类型. 这种方法虽然可以降低噪声 但同时也会抑制一部分语音信号 从而降低语音的可懂度. 本文提出一种基于自适应小波阈值的语音增强新方法 它不同于文献[9]中介绍的多尺度多阈值方法. 该方法根据噪声类型的不同 采用不同的自适应小波阈值对带噪信号进行增强处理.
图1
f ig. 1
自适应小波阈值语音增强方法框图
Schematics of adaptive Wavelet threshold speech enhancement method
1. 1
噪声类型判别方法
根据有色噪声的幅频特性可知 不同频率处
的噪声幅度是不同的. 有些有色噪声的幅度相差很大 而有些有色噪声幅度则相差很小 接近于白噪声. 前者的频响曲线 极不平整 而后者的频响曲线 比较平整. 因此 可以用噪声频响曲线的 平整度来描述其频率特性. 频响曲线越平整 则越接近白噪声; 频响曲线越不平整 说明噪声特性越差.
通过计算噪声帧每个频率点处幅度值与平均幅度差值的平均值 将噪声区分为白噪声(含频响曲线比较平整的有色噪声) 和频响曲线不平整的有色噪声两类.
该平均值描述了噪声频响曲线的
1
自适应小波阈值语音增强方法
自适应小波阈值语音增强方法框图如图1所
收稿日期:2005-01-19; 修回日期:2006-05-22.
基金项目:国家自然科学基金资助项目(60575011; 60372082).
作者简介:马晓红 (1967-) 女 博士 副教授; 殷福亮(1962-) 男 教授 博士生导师.
562
大连理工大学学报
第46卷
起伏程度9定义为谱的平整度. 如果该平均值小9说明谱的平整度好9则为白噪声(含频响曲线比较平整的有色噪声) ; 如果该平均值大9说明谱的平整度不好9则为频响曲线不平整的有色噪声. 具体步骤如下2
(1) 对带噪语音信号进行有音/无音检测 10 ;
(2) 对噪声帧进行加窗傅里叶变换;
(3) 计算其频响曲线的平均幅度c f ; (4) 计算谱的平整度7;
g(z) 选取主要基于三点考虑2(1) 噪声小波系数随尺度增加而减小9因此应满足递减性质. (2) 对不同尺度下白噪声小波系数跟踪并研究其变化规律9发现小波系数除了与尺度有固定的关系之外9随着尺度的增加9其下降速度并不相同. 尺度越大9下降速度越快. (3) 对多组数据分析表明9它近似满足对数函数分布的形式. 综合考虑以上因素9本文实验中选取g(z) =1/(2z) ).
因为1. 2. 2频响曲线不平整的有色噪声情况
2
ln(1+
(5) 如果小于一个特定的阈值9则认为是白噪声(含频响曲线比较平整的有色噪声) 9否则认为是频响曲线不平整的有色噪声. 1. 2
阈值处理方法
通过正确选择正交小波基函数9对带噪信号进行多分辨率小波分解9利用随机白噪声的Lipschitz 指数小于零9而纯净语音的Lipschitz 指数不小于零的特点9通过检测连续尺度上带噪信号小波变换的模极大值9可以区分它们是由噪声产生的还是由信号产生的. 由于高斯白噪声小波变换模值的平均密度反比于尺度j9去掉那些随着尺度减小而小波变换幅度平均增长的所有极大值9或不传递到大尺度上的极大值后9即可达到抑制噪声的目的.
通常9软阈值函数定义为 11
thl(c z 9/)=
{
sgn(c z ) (c z -/); c z Z /
0; c /
(1)
z
/=O
(2)
其中N 为输入信号序列长度9O 为噪声标准差. 该方法称为单一阈值法.
本文分别对白噪声(含频响曲线比较平整的有色噪声) 和频响曲线不平整的有色噪声选用了两种不同类型的阈值函数.
1. 2. 1白噪声(含频响曲线比较平整的有色噪声) 情况由于随机白噪声的Lipschitz 指数小于零9且其小波系数c z 与尺度成反比9可对式(2) 的阈值函数进行修正9使得该阈值函数也随着尺度的增加而减小. 修正后的函数为
//=O
-g(z) (3)
式中g(z) 是尺度z 的反比例函数. 式(3) 的软阈值函数随着尺度和噪声方差的变化而变化9称为与尺度相关的自适应阈值法9通过适当选择g(z) 函数9可以改善对白噪声的去噪性能.
有色噪声的Lipschitz 指数并不总是小于零9因此9如果仍采用随尺度增加而减小的阈值函数进行处理9则有可能漏掉某些噪声的小波系数9降低系统性能.
不同的有色噪声具有不同的频率特性9有些噪声的频响曲线比较平整9而有些则起伏较大9极不平整. 因此该修正法可以利用噪声帧内频响曲线的平整度对阈值函数进行修正9修正后的函数如下式所示2
//=O
-S (7) (4)
式中S (7) 表示以噪声帧内频响曲线平整度为自变量的修正函数. 该阈值函数与噪声的平整度有关9因此该修正法称为与噪声性质相关的自适应阈值法. 同样9可以通过选择适当的S (7) 函数来改善对有色噪声的抑制能力.
为了确定修正函数S (7) 的形式9对不同平整度7的小波系数进行了跟踪分析. 对于有色噪声情况9小波系数随尺度的变化基本无序9不再具有单调下降的趋势9也不能再采用尺度相关的函数进行阈值修正. 实验数据表明97值越大的噪声帧9噪声小波系数变化越不规律9越容易与语音信号的系数混杂在一起9难以区分. 在这种情况下9为了尽可能保留原始语音成分9只能牺牲部分噪声抑制能力换取语音信号的完整性9将阈值选取得低一些; 7值较小的噪声帧9噪声与语音的小波系数相对而言比较容易分离9这时可以适当降低阈值函数9既得到较好的去噪性能9又可以保证语音信号不会有太大失真. 具体函数可以通过实验选取9对已有数据进行分析9并综合考虑以上因素9本文选取S (7) =
2
实验结果
采用计算机模拟(分为白噪声和有色噪声两种情况) 和实际录制的带噪语音信号对该系统性能进行了测试. 语音数据长度均为30000点9有色噪声是实际环境录制的非平稳噪声. 窗函数采
第4期
马晓红等, 自适应小波阈值语音增强新方法
563
用1024点的Hamming 窗, 小波函数选取三阶Daubechies 小波, 分解6级. 2. 1
模拟语音信号实验结果
表1示出了白噪声情况下单一阈值法(式(2) ) ~多尺度多阈值法和本文方法语音增强结果的对比情况. 其中R i 表示输入信噪比, R o 表示输出信噪比. 表1
tab. 1
无法重构原信号. 在白噪声情况下, 后两种方法的噪声抑制能力差别不是很大, 这是因为白噪声的噪声特性相对于多数有色噪声来讲平整得多, 因此噪声特性估计对系统性能改善并不明显. 图2示出纯净语音信号的时域波形图, 图3示出在纯净语音信号中加入0dB 白噪声后的带噪语音信号时域波形图, 图4~6示出对图3中的带噪语音信号用3种方法增强后信号的时域波形图. 从图4~6可以直观地看出, 本文提出方法对白噪声的确具有较好的噪声抑制效果, 而且增强前后语音成分失真不大.
为了验证对频响曲线不平整的有色噪声, 本文提出的与噪声频率特性相关的自适应阈值法(式(4) ) 的噪声抑制能力要优于单一阈值法(式(2) ) 和与尺度相关的自适应阈值法(式(3) ) , 本文进行了相关的实验, 实验结果如表2所示.
由表2可以看出, 采用与噪声频率特性相关的自适应阈值法更适合抑制有色噪声. 这也证明了有色噪声并非处处都具有负奇异性这一特征. 而适用于白噪声的与尺度相关的自适应阈值法性能甚至不如单一阈值法, 是由有色噪声复杂的频率特性导致的. 噪声的小波系数与尺度并不是简单的单调下降的关系, 这使得尺度相关自适应阈值法在处理这类信号时有可能漏掉部分小波系数, 使得系统性能有所下降.
三种阈值方法语音增强前后性能对比(白噪声)
Performance
comparison
before
and
after
processing of three methods (white noise)
R i /dB -505101520
R o /dB
单一阈值法-6. 577. 4316. 3523. 7030. 1335. 99
多尺度多阈值法
3. 5911. 1417. 3123. 1228. 6033. 70
本文提出方法
3. 4311. 1217. 9524. 1729. 9435. 30
从表1可以看出, 当输入信噪比足够大时, 3种方法都具有较好的噪声抑制能力. 但是, 当输入信噪比降低至5dB 以下时, 多尺度多阈值法和本文提出方法则要明显优于传统的单一阈值法. 尤其当输入信噪比低于0dB 时, 单一阈值法根本
图2
f ig. 2
纯净语音信号
Pure speech signal
图3加入0dB 白噪声后的带噪语音信号
f ig. 3
Signal with 0dB white noise
图4
f ig. 4
单一阈值法对白噪声的增强结果
the enhancement result of the single-threshold method for white noise
564
大连理工大学学报
第46卷
图5
f ig. 5
多尺度多阈值法对白噪声的增强结果
The enhancement result of the multi-scale-multi-threshold method for white noise
图6
f ig. 6
本文方法对白噪声的增强结果
The enhancement result of the proposed method for white noise
表2
Tab. 2
3种阈值方法增强前后性能对比(有色噪声)
Performance comparison before and after processing of three methods (colored noise)
单一阈值法
2. 989. 5016. 0222. 01R o /dB
与尺度相关的自适应阈值法
2. 058. 5214. 4320. 07与噪声特性相关的自适应阈值法
3. 2310. 7217. 4823. 87图7示出在纯净语音信号中加入0dB 有色噪声后的带噪语音信号时域波形图 图8~10示出对图7中的带噪语音信号用3种方法增强后信号的时域波形图. 从图8~10可以直观地看出 相对于前两种方法 本文提出方法对有色噪声同样具有较好的噪声抑制效果 而且增强前后语音成分失真不大.
R i /dB 051015图7加入0dB 有色噪声后的语音信号
Signal with 0dB colored noise
f ig. 7
图8
f ig. 8
单一阈值法对有色噪声的增强结果
The enhancement result of the single-threshold method for colored noise
图9
f ig. 9
多尺度多阈值法对有色噪声的增强结果
The enhancement result of the multi-scale-multi-threshold method for colored noise
第4期
马晓红等:自适应小波阈值语音增强新方法
565
图10
Fig. 10
本文方法对有色噪声的增强结果
图. 可以看出 本文方法在实际应用环境中也同样具有良好的噪声抑制能力 而且语音成分失真不大.
表3
Tab. 3
The enhancement result of the proposed method for colored noise
实际语音信号实验结果
会议室体积为7m >5m >3m 声源距离麦克风1m 远. 噪声由电脑风扇~电吹风等设备产生. 对该会议室内录制的带噪语音信号 用单一阈值法~多尺度多阈值法和本文方法进行语音增强前后信噪比对比情况如表3所示.
由表3可以看出 本文方法对于实际语音信号同样具有较好的噪声抑制能力.
图11为实际录制带噪语音信号的时域波形图 图12*14为3种方法增强之后的时域波形2. 2
实际录制的带噪语音信号增强结果
The enhancement results of the signal recorded in the real environment
R o /dB
R i /dB 6. 188. 74
单一阈值法
10. 5410. 90
多尺度多阈值法
10. 7211. 34
本文自适应阈值法
11. 5613. 16
图11
Fig. 11
实际录制的带噪语音信号波形
The signal recorded in the real environment for real noise
图12
Fig. 12
单一阈值法对实际噪声的增强结果
The enhancement result of the single-threshold method for real noise
图13
Fig. 13
多尺度多阈值法对实际噪声的增强结果
The enhancement result of the multi-scale-multi-threshold method for real noise
图14
Fig. 14
本文方法增强后的语音波形
The enhancement result of the proposed method
566
大连理工大学学报
Lett 2004 llC 4) :450-453
第46卷
3
结语
[5]GUSTAFSS0N ~ N0RD~0LM S E CLAESS0N
I.
Spectral
subtraction
using
reduced
delay
convolution and adaptive averaging [J].IEEE Trans Speech and Audio Process 2001 9C 8) :799-807[6]EP~RAIMY MALA~D. Speech enhancement
using a minimum mean sguare error short-time spectral amplitude estimator Acoust Speech 1109-1121
[7]EP~RAIMY MALA~D. Speech enhancement
using a minimum mean-sguare error log-spectral amplitude estimator
[J].
IEEE Trans Acoust
Speech Signal Process 1985 33C 2) :443-445[8]EP~RAIMY. A Bayesian estimation approach for
speech enhancement using hidden Markov models [J].IEEE Trans Signal Process 1992 40C 4) :725-735[9]孟
哲. 基于小波变换的多尺度多阈值语音增强方
--
本文提出了一种自适应小波阈值语音增强新方法. 该方法根据噪声类型的不同 对小波系数分别利用不同的自适应阈值函数进行处理. 对计算机模拟和实际环境中的语音信号进行了增强处理 均获得了比较好的效果.
[J].IEEE Trans 1984
3ZC 6) :
参考文献:
[1]GANN0T S BURS~TEIND WEINSTEIN E.
Iterative and seguential Kalman filter-based speech enhancement algorithms [J].IEEE Trans Speech and Audio Process 1998 6C 4) :373-385
[2]LEE B G LEE K Y ANN S. An EM-based
approach
for
parameter
enhancement
with
an
application to speech signals [J].Signal Process 1995 46C 1) :1-14
[3]KIM J B LEE K Y LEE C W. 0n the applications
of the interacting multiple model algorithm for enhancing noisy speech [J].IEEE Trans Speech and Audio Process 2000 8C 3) :349-352
[4]~ASANM K SALA~UDDINS K~ANM R. A
modified a priori SNR for speech enhancement using spectral subtraction rules [J].IEEE Signal Process
Signal Process
法[J].武汉理工大学学报 2001 Z5C 2) :209-212[10]TANYER S G 0Z ER ~.V oice activity detection
in nonstationary noise [J].IEEE Trans Speech and Audio Process 2000 8C 4) :478-482
[11]杨福生. 小波变换的工程分析与应用[M].北京:科
学出版社 2000
A ne w approach f or adapti v e w a v elet threshold speech enhance m ent
MA
Xi ao -h on g
1
SON G
2h u i
YI N Fu -l i an g
1
C 1. Sch ool of el ectr . an d I n f . en g . Dal i an Un i v . of tech n ol . Dal i an 116024 Ch i n a ; 2. Dept . of el ectr . en g . tsi n gh u a Un i v . Bei j i n g 100084 Ch i n a )
A b stract :To solve the problem of poor understandability of the speech signals processed by the fi X ed
wavelet threshold a new speech enhancement method of adaptive wavelet thresholds is presented. The types of additive noise are to be ascertained firstly according to the differences in the spectrum amplitude between white noise C including color noise with flatting spectrum amplitude) and color noise with varying spectrum amplitude. Since Lipschit z e X ponent varies with the types of noise and speech different kinds of the adaptive threshold function of the wavelet transform are used to enhance the noisy speech signals according to the types of noise. The proposed scheme was evaluated on noisy speech signals simulated by computer and recorded in real environment separately. E X perimental results show the effectiveness of the proposed method.
K e y w ords:speech enhancement ; adaptive wavelet threshold ; wavelet transform
自适应小波阈值语音增强新方法
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
马晓红, 宋辉, 殷福亮, MA Xiao-hong, SONG hui, YIN Fu-liang
马晓红,殷福亮,MA Xiao-hong,YIN Fu-liang(大连理工大学,电子与信息工程学院,辽宁,大连,116024), 宋辉,SONG hui(清华大学,电子工程系,北京,100084)大连理工大学学报
JOURNAL OF DALIAN UNIVERSITY OF TECHNOLOGY2006,46(4)5次
1. GANNOT S;BURSHTEIN D;WEINSTEIN E Iterative and sequential Kalman filter-based speechenhancement algorithms[外文期刊] 1998(04)
2. LEE B G;LEE K Y;ANN S An EM-based approach for parameter enhancement with an application tospeech signals[外文期刊] 1995(01)
3. KIM J B;LEE K Y;LEE C W On the applications of the interacting multiple model algorithm forenhancing noisy speech[外文期刊] 2000(03)
4. HASAN M K;SALAHUDDIN S;KHAN M R A modified a priori SNR for speech enhancement usingspectral subtraction rules 2004(04)
5. GUSTAFSSON H;NORDHOLM S E;CLAESSON I Spectral subtraction using reduced delay convolutionand adaptive averaging 2001(08)
6. EPHRAIM Y;MALAH D Speech enhancement using a minimum mean square error short-time spectralamplitude estimator[外文期刊] 1984(06)
7. EPHRAIM Y;MALAH D Speech enhancement using a minimum mean-square error log-spectralamplitude estimator 1985(02)
8. EPHRAIM Y A Bayesian estimation approach for speech enhancement using hidden Markov models[外文期刊] 1992(04)
9. 孟哲 基于小波变换的多尺度多阈值语音增强方法[期刊论文]-武汉理工大学学报(交通科学与工程版)2001(02)
10. TANYER S G;OZER H Voice activity detection in nonstationary noise[外文期刊] 2000(04)11. 杨福生 小波变换的工程分析与应用 2000
1. 徐耀华. 王刚. 郭英. Xu Yao-hua. Wang Gang. Guo Ying 基于时频阈值的小波包语音增强算法[期刊论文]-电子与信息学报2008,30(6)
2. 马晓红. 殷福亮. 陆晓燕. 王晓宁 基于小波变换的传声器阵列语音增强方法[期刊论文]-大连理工大学学报2003,43(4)
3. 徐岩. 杨静. 王维汉 基于谱相减改进算法的语音增强研究[期刊论文]-铁道学报2004,26(1)4. 楼红伟. 胡光锐 基于简化的KLT和小波变换的非平稳宽带噪声语音增强[期刊论文]-控制与决策2003,18(5)
5. 李晔. 崔慧娟. 唐昆. LI Ye. CUI Huijuan. TANG Kun 基于谱减的语音增强算法的改进[期刊论文]-清华大学学报(自然科学版)2006,46(10)
6. 李雪耀. 谢华. 张汝波. LI Xue-yao. XIE Hua. ZHANG Ru-bo 基于离散余弦变换的语音增强[期刊论文]-哈尔滨工程大学学报2007,28(2)
7. 蒋海霞. 成立新. 陈显治. JIANG Hai-xia. CHENG Li-xin. CHEN Xian-zhi 一种改进的谱相减语音增强方法[期刊论文]-解放军理工大学学报(自然科学版)2001,2(1)
8. 基于离散小波变换与小波包分解的语音增强算法[期刊论文]-解放军理工大学学报(自然科学版)2005,6(5)
9. 王娜. 郑德忠. Wang Na. Zheng Dezhong 结点阈值小波包变换语音增强新算法[期刊论文]-仪器仪表学报2007,28(5)
10. 卜凡亮. 王为民. 戴启军. 陈砚圃. Bu Fan-liang. Wang Wei-min. DAI Qi-jun. Chen Yan-pu 基于噪声被掩蔽概率的优化语音增强方法[期刊论文]-电子与信息学报2005,27(5)
1. 李战明. 林娟. 陈若珠 基于改进的小波阈值去噪和二级判断模型的说话人识别[期刊论文]-兰州理工大学学报 2010(1)
2. 王春丽 改进的小波阈值去噪算法及其实现[期刊论文]-兰州交通大学学报 2011(6)3. 张飞 基于小波变换的语音净化新方法[期刊论文]-通信技术 2009(9)
4. 李如玮. 鲍长春. 窦慧晶 基于双正交小波包分解的自适应阈值语音增强[期刊论文]-仪器仪表学报2008(10)
5. 李如玮. 鲍长春. 窦慧晶 基于小波变换的语音增强算法综述[期刊论文]-数据采集与处理 2009(3)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_dllgdxxb200604019.aspx