基于PCA方法的机械噪声数据处理
2010年6月噪 声 与 振 动 控 制第3期
文章编号:1006-1355(2010) 03-0118-05
基于PCA 方法的机械噪声数据处理
梁胜杰, 张志华, 崔立林
1
1
2
(1. 海军工程大学, 武汉 430033; 2. 海军工程大学振动与噪声研究所, 武汉 430033)
摘 要:双层圆柱壳体机械噪声源众多, 噪声数据结构复杂。使用相关性分析研究实验测得的壳体机械噪声数据, 并使用主成分分析法(PCA ) 对噪声数据进行降维处理。验证了使用累积贡献率大于0. 85作为双层圆柱壳体机械噪声选择主元数目标准的合理性。初步分析噪声源在不同区域的传播特点以及不同工况下的噪声源与其
在不同通道上降维后所保留主元数目的关系。
关键词:振动与波; 主成分分析方法; 机械噪声; 回归分析; 相关性分析; 降维中图分类号:O 212. 4; TB53 文献标识码:A
DO I 编码:10. 3969/.j issn . 1006-1355. 2010. 03. 031
Processi ng ofM echanical Noise Date U si ng PCA
LI ANG Sheng-jie , ZHANG Zhi -hua , CUI L i -lin
1
1
2
(1. Nava lUniversity o f Eng i n eering , W uhan 430033, H ubei China ;
2. Instit u te of No ise and V i b ra ti o n , Nava lUniversity o f Eng i n eering , W uhan 430033, Ch i n a) Abstract :R ibbed double -layer cy li n drical she lls have m any m echanical no ise sources , and the noise date is very i n tricate . In th is paper , the no ise date of the cy li n drical she ll is studied usi n g the re la -tiv ity analysis m ethod . And t h e di m ension -reducti o n processi n g of the no i s e date is also carried out using the PCA m ethod . A fter su mm arizi n g so m e spec ific steps of d i m ensi o n reduction , the relati o n bet w een the m echan ica l no ise sources and the princi p al co m ponents (PC s) in different sensors is analyzed . R esults show that it is reasonable to se lect t h ese m echan ica l no ises , w hich accu m u lated contri b uti o n ratios are larger than 0. 85, as a standar d for deter m i n ation o f the number o f princ i p al co m ponen ts .
K ey words :v i b rati o n and w ave ; PCA; m echanical no ise ; reg ression analyze ; relati v ity ana l y sis ; d i m ensi o n reducti o n
双层圆柱壳体的水下噪声主要来自三个方面:
[1]
机械噪声、螺旋桨噪声和水动力噪声。这三种噪声源中, 机械设备产生的噪声是双层圆柱壳体低速巡航时最主要的噪声
[2]
降维两大类。常用的线性降维方法 主成分
分析法(PCA), 具有概念简单, 计算方便, 以及最优线性重构误差等优良的特性, 成为实际数据处理中应用最为广泛的线性降维方法之一。在充分分析双层圆柱壳体机械噪声数据特点的基础上, 研究使用PC A 方法对噪声数据进行降维。并根据不同工况、不同通道下的噪声数据降维结果对噪声数据特点进行分析。
[3]
。
由于噪声源复杂, 分析处理过程计算量大, 难以取得理想效果。因此可以通过数理统计中成熟的降维方法去除这些冗余信息, 从而降低数据分析处理的难度, 提高数据分析处理的准确度。
现有的数据降维方法分为线性降维和非线性
收稿日期:2009-06-20; 修改日期:
2009-07-08
1 PCA 方法
PCA 方法是在各个变量之间相关关系研究的基础上, 用一组较少的、互不相关的新变量(即主元) 代替原来较多的变量, 而且使这些新变量尽可能多地保留原来复杂变量所反映信息的一种基于
基金项目:国家自然科学基金(50775218)
作者简介:梁胜杰(1981-), 男, 山东鄄城人, 博士研究生, 目前从事
武器系统总体技术、高维数据处理研究。E -m ai :l
lsj 0155@s i na . co m
基于PCA 方法的机械噪声数据处理
二阶统计的数据分析方法
[4]
119
。PC A 方法已广泛应
[5-8]
其中, var (x i (n)) 、var (xj (n) ) 分别是x i (n) 、x j (n) 的方差, cov (xi (n), x j (n) ) 是x i (n) 、x j (n) 的协方差。2. 2 线性回归法
当不能确定特征指标之间存在相关性或相关性不明显时, 可先假定它们之间具有某种不确定的相关性, 再使用回归分析
[10]
用于特征提取、数据压缩、图像编码、模拟识别、综合评价以及故障检测等诸多领域。
设x 是具有d 维(列) 向量元素的随机向量。x (1), x (2), , x (n ) 是随机向量x 的n 个样本。使用PCA 方法降维后可以得到另一个具有m 维的不相关向量y, m d 。
具体步骤如下:
1) 对原始数据x 进行标准化处理
x =
1n -1)
。将每个特征指标看做
是一个随机变量, 通过使用回归分析的方法研究特征指标之间的相关性。
将一特征指标看做因变量y , 将其它特征指标
2
看做自变量x 1, x 2, , x p , p 是自变量特征指标的个数。建立y 与x 1, x 2, , x p 之间的线性回归模型
(1)
T
[6]
n
(x i -x )
i=1
:
x = x i
n i=1
y = 0+ 1x 1+ 2x 2+ + p x p + 其中, 0, 1, 2, , p 是待估计参数, 是服从正态分布的随机变量。
求得线性回归模型之后, 必须进行显著性检验(F检验法), 以验证回归模型是否合适、自变量与因变量之间是否存在线性关系。
给定显著性水平 , 使用F 检验法进行显著性
2) 计算x 的协方差矩阵C x =E {xx };
3) 计算矩阵C x 的特征值 1, 2, , d ( 1 2
, e d ; d ), 及特征向量e 1, e 2,
4) 根据累积贡献率
=
m
i
(2)
i
[4]
i=1
d i=1
检验的步骤如下:
1) 计算离差平方和
确定m 取值( 常取0. 7至0. 9之间) 。设y k 是
T
k
U =Q =
(y ^ -y ) ,
2
i=1n
i
n
x 的第k 个主元(k=1, 2, , m ), 则y k =e x 就是经过降维后得到的m 个互不相关的主成分, 其中x =(x 1, x 2, , x d ) 。
m 取值越小, 降维后的数据就越容易分析处理, 损失掉的信息也越多; m 取值越大, 损失掉的信息就越少。当m =d 时, 无信息损失, 失去了降维的目的。因此工程上, 常取 在0. 85以上以满足PCA 的分析要求
[9]
T
i=1
(y i -y ^ i )
2
(4)
2) 假设:H 0: 0= 1= = 。在假设H 0p =0成立时, 统计量F =p -1) 的F 分布;
3) 判断:根据自由度(p, n -p -1) 、显著性水平 查F 分布表, 得到临界值F , 若F >F , 则否定原假设H 0, 认为y 与x 1, x 2, , x p 之间存在线性相关关系, 且F 值越大说明相关性越强, F 值越小相关性越弱; 若F F , 则接受原假设H 0, 认为y 与
x 1, x 2, , x p 之间不存在线性相关关系。
(p, n -pQ
。
2 相关性分析方法
分析处理前, 应先判别数据是否适合降维处理。因此可先根据统计学中的相关性知识来判别数据之间的联系程度。2. 1 相关函数法
将每一特征指标看做关于n 的时间序列值, 则第i 个特征指标表示为:x i (n ), 这里n =200。利用第i 个特征指标与第j 个特征指标之间的相关函数, 可判断两者相关性的强弱。
相关函数为
(xi (n), x j (n ) ) =ij =
cov (x i (n ), x j (n) ) i var (xj (n ) )
(3)
3 数据计算
3. 1 实验设计
在实验室内使用三台设备(海水泵、电机、激振器) 模拟双层圆柱壳体的噪声源。在单开一个噪声源或者同开几个噪声源的情况下进行实验, 并变换各噪声源的条件, 如泵可分为半开和全开、激振器
可改变不同的频率等等。每一个不同的条件设置称为是一种工况。通过改变工况可收集双层圆柱壳体在不同条件下的机械噪声数据。实验工况如表1所示:
2010年6月
表1 工况设置
噪 声 与 振 动 控 制第3期
可得到4 200的数据值。其中, 4是维数, 200是样本量。3. 2 相关性分析
激振器 360H z 360H z 360H z
Tab . 1Se tti ng of w orking -m ode
工况设置
工况名称工况1工况2工况3工况4工况5工况6
泵半开 半开 半开
电机 开 开开开
对工况1、工况2、工况3的数据进行降维研究(其它工况和通道下的降维分析过程一样) 。
1) 利用相关函数法对特征指标进行相关性分析。根据2. 1节计算方法可得到三种工况在不同通道上各特征指标之间的相关函数值, 表2只列举了第一、五、十六通道上的相关函数值。
从表2可以看出在三种工况、三个通道上, 峰值因数与脉冲因数的相关函数都大于0. 99。
经过计算所有工况在所有通道下的峰值因数与脉冲因数的相关函数都大于0. 99, 这充分表明两特征指标之间具有强相关性。
因此, 在进一步分析处理时, 可将特性相近的峰值因数和脉冲因数两特征指标去掉一个以简化原噪声数据。
2) 利用回归分析法对相关函数法无法确定强相关性的特征指标进行进一步的相关性分析。将三种工况下的波形因数看作因变量y , 将其它特征指标看作自变量(本文选择峰值因数为x 1和振动加速度总级为x . 2节方法可得到三种工况2) 。由2在不同通道下的F 检验值, 如表3所示。
在双层圆柱壳体的不同位置布置19个加速度传感器(每个传感器称为一通道), 采样时间8s , 采样频率2048H z 。
由于在一个通道下的采样点较多, 因此对样本点进行预处理:
1) 选定信号处理中常用的四个特征指标:波形因数, 峰值因数, 脉冲因数, 振动加速度总级;
2) 以2048个相邻样本点为一样本段, 并以70个样本点为步长, 将样本段平移, 则可在16384个
样本点内得到约205个样本段;
3) 取前200个样本段, 在每个样本段内计算选定的四个特征指标。
表2 工况1、工况2、工况3在第一、五、十六通道上各特征指标之间的相关函数值
Tab . 2Corre l ative func ti on date of character variab l e a m ong th e 1st 、5th and 16th of th e 1-mod e 、2-m ode 、3-m ode
工况1
波形因数
第1通道第5通道第 通道
波形因数峰值因数脉冲因数振动加速度波形因数峰值因数脉冲因数振动加速度波形因数峰值因数脉冲因数振动加速度
1-0. 12-0. 060. 301100. 071-0. 3710. 1710. 218
峰值因数10. 998010. 9970. 2950. 17110. 999
脉冲因数0. 99810. 0710. 99710. 2670. 2180. 9991
振动加速度0. 301
波形因数1
工况2峰值因数10. 9970. 2190. 20810. 9980. 58110. 997
脉冲因数0. 99710. 1650. 2660. 99810. 640. 9971
振动加速度0. 2190. 1651-0. 03-0. 35-0. 351-0. 02-0. 25-0. 241
波形因数10. 8450. 8980. 65810. 5220. 60610. 4310. 503
工况3峰值因数0. 84510. 9940. 6260. 52210. 9950. 43110. 997
脉冲因数0. 8980. 99410. 6420. 6060. 99510. 5030. 9971
振动加速度0. 6580. 6260. 6421-0. 42-0. 49-0. 511-0. 21-0. 55-0. 541
-0. 12-0. 06-0. 62-0. 56-0. 73
-0. 24-0. 62-0. 22-0. 561-0. 370. 2950. 2671-0. 04-0. 24-0. 241
-0. 7310. 2080. 26610. 5810. 64
-0. 24-0. 22
-0. 03-0. 35-0. 35-0. 42-0. 49-0. 51
-0. 04-0. 24-0. 24-0. 02-0. 25-0. 24-0. 21-0. 55-0. 54
给定显著性水平 =0. 05, 在自由度为(2, 197) 时, 查表知F 。可知波形因数与峰值因数、振动加速度总级在工况1的第十六通道下、工况2的第十一通道下不具有相关性, 其余情况下均具有线性相关性, 且大部分F 检验值都较大(大于10), 即具有
强相关性。因此可使用PCA 方法对特征指标进行降维。
4 降维分析
对噪声数据进行降维处理, 并通过对比单噪声
基于PCA 方法的机械噪声数据处理
源(如只开泵) 与多噪声源(如泵与电机同时开) 条件下降维结果的变化情况, 对机械噪声数据进行初步分析。
表3 工况1、工况2、工况3在不同通道下的F 检验值
T ab . 3F -test date i n d ifferen t sen sors
of th e 1-m od e 、2-mode 、3-m ode
编号第1通道第2通道第3通道第4通道第5通道第6通道第7通道第8通道第9通道第10通道第11通道第12通道第13通道第14通道第15通道第16通道第17通道第18通道第19通道注:表3中带
*
**
121
征近似, 可以用较少的主元表示原数据的特点。通过计算其它工况也符合此结论。
表4 工况1、工况2、工况3在不同通道下的主元数目
Tab . 4PC s i n d ifferent sen s ors of th e
1-m ode 、2-mod e 、3-m ode
编号
工况13*223*23*22223*22223*222
工况22222
*
3
工况322222223*222222223*23*
工况110. 1*37. 649. 79. 26*17. 59. 68*24. 584. 139. 646. 14. 08*35. 923. 977. 476. 32. 97**
16560. 49. 21
工况229443. 823140. 7
*
4. 7
工况328254. 551. 654. 143. 934. 124. 519. 811039. 633. 929. 766. 528112122. 622. 2*43. 13. 28**
*
第1通道第2通道第3通道第4通道第5通道第6通道第7通道第8通道第9通道第10通道第11通道第12通道第13通道第14通道第15通道第16通道第17通道第18通道第19通道
22222
*
3
39. 137. 179. 63321202. 69**52. [1**********]4. 45. 01*94. 4233
22222
*
3
22
比较表3与表4中带*数据的对应关系可知, 在使用PC A 方法之前进行相关性分析可充分验证降维的合理性。同时, 通过相关性分析得出的对应关系也证明了把 0. 85作为双层圆柱壳体机械噪声数据降维时选择主元数目的标准是合适的。
根据工况1、工况2、工况3在不同通道上的降维结果, 可分析单一噪声源条件下的噪声传播特点。由于同一工况条件下在十九条不同通道上的主元数目不同, 如对于工况1, 在第1、4、6、11、16通道上可降到三维, 在其余通道上可降到二维, 这表明噪声源在双层圆柱壳体不同的传播区域(不同通道处) 传播机理是不相同的。4. 2 多噪声源
与3. 2节的计算方法相同, 以累积贡献率大于0. 85作为选择主元数目的标准, 利用M atlab 编程实现PC A 方法的降维。计算得到工况4、工况5、工况6三种工况在不同通道下的主元数目, 如表5所示:
数据表示F 检验值小于临界值; 带数
据与表4中带数据相对应, 表示具有较小的F 检验值
4. 1 单噪声源
将4 200双层圆柱壳体机械噪声数据经过标准化处理之后, 利用M atlab 编程实现PCA 方法的降维。以累积贡献率大于0. 85作为选择主元数目的标准, 可计算工况1、工况2、工况3三种工况在不同通道下的主元数目(即降维的目的维数), 如表4所示。
由表4, 依据累积贡献率大于0. 85的标准, 使用PCA 方法可将四维数据大部分降低到二维。对应于只能降低到三维的情况其F 检验值也较小(基本上都小于10) 。说明具有弱相关性或不相关的特征指标各自都代表着不同的数据特征, 因此使用PCA 降维后需要保留较多的主元以表示原数据的特点; 而具有强相关的特征指标之间包含的数据特
2010年6月噪 声 与 振 动 控 制第3期
表5 工况4、工况5、工况6在不同通道下的主元数目
Tab . 5PC s i n d ifferen t sen sors of the 4-m ode 、5-mode 、6-m ode
编号第1通道第2通道第3通道第4通道第5通道第6通道第7通道第8通道第9通道第10通道第11通道第12通道第13通道第14通道第15通道第16通道第17通道第18通道第19通道
工况[***********]22
工况[***********]22
工况[***********]33
元数目减少, 通道2、11、12上的主元数目增加, 其余通道上的主元数目不变。对比工况4和6:在泵(半开) 和电机两种噪声源的基础上加入激振器(360H z) 噪声, 通道10、14上的主元数目减少, 通道15、16、18、19上的主元数目增加, 其余通道上的主元数目不变。
5 结 语
通过相关性分析, 说明了双层圆柱壳体机械噪声数据使用线性降维方法 PC A 方法进行降维处理是可行性的。回归分析的F 显著性检验结果
验证了依据累积贡献率大于0. 85的标准选择双层圆柱壳体机械噪声数据主元数目的合理性。使用PCA 方法可将经过初步处理的机械噪声数据由四维降低到三至二维, 对于特征指标之间的F 检验值较大的情况一般可降至二维。对在单噪声源和多噪声源条件下降维结果的分析, 发现双层圆柱壳体机械噪声在不同传播区域具有不同传播机理。依据总结出的主元在不同噪声条件和通道条件下的变化情况, 可为研究不同噪声源在不同区域的传播机理提供丰富的先验信息。参考文献:
[1]施 引, 朱石坚, 何 琳. 舰船动力机械噪声及其控制[M ].北京:国防工业出版社, 1990.
[2]姚耀中, 林 立. 潜艇机械噪声控制技术综述[J].舰
船科学技术, 2007, 29(1):21-26.
[3]吴玲达, 贺 玲, 蔡益朝. 高维索引机制中的降维方法
综述[J].计算机应用研究, 2006, 12:4-7. [4]Jolliffe , I . T. Pr i nc i pal Component A na l y si s (Second Ed-i ti on) [M].N ew Y ork , Spr i nge r , 2002.
[5]李 成, 孔 旭, 程福臻. 主成分分析法在天体物理中
的应用[J].天文学进展, 2001, 19(1):9-16. [6]Jiang H u i yua , W ang W anx ian . A ppli cation o f P r i ncipa l Co m ponent A nalysis i n Synthe tic A ppra isa l for M u lt-i ob -jects D ec i s i on -m ak i ng[J].Journal ofW uhan Un ivers-i
ty of Technol ogy (T ransportation Science &Eng i neer -i ng), 2004, 28(3):467-470. [7]R uan Q i ng , W ang Y -i qi ang. PCA A pproach t o BP L earn i ng [J].Journa l of Fudan Un i versity (N at ura l Sc ience),
2005, 44(2):318-322.
[8]杨 帆, 胡金海, 陈 卫, 张 进, 蔡开龙. 主元分析方
法在航空发动机故障检测与诊断中的应用[J].机械科学与技术, 2008, 27(3):330-333. [9]李 元, 谢植, 王 钢. 基于故障重构的PC A 模型主元数的确定[J].东北大学学报(自然科学版), 2004, 25(1):20-23.
[10] 现代应用数学手册 编委会. 现代应用数学手册:概
率统计与随机过程卷[M].北京:清华大学版社, 1999.
对比表4、表5中数据:在泵(半开) 噪声源基础上加开电机噪声源时(从工况1到工况4), 通道1、4、16上的主元数目减少, 通道10、14上的主元数目增加, 其余通道上的主元数目不变。由此可知, 在通道1、4、16上, 电机噪声与泵(全开) 噪声部分相消, 导致混合噪声特征减少, 降维后只需用较少的主元就可以代表混合噪声数据的特点; 在通道10、14上, 随着电机噪声的加入改变了原有噪声的特性, 即加入的噪声与原噪声非线性叠加, 增加了混合噪声数据的特点, 导致降维后需要保留较多的主元数目表示原始噪声数据的特点; 在其余没有发生主元数目变化的通道上, 电机噪声与泵(全开) 噪声在该区域的传播特性相近或相同的, 即两种噪声源数据线性叠加在一起, 从而使得混合噪声数据特点没有增加。
对比工况2和工况4:在电机噪声基础上加入泵(半开) 噪声, 通道5、11、17上的主元数目减少, 通道6、10、14上的主元数目增加, 其余通道上的主元数目不变。对比工况5和工况3:在激振器(360H z) 噪声基础上加入电机噪声, 通道19上的主