环境污染研究的对应分析方法及应用
第7卷 第5期 大 连 民 族 学 院 学 报 V ol.7 No.5 2005年9月 JOURNAL OF DALIAN NATIONALITIES UNIVERSITY Sept. 2005
环境污染研究的对应分析方法及应用
申明金1 胡永金2
(1. 川北医学院 化学教研室,四川 南充 637000;2. 川西磷化总公司,四川 什邡 618400) 摘 要:介绍了气体污染分析的对应分析方法,针对川西磷化总公司周边地区的大气污染数据,以该方法就污染的具体情况进行分析研究. 实证分析结果表明,对应分析能揭示出取样点和变量之间的内在联系,是一种有优势的分析方法. 关键词:环境污染;对应分析;因子载荷
中图分类号:O212 文献标识码:A 文章编号:1009-315X (2005)05-0030-03
对环境污染进行分析的数学方法主要有:模糊数学、主成分分析和因子分析等[1]. 这些方法在污染分析研究上一般侧重于对污染取样点的评价:或是就样点污染程度进行评价、分级;或是就样点污染相似性进行分类研究. 而实际上,样点污染程度和相似性决定于污染指标变量,这些变量之间又具有不同程度的相关性,这种相关性又体现在对样点的观测值上,即样点和指标是不可分离的. 应用对应分析能够把取样点和环境变量同时反应到相同的因子轴上,有助于对污染地区进行分类和成因解释. 本文以此方法对什邡川西磷化总公司周边大气分析数据进行实证分析,结果满意.
行和x i . =
1.2 对应分析中的数据变换方法及计算、分析步骤[7]
对应分析的关键所在是使R 型和Q 型分析中的变量和样点的载荷反映在相同的公因子轴上,这便要求从R 型分析的相关系数阵与从Q 型分析的相似阵出发,导出的非零特征根应相同,其详细的计算步骤如下:
(1)将对应分析原始数据阵X 进行变换 假定有n 个样品,每个样品有m 个变量,其原始数据阵为X nxm ,为使变换后的数据阵对变量和样品具有对称性,可先按行、列求和,再求出总和.
1 环境污染的对应分析方法
1.1 对应分析方法简介
对应分析是在因子分析[2-4]基础上发展得来的一种多元统计分析方法,1970年由Beozecri 首先提出. 该方法综合了R 型(对指标变量的)因子分析和Q 型(对样点的)因子分析的优点,并将二者统一起来,使得对指标变量的分析结果很容易得出对样点的分析结果,更重要的是它可把变量和样点的载荷反映在相同的公因子轴上,以达到把变量和样点联系起来加以分析、解释和推断的目的. 目前,该方法已较成功地应用于气象学领域[5]和水质评价[6],取得了很好的效果.
收稿日期:2005 - 04 - 14.
∑x
j =1
m
ij
(i=1,2,…,n);
列和x . j =
∑x
i =1n
m
n
ij
(j=1,2,…,m);
总和T=
∑∑x
i =1j =1
ij
.
令z ij =(x ij - x i. x.j / T )/x i . x . j ,
则Z=(z ij )为变换后的数据矩阵. 此新数据矩阵对变量和样品具有对称性.
(2)计算变量的“协方差阵”R
作者简介:申明金(1971-),男,四川南充人,川北医学院化学教研室讲师. 研究方向:化学计量学研究.
第5期 申明金,胡永金:环境污染研究的对应分析方法及应用 31
n
R=Z ′Z=(r ij ),其中r ij =
∑z ti z tj
(j,i=1,2,…,m)
t =1
(3)从R 阵出发进行R-型因子分析 首先用Jacobi 方法求R 的特征值:λ1≥λ2≥…≥λm ≥0及相应的特征向量u 1,u 2,…,um ,然后由临界概率确定主因子的个数k ,再计算R 型因子载荷阵F=(f ij ),其中f ij =uij λj (i=1,2,…,m; j=1,2,…,k),并在两两因子轴平面上作指标变量的点图.
(4)从Q=ZZ ′出发进行Q 型因子分析 由线性代数可知,Z ′Z 与Z Z ′具有相同的非零特征值,即Q 与R 的非零特征值相同,故λ
1≥λ2≥…≥λm ≥0也是Q 的特征值,又因u i
(i=1,2,…,m)是R 的特征向量,故V i =Zuii (i=1,2,…,m)是Q 的特征向量,从而Q 型因子载荷阵为G=(g ij )
,其中g ij =vij λj (i=1,2,…, m; j=1,2,…,k),并在与R-型因子分析相应的两两因子轴平面上作样点的点图.
(5)根据以上所作污染指标变量和样点的主因子平面点聚图,对污染状况进行综合评价、解释和推断.
2 实证分析
什邡川西磷化总公司是一家生产磷酸盐产品、硫酸和农药的化工厂,其周边厂矿较多. 为了解周边地区的污染情况和污染原因,我们对该厂周边8个取样点的大气污染数据(见表1)进行对应分析.
表1 对应分析资料阵 mg / m3
取样
二氧
环氧氯
氯
硫化氢
碳4
环已烷
点
化硫 丙烷 1 0.056 0.084 0.031 0.038 0.00810.0222 0.049 0.055 0.100 0.110 0.02200.00733 0.038 0.130 0.079 0.170 0.05800.0434 0.034 0.095 0.058 0.160 0.2000.0295 0.084 0.066 0.029 0.320 0.0120.0416 0.064 0.072 0.100 0.210 0.0281.3807 0.048 0.089 0.062 0.260 0.0380.0368 0.069 0.087 0.027 0.050 0.089
0.021
将上述数据输入用VB 语言所编程序进行计
算,由于R-型因子分析结果中第一特征值和第二特征值累计贡献已超过85%,故取2个主因子,其计算结果见表2、表3.
表2 R-型因子分析计算结果
变量 特征值贡献 第一主因子 第二主因子特征值
序号
比例/%
载荷
载荷
1 0.5067 0.6999 -0.1383 -0.0438 2 0.1221 0.1687 -0.2033 0.0265 3 0.0566 0.0782 -0.1100 -0.0199 4 0.0290 0.0401 -0.2175 -0.1869 5 0.00945 0.0130 -0.2172 0.2883 6 2.32e-10 3.22e-10 0.5828 0.0328
表3 Q-型因子分析计算结果
样品第一主 第二主 样品
第一主
第二主
序号
因子载荷
因子载荷
序号
因子载荷 因子载荷
1 -0.1060 5 -0.1585 -0.19312 -0.1537 6 0.5615 0.01903 -0.1628 -0.00928
7 -0.1666 -0.1066
8 -0.1643 0.1364
取第一主因子的载荷为横坐标,第二主因子载荷为纵坐标,将8个取样点和6个变量点的第一、二主因子载荷在同一因子平面上点图(如图1所示).
图1 主因子载荷平面点聚图
3 结果与讨论
由图1可知,从6个变量来看,距离较近的变量1、2、3、4之间相互关联程度较为密切,而
32 大 连 民 族 学 院 学 报 第7卷
变量5和变量6是相对独立的两个变量,它们中的任一变量与其他所有变量相关性较差. 全部变量(污染气体)和取样点可分为三类,每一类聚合了一部分变量和样品,如第I 类包含第1,2,3,5,7五个取样点及第1,2,3,4四种污染气体. 这表明这五个取样点属同一类污染地区,该地区被污染的主要污染气体是氯、硫化氢、二氧化硫和碳4这四种. 第II 类地区包含第4,8二个取样点,该地区被污染的主要污染气体是环氧氯丙烷;第III 类地区只有第6号取样点,主要污染气体是环己烷.
参考文献:
4 结束语
对应分析由R-型因子分析的结果可以很容易地得到Q-型因子分析的结果,这不仅克服了在样本量大时作Q-型因子分析所带来的计算困难,而且把R-型和Q-型因子分析统一起来了,将取样点和环境变量同时反映到相同的因子轴上,从而揭示了所研究的取样点和变量间的内在联系,也便于对环境污染的成因进行解释和推断,是一种极具优势的环境污染研究方法.
[1] 李惠明,尚广平. 水质现状评价数学模型综合研究[J]. 中国环境数学,1991,11(5):356-360. [2] 孙文爽,陈兰祥. 多元统计分析[M]. 北京:高等教育出版社,1994. [3] 刘树深,易忠胜. 基础化学计量学[M]. 北京:科学出版社,1999. [4] 许 禄,邵学广. 化学计量学方法[M]. 北京:科学出版社,2004.
[5] 史久恩. 概率统计在气象学中的应用和问题[J]. 应用概率统计,1991,(4):26-37.
[6] 王晓鹏. 水质评价的对应分析方法及在湟水流域的应用[J]. 青海师范大学学报(自然科学版),2001,(1):66-70. [7] 张 焱. 生物多元统计分析[M]. 重庆:西南师范大学出版社,1999.
Correspondence Analysis Method and Application of Environment Pollution Study
SHEN Ming-jin1 HU Yong-jin 2
(1. Department of Chemistry, North Sichuan Medical College, Nanchong Sichuan 637000, China;
2. West Sichuan Phosphorus Chemistry Company, Shifang Sichuan 618400, China)
Abstract: In this paper, the method of environment pollution study based on correspondence analysis is presented. With the method, the author makes comprehensive research of the polluting status according to the gas data near West Sichuan Phosphorus Chemistry Company. The practical analysis indicated that it can reveal the inner link between sample point and variable. It is an effective and superior method.
Key words: environment pollution; correspondence analysis; load score of factor
(责任编辑 邹永红)