基于因子分析和聚类分析的江苏十三市环境保护评价研究_李旭东
DOI:10.14034/j.cnki.schj.2012.06.008
第31卷第6期2012年
12月
四川环境Vol.31,No.6December2012
SICHUANENVIRONMENT
·环境评价·
基于因子分析和聚类分析的江苏十三市
环境保护评价研究
李旭东
(江苏省科学技术情报研究所,南京210042)
摘要:本文根据工业废水排放量、工业二氧化硫排放量、工业烟尘排放量、工业废水排放达标率、工业固体废物综合利用率5个指标的统计数据,运用因子分析和聚类分析,对江苏13个市的环境保护状况进行评价,并将其分成5个不同的类别,第1类是苏州,第2类是南京,第3类包括无锡、南通、常州,第4类包括徐州、扬州、泰州、淮安、宿迁,第5类包括盐城、镇江、连云港,然后进一步对各类城市在污染强度和污染控制方面的特征进行分析。最后,分别对每类地区的环境保护提出对策建议。关
键
词:江苏;环境保护;因子分析;聚类分析
文献标识码:A
3644(2012)06-0095-06文章编号:1001-中图分类号:X821
EvaluationofEnvironmentalProtectionin13CitiesofJiangsuProvinceBasedon
FactorAnalysisandClusterAnalysis
LIXu-dong
(JiangsuInformationInstituteofScience&Technology,Nanjing210042,China)
Abstract:Inthispaper,basedonthestatisticaldataofindexesfromfiverespectsincludingindustrialwastewaterdischarges,
industrialSO2emissions,industrialdustemissions,controlratesofindustrialwastewaterdischargeandmulti-userateofindustrialsolidwastes,thestatusofenvironmentalprotectionin13citiesofJiangsuProvincewereassessedapplyingfactoranalysisandclusteranalysis.The13citieswereclassifiedintofivecategoriesasfollows:thefirstcategorywasSuzhou;thesecondcategorywasNanjing;thethirdcategoryincludedWuxi,NantongandChangzhou;thefourthcategoryincludedXuzhou,Yangzhou,Taizhou,HuaianandSuqianandthefifthcategoryincludedYancheng,ZhenjiangandLianyungang.Thenthecharacteristicsofpollutionintensityandpollutioncontrolofeverycategorywereanalyzed.Finally,correspondingsuggestionsofenvironmentalprotectionforeverycategorywereproposedrespectively.
Keywords:JiangsuProvince;environmentalprotection;factoranalysis;clusteranalysis
江苏省地处我国东部沿海经济发达地区,全省
2
土地面积10.26万km,下辖13个地级市。自1978年以来,江苏经济年均增长16%,以占全国1.06%的国土面积平均每年创造了全国1/7的工业总产值和10%的GDP,成为中国经济最发达的省份之一。然而,江苏经济发展模式总体上仍是以高投入、高消耗、高污染为代价,从污染排放强度看,中国污染排放强度是世界的2倍多,江苏是全
07-11收稿日期:2012-2008年毕业于安徽大作者简介:李旭东(1982-),男,湖南桂阳人,
学环境科学专业,硕士,助理研究员,主要从事环境保护
和科技战略研究。
国排放的6倍,而太湖地区、环太湖地区是全省的2倍,这个强度是世界的20多倍[1,2],粗放型经济增长方式使生态环境不断恶化,资源开发与生态环
。“十二五”时期是江苏由境治理的矛盾日益凸显
全面建成小康社会向基本实现现代化迈进的关键阶
段,绿色增长将成为这一时期的主要特征之一,江,“建设资源节苏省“十二五”规划纲要明确提出
约型、环境友好型社会,已成为‘十二五’发展。但13个市在经济发展程度、污染的紧迫任务”
排放强度、污染控制程度等方面均有差异,必须根据自身情况制定相应措施。本文基于2009年江苏各市的环境保护统计数据,通过因子分析和聚类分
析,找出各市在环境保护方面存在的问题及差距,有针对性地提出各市环境保护的对策建议。两类指标进行合并;然后,考虑合并后的类与其他类之间的距离,再进行合并;重复这一过程,直至将所有的样品(或指标)合并为一类1.3数据准备
[3]
1
1.1
分析方法和数据准备
因子分析
因子分析法是把一些具有错综复杂关系的变
。
量,归结为少数几个无关的新的综合因子的一种多
变量统计分析方法。其基本思想是根据相关性大小对变量进行分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,因子分析中将之称为公因子。因子分析的基本方法是,通过求得相关系数矩阵、特征值、累计贡献率等相关指标,提取核心因子作为公因子,使其具备实际含义和可解释性,并建立因子分析模型,计算各公因子的得分以及综合得分,据此
[3]
进一步进行分析、评价和排名。1.2
聚类分析
聚类分析,又称集群分析,是按“物以类聚”原则研究事物分类的一种多元统计分析方法,根据
本文旨在分析江苏各市的环境保护情况,选取5个指标:工业废水排放量、工业二氧化硫排放量、工业烟尘排放量、工业废水排放达标率、工业固体废物综合利用率,并分别命名为x1、x2、x3、x4和x5,所有原始数据(表1)均来源于《中国
[5]
城市统计年鉴2010》。
在进行因子分析和聚类分析前,必须对数据进[6]
行处理。一是正向化,因为对环境保护来说,工业废水排放量、工业二氧化硫排放量、工业烟尘排放量3个指标越小越好,而工业废水排放达标率、工业固体废物综合利用率两个指标越大越好,因此必须同趋势化,本文采用的方法是:
x'ij=-xij
(1)
二是无量纲化,5个指标具有不同的量纲和量纲单位,为了消除由此带来的不可公度性,应将各指标作无量纲处理,本文采用的方法是标准化法:
xij-xj
yij=(2)
σj
经过正向化和无量纲化的数据如表2。本文运用SPSS16.0软件进行因子分析和聚类分析。
样本的多指标、多个观察数据,定量地确定样品(或指标)之间存在的相似性或亲疏关系,据此联
[4]
结这些样品或指标归纳成大小类群。本文采用了层次聚类分析法,该方法是聚类分析中应用最为
广泛的一种方法,它的基本原理和方法是,首先将一定数量的样品(或指标)各自看成一类,根据样品(或指标)的平方欧式距离,将距离最近的
表1
Tab.1
地
区
2009年江苏13市环境保护情况数据
Thedataofenvironmentalprotectionof13citiesinJiangsuin2009
工业二氧化硫排放量(吨)/x2
[***********][***********][***********][1**********]51
工业烟尘排放量(吨)/x3
[***********][***********][***********]153789844
工业废水排放达标率(%)/x4
95.4298.6798.60100.0099.9498.8898.18100.0095.4898.3496.5397.7498.10
工业固体废物综合利用率(%)/x5
91.3798.6199.2695.4898.5998.6892.0599.8394.9397.4392.5299.7499.83
工业废水排放量(万吨)/x1
[***********][***********][***********]5006
南京市无锡市徐州市常州市苏州市南通市连云港市淮安市盐城市扬州市镇江市泰州市宿迁市
表2
Tab.2
地
区
工业废水排放量/x1-0.9299-1.28820.7174-0.9586-2.19740.22140.94650.65090.62050.60310.61320.16950.8317
经正向化和无量纲化后的数据
Datapositivechangedandnondimensionalized
工业二氧化硫排放量/x2-1.6448-0.6021-0.41620.2114-1.98780.11021.11680.50151.0641-0.32410.29540.32621.3494
工业烟尘排放量/x3-0.6311-1.4225-0.0997-0.1668-1.8853-1.20531.13910.45070.65810.89300.77530.54170.9527
工业废水排放达标率/x4-1.77120.34380.29311.20421.16570.47800.02261.2042-1.72780.1244-1.0498-0.2596-0.0275
工业固体废物综合利用率/x5
-1.72180.57650.7829-0.41710.57020.5988-1.50600.9638-0.59170.2020-1.35680.93530.9638
南京市无锡市徐州市常州市苏州市南通市连云港市淮安市盐城市扬州市镇江市泰州市宿迁市
2
2.1
结果与分析
因子分析适宜性检验
检验卡方值为0.001(<0.050),说明数据适合做
[4]
因子分析。2.1.2
累计方差贡献
采用主成分法获取初始因子,同时采用方差极大法进行因子旋转。旋转后,按照特征值大于l与主因子对应的累计贡献率大于等于85%的原则提
[7]
取主成分,最终选取了两个主因子,它们共解释了总变异的84.998%,基本上全面地反映所有信息(表3)。
2.1.1
在进行因子分析前,必须对数据进行适宜性检验,即对变量间的偏相关性进行检验,以确定样本是否适宜做因子分析。在SPSS中,可以通过KMO检验和Bartlett's球形检验来测定。实际分析中,KMO值>0.600、Bartlett's球形检验卡方值<0.050适合使用因子分析。结果显示,对表2中数据的KMO检验结果为0.659(>0.600),Bartlett's球形
表3Tab.3
初
成
分
特征值2.7231.5270.4030.2170.130
始
情
况
总方差分解
Totalvarianceanalysis
未经旋转因子提取结果
经旋转因子提取结果
特征值2.5941.656
方差累计方差贡献率(%)贡献率(%)51.87133.127
51.87184.998
累计方差方差
贡献率(%)贡献率(%)54.45330.5468.0524.3472.602
54.45384.99893.05197.398100.000
特征值2.7231.527
方差累计方差贡献率(%)贡献率(%)54.45330.546
54.45384.998
12345
2.1.3建立因子载荷矩阵
主因子与原有变量指标之间的关联程度由因子载荷值表现,因子载荷值越高,表明该因子包含指标的信息量越多。旋转后的因子载荷矩阵见表4。
x2和x33个指标由表4可知,主因子1(F1)在x1、
上的系数最为显著,可以看作是污染强度因子,对方差贡献率是51.871%;主因子2(F2)在x4和x5两个指标上的系数最为显著,可以看作是污染控制因
98
子,对方差的贡献率是33.127%。
表4
Tab.4
指
标
四川环境31卷
5),得到两个主因子对各原始变量的线性组合模型如下:
F1=0.368x1+0.372x2+0.341x3+0.008x4+0.090x5(3)F2=0.036x1+0.120x2-0.071x3+0.530x4+0.567x5(4)以两个主因子对方差的贡献程度为权数,构造综合得分模型如下:
F=0.51871F1+0.33127F2
2.1.5
(5)
因子分析结果
根据F1、F2和F,把13个市经处理后的数据代入函数进行计算,分别得到各市的污染强度得分、污染控制得分和综合得分,并对其进行排序,结果如表6。根据主因子F1的得分和排名情况可以看出,污染强度从大到小依次是苏州、南京、无锡、常州、南通、徐州、扬州、泰州、镇江、淮安、盐城、连云港、宿迁,基本上与GDP排名相当。根据主因子F2的得分和排名可以看出,污染控制情况从好到坏依次是淮安、苏州、南通、宿迁、徐州、无锡、常州、泰州、扬州、连云港、盐城、镇江、南京。根据综合因子F的得分和排名,环境保护状况从好到差依次是宿迁、淮安、泰州、连云港、徐州、扬州、南通、盐城、常州、镇江、无锡、苏州、南京。
-0.0770.060-0.2440.9060.876
旋转后因子载荷
Rotatedmatrixoffactorloading
主因子1(F1)
0.9420.9210.9100.023-0.175
主因子2(F2)
工业废水排放量/x1工业二氧化硫排放量/x2工业烟尘排放量/x3工业废水排放达标率/x4工业固体废物综合利用率/x5
2.1.4构建得分模型
表5Tab.5
指
标
因子得分矩阵
Thematrixoffactorscore
主因子1(F1)
0.3680.3720.3410.0080.090
主因子2(F2)
0.0360.120-0.0710.5300.567
工业废水排放量/x1工业二氧化硫排放量/x2工业烟尘排放量/x3工业废水排放达标率/x4工业固体废物综合利用率/x5
对主因子做回归分析计算因子得分矩阵(表
表6
Tab.6
地
区
F1
得分-1.33841-1.128470.147977-0.35892-2.13033-0.23081.016880.6761530.7815330.4250480.4693830.4505141.219449
排名[**************]61
得分-2.101040.4914570.5822060.4044190.7573350.699616-0.754691.236322-1.147920.099865-1.323220.3994760.656175
13市得分及排序
Scoresanditsrankedlistofthe13cities
F2
排名[**************]84
得分-1.39026-0.422540.269625-0.0522-0.854140.1120420.277460.7602840.0251180.253559-0.194870.3660210.849911
F
排名[**************]31
数量(万元)[***********][***********][***********][***********][***********][1**********]2
GDP
排名[**************]13
南京市无锡市徐州市常州市苏州市南通市连云港市淮安市盐城市扬州市镇江市泰州市宿迁市
2.2
聚类分析
根据表2数据对13个市进行聚类分析。为更好的分析各市情况,本文分别对污染强度、污染控
制和综合情况进行3次聚类。2.2.1污染强度情况聚类分析
根据代表污染强度的x1、x2、x33个指标对
13个市进行聚类,结果如图1所示。可以看出,按照污染强度,全省13个市可以分为3个类别。第1类:包括南京、无锡、苏州,结合表5,这3个市的污染强度排在前3位,此类可以定义为强污染类。
第2类:包括常州和南通,结合表5,此类可以定义为中污染类。
第3类:包括连云港、宿迁、盐城、淮安、镇江、泰州、扬州、徐州,结合表5,此类可以定义为低污染类
。
图1
Fig.1
污染强度聚类分析图
Clusteranalysisofpollutionintensity
2.2.2
污染控制情况聚类分析
根据代表污染控制的x4、x5两个指标对13个市进行聚类,结果如图2所示。可以看出,按照污
州、宿迁、苏州、淮安、常州,结合表5,这9个市污染控制情况较好。
第2类:包括南京、镇江、盐城、连云港,结合表5,这4个市污染控情况较差
。
染控制情况,全省13个市可以分为两大类别。
第1类:包括无锡、南通、徐州、扬州、泰
图2Fig.2
污染控制聚类分析图
Clusteranalysisofpollutioncontrol
2.2.3
综合情况聚类分析
根据5个指标对13个市进行聚类,结果如图第2类:南京,污染强度较大,但污染控制情况也较差。
第3类:包括无锡、南通、常州,这3个市的污染强度较大或中等,污染的控制情况也较好。
第4类:包括徐州、扬州、泰州、淮安、宿
3所示。可以看出,一共可以分为5类。
第1类:苏州,根据之前结果可以看出,苏州的污染强度最大,污染控制情况也较好。
迁,这5个市污染强度较小,污染控制情况也较好。第5类:包括盐城、镇江、连云港,这3个市污染强度较小,但污染控制情况却较差
。
图3
Fig.3
综合情况聚类分析图
Clusteranalysisofcomprehensivesituation
3建议
根据上述分析结果,本文同时从污染治理和经济发展入手,分别对各类城市提出建议:
(1)苏州。污染排放的强度最大,污染控制做得也较好。苏州的首要任务是降低污染强度,应加快转变发展方式,大力发展低消耗、低污染的高新技术产业和现代服务业,减少污染物排放量。
(2)南京。在环境保护方面的情况不容乐观,必须同时在减少污染排放和加强环境治理方面下功夫。南京应紧紧抓住承办青奥会的大好机遇,借助丰富的科教资源和人才资源,大力发展高新技术产业和高技术服务业,加大在环保方面的投资和建设力度,着力改善生态环境。
(3)无锡、南通、常州。无锡和常州是传统的苏南经济强市,污染排放强度比较大,治理做得也比较好;应大力提升制造业的科技含量,加快绿色技术和清洁生产的推广应用,进一步降低污染强度,提升污染治理的水平。南通的经济发展速度很快,在排放强度上逼近苏南水平,但在污染控制方面也能及时跟进;随着经济进一步发展,污染排放量势必快速上升,应在发展过程中重点选择低污染、高技术含量的产业,避免先发展后治理的老路。
(4)徐州、扬州、泰州、淮安、宿迁。这5
个市的污染强度较小,污染控制也较好,在发展过程中压力相对较小,但也应注重发展高新技术产业,不能放松污染治理力度。
(5)盐城、镇江、连云港。这3个市的污染强度较小,但污染控制却较差,随着经济的发展和污染排放的增多,如不及时加强治理,必然影响环境质量和发展水平。所以这3市的当务之急是加大环境保护力度,为随后的经济快速发展作好准备。
参考文献:
[1]郭
——以太湖流域伟.论江苏经济增长与环境协调发展—J].现代商贸工业,2009,(20):86-87.为例[
[2]孙忠英.突破制约江苏发展的环境“瓶颈”.生策略研究[J]
2011,(3):184-188.态经济,
[3]张军涛,陈
(4):36-44.
[4]韩德军,鲁静芳,张文专.基于因子分析法和聚类分析法的
.安徽农业科县域经济竞争力评价研究—以贵州省为例[J]2011,39(10):6298-6300.学,
[5]国家统计局城市社会经济调查司.中国城市统计年鉴2010
[M].北京:中国统计出版社,2011.
[6]叶宗裕.关于多指标综合评价中指标正向化和无量纲化方
.浙江统计,2003,(4):24-25.法的选择[J]
[7]徐一萍.基于因子分析和聚类分析的我国地区R&D投入水
J].科技与经济,2011,24(1):75-79.平研究[
蕾.基于因子分析和聚类分析的中国区域自主
——创新系统视角[J].工业技术经济,2011,创新能力评价—