雾霾影响因素的探究
雾霾影响因素的探究
---------以北京市雾霾天数为例
上海海洋大学 胡坤 王涛 沈雨晴 指导老师 魏云超
摘要
由于雾霾天数对政府从宏观把握空气状况,制定相应政策更具有实际意义,所以本文选择年度雾霾天数而非具体每天的天气情况为研究对象,以期为政府控制雾霾提供可行性建议。
本文从区域经济发展、地区环境、人们生活水平、城市开发状况等角度出发,寻求影响雾霾天数的关键因素。按照全面性、区别性、适宜性的原则我们选择了二氧化硫排放量、二氧化氮年日均值、汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、可吸入颗粒物年日均值、全市集中供热面积和第二产业税收收入等作为关键因素,构建了影响雾霾天数的统计指标体系。其中 NO2的年日均值与雾霾天数成负相关,
SO2 、汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、可吸入颗粒
物年日均值、全市集中供热面积和第二产业税收收入与雾霾天数成正相关 。
对指标数据进行主成分分析,按照贡献率 90%的原则,选择前两个主成分,通过进行系数分析可以看出第一主成分主要反映影响雾霾的物理因素,称之为物理因子,第二主成分更多的反映了社会发展对雾霾的作用,我们称之为社会因子。
构建上述物理因子、社会因子对雾霾天数的线性回归模型。并以北京市数据为例对模型进行了实证检验和分析,结果表明所选因素对雾霾天数的解释性强,模型设定合理。对模型进行深入分析,可知若降低雾霾天数10天,需降低SO2的排放量44.33万吨,汽车保有量减少36.59百万辆,地区生产总值减少67.70亿元,煤炭消耗量减少38.38万吨,户籍人口减少39.54万户,施工面积减少36.59万平方米,可吸入颗粒物54.76 毫克/立方米,全市集中供热面积缩减 39.15万平方米,第二产业税收收入减少 33.98亿元。这一结论对政策的制定具有很强的指导意义。
关键字:雾霾天数 ;主成分分析法 ;线性回归模型
问题重述
雾天由于湿度大,能见度差,容易造成交通阻塞和引发交通事故;而霾天的细粒子会造成气溶胶污染,粒子被人体吸收将刺激支气管,加重哮喘、鼻炎等呼吸系统病症,可见雾霾天气对人类活动有很大的危害性。从雾霾的定义来看,PM2.5、二氧化硫、氮氧化物、可吸入颗粒物等因素对雾霾形成有直接影响,但是这些因素处于较低的微观层次,不利于政府从宏观上把握和制定有效的政策,所以我们选择更为直观的雾霾天数作为研究对象。因此研究雾霾现象并通过雾霾天数找出控制的方法具有十分重要的现实意义。
问题的提出
本文利用已有的数据,建立北京市的雾霾天数预测模型。我们通过查阅大量的文献资料发现,大多数专家学者和机构主要的工作都是研究影响雾霾天气发生的因素,很少对未来的雾霾天数情况进行模拟。我们通过对雾霾天数与10种影响因素关系模型的研究,针对北京市的雾霾天数数据情况,建立一般的雾霾天数发生预测模型,并以此探讨控制或者减轻雾霾的方法。
雾霾形成的影响因素介绍
(一)物理因子
近年以来,我国中东部地区频繁出现雾霾天气,工业生产和生活燃煤、市区工程建设、机动车尾气排放、地形因素等被指为雾霾成因。通常在低层大气中,气温是随高度的增加而降低的.但某些情况下会出现逆温现象,气温会随高度的增加而升高。逆温层是指出现逆温现象的大气层。在逆温层中,较暖而轻的空气位于较冷而重的空气上面,形成一种极其稳定的空气层,笼罩在近地层的上空,严重地阻碍着空气的对流运动。对流运动受阻导致近地层空气中的各种有害气体、汽车尾气、烟尘以及水汽等,只能飘浮在逆温层下面的空气层中,无法向上向外扩散,有利于云雾的形成,导致能见度降低,甚至由于空气中的污染物不能及时向大气中扩散,造成大气污染加重,给人们生产生活及交通安全带来严重的危害。因此,常见的雾霾形成的影响因素包括有害气体、汽车尾气、烟尘以及水汽等。但是,这些因素是导致雾霾的普遍原因,不利于地区政策的有效制定,本文希望更有针对性的对地区雾霾进行控制,因此选择更具有特殊意义的社会因子作为研究的切入点。
(二)社会因子
随着经济社会的发展,人类活动日益频繁,地区汽车保有量也在逐年增加,相对应的公共交通的使用量却逐年下降,此外,伴随着城市的开发,地区的建筑面积也在逐年扩大,建筑粉尘也呈逐年递增态势,另外,至今仍有许多工厂设在市内,大量的硫化物和氮化物的排放随着工业的发展也在不断增多,加之人们的环保意识不强,在家庭装修和为汽车、冰箱喷油漆中使用的黏合物挥发出的有机物会增加大气氧化性,可以生成更多的二次颗粒物,由上述因素导致的氮氧化物、二氧化硫、可吸入颗粒物的大量排放加剧了雾霾的严重程度,使雾霾天数不断增多。这些因素具有明显的地域性,与一个地区的经济发展、人们的生活水平、城市的开发状况和地区环境密切相关,同时这些因素的
可控性也比较强,对这些因素的研究也能为政府制定控制雾霾的政策提供可行性意见。
研究对象背景介绍
根据北京市雾霾天气的持续天数和严重程度,结合已有的数据,我们选择了二氧化硫排放量、二氧化氮年日均值、汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、可吸入颗粒物年日均值、全市集中供热面积和第二产业税收收入等影响因素作为我们研究的对象,并通过主成分分析法从中筛选出最具代表性的两大主要影响因素物理因子和社会因子作为主要研究对象。
数据整理与分析
(一)数据来源
本文数据来源于北京统计局网站及北京统计年鉴(2012)。由于雾霾的记录主要从2000 年开始,所以数据选择从 2000-2012 年
表 1:雾霾影响因素指标体系
表 1(续):雾霾影响因素指标数据
数据分析
数据预处理
为了方便研究,我们将数据进一步标准化和方向化。由于各影响因素之间的量纲不同,所以先将所有的自变量和因变量进行标准化。为了方便起见,标准化后的数据仍然使用原的符号 S 、 N 、 M 、 G 、 C 、 P 、 B 、 D 、 H 、 T 。
主成分分析
我们通过对 10 个影响因素的主成分分析,可得出两个主要因子,即物理因子(PhysicalFactor,简记为 PF ),
PF1S2N3 M4G5C6P7 B8 D9 H10T 主要反映二氧化硫排放量、二氧化氮年日均值对雾霾天数的影响;社会因子(Social
Factor,简记为 SF ),
SF1S2N3M4G5C6P7 B8D9 H10T
主要反映汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、全市集中供热面积和第二产业税收收入对雾霾天数的影响。
线性回归分析
雾霾天数(简记为 Haze ),则物理因子、社会因子对雾霾天数的线性回归分析模型为:
Haze01PF2SF 。其中: N (0, 2 ) 。
问题求解
一、主成分分析法介绍
(一)主成分分析原理
主成分分析法是霍特林于 1933 年首先提出来的,其原理是利用降维的思想,把原来众多具有一定相关性(比如 p 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来 p 个指标作线性组合,作为新的综合指标。最经典的做法就是用 PF(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(PF )越大,表示 PF 包含的信息越多。因此在所有的线性组合中选取的 PF 应该是方差最大的,故称 PF 为第一主成分。如果第一主成分不足以代表原来 p 个指标的信息,再考虑选取 SF即选第二个线性组合,为了有效地反映原来信息,PF 已有的信息就不需要再出现在 SF 中,用数学语言表达就是要求 Cov(PF , SF ),则称 SF 为第二主成分,依此类推可以构造出第 三、 第四、……、第 p 个主成分。
(二)主成分分析数学模型
PFi 1iS2i N3i M +4iG + 5iC +6iP +7i B + 8iD+ 9iH + 10iT
SFi b1i S b2i N b3iM + b4iG + b5iC + b6iP + b7i B + b8i D+ b9iH+ b10i T
其中 1i , 2i , 3i ,, 10i( i =1,, m );b1i, b2i,b3i ,, b10i( i =1,,m )为自变量的协方差阵 的特征值对应的特征向量, S , N ,,T 是原始变量经过标准化处理的值。
二、雾霾影响因素指标数据的主成分分析——以北京市数据为例
对 2000-2012 年 S 、 N 、 M 、 G 、 C 、 P 、 B 、 D 、 H 、 T 数据进行主成分分析,由于各影响因素之间的量纲不同,所以先将所有的自变量和因变量进行标准化,成为无量纲变量之后进行回归计算。具体结果见表 2。
表2:主成分分析结果
表3: 第一主成分、第二主成分系数构成
从表3可知雾霾天数与汽车保有量、煤炭消耗量、户籍人口、施工面积、全市集中供热面积、第二产业税收收入这几个指标存在着极其显著的关系, 与二氧化硫排放量存在着显著关系。
三、主成分对雾霾天数进行线性回归分析
由上节计算可得第一、二主成分,即物理因子 PF 、社会因子 SF 如下,
PF= 0.33S - 0.14N +0.36M+ 0.01G+ 0.36+0.36P+0.35B+ 0.05D+ 0.36H+0.33T
SF= 0.08S+0.56N- 0.02M+ 0.55G - 0.03C- 0.06P+ 0.05B +0.57D-0.05H+0.19T
以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型, 即用第一主成分 PF 中每个指标所对应的系数乘上第一主成分 PF 所对应的贡献率再除以所提取两个主成分的两个贡献率之和, 然后加上第二主成分 SF 中每个指标所对应的系数乘上第二主成分 SF 所对应的贡献率再除以所提取两个主成分的两个贡献率之和。
用Eviews软件进行影响雾霾天数因素对雾霾天数的线性回归分析,可得结果如下: 表4:显著性检验结果
此时可得物理因子 PF 、社会因子 SF 对雾霾天数 Haze 的线性回归模型:
变系数 系数 Std. Error 统计数值 概率.
C 59.23080 1.819257 32.55769 0.00000 PF 3.003998 0.286792 10.47450 0.00000 SF 2.062117 0.74997 2.749573 0.02050
决定系数 0.918113 应变量均值 59.23077 判断系数 0.901735 S.D. dependent var 20.92508
回归 6.559424 Akaike inf 6.798857 残差平方和 430.2604 标准量 6.929230 对数可能性 -41.19257 标准条件 6.772059 统计量 56.05962 Prob(F-statistic) 0.000004 宾沃森统计 2.577531 施瓦茨标准 6.772059
注:此处的C是常数项。
Haze59.23080 3.003998PF 2.062117SF 。
由表4可知, R =0.918113,修正的可决系数为0.901735, p 值小于0.05,说明显著性很高,模型对样本的拟合度较好。将原始变量带入上述模型可得最终标准化的数据模型如下:
Haze 0.2256S 0.0002N 0.2733M 0.1477G 0.26055C 0.2529P
0.273325B 0.1826D 0.25545H 0.2943T
四、实际的分析
由上式可知, NO2 的年日均值与雾霾天数成负相关, SO2 、汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、可吸入颗粒物年日均值、全市集中供热面积和第二产业税收收入与雾霾天数成正相关。由于 NO2 与雾霾天数的相关性很弱,所以在此不予以进一步分析。在保持其他因素不变时,若降低雾霾天数10天,需降低
SO2 的排放量44.33万吨,汽车保有量减少36.59百万辆,地区生产总值减少67.70
亿元,煤炭消耗量减少38.38万吨,户籍人口减少39.54万户,施工面积减少36.59万平方米,可吸入颗粒物54.76毫克/立方米,全市集中供热面积缩减39.15万平方米,第二产业税收收入减少33.98亿元。
结论
至此,我们已完成了对影响北京市雾霾指标的模拟,线性回归方程产生的数据保留了实际数据的统计特点,并具有一定的随机性,可以作为北京市雾霾天气的有效模拟。通过预测的数据和实际数据的情况可以判断未来的年度雾霾天数,对雾霾控制方法的研究有很大的帮助。因此,雾霾天数的控制主要针对二氧化硫排放量、二氧化氮年日均值、汽车保有量、地区生产总值、煤炭消耗量、户籍人口、施工面积、可吸入颗粒物年日均值、全市集中供热面积和第二产业税收收入等正向指标。
建议
本文通过对雾霾影响因素与其出现天数的线性回归预测模型的研究,可以总结出对雾霾影响最主要的因素可以分为物理因子和社会因子,从这两个因素出发,同时参考线性回归预测的结果,我们可以得出有效控制雾霾的因素。对应两大主要因素,本文对雾霾现象的控制从两大方面提出建议:一是适当改善产业结构,减少第二产业的比重,并适当减少市区工业的比重,尽量将污染比较严重的企业迁往郊区,从而减少市区二氧化硫、二氧化氮等有害气体的排放,达到转移污染源的目的。另外,在工地施工方面,可以选择天气干燥的时间施工,从而减少粉尘在空气中的悬浮量;二是从社会方面来看,可以分散居民的居住地点,降低人口密度,从而减少每个地区的汽车保有量,分散污染源,此外还可以采取汽车单双号限行政策,减少开私家车,多使用公共交通工具,鼓励小排量汽车的使用,尽量减少大排量汽车的使用量,进而减少废气的排放,达到有效控制雾霾污染物排放的目的。对于每个公民来说,要增强自己的环保意识,使用节能空调和冰箱,在日常生活中做到节能减排,从而减少空气中的颗粒物,通过实施以上两个方面的措施,可以达到减少雾霾天数,控制雾霾的目的。
参考文献
[1] 何晓群:现代统计分析方法与应用[M].北京:中国人民大学出版社,2007.
[2] 李艳双、曾珍香、张闽:主成分分析法在多指标综合评价方法中的应用[J].河北工业大学学报,1999(1).
[3] 国家统计局编:中国统计年鉴[M].北京:中国统计出版社,2002.
[4] 洪楠:SPSS FOR Windows 统计分析教程[M].北京:电子工业出版社,2000.
[5] 彭介寿、赵金先:主成分分析法与企业综合经济效益评价[J].企业经济,2003(6).
[6] 李万彪:大气概论 [M].北京:人民出版社,2009.
[7] 吴兑:雾与霾的区别和灰霾天气预警建议 [J].北京气象,2004(4).
[8] 晓风:雾的成因及危害[J].北京气象,2010(4).