交通事故损失的时间序列分析
第17卷第7期中国
2007年7月China 安全
Safety 科学Science 学报Vol. 17No. 7
Journal Jul. 2007
交通事故损失的时间序列分析
教授 邵 辉 王 钰 李保安 张蓉爱(江苏工业学院环境与安全工程系, )
学科分类与代码:620. 2030 中图分类号:. 03A
3
【摘 要】 , 建立了AR I M A
模型, 对1985—2005。根据原始数据的特点, 选, 得到2006—2008年的交通事故损失9, 7和3. 0129亿元, 置信区间为95%。通过对1985—2005年交通事, 预测结果接近原始数据, 该方法为交通事故的预防和控制提供了技术指导和有益参考。【关键词】 交通事故; 损失; 时间序列分析; AR I M A (差分自回归滑动平均) 模型;
统计分析系统(S AS )
Ti m e Series Analysis of Traffic Accident Loss
, Prof . SHAO Hu i W ANG Y u L I Bao 2an ZHANG Rong 2a i
(Depart m ent of Envir on mental &Safety Engineering, Jiangsu Polytechnic University, Changzhou 213164, China )
Abstract: I n order t o reveal the changing rule of traffic accident econom ic l oss, a AR I M A model is set up by use of ti m e series method, with this model, an analysis and forecast of econom ic l oss caused by traf 2fic accidents is made based on these data fr om 1985t o 2005. According t o the characteristics of the origi 2nal data, the rando m ti m e series analysis is chosen t o be the analysis method . Thr ough model identificati on and para meters selecti on, the econom ic l oss caused by traffic accidents in 2006-2008is f orecasted t o be 295590000Yuan, 297070000Yuan and 301290000Yuan res pectively, and the confidence level is 95%.Then again, this model is res pectively used t o forecast the l oss in 1985t o 2005, it shows that the f orecasting results are cl ose t o the original data . This illustrates that the model is very hel pful t o the fore 2cast and p reventi on of traffic accidents . Key words: traffic accident; AR I M A (aut oregressive 2integrated 2moving average ) model;
ti m e series analysis; l oss; S AS (statistics analysis syste m )
0 引 言
交通事故的预防与控制是城市公共安全的重点之一, 道路交通安全问题也引起社会的广泛关注。交通事故不仅造成人员伤亡或物质的损失, 也阻碍了社会经济的发展, 影响到社会的稳定。掌握和预测交通事故损失情况, 不仅对政府, 对有关科学研
究的人员都是一个极具现实意义的课题
[1]
。
目前, 对交通事故损失的情况研究, 大多局限于对事故发生次数、死亡人数和事故损失等数据的简单统计分析, 缺乏对事故发展变化和趋势的把握。近年来, 进行交通事故损失的预测研究的方法主要有:BP 神经网络法、混沌神经网络法和自适应神经网络法等
[2—4]
。上述方法以神经网络为理论依托,
3文章编号:1003-3033(2007) 07-0010-04; 收稿日期:2007-03-23; 修稿日期:2007-06-30
第7期 邵辉等:交通事故损失的时间序列分析
・11・
虽然能够准确预测事故损失的趋势, 却由于其分析方法的复杂性, 不便于进行广泛的应用。
笔者选取应用方便的AR I M A (aut oregressive 2in 2tegrated 2moving average, 差分自回归滑动平均) 模型, 对事故发生的未来趋势进行预测, 从而为交通事故的预防工作提供一定的技术指导。
AR I M A 模型具有一套完整、规范、结构化的建模方法, 近年来AR I M A 模型一直是描述平稳随机序列的最常用方法, 应用于股价指数研究、电力负荷的建模及预报等领域的数据处理与预测。线形的时间序列(Analysis System ) AR I M A 模型, 根据近20了S AS 程序, 建立了交通事故损失时间序列预测模型, 并进行了预测分析。
一类有限参数的线形时间序列模型, 可有效地描述各种时间序列。简单的说, AR I M A 模型是指序列Z t 的d 阶差分具有AR I M A (p, q ) 模型, 记作AR I M A (p, d, q ) , 用后移算子B 表述。
Z t 的d 阶差分为
Δd Z t =(1-B ) d Z t
(1)
如果Z t 的d W t ) 满足AR I M A (p, , ) MA (q ) 模型的方p 个滞后值的自回归:
(2) W t =
MA (q ) 模型为最近期q 个随机干扰的线性
组合:
αt -p W t =μ+αt -θ1αt -1-…-θp
(3)
将式(2) 、式(3) 用平稳自回归多项式
可逆滑动平均多项式Q p (B ) 进行整理, AR I M A 模型的最终形式如下:
d
θ
(4)
1 时间序列的基本原理
111 Box Jenkins 法
20世纪70年代, G . P . Box 和G . M. Jenkins 发表
分析AR I M A 模型的步骤流程图如图1所示
。
了专著《时间序列分析:预测和控制》, 对平稳时间
序列数据, 提出了自回归滑动平均模型, 以及一整套的建模、估计、检验和控制方法, 使时间序列分析广
[5]
泛的运用成为可能。
拟合一个时间序列时, 先通过差分法或适当的变换使非平稳序列转化为平稳序列, 再考虑参数化和记忆特征的有效性。用这种参数方法拟合序列为某种特定的结构, 只需少量的参数, 使参数的有效估计成为可能, 相对于一个序列的过去值可用传统的Box 和Jenkins 方法建模。
图1 AR I M A 模型的分析流程图
2 模型分析
211 原始数据
1985—2005年全国交通事故损失的数据如表1
所示, 表1对应的原始时间序列如图2所示。
表1 1985—2005年交通事故发生情况表年份
[***********][***********][**************]8
事故次数(次) 死亡人数(人) 直接损失(亿元)
[1**********]2. [**************]. [**************]. [**************]. [**************]. [**************]. [**************]. [**************]. [**************]3. [**************]5. [**************]7. [**************]8. [**************]9. 295
根据所建立的时间序列模型不同, 时间序列预
测方法有两类:直观的确定型时间序列分析方法和随机时间序列分析方法。随机时间序列分析方法, 是指随机变量按时间顺序排列形成的序列, 由于时间序列的不可重复性, 只能利用相关分析寻找科学的估计, 通常的处理方法是Box Jenkins 方法。根据交通事故时间序列的数据特点, 可采用随机时间序
[6—8]
列分析方法对数据进行分析处理。112 AR I M A 模型
许多实际的序列, 如交通事故损失序列, 由于观察个数有限, 只能建立有限阶数模型。AR I M A 模型是混合自回归和滑动平均模型。模型包括很广的
・12・
中国China 安全科学Safety Science 续表
学报第17卷
Journal 2007年
年份
[1**********]1
[**************]5
事故次数(次)
死亡人数(人) 直接损失(亿元)
[1**********]21. [**************]6. [**************]30. 879
[***********]450254
[***********]8738
33. 244
33. 69127. 70018
. 800
注:数据来源于公安部通报全国道路交通事故统计分析
3 , 对原始数据取对数处理以后,
。再对上述对数时间序列取一次差分, 得到dif 时间序列, 见图4。对数据取一次差分以后, 数据变化较为平稳, 故数据的处理基本完毕。
图2 交通事故损失的原始时间序列图
通过1985—2005年全国交通事故损失的数据可以看出, 从1985—2003年, 全国交通事故损失呈
现逐年增长的趋势。自2004年始, 交通事故的损失出现拐点, 呈现大幅度的下降的趋势。212 模型的识别
图4 一次差分序列图
由图2可以看出, 原始数据有明显的上升趋势。为了降低数据序列的不规则波动性影响, 采用交通事故损失Y 的自然对数ln Y 对数据进行处理, 使时间序列平稳化(见图3) 。
参数MA1, 1
MA2, 1AR1, 1AR2, 1
213 参数估计
使用最小二乘估计法计算的该参数估计值、标准误差和t 率, 并明确该参数在模型中的滞后数(见表2) 。
t 率
表2 t 率检验表
估计值-0. 51521
0. 118001. 000000. 14768
标准误差0. 23978
0. 341760. 049250. 32684
-2. 150. 3520. 300. 45
概率逼近0. 0464
0. 7341
lag 1415
在表2中,MA1, 1, MA2, 1, AR2, 1参数t 率比AR1, 1参数t 率要小得多。由于无法确定t 率较小的3个参数中, 哪个系数为0的假设检验不显著, 故采用试算法, 对3个参数分别取舍。
序号6
1218
试算结果表明MA1, 1系数为0的假设检验不
[9—10]
显著。在丢弃该项后, 重新对参数进行估计, 如表3所示。
表3 拟合优度统计量表
卡方统计量
24. 08
39. 3043. 95
自由度3
915
Pr >概率
0. 6260. 454-0. 071
0. 4390. 3930. 087
自相关系数0. 2710. 212
0. 2090. 120
0. 0770. 035
0. 204-0. 044-0. 096
0. 402-0. 073-0. 094
第7期 邵辉等:交通事故损失的时间序列分析
・13・
从表3可以看出, 参数估计的t 率可以保留。拟合优度统计量表中给出了残差序列的方差0. 072248和标准误差0. 26879。通过对AR I M A 模型的参数估计, 得到A I C 和S BC 表的统计量分别为7. 177668和10. 31124, 表明模型拟合较好; 白噪声残差的卡方统计量为39. 30, 其对应的概率值为
33
设。将计算得到的自回归AR 的因子(1-1B (1) ) , (1-0. 25041B 33(5) ) 和移动平均MA 的
33
(4) ) 代入AR I 一个因子(1-0. 23992B M A 模型
的估计形式[见式(4) ], 得到具体模型如下:
54
(1-B ) (1-0. 25041B ) Z t =(1-) (5)
式中:Z t =l og X; B t 。214 模型的预测
民的交通素质教育等方面, 使得交通安全形势得到
好转, 这一现象也说明交通安全的影响是十分复杂的问题。
另外, 由图5还可见, 对2006年、2007年、2008年度的预测值有微升的趋势, 这表明在未来的3年我国的汽车业将有较大的发展, 特别是私人汽车的占有量在快速增加, 、交通综合管理、, 发展中的问。, 要加强交通安全综, 才能有效地遏制交。总之, 模型的预测可为交通安全管理与控制提供技术支持和重要参考。
3 结 论
笔者利用AR I M A 模型, 对我国1985—2005年的交通事故经济损失作时间序列分析研究, 并对2006—2008年交通事故的经济损失进行预测, 得出如下的结论:
1) 由于交通事故的发生具有时变性、随机性和非线性, 所以实际的原始时间序列呈现波动的变化趋势。通过建立AR M I A 模型, 使用S AS 软件检验模型的可行性, 对原始时间数据进行分析和预测。通过计算表明AR M I A 模型能够较好地拟合交通事故损失情况, 可为交通事故的预防和控制提供技术指导。
2) 预测得到的2006年、2007年、2008年交通事故损失分别为2. 9559, 2. 9707和3. 0129亿元, 置信区间为95%。由图5可以看出AR I M A 模型得到的1995—2005年的预测值与实测值接近, 模型的选择恰当。
3) 研究对交通事故损失预测做了有益的尝试。由于交通事故的预测受到多种因素的影响, 如政策的变动、突发事件的发生、自然因素的变化等。因而决定了对交通事故损失的预测只适合做短期预测, 而不适合做长期的预测。相关因素对交通事故损失预测的影响还需作进一步的探讨。
模型确定后, 使用该模型预测今后3年交通事故的损失情况, 其预测结果如表4所示, 预测值与实际值的对比如图5所示。
表
4 未来3年交通事故损失的预测结果
数据编号22
2324
预测值2. 9559
2. 97073. 0129
标准差0. 2688
0. 38010. 4656
95%置信区间2. 42902. 22562. 1005
3. 48273. 71573. 9254
图5 预测值与实际值对比
由图5可见, 2004年、2005年的预测值稍高于
实际值, 是因为国家对2003年以来的严峻交通安全状况进行了全面的综合整治行动, 包括加快交通设施建设、提高交通综合管理水平、加强交通法治和国
参考文献
[1] 曾凡仔, 裘正定. 基于可行域解析中心的股指时间序列预测[J ].系统工程理论与实践, 2004, 24(11) :45~49
[2] 李晓娟, 丁艺, 岳小泉等. 基于BP 神经网络的道路交通事故损失预测[J ].森林工程, 2006, 22(5) :57~59[3] 谢小鱼, 唐志强, 张生. 基于混沌神经网络的交通事故损失预测[J ].山西科技, 2006(2) :97~101
[4] 成卫, 李国超, 张瑾. 基于自适应神经网络模糊系统的交通事故损失预测[J ].昆明理工大学学报(理工版) , 2004,
29(2) :126~131[5] 邓祖新. S AS 系统和数据分析[M].北京:电子工业出版社, 2002:78~81
[6] 邵辉, 施志荣, 赵庆贤. 混沌理论在事故分析及预测中的应用[J ].中国安全科学学报, 2005, 15(4) :21~24
[7] 邵辉, 施志荣, 朱其良. 季节趋势模型在气体泄漏扩散模拟预测中的应用[J ].中国安全科学学报, 2006, 16(6) :30~34[8] 王从陆, 尹长林, 李石林. 自回归模型在井水埋深预测中的应用及改进[J ].中国安全科学学报, 2005, 15(6) :20~23[9] 朱宁, 徐标等. 上证指数的时间序列预测模型[J ].桂林电子工业学院学报, 2006, 26(2) :124~128[10] 刘明芝, 孔凡清. 对全国发电量时间序列分析的经济计量建模分析[J ].价值工程, 2006, 25(4) :19~22