综合性实践环节总结报告(模版)
综合性实践环节 总结报告
题目:关于沪深股市的统计分析 时间:第9-10周 地点: 陕西理工学院 班级: 数应1302班
成员:马星博、李新、董凯、孙坤、张讯
题目:关于沪深股市的统计分析
1. 研究目的及意义
目的:通过对深证股市和上证股市的分别分析以及相互比较得到其各自的特点及相互的影响,从而使投资者对未来股价的趋势和风险有一个理论上的了解,从而指导投资者的投资。
意义:通过对所得数据的分析是我们能够更加熟练的掌握一些统计软件,并且对金融数据的分析步骤及分析方法有更深入的了解,从而提高自己。
2. 指标(变量)选择及数据来源
指标变量:日期、开盘价、收盘价、涨跌额、涨跌幅、成交量、成交金额、对数收益率 数据来源:统计分析实践环节分析材料—沪深股市。
3. 数据处理及分析
1、 对所有变量进行描述性分析(均值、方差、峰度、偏度、极值、带正态曲线的直方图)
结果如下:
2、 分布拟合与参数估计
由1中的带正态曲线的直方图以及峰度和偏度,我们对以上数据进行数学变换,对其变换后的数据进行正态性检验得到p-p 图,结果如下:
(1)上证股市:
估計的分配參數
对数收益率 50604
尺度 1.2606445973
11012
觀察值未加權。(对数)
常態分配 位置 -5.887399720
由图前四个能较好的模拟正态分布而后面的变量数据即便进行数学变换依然不能很好地模拟正态分布,由图可知其服从偏正态分布,其参数如参数表。 (2)深证股市:
觀察值未加權。(不做变换)
估計的分配參數
常態分配 位置
尺度
对数收益率 -.[1**********]724
.[**************]
觀察值未加權。(不做变换)
由图可知前四个变量后半部分能较好的模拟正态分布,中间两个全部能模拟正态分布,后三个属于偏正态分布,参数如参数表。
3、 价格变动趋势(做开盘、收盘、实际涨跌额、对数收益率分别对时间的散点图。
注:实际涨跌额=收盘价-开盘价 结果如下: (1)上证股市:
由图知从2000年-2014年开盘价波动较大,可大致分为两部分,前半部分为2000-2006年价格统一较低,后半部分为2006-2014年价格统一较高,其中2008年前后有巨大涨跌。
由图可知收盘价在2006-2009年股价波动较大,其余部分比较平缓。
由图知对数收益率波动平缓但有极个别偏差较大。
由图可知实际涨跌额在2008年前后波动较大,其余时间比较平缓。 (2)深证股市:
由图知从2000年-2014年开盘价波动较大,可大致分为两部分,前半部分为2000-2006年价格统一较低,后半部分为2006-2014年价格统一较高。
由图可知收盘价在2006-2009年股价波动较大,2006年之前股价较低,2009年之后股价统一偏高。
由图可知实际涨跌额在2008年前后波动较大,其余时间比较平缓。
由图知对数收益率波动平缓
综上所述可知2008年金融风暴对两个股市均有较大冲击,导致股市较大起伏波动。 4、 各个变量之间的相关性分析
(1) :上证股市 (2) :深证股市
由以上两个股市各个变量之间的相关性可知,开盘价与收盘价显著相关,涨跌额与涨跌幅显著相关,最低于最高价显著相关,成交额与成交量显著相关,收盘价(开盘价)与成交量(成交额)之间有较强相关性,其余变量间均无明显相关性。 5. 股价波动对成交量与成交额的影响。
由变量间的相关性可知部分变量间两两相关,而对数收益率又由收盘价所决定且有确定函数,为避免出现共线性问题,故对股价波动即涨跌额分别对成交量,成交额做回归,得到结果如下: (1)上证股市:
由表得到其标准化回归方程为成交量=0.543*涨跌额,即涨跌额每变动1,成交量变动0.543,而截矩项为0。此方程可解释大约54.3%的变异。
由上表可知其标准化方程与其成交量标准化方程一致,解释的变异比也相同,充分说明成交额与成交量有高度相关性,故此结果不出预料。 (2)深证股市:
由上表可知其标准化方程为成交量=0.586*涨跌额,即涨跌额每变动1,成交量变动0.586,而截矩项为0。此方程可解释大约58.6%的变异。
由上表可知其标准化方程与其成交量标准化方程一致,解释的变异比也相同,充分说明成交额与成交量有高度相关性,故此结果不出预料。 对上面两个方差作比较可知,涨跌额均对成交量由正的影响,但对深证影响略比上证影响大。 6. 对风险的评估。
根据1的描述性分析可知上证的收益率平均约为-0.[1**********]80,其标准误为0.[1**********]87,得到其95%的置信区间为[-0.[**************],0.[**************]]。同理可得深证的平均收益率为-0.[1**********]505,标准误为0.[**************],得到其95%的置信区间为[-0.[**************]48,0.[**************]48]。 7. 对开盘价,收盘价,成交量,对数收益率做未来20天的预测。
我们用时间序列中的专家建模条件对上述前三个变量分别做最优模拟,用模拟的时间序列给
出20个预测值,结果如下: (1) 上证股市:
模型描述
模型 ID V 2
V3 V4
模型_1 模型_2 模型_3 V2,V3,V4分别代表开盘价,收盘价,成交量.
通过上表预测数据可计算的对数收益率的值如下:
0.[1**********]5 0.[1**********]9 0.[1**********]4 0.[1**********]9 0.[1**********]7 -0.[1**********]6 0.[1**********]7 0.[1**********]5 0.[1**********]5 0.[1**********]3 0.[1**********]6 0.[1**********]2 0.[1**********]5 0.[1**********]0 0.[1**********]2 0.[1**********]9 -0.[1**********]1 0.[1**********]1 -0.[1**********]8 0.[1**********]1
(2)深证股市:
通过上表预测数据可计算的对数收益率的值如下:
通过上表预测数据可计算的对数收益率的值如下:
0.[1**********]6 0.[1**********]7 0.[1**********]6 -0.[1**********]6 -0.[1**********]3
0.[1**********]7 0.[1**********]7 0.[1**********]6 0.[1**********]7 0.[1**********]8
0.[1**********]0 0.[1**********]4 0.[1**********]1 0.[1**********]2 0.[1**********]6
0.[1**********]6 0.[1**********]9 0.[1**********]4 0.[1**********]2 0.[1**********]4
通过上述分析可见在接下来的20天股价会有一个略微上升的趋势,其收益率却无明显的增加。
8. 对两个股市的比较。
我们通过将两个故股市的同一变量画在一个图中来比较其股价的走势相互影响。
[键入文字] [键入文字] 键入文字]
[
通过上图的比较我们看到两个股市之间的价格波动趋向一致,即同增同减。而深证的股价一直高于上证的股价,但其趋势却相同。
4. 结论及建议.
结论:1. 通过以上的数据分析我们可以看到接下来的股价会有一个上升的趋势,投资这可以选择去购买其股票。
2. 通过收益率的方差分析可以看出虽然股价会有持续上升的趋势,但在95%的置信区间上,落到0以下区间的宽度较宽,也就意味着对数收益率可能并不像股价反映的那样持续升高。
3. 通过对两个股市的比较会发现其股价波动趋势趋于一致并且都在2008年的金融海啸前后有较大落差。
4. 通过对股价的散点图知道在2006年之前由于国力,金融市场的不完善以及参与交易的人较少,股价统一偏低;而在2006年之后抛开金融海啸的影响不说随着我国国力的提升,金融市场的完善与发展,有许多新进的股民参与,这写因素共同促进了股价的整体上扬。
5. 由统计描述中的图及散点图可以看到,股价的波动还是较大的,所以建议投资人投资时要格外小心,需谨记股市有风险,投资需谨慎。
建议:1. 在做回归时要求解释变量是非随机的,而此例中的解释变量涨跌幅却并非完全意义上的随机,可能会对回归方程有影响,但却不改变其无偏性与一致性。
2. 由于其预测是做的对未来的预测,并且可能由于数据不符合一些特定条件,而我们却对此无能为力,从而使做出的预测会有偏差,因此不能盲目轻信,需要投资者自己做出判断。
[键入文字] [键入文字] [键入文字]