实验二数据描述与分析
实验二 数据描述与分析
一、填空题
1、统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__集中趋势__,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__离散程度__,反映各数据远离其中心值的趋势;三是分布的__偏度与峰度__,反映数据分布的形状。
2、在一组数据分布中,当算术平均数大于中位数大于众数时属于__右偏__分布;当算术平均数小于中位数小于众数时属于__左偏__分布。
3、___方差___是各变量值与其均值离差平方的平均数,是测度数值型数据_离散程度_最主要的方法。
4、偏态是对分布 偏斜方向__和___程度___的测度;而峰度则是指分布集中趋势 尖峭程度__的形状。
二、判断题
1、根据组距式数列计算得到的算术平均数只能是一个近似值。( )
2、众数的大小只取决于众数组相邻组次数的多少。( )
3、若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。( )
4、如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。( )
5、离散系数最适合于不同性质或不同水平数列算术平均数代表性的比较。( )
6、当偏态系数α=0 时,表明数据分布属于对称分布。( )
7、当峰度系数β=0 时,表明数据分布属于正态分布。( )
三、单项选择题
1、由组距式数列确定众数时,如果众数组相邻两组的次数相等,则( B )
A.众数为零 B.众数组的组中值就是众数
C.众数不能确定 D.众数组的组限就是众数
2、受极端数值影响最小的集中趋势值是( B )
A.算术平均数 B.众数和中位数 C.几何平均数 D.调和平均数
3、标准差系数抽象了( D )
A.总体单位数多少的影响 B.算术平均数高低的影响
C.总体指标数值大小的影响 D.标志变异程度的影响
4、某公司2003年管理人员年均收入35000元,生产人员为25000元;2004年各类人员年均收入水平不变,但管理人员增加15%,生产人员增加25%,则两类人员平均的年收入2004年比2003年( C )
A.提高 B.下降 C.持平 D.无法判断
5、离散程度测度值中,由总体中最大变量值和最小变量值之差决定的是( D )
A.方差 B.标准差 C.平均差 D.极差
6、分配数列各组变量值都减少一半,每组次数加1倍,中位数( C )
A.减少一半 B.增加1倍 C.增加2倍 D.不变
7、离散程度的测度值愈大,则( A )
A.反映变量值愈分散,算术平均数代表性愈差
B.反映变量值愈集中,算术平均数代表性愈差
C.反映变量值愈分散,算术平均数代表性愈好
D.反映变量值愈集中,算术平均数代表性愈好
8、甲数列的算术平均数为100,标准差为12.8;乙数列的算术平均数为14.5,标准差为3.7,故( B )
A.两数列算术平均数的代表性相同
B.乙数列算术平均数的代表性好于甲数列
C.甲数列算术平均数的代表性好于乙数列
D.两数列算术平均数的代表性无法比较
四、计算题
1949-1990年我国洪涝灾害统计数据如下表所示,请解决以下问题:(1)计算各项指标的平均值、标准差、变异系数、偏度与峰度;(2)各项指标是否服从正态分布?若服从正态分布,计算概率为1%时的受灾面积、受灾人口及直接经济损失。
1n1n
解:(1)已知均值:xxi 标准差:s(xi) 变异系数: n1i1ni1
nsxnCV100(%) 偏度:g
1(i) (n1)(n2)i1s32
nxi4n(n1)3(n1)2
峰度:g2 ()(n1)(n2)(n3)i1s(n1)(n3)