第四节 分布的偏度和峰度
第四节 分布的偏度和峰度
一、统计动差
描述统计总体分布的变异状况,除了用第二节所介绍的各种变异指标外,在许多场合还利用统计k阶动差(动差也称矩,是物理学的概念在统计分析中的运用)更进一步地刻划分布的形态特征。 k阶动差的一般形式为∑f,称之为原点矩,通常用μ表示。
显然,当k等于1时,即1阶的原点动差就是算术平均数;当k等于2时,2阶的原点动差就是平方平均数
如果把原点移到算术平均数的位置,就可以得到一个以频数分配各组标志值xi对平均数的K阶中心动差,或称中心矩,通常用v表示。 i=1ikki=1nk∑xfin
νk=i=1∑(xi-)fi
i=1nk∑fin
(3.34)
当k=0时,即零阶中心动差ν=1; 当k=1时,即一阶中心动差v=0; 当K=2时,即二阶中心动差ν=σ。 01
22
二、偏度
偏度是用于衡量分布的不对称程度或偏斜程度的指标。如果用矩法方式测定,偏度指标α是变量的三阶中心动差除以
标准差三次方,用公式表示为:
ν3ν3α=3=3σ(ν2)2
(3.35)
当分布对称时,它的所有奇数阶中心矩均为0,要判断分布是否对称,可考虑用奇数阶中心矩测定。一阶中心矩恒为0,五阶以上的中心矩计算较为繁琐,偏度指标α就是以三阶中心动差来测定的。
由于三阶中心矩含有计量单位,为消除计量单位的影响,以σ除之。
正态分布曲线左右完全对称,三阶中3
心动差ν等于0,即α=0。当分布不对称时,则三阶中心动差不为0,其分布的偏斜程度使α大于0或小于0。如图3-12所示,
当α=0时为正态分布;当α>0时为正偏
斜;当α
Ⅰ(α=0)
II(α>0) Ⅲ(α
图3-12 3
三、峰度
峰度是用于衡量分布的集中程度或分布曲线的尖峭程度的指标。峰度指标β的计算公式如下:
ν4∑(x-)fβ=4-3=-34σσ∑f
分布曲线的尖峭程度与偶数阶中心矩4
的数值大小有直接的关系,ν是方差,以四阶中心动差ν度量分布曲线的尖峭程度。ν含有计量单位,其计量单位同σ。为消除计量单位的影响,将ν除以σ,就
得到无量纲的相对数。因为衡量分布的集中程度或分布曲线的尖峭程度是以正态分布的峰度作为比较标准的,在正态244444分布条件下,ν4≡34σ,将各种不同分布的尖ν4
σ4峭程度与正态分布比较,即减3,就得
峰度指标β的测定公式。
当峰度指标β>0时,表示分布比正态分布更集中在平均数周围,分布呈尖峰状态;β=0分布为正态分布;β
Ⅱ(β>0)
Ⅰ(β=0)
Ⅲ (β
图3-13