5.第四章抽样分布
第四章 抽样分布
本章的目的?
• 总体与样本之间的关系 • 由已知的总体出发,研究样本的分布规 律 • 例如:
– 从一个正态总体中抽取一个样本,这个样本 的变量(统计量)是否也服从正态分布?或 者服从其它分布?
4.1 从一个正态总体中抽取的样 本统计量的分布
• 样本平均数的分布
– 总体标准差已知时的平均数的分布 :u分布
• 从平均数为μ,标准差为σ的正态总体中,独立 随机地抽取含量为n的样本,其样本平均数为一 服从正态分布的随机变量 • 平均数和方差分别为
x
n
x
n
称为平均数的标准误差
– 即:
• 若 X 服从 N(μ,σ2) , • 则 X 服从 N( μ,σ2/ n) • 将平均数标准化,则
u
x
n
• 标准化的样本平均数 u 服从标准正态分布 N(0,1)
• 总体标准差未知时的平均数的分布:t分布
– 若总体的标准差未知,则用样本标准差代替 总体标准差 – 标准化的平均数称为t
x t s n
– s/ n称为样本标准误差 s x – 统计量 t 不再服从N (0,1)分布,而服从(n – 1) 自由度的 t 分布
– 与正态分布一样,t 分布也是一种对称分布 – 在密度函数中只有自由度一个参数 df = n-1
df 1 ( ) df 1 2 t 2 f df (t ) (1 ) 2 , t df df df ( )( ) 2
– 随着自由度的增加,t 分布越来越接近于标 准正态分布
不同自由度下的t分布
- 与标准正态分布类似,t分布的上侧、下侧和 双侧临界值,由以下各式给出
P t t
P t t 2
P t t
- 对于给定的α从附表4中可以查出相应的上侧、下侧 和双侧分位数
• 样本方差的分布
– 从方差为σ2的正态总体中,随机抽取含量为 n的样本,计算出的方差称为样本方差s2 – 将样本方差s2标准化后称为χ2 (卡方)
2 df
df s 2
2
n 1s 2
2
– χ2服从n-1自由度的卡方分布 (4.13) – s2分布的特征数 2
s
2 2
s
2
2 df
不同自由度下的χ2分布
– 与t分布不同, χ2分布是不对称的 – 附表6给出了P(χ2 >χ2α) =α时的χ2α,称为上侧 临界值 – 由于不对称,求下侧临界值时不能用标准正 态分布和t分布的方法查找 – 正确的做法是,只要查出1-α的上侧临界值 即可 – 例如,若查样本含量为20,概率α=0.01的 下侧临界值,则: – 应查19自由度1-α=0.99的值, 为7.633
χ2分布的上侧和下侧临界值
4.2 从两个正态总体中抽取的样 本统计量的分布
• 通过抽样比较两个总体的参数
• 例如:
– 检验某一药物对动物的使用效果,即抽取服用前的 一组数据和服用后的一组数据,从这两个样本的数
据来推断药物服用前后动物是否存在差异? – 或者说,判断抽取的两个样本是否来自同一个总体?
• 标准差σi已知时,两个平均数的和与差的 分布
x x 1 2
1 2
x x
1 2
12
n1
2 2
n2
– 注意:标准差的计算公式右边! – 如果两个总体的分布都是正态分布,那么平 均数的和与差 ( x1 x2 ) 的分布也是正态的
2 12 2 N 1 2 , n n 2 1
– 将 ( x1 x2 ) 标准化,则标准化的变量u服从 标准正态分布 N(0,1)
x1 x 2 1 2 u
12
n1
2 2
n2
• 标准差σi未知但相等时,两个平均数的和 与差的分布
– 当σ1和σ2未知时,可用s1和s2代替。若两个 总体相互独立且都是正态分布,同时,则公 式4.25服从df1+df2自由度的t分布。
t
x1 x2 1 2
2 df1s12 df 2 s2 1 1 ( ) df1 df 2 df1 1 df 2 1
4.25
• 两个样本方差比的分布—F分布
– 两个样本的方差比较一般用比值表示 – 一般将样本方差标准化后求比值 – 统计量F的定义为
F
12
2 2 2 s2
s12
– F分布的密度函数由两个自由度df1和df2决定
– F分布属于不对称分布
– 附表7给出了F分布P(F > Fα) =α时的上侧临 界值Fα 注意:附表7中自由度的对应关系!
– 查F分布的下侧临界值F1-α时,需先将两自由 度颠倒后查 α 的上侧临界值,然后再将所查 值取倒数,即为所求Fα – 例:P78
概率值 连续型数据 离散型数据 无gap 有gap
常见的分布律
曲线下面x到x+Δx之间的 正态分布,标准正态分布,u 面积 分布,t分布,χ2分布。。。 y轴的值p(x) 二项分布、泊松分布
随机 特征值 变量 (平均数, 符号 标准差)
图形特征
α的上侧临界值 α的下侧临界值
标准化方式 (统计量定义方式)
服从何种分布 标准化后服从标准 正态分布
正态分布 标准正态分 布
x μ, σ u 0,1
以μ对称
以0对称
u分布(σ已知时 u μ, 平均数的分布) t分布(σ未知时 t 0, 平均数的分布) χ2分布(方差为σ2 χ2 σ2, 时样本方差s2的分布) 两平均数差 (和)的分 布 μ1±μ2, u
服从
服从N(μ,
)
uα -uα tdf, α -tdf, α χ2df, α χ2df, 1-α
标准化后服从标准正 态分布 服从(n-1)的t分布 标准化后服从(n1)的卡方分布
对称, df约束图形
不对称, df约束图形
标准化后服从标准正 态分布
F分布(两方 F 差比的分布)
4.30, 4.31 (不要求) 不对称
Fdf1,df2,α Fdf1,df2,1-α
统计量定义
服从df1,df2的F分布
That’s all for this chapter!