概率统计知识点
第一章 随机事件与概率
一、教学要求
1.理解随机事件的概念,了解随机试验、样本空间的概念,掌握事件之间的关系与运算. 2.了解概率的各种定义,掌握概率的基本性质并能运用这些性质进行概率计算.
3.理解条件概率的概念,掌握概率的乘法公式、全概率公式、贝叶斯公式,并能运用这些公式进行概率计算. 4.理解事件的独立性概念,掌握运用事件独立性进行概率计算.
5.掌握贝努里概型及其计算,能够将实际问题归结为贝努里概型,然后用二项概率计算有关事件的概率. 本章重点:随机事件的概率计算. 二、知识要点
1.随机试验与样本空间
具有下列三个特性的试验称为随机试验: (1) 试验可以在相同的条件下重复地进行; ·
(2) 每次试验的可能结果不止一个,但事先知道每次试验所有可能的结果; (3) 每次试验前不能确定哪一个结果会出现.
试验的所有可能结果所组成的集合为样本空间,用表示,其中的每一个结果用记作
e表示,e称为样本空间中的样本点,
{e}.
2.随机事件
在随机试验中,把一次试验中可能发生也可能不发生、而在大量重复试验中却呈现某 种规律性的事情称为随机事件(简称事件).通常把必然事件(记作)与不可能事件(记作看作特殊的随机事件.
3.**事件的关系及运算 (1) 包含:若事件
)
A发生,一定导致事件B发生,那么,称事件B包含事件A,记作AB(或BA). A与B相互包含,即AB且BA,那么,称事件A与B相等,记作AB.
(2) 相等:若两事件
(3) 和事件:“事件A与事件B中至少有一个发生”这一事件称为A与B的和事件,记作
AB
;“n个事件
A1,A2,,An
中至少有一事件发生”这一事件称为
n
A1,A2,,An
的和,记作
A1A2An(简记为i1
A1,
Ai
).
(4) 积事件:“事件A与事件B同时发生”这一事件称为A与B的积事件,记作
AB(简记为AB);“n
个事件
A2,,An同时发生”这一事件称为A1,
n
A2,,An的积事件,记作A1A2An(简
AAAn或i1记为12
A1,A1,
A2,,
An
Ai
).
(5) 互不相容:若事件A和B不能同时发生,即
AB,那么称事件
A与B互不相容(或互斥),若n个事件
(1≤i
中任意两个事件不能同时发生,即
AiAj
A2,,An互不相容.
AB且AB,那么,称A与B是
(6) 对立事件:若事件A和B互不相容、且它们中必有一事件发生,即对立的.事件A的对立事件(或逆事件)记作
A.
AB(或AB) .
(7) 差事件:若事件A发生且事件B不发生,那么,称这个事件为事件A与B的差事件,记作
(8) 交换律:对任意两个事件A和B有
ABBA,ABBA.
(9) 结合律:对任意事件A,B,C有
A(BC)(AB)C, A(BC)(AB)C.
(10) 分配律:对任意事件A,B,C有
A(BC)(AB)(AC), A(BC)(AB)(AC).
(11) 德摩根(De Morgan)法则:对任意事件A和B有
ABAB, ABAB.
4.频率与概率的定义 (1) 频率的定义
设随机事件A在n次重复试验中发生了
nA次,则比值nA/n
称为随机事件A发生的频率,记作
fn(A),即
fn(A)
nAn
.
(2) 概率的统计定义
在进行大量重复试验中,随机事件A发生的频率具有稳定性,即当试验次数n很大时,频率
fn(A)在一个稳定的值
p(0
(3) **古典概率的定义
具有下列两个特征的随机试验的数学模型称为古典概型: (i) 试验的样本空间是个有限集,不妨记作
{e1,e2,,en};
ei (ii) 在每次试验中,每个样本点i(
1,2,,n)出现的概率相同,即
P({e1})P({e2})P({en}).
在古典概型中,规定事件A的概率为
P(A)
(4) 几何概率的定义
A中所含样本点的个数nA
中所含样本点的个数n
.
如果随机试验的样本空间是一个区域(可以是直线上的区间、平面或空间中的区域),且样本空间中每个试验结果的出现具有等可能性,那么规定事件A的概率为
P(A)
(5) 概率的公理化定义
A的长度(或面积、体积)
样本空间的的长度(或面积、体积)·
P(A)是实值函数,若满足下列三条公理:
设随机试验的样本空间为,随机事件A是的子集, 公理1 (非负性) 对于任一随机事件A,有 公理2 (规范性) 对于必然事件,有
P(A)≥0;
P()1;
公理3 (可列可加性) 对于两两互不相容的事件
A1,A2,,An,,有
P(Ai)P(Ai)
i1
i1
,
则称
P(A)为随机事件A的概率.
5.**概率的性质
由概率的三条公理可导出下面概率的一些重要性质 (1)
P()0.
(2) (有限可加性) 设n个事件
A1,A2,,An两两互不相容,则有
P(A1A2An)P(Ai)
i1n
.
(3) 对于任意一个事件A:
P(A)1P(A).
(4) 若事件A,B满足
AB,则有
P(BA)P(B)P(A),
P(A)P(B).
(5) 对于任意一个事件A,有
P(A)1.
P(AB)P(A)P(B)P(AB).
(6) (加法公式) 对于任意两个事件A,B,有
对于任意n个事件
n
A1,A2,,An,有
n
P(Ai)P(Ai)
i1
i1
1ijn
P(AiAj)
1ijkn
P(iAAA)(n11)jk
1
P(A
n
A)
.
6.**条件概率与乘法公式
设A与B是两个事件.在事件B发生的条件下事件A发生的概率称为条件概率,记作定
P(A|B).当P(B)0,规
P(A|B)
在同一条件下,条件概率具有概率的一切性质. 乘法公式:对于任意两个事件A与B,当
P(AB)
P(B).
P(A)0,P(B)0时,有
P(AB)P(A)P(B|A)P(B)P(A|B).
7.*随机事件的相互独立性 如果事件A与B满足
P(AB)P(A)P(B),
那么,称事件A与B相互独立.
关于事件A,月的独立性有下列两条性质: (1) 如果
P(A)0,那么,事件A与B相互独立的充分必要条件是P(B|A)P(B);如果P(B)0,那么,
事件A与B相互独立的充分必要条件是
P(A|B)P(A).
这条性质的直观意义是“事件A与B发生与否互不影响”. (2) 下列四个命题是等价的: (i) 事件A与B相互独立; (ii) 事件A与B相互独立; (iii) 事件 (iv) 事件
A与B相互独立; A与B相互独立.
对于任意n个事件事件
A1,A2,,An相互独立性定义如下:对任意一个k2,,n,任意的1i1ikn,若
A1,A2,,An总满足
P(Ai1Aik)P(Ai1)P(Aik),
则称事件
A1,A2,,An相互独立.这里实际上包含了2nn1个等式.
P(A)p(0p1),则在n
次重复独立试验中.,事件A恰发生k次
8.*贝努里概型与二项概率
设在每次试验中,随机事件A发生的概率的概率为
nk
Pn(k)p(1p)nk,k0,1,,n
k,
称这组概率为二项概率. 9.**全概率公式与贝叶斯公式
AA,A1,2,n 全概率公式:如果事件两两互不相容,且i1
P(Ak|B)
n
i
n
Ai
,
P(Ai)0,i1,2,,n,则
P(Ak)P(B|Ak)
,k1,2,,n
.
P(A)P(B|A)
i
i1
第二章 离散型随机变量及其分布
一、教学要求
1.理解离散型随机变量及其概率函数的概念并掌握其性质,掌握0-1分布、二项分布、泊松(Poisson)分布、均匀分布、几何分布及其应用.
2.理解二维离散型随机变量联合概率函数的概念及性质;会利用二维概率分布计算有关事件的概率. 3.理解二维离散型随机变量的边缘分布,了解二维随机变量的条件分布. 4.掌握离散型随机变量独立的条件.
5. 会求离散型随机变量及简单随机变量函数的概率分布. 本章重点:离散型随机变量的分布及其概率计算. 二、知识要点 1.一维随机变量
若对于随机试验的样本空间中的每个试验结果称
e,变量X
都有一个确定的实数值与
e相对应,即XX(e),则
X
是一个一维随机变量.
概率论主要研究随机变量的统计规律,也称这个统计规律为随机变量的分布. 2.**离散型随机变量及其概率函数 如果随机变量
X
仅可能取有限个或可列无限多个值,则称
X
为离散型随机变量.
设离散型随机变量
X
a(i的可能取值为i1,2,,n,),
piP(Xai),i1,2,,n,.
若i1
p
i
1
,则称
pi(i1,2,,n,)离散型随机变量X
的概率函数,概率函数也可用下列表格形式表示:
3.*概率函数的性质 (1)
pi0, i1,2,,n,;
(2) i1
p
i
1
.
由已知的概率函数可以算得概率
P(XS)pi
aiS
,
其中,S是实数轴上的一个集合. 4.*常用离散型随机变量的分布 (1) 0—1分布
B(1,p),它的概率函数为
P(Xi)pi(1p)1i,
其中,i
0或1,0p1.
B(n,p),它的概率函数为
(2) 二项分布
n
P(Xi)pi(1p)ni
i,
其中,
i0,1,2,,n,0p1.
P(),它的概率函数为
(4) 泊松分布
P(Xi)
其中,
i
i!
e
,
i0,1,2,,n,,0.
(5) 均匀分布,它的概率函数为
P(Xai)
其中,
5.二维随机变量
若对于试验的样本空间中的每个试验结果
1
n,
i0,1,2,,n.
(X,Y)都有确定的一对实数值与e相对应,XX(e),e,有序变量即
YY(e),则称(X,Y)为二维随机变量或二维随机向量.
6.*二维离散型随机变量及联合概率函数 如果二维随机变量
(X,Y)仅可能取有限个或可列无限个值,那么,称(X,Y)为二维离散型随机变量. (X,Y)的分布可用下列联合概率函数来表示:
二维离散型随机变量
P(Xai,Ybj)pij,i,j1,2,,
pij0,i,j1,2,,
其中,
p
i
j
ij
1
.
7.二维离散型随机变量的边缘概率函数 设
P(Xai)(i1,2,)(X,Y)为二维离散型随机变量,pij为其联合概率函数(i,j1,2,)
,称概率
X
的边缘概率函数,记为
为随机变量
pi并有
j
pi.P(Xai)pij,i1,2,
,
称概率
P(Ybj)(j1,2,)为随机变量Y的边缘概率函数,记为p.j,并有
p.j=
P(Ybj)pij,j1,2,
i
.
8.随机变量的相互独立性 . 设
(X,Y)为二维离散型随机变量,X
与Y相互独立的充分必要条件为
pijpipj,对一切i,j1,2,.
多维随机变量的相互独立性可类似定义.即多维离散型随机变量的独立性有与二维相应的结论. 9.随机变量函数的分布 设
X
是一个随机变量,
g(x)是一个已知函数,Yg(X)是随机变量X
的函数,它也是一个随机变量.对离散型
随机变量
X,下面来求这个新的随机变量Y的分布.
设离散型随机变量
X
的概率函数为
则随机变量函数
Yg(X)的概率函数可由下表求得
但要注意,若
g(ai)的值中有相等的,则应把那些相等的值分别合并,同时把对应的概率pi相加.
第三章 连续型随机变量及其分布
一、教学要求
1.理解连续型随机变量及其概率密度的概念,并掌握其性质,掌握均匀分布、指数分布、正态分布及其应用.
2.理解二维随机变量的联合分布的概念、性质以及连续型随机变量联合概率密度;会利用二维概率分布计算有关事件的概率.
3.理解二维随机变量的边缘分布,了解二维随机变量的条件分布. 4.理解随机变量的独立性概念,掌握连续型随机变量独立的条件.
5.掌握二维均匀分布;了解二维正态分布的密度函数,理解其中参数的概率意义.
(不考)6.会求两个独立随机变量的简单函数的分布,会求两个独立随机变量的简单函数的分布,会求两个随机变量之和的概率分布.
(不考)7.会求简单随机变量函数的概率分布.
本章重点:一维及二维随机变量的分布及其概率计算,边缘分布和独立性计算. 二、知识要点 1.*分布函数
随机变量的分布可以用其分布函数来表示,随机变量函数,记作
X
取值不大于实数
x的概率P(Xx)称为随机变量X
的分布
F(x), 即
F(x)P(Xx),x.
F(x)的性质
2.分布函数 (1) (2)
0F(x)1;
F(x)是非减函数,即当x1x2时,有F(x1)F(x2);
x
x
F(x)0,limF(x)1lim (3) ;
(4)
F(x)F(a)
F(x)是右连续函数,即limxa0.
X
的分布函数
由已知随机变量
F(x),可算得X
落在任意区间
(a,b]内的概率
P(aXb)F(b)F(a);
也可以求得
P(Xa)F(a)F(a0).
3.联合分布函数 二维随机变量
(X,Y)的联合分布函数规定为随机变量X
取值不大于
x实数的概率,同时随机变量Y
取值不大于实数
y的概率,并把联合分布函数记为F(x,y),即
F(x,y)P(Xx,Yy),x,y.
4.联合分布函数的性质 (1) (2)
0F(x,y)1;
F(x,y)是变量x(固定y)或y(固定x)的非减函数;
x
y
limF(x,y)0,limF(x,y)0
(3)
,
limF(x,y)0,limF(x,y)1
xy
xy
;
(4) (5)
F(x,y)是变量x(固定y)或y(固定x)的右连续函数;
P(x1Xx2,y1Yy2)F(x2,y2)F(x2,y1)F(x1,y2)F(x1,y1).
X
的分布函数为
5.**连续型随机变量及其概率密度 设随机变量
F(x),如果存在一个非负函数f(x),使得对于任一实数x,有
F(x)f(x)dx
x
成立,则称X为连续型随机变量,函数 6.**概率密度 (1)
f(x)称为连续型随机变量X
的概率密度.
f(x)及连续型随机变量的性质
f(x)0;
(2)
f(x)dx1
X
;
(3)连续型随机变量 (4)设 (5) 设
的分布函数为
F(x)是连续函数,且在F(x)的连续点处有F(x)f(x);
P(Xc)0;
X
为连续型随机变量,则对任意一个实数c,
f(x)是连续型随机变量X
b
的概率密度,则有
P(aXb)P(aXb)P(aXb)P(aXb)
=a
f(x)dx
.
7.**常用的连续型随机变量的分布 (1) 均匀分布
R(a,b),它的概率密度为
1
,axb;
f(x)ba
其余. 0,
其中,
ab).
E(),它的概率密度为
(2) 指数分布
ex,x0;f(x)
其余. 0,
其中,
0.
N(,2),它的概率密度为
(3) 正态分布
f(x)
其中,
(x)222
,x
,
,0,当0,1时,称N(0,1)为标准正态分布,它的概率密度为
f(x)
标准正态分布的分布函数记作
x22
,x
,
(x),即
(x
)
当出
(x)
x
dt,
t2
2
x0时,(x)可查表得到;当x0时,(x)可由下面性质得到
(x)1(x).
2
X~N(,),则有 设
F(x)(
x
)
;
P(aXb)(
b
)(
a
)
.
8.**二维连续型随机变量及联合概率密度 对于二维随机变量(X,Y)的分布函数有
F(x,y),f(x,y),(x,y)如果存在一个二元非负函数使得对于任意一对实数
F(x,y)
成立,则
9.二维连续型随机变量及联合概率密度的性质 (1)
x
y
f(s,t)dtds
(X,Y)为二维连续型随机变量,f(x,y)为二维连续型随机变量的联合概率密度.
f(x,y)0,x,y;
(2)
f(x,y)dxdy1
;
(3) 设 (4) 在
(X,Y)为二维连续型随机变量,则对任意一条平面曲线L,有P((X,Y)L)0; ’
f(x,y)的连续点处有
2F(x,y)
f(x,y)
xy;
(5) 设
(X,Y)为二维连续型随机变量,则对平面上任一区域D有
P((X,Y)D)f(x,y)dxdy
D
.
10,**二维连续型随机变量 设
(X,Y)的边缘概率密度
的边缘概率密度为
f(x,y)为二维连续型随机变量的联合概率密度,则X
fX(x)
Y
的边缘概率密度为
f(x,y)dy
;
fY(y)
11.常用的二维连续型随机变量 (1) 均匀分布
f(x,y)dx
.
如果
(X,Y)在二维平面上某个区域G上服从均匀分布,则它的联合概率密度为
1
,(x,y)G;
f(x,y)G的面积
0,其余.
22
N(,,,,) 1212 (2) 二维正态分布
如果
(X,Y)的联合概率密度
f(x,y)
则称
(x1)2(x1)(y2)(x1)21
22222(1)1121
2(X,Y)~N(1,2,12,2,).
(X,Y)服从二维正态分布,并记为
2222
(X,Y)~N(,,,,)X~N(,)Y~N(,),即二维正态分布的边12121122 如果,则,
缘分布还是正态分布.
12.**随机变量的相互独立性 . 如果
X与Y的联合分布函数等于
X,Y
的边缘分布函数之积,即
F(x,y)FX(x)FY(y),对一切x,y,
那么,称随机变量 设
X与Y相互独立.
与Y相互独立的充分必要条件为
(X,Y)为二维连续型随机变量,则X
f(x,y)fX(x)fY(y),在一切连续点上.
如果
2(X,Y)~N(1,2,12,2,).那么,X
与Y相互独立的充分必要条件是
0.
多维随机变量的相互独立性可类似定义.即多维随机变量的联合分布函数等于每个随机变量的边缘分布函数之积,多维连续型随机变量的独立性有与二维相应的结论. 13.随机变量函数的分布 **一维随机变量函数的概率密度 设连续型随机变量
X
的概率密度为
fX(x),则随机变量Yg(X)的分布函数为
Iy
FY(y)P(Yy)P(g(X)y)P(XIy)
其中,
f
X
(x)dx
{XIy}与{g(X)y}是相等的随机事件,而Iy{x||g(x)y}是实数轴上的某个集合.随机变量Y
f(y)可由下式得到:
的概率密度Y
fY(y)FY'(y).
连续型随机变量函数有下面两条性质: (i) 设连续型随机变量的概率密度为
fX(x),Yg(X)是单调函数,且具有一阶连续导数,xh(y)是
yg(x)的反函数,则Yg(X)的概率密度为
fY(y)f(h(y))|h'(y)|.
(ii) 设
X~N(,),YkXb~N(kb,k),
则当k0时,有特别当
X
222
k
1
,b
YkXb~N(0,1),
时,有
特别有下面的结论:
~N(0,1)
.
22
X~N(,)Y~N(,11,22),且X设22
XY~N(,1212). 与Y相互独立,则
第四章 随机变量的数字特征
一、教学要求
1.理解随机变量的数学期望、方差的概念,并会运用它们的基本性质计算具体分布的期望、方差, 2.掌握二项分布、泊松分布、均匀分布、指数分布、正态分布的数学期望和方差. 3.会根据随机变量布计算其函数
X
的概率分布计算其函数
g(X)的数学期望E[g(X)];会根据随机变量(X,Y)的联合概率分
g(X,Y)的数学期望正E[g(X,Y)].
(不考)4.理解协方差、相关系数的概念,掌握它们的性质,并会利用这些性质进行计算,了解矩的概念。
本章重点:随机变量的期望。方差的计算. 二、知识要点 1.**数学期望 设
X
是离散型的随机变量,其概率函数为
P(Xai)pi,i1,2,,
如果级数i
ap
i
i
绝对收敛,则定义
X
的数学期望为
E(X)aipi
i
;
设
X
为连续型随机变量,其概率密度为
f(x),如果广义积分xf(x)dx绝对可积,则定义X
的数学期望为
E(X)xf(x)dx
.
2.*随机变量函数的数学期望 设
X
为离散型随机变量,其概率函数
P(Xai)pi,i1,2,,
如果级数i
g(a)p
i
i
绝对收敛,则
X
的函数
g(X)的数学期望为
i
E[g(X)]g(ai)pi
设
(X,Y)为二维离散型随机变量,其联合概率函数
P(Xai,Ybj)pij,i,j1,2,,
如果级数j
i
g(ai,bj)pij
绝对收敛,则
(X,Y)的函数g(X,Y)的数学期望为
E[g(X,Y)]g(ai,bj)pij
j
i
;
E(X)aipij;E(Y)bjpij
特别地
i
i
j
i
.
设
X
为连续型随机变量,其概率密度为
f(x),如果广义积分
g(x)f(x)dx
绝对收敛,则
X
的函数
g(X)
的数学期望为
E[g(X)]g(x)f(x)dx
.
设
(X,Y)为二维连续型随机变量,f(x,y),
其联合概率密度为如果广义积分
(X,Y)的函数g(X,Y)的数学期望为
g(x,y)f(x,y)dxdy
绝对收敛,则
E[g(x,y)]
特别地
g(x,y)f(x,y)dxdy
;
E(x)
xf(x,y)dxdy
,
E(Y)
3.**数学期望的性质 (1) (2) (3)
yf(x,y)dxdy
.
E(c)c (其中c为常数);
E(kXb)kE(X)b (k,b为常数); E(XY)E(X)E(Y);
X
与相互独立,则
(4) 如果
E(XY)E(X)E(Y).
4.**方差与标准差 随机变量
X
的方差定义为
D(X)E[XE(X)]2.
计算方差常用下列公式:
D(X)E(X2)[E(X)]2’
当
X
为离散型随机变量,其概率函数为
P(Xai)pi,i1,2,,
如果级数i
(aE(X))
i
2
pi
收敛,则
X
的方差为
D(X)(aiE(X))2pi
i
;
当
X
为连续型随机变量,其概率密度为
2
f(x),如果广义积分(xE(X))f(x)dx收敛,则X
的方差为
D(X)(xE(x))2f(x)dx
.
随机变量
X
的标准差定义为方差
D(X
) 5.**方差的性质 (1) (2)
D(c)0 (c是常数);
D(kX)k2D(X) (k为常数);
X
与Y独立,则
(3) 如果
D(XY)D(X)D(Y).
6.原点矩与中心矩 随机变量X 随机变量
k
E(X); k的阶原点矩定义为
X
的k阶中心矩定义为
E[(XE(X))k]];
kl
(X,Y)(k,l)E(XY);
随机变量的阶混合原点矩定义为
kl
(X,Y)(k,l)E[(XE(X))(YE(Y))].
随机变量的阶混合中心矩定义为
一阶原点矩是数学期望
E(X);
二阶中心矩是方差D(X);
(1,1)阶混合中心矩为协方差cov(X,Y).
X
7.**常用分布的数字特征 (1) 当
服从二项分布
B(n,p)时,
E(X)np,D(X)np(1p).
(2) 当
X
服从泊松分布
p()时,
E(X),D(X),
(3) 当
X
服从区间
(a,b)上均匀分布时,
ab(ba)2
E(X),D(X)
212
(4) 当
X
服从参数为
的指数分布时,
E(X)
1
,D(X)
1
2
(5) 当
X
服从正态分布
N(,2)时,
E(X),D(X)2.
(6) 当
22
(X,Y)服从二维正态分布N(1,2,1,2,)时,
E(X)1,D(X)12;
E(Y)2,D(Y)22;
cov(X,Y)12,XY
第五章 数理统计的基本概念
一、基本教学要求与主要内容 (一)教学要求
1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解
分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。
3.掌握正态总体的某些常用统计量的分布。 本章重点:统计量的概念及其分布。 (二)主要内容 1.总体、个体
我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体
密度函数。当 X服从正态分布 (1) (2) (3)
未知,但未知,但和
已知; 已知;
时,称总体X为正态总体。正态总体有以下三种类型:
均未知。
2.简单随机样本
数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为称为样本。n称为样本容量。 ( 如果样本( (1) (2) 则称(
)满足 相互独立;
服从相同的分布,即总体分布; )为简单随机样本。简称样本。
,则样本(
)的联合概率函数(联合密度函数为)
)称为样本观测值。
,这一过程称为抽样。由于抽样前无法,n维随机向量(
)
设总体X的概率函数(密度函数)为
3. 统计量 完全由样本确定的量,是样本的函数。 即:设
未知参数,则
称
是来自总体X的一个样本,
是一个n元函数,如果
中不含任何总体的
,则
称
为一个统计量,经过抽样后得到一组样本观测
值
为统计量观测值或统计量值。
4. **常用统计量
(1)样本均值:
1n
S(Xi)2n1i1
(2)样本方差:
n1
Sn2(Xi)2
ni1
2
观察值仍分别称为样本均值、样本方差
5. **三个重要分布 (1)设记为称满足:(2)t分布
设随机变量X与Y独立,
,则称
。
的点
为
分布的
分位点。
分布
为独立标准正态变量,称随机变量
的分布为自由度为n的
分布,
的分布为自由度n的t分布,记为称满足:(3)F分布
设随机变量U与V相互独立,
,则称
的点
。 为t分布的
分位点。
的分布为自由度称满足:
的F分布,记为
的点
。 为F分布的
分位点,且有
6. **正态总体的抽样分布 统计量的分布称为抽样分布,设的均值和样本方差,则有
是来自正态总体
的一个简单随机样本,
与
分别为样本
(1)(2)
与相S
2
;
1n
(Xi)2互独立; n1i1
(3)
n1
2
S22(n1)
学习要点
1,统计学的核心问题是由样本推断总体,因此理解统计量的概念非常重要。它是样本的函数,统计量的选择和运用在统计推断中占据核心地位。
2,样本均值、样本方差以及其他样本矩都是一些常用的统计量,必须熟悉它们的计算方法及其有关性质。 3,统计量的分布称为抽样分布,其中的查表方法;
4,正态总体抽样分布是统计学中最重要的一个理论结果,必须弄清它的条件及结论,并能运用判断一些常用统计量的分布。 第六章 参数估计 一、教学基本要求与主要内容 (一)教学基本要求 1.理解点估计的概念。
2.掌握矩估计法(一阶、二阶)和极大似然估计法。 3.了解估计量的评选标准(无偏性、有效性)。 4.理解区间估计的概念。
5.会求单个正态总体的均值和方差的置信区间。
不考6.会求两个正态总体的均值差和方差比的置信区间。
本章重点:未知参数的矩估计,极大似然估计及正态总体未知参数的区间估计。 (二)主要内容 1. **点估计方法 设则称
为参数
是来自总体X的样本,是总体的未知参数,若用一个统计量
的估计量,在抽样后,称
为参数
的估计值。这种估计称为点估计。
来估计
,
分布、t分布、F分布即是本章的重点,必须熟悉它们的定义、性质及其上
分位点
矩估计和最大似然估计是两种常用的点估计法。 (1)**矩估计法
用样本的各阶原点矩去估计对应的各阶总体的原点矩,这就是矩估计的基本方法。
\
nn11kkABVX, U(X)kkikkini1ni1
nn11kk(,,,)VX,U(,,,)(X)ik12mnk12mini1i1
(2)**最大似然估计法 设总体X的密度函
数
的观察值,则求
① 写出似然函数
(其
中
的最大似然估计值
为未知参数),已
知
的步骤如下:
为总体X的样
本
L()f(x1,x2,,xn,)f(xi,)
i1
n
② 似然函数取对数
lnL(x1,x2,,xn,)lnf(xi,)
i1
n
(3)建立并求似然方程
dlnL
0
d
(4)最大似然估计值可以由解对数似然方程得到。 2. 点估计的优良性评判准则 (1)无偏性 设
是
,对每一
则称(2)有效性 设
比
是有效。
无偏估计中,方差最小的那一个为一致最小方差无偏估计。 的两个无偏估计,如对每一
,有
且至少对某个
使之成立严格不等式,则称
是
的一个估计量,若
成立
的一个无偏估计。
称在所有的
3. **单正态总体下的置信区间
设
是取自正态总体
的一个样本,置信水平为
,样本均值
,样本方差
。
(1)均值
的置信区间
若已知,取,故的双侧置信区间为:
若未知,取,故的双侧置信区间为:
(2)方差
的置信区间
若已知,取,故的双侧置信区间为:
若未知,取,故的双侧置信区间为:
学习要点
1本章的要点是理解参数点估计的概念,掌握参数点估计的评判标准,会能实际应用。特别是要掌握矩估计法和最大似然估计法这二种点估计的常用方法,并能熟练地运用这二种点估计的常用方法去求参数的估计量.
2本章的另一要点是理解参数区间估计的概念和置信水平、置信区间的概念及其意义,熟悉对单正态总体的均值与方差和两正态总体的均值差进行区间估计的方法及步骤,并能熟练地运用以上方法求各种置信区间。
第七章 假设检验
一. 教学基本要求
1.理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率,并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。
2.理解单个及正态总体的均值和方差的假设检验。3.(不考)了解总体分布假设的 本章重点:单个正态总体的参数的假设检验。 二. 内容提要
1.假设检验的基本概念
假设检验是基于样本判定一个关于总体分布的理论假设是否成立的统计方法。方法的基本思想是当观察到的数据差异达到一定程度时,就会反映与总体理论假设的真实差异,从而拒绝理论假设。
原假设与备选假设是总体分布所处的两种状态的刻画,一般都是根据实际问题的需要以及相关的专业理论知识提出来的。通常,备选假设的设定反映了收集数据的目的。
检验统计量是统计检验的重要工具,其功能在用之于构造观察数据与期望数之间的差异程度。要求在原假设下分布是完全已知的或可以计算的。检验的名称是由使用什么统计量来命名的。
否定论证是假设检验的重要推理方法,其要旨在:先假定原假设成立,如果导致观察数据的表现与此假定矛盾,则否定原假设。通常使用的一个准则是小概率事件的实际推断原理。
2.两类错误概率。第一类错误概率即原假设成立,而错误地加以拒绝的概率;第二类错误概率即原假设不成立,而错误地接受它的概率。
3.显著水平检验。在收集数据之前假定一个准则,即文献上称之为拒绝域,一旦样本观察值落入拒绝域就拒绝原假设。若在原假设成立条件下,样本落入拒绝域的概率不超过事先设定的
,则称该拒绝域所代表的检验为显著水平
的检验,而称
为
拟合优度检验法。
显著水平。由定义可知,所谓显著水平检验就是控制第一类错误概率的检验。 4.**单正态总体均值和方差的检验(U检验,T检验和卡方检验) 我们以单正态总体均值U检验:
(1) 列出问题,即明确原假设和备选假设。先设
已知,检验
其中
已知。
,提出检验统计量U检验为例,即假定总体
。
(2) 基于的估计
~N(0,1)
(3) 对给定水平
Pu,/2构造水平
检验的拒绝域
Uu2
其中2为标准正态分布的
u双侧分位点。
(4) 基于数据,算出
的观察值,如
u则拒绝
,否则只能接受.
因此检验使用统计量U,称之为U-检验。
注意:单边检验的区别 H:=;H:
0010
Pu构造水平
H:=;H:
0010
检验的拒绝域U
u单侧分位数
Pu构造水平
T-检验。 当
未知时,改检验统计量U为T统计量
检验的拒绝域U
u单侧分位数
(1) 列出问题,即明确原假设和备选假设。先设未知,检验
其中未知。
,提出检验统计量T
(2) 基于的估计
~t(n1)
(3) 对给定水平
,P
t(n1)
构造水平检验的拒绝域
Tt(n1)
其中2为标准正态分布的
t双侧分位点。
T
t2(n1)则拒绝
,否则只能接受
.
(4) 基于数据,算出
T
的观察值,如
因此检验使用统计量T,称之为T-检验。
注意:单边检验的区别 H:=;H:
0010
Pt(n1)构造水平
H:=;H:
0010
检验的拒绝域T
t(n1)单侧分位数
Pt(n1)构造水平
检验的拒绝域T
t(n1)单侧分位数
2检验。
当未知时,单正态总体方差
的检验
(1) 列出问题,即明确原假设和备选假设。先设未知,检验
22
H0:20;H1:20;
其中未知。
(2) 基于的估计,提出检验统计量
2
(n1)S2
2
0
~2(n1)
(3) 对给定水平,
2P22(n1),P2(n1)
1
2222
构造水平检验的拒绝域
2
222(n1)或21n1)2(
其中
2
12(n1),2(n1)为标准正态分布的双侧分位点。
2
2的观察值,如2)或2122(n1)则拒绝2(n1
(4) 基于数据,算出,否则只能接受.
因此检验使用统计量2,称之为2-检验。 学习要点
1本章内容涉及概念及方法两大部分,要求理解和掌握假设检验的一些基本概念,如两类错误概率,否定论证原理,显著水平,弄清显著水平
检验的确切含义。
2掌握单正态总体检验的基本方法。
第八章 方差分析
检验假设H0
:12...r 找到F统计量
单因素试验方差分析表
方差来源 平方和 自由度 组间 组内 总和
简便计算公式:
均方和
MSA
SSA
dfA
F 值
F 值临介值
SSA
dfAdfE
dfT
F
MSAMSE
Fr1,nr
SSESST
MSE
SSEdfE
Ti2T2
SSA
ni1ni
rTi2
SSEX,SSTSSASSE
ni1j1i1i
r
2
ij
r
ni
TiXij,TTi
j1i1nir
dfAr1,dfEnr,dfTn1
第九章 回归分析
1.回归函数或回归方程的建立 y01x
Lxy1Lxx 10
1n1n
xi, yini1ni1
Lxy(xi)(yi)xiyi*i1
ni1nn
Lxx(xi)2xi22
i1
ni1nn
Lyy(yi)yi222
i1i1
2.回归方程的有效性检验F检验法
检验假设H0: 10, H1: 10, 找到F统计量 一元回归分析表
方差来源平方和 自由度回归
剩余
总和
简便计算公式: 均方和 MSRSSRdfRF 值 FMSRMSEF 值临介值 F1,n2SSRdfR1SSESSTdfEdfTMSESSEdfE
SSR1Lxy SSELyy-1Lxy, SSTSSASSELyy dfR1,dfEn2,dfTn1
3回归方程的点预测
ˆabx0即为 y 的点预测值。 xx0,y