第三章 数字特征与特征函数
第三章 数字特征与特征函数 §1 数学期望
一、离散型随机变量的数学期望
二、连续型随机变量的数学期望
三、一般定义
四、随机变量函数的数学期望
五、数学期望的基本性质
六、条件数学期望
分布函数可以全面地描述一个随机现象,但在实际工作中,人们不易掌握随机变量的分布函数,故全面描述较难做到.因此要引入某些数字特征以反映随机变量的主要性状.另一方面,根据经验,某些随机现象的随机变量服从某类分布,它们的一些参数可由某些数字特征确定. 对这些随机现象,数字特征有更重要的意义. 主要的数字特征有描述平均水平的数学期望(即均值)和描述相对于均值的离散程度的方差. 还有描述两个随机变量间线性关系密切程度的相关系数等,本章将详细介绍它们的概念、性质和计算.
本章还将讨论描述随机变量的一个强有力的工具——特征函数,并利用它,对在多元分析中起主要作用的多元正态分布作一介绍.
§1 数学期望
一、离散型随机变量的数学期望
例1 为评价甲的射击技术,随机观察甲的10次射击,统计各次击中环数 和频数 如下表,求他每次射击击中的平均环数.(其中N= =10).
击中环数
8 9 10
频 数
2 5 3
频 率
0.2 0.5 0.3
解 这是一般求平均数 问题,此时
.
写成一般形式就是
.
若要全面考察甲的射击技术,仅凭这10次观察是不够的,因为频率 是与该次射击(试验)的结果有关的. 但当观察次数N不断增多,由于频率稳定于概率 ,和式 就稳定于 . 它是一个确定值,不依赖于具体试验,应该更能表示甲的射击水平. 把上述例子一般化就导出了下述定义.
定义1 设离散型随机变量ξ的分布列为
,
如果级数 绝对收敛,即
= . (1)
注:条件
例2 退化分布 的数学期望 = = , 也即常数的数学期望就是它本身.
例3 二项分布 = , ,的数学期望
= =
=
=
= = .
特别当n =1时,得到两点分布 (0—1分布)的数学期望为 .
例4 泊松分布 = , = 0, 1,… 的数学期望
= = = = =λ.
故泊松分布中参数λ就是它的数学期望.
例5 几何分布 = , k =1, 2,…, 0
= = = =
= = = .
上述各例中,或者只有有限项,或者 都为非负的,故未验证级数的绝对收敛性.当 可取无穷多个值,且其中有正有负时,绝对收敛性的验证是必要的.
例6 设P( = ) , k = 1, 2, …. 因
(调和级数),
虽有 (莱布尼兹级数),仍说 不存在.
二、连续型随机变量的数学期望
若ξ是连续型随机变量,其密度函数为 ,则其数学期望的定义可借鉴离散型情形的定义及普通积分的导出过程来引入. 先设ξ只在有限区间 [a, b] 上取值,将 [a, b]作分割: , ξ落在各小段的概率
P ( ) = ≈p (
近似地视为落在一点上的概率,此时与它相应的离散型随机变量的数学期望为 . 令n→∞, max{ ,则和式的极限为积分 . 自然把它作为ξ的数学期望. 如果 在整个实轴 上取值,让 , 就得如下的一般定义.
定义2 设ξ为连续型随机变量,有密度函数 ,则当 时,称
= (2)
为 的数学期望. 如果 ,就称 的数学期望不存在.
例7 均匀分布的密度函数: 时 ,其它情形 为0. 它的数学期望
= = .
例8 指数分布密度函数: 时 , 时 , . 它的数学期望
= = .
如果注意到指数分布与泊松分布的关系,上述结果是容易理解的.
例9 正态分布 ~ 的数学期望.
因为 , 故 存在.
=
= +
= .
上述第二个等式系通过变量代换 得出. 因此正态分布 中参数 表示它的均值,这在密度函数的图形中已显示出来了.
例10 柯西(Cauchy)分布的密度 , 由于 , 故它的数学期望不存在.
三、一般定义
上一小节中我们把连续型随机变量的数学期望定义作 的极限 . 如设 的分布函数为 , 则
= = .
由此我们引入一个新的积分,叫做斯梯尔吉斯(Stieltjes)积分,而把上式右端的极端记作 . 关于斯梯尔吉斯积分的性质请参见本章末补充与注记1.
定义3 设随机变量 有分布函数 ,若 , 则称
= (3)
为 的数学期望. 当 , 就称 的数学期望不存在.
顺便指出, 对于这类积分,有
由此对任何随机变量 ,概率 可写成 = . (4)
四、随机变量函数的数学期望
定理1 设 是随机变量, 是一元波雷尔函数, . 和 的分布函数分别为 和 ,则
(5)
这一定理的严格证明要用到测度理论中的积分论. 但就常见的特殊情况还是容易证明的. 例如, 设 有密度 , 严格单调增加,它的反函数 有连续导数,那么由第二章§5 (4)式, 有密度函数 , 而 , 所以
.
另一方面若令 , 则 ,上式右边等于
= .
所以此时(5)式成立.
(5)式在计算随机变量函数的数学期望时很有用. 事实上,如利用(3)式计算,要先按第二章§5的方法求得 的分布函数,相当繁复. 而由(5)式,则可从 直接计算 . 特别当 有密度 时,(5)式就是
=
例11 设随机变量 服从[a, b]上的均匀分布,求 的数学期望.
解 = = = .
定理1的结论可推广到随机向量的函数上.设 的分布函数为 ,而 是 元波雷尔函数,则
= . (6)
特别地有
= = ,
其中 是 的分布函数,即 的第i个一维边际分布. 对二元分布函数 有
= , =
等等.
五、数学期望的基本性质
性质1 若 ,则 存在且 . 特别若 , 则 .
性质2 若 都存在,则对任意常数 及 , 存在,且
= . (7)
特别地我们有
= , = .
性质3 若 相互独立,各 存在,则
(8)
证 因为
=
=
故 存在, 类似地可证(8)式成立.
例12 设 服从二项分布 ,求 .
解 在例3中已算得 , 现在利用性质2来计算 .
设计一个伯努里试验,记
.此时 服从0-1分布, , 且 .故 = .
例13 设 是服从超几何分布的随机变量,即
= , ,
求 .
解 设计一个不放回抽样. 令 为第 次抽取时的废品数,则 = .由第一章已知 , , 故 .
例14 设随机变量 独立同分布,有密度函数 .试证对任意 ,
.
证 因 , 具有相同的分布函数,所以对任意 有
,
由此
=
= ,
从而得
= =
下面再看几个数学期望应用的例.
例15 在一个人数很多的单位中普查某疾病, N个人验血,可用两种方法: (1) 每个人化验一次,共需化验N次;2) 个人的血混合化验,如果结果是不含该病菌,说明这k个人都无该病,这样k个人化验一次即可;如果结果是含该病菌,则该组每个人再分别化验一次, 个人共化验 ( +1) 次. 试问用哪一种方法可减少化验次数?
解 记用第二种方法化验时,一组 人中每人所要化验次数为 . 第一种情况是 个人化验一次,则每人化验 次,其概率为
= .
第二种情况是 个人化验 ( +1) 次,每人化验 次, 其概率为
,
所以
.
当 时, , 平均起来能减少验血次数. 如当 时,取 , 则 , 平均能减少40 %的工作量. 如 给定,还可求 使 达到最小.
例16 国际市场上每年对我国某种商品的需求量 服从 [2000, 4000]上的均匀分布.每售出一吨该商品,可获利3万美元; 但若积压于仓库,每吨将损失1万美元. 问应组织多少货源才能使收益最大?
解 收益 是随机变量,故“收益最大”的含义是指“平均收益最大”. 而 与需求量 有关,也与组织的货源 有关. 即
.
而 的密度函数 ,(当 时). 由 式得
.
易见当 时, 达到最大值825万.
例17 有 家企业同时生产某种产品, 年产量为 的有 家, , . 随机(不放回)抽样检查 家,求 家企业产量总和 的数学期望.
解 记
并记第 家企业产量为 ,则
, .
由于各企业被抽到的概率相同, 故 , . 且 = , 故
其中 为各企业产量的平均.
六、条件数学期望
在第二章§4曾引入条件分布的概念,它具有通常分布函数的一切性质. 因此也可以对它求数学期望,称为条件数学期望(conditional expectation).
设在 的条件下, 有条件密度 ,则它的条件期望为
(9)
从第二章§4例知,若 服从二元正态分布 , 则 时, 的条件分布为正态分布 . 于是由一元正态分布数学期望公式可得
.
若以 记 的如下函数:当 时它取值 ,这样定义的 是一个随机变量,对它求数学期望,得到如下有趣的结果:
(10)
这里对连续型随机变量给出证明:设 有联合密度 ,此时 有密度 ,则
.
由 的函数的数学期望公式 ,有
.
当 是离散型随机变量时,记 , 则(10)式就成为
(11)
它类似于全概率公式,称为全数学期望公式(total expectation formula).
例18 设 是同分布随机变量序列,服从二项分布 , 服从泊松分布 ,求 .
解 记 , 则 . 由(11)式
.