3.1统计决策

05-02

第三章统计决策与贝叶斯估计

§3.1 统计决策的基本概念

一、统计判决问题的三个要素

为了估计一个未知参数，需要给出一个合适的估计量，该估计量也称为该统计问题的解。一般地说，一个统计问题的解就是所谓的统计决策函数。为了明确统计决策函数这一重要概念，需对构成一个统计决策问题的基本要素作一介绍。这些要素是：

1).样本空间和分布族；

2).行动空间(决策空间)；

3).损失函数.

以下逐个介绍。

1.样本空间和分布族

设总体X 的分布函数为F (x ; θ)，θ是未知参数θ∈Θ, Θ称为参数空间。

则样本空间: 若(X 1, X 2, " , X n )T 为取自总体X 的一个样本，

样本所有可能值组成的集合称为样本空间，记为χ.

分布族：由于X i 的分布函数为F (x i ; θ), i =1, 2, " n , 则

(X 1, X 2, " , X n )T 的联合分布函数为

F (x 1, x 2, " , x n ; θ)=∏F (x i ; θ), θ∈Θ.

i =1n

若记F ={∏F (x i ; θ):θ∈Θ},则称F ∗为样本(X 1, X 2, " , X n )T 的概*

i =1n

率分布族，简称分布族。

注：若总体X 为离散型变量，则F ∗中的联合分布函数应换成联合分布律。

例3.1设总体X 服从两点分布B (1, p ), p 为未知参数,0≤p ≤1, (X 1, X 2, " , X n )T 是取自总体X 的样本,则样本空间是集合

χ={(x 1, x 2, " , x n ):x i =0,1, i =1, 2, " n }.

它含有2n 个元素，样本(X 1, X 2, " , X n )T 的分布族为

n ⎧∑x i n −x i ⎪F ∗=⎨p i =1(1−p )∑, x i =0,1, i =1

⎪⎩n ⎫⎪i =1, 2, " , n ,0≤p ≤1⎬. ⎪⎭

2.决策空间（或称判决空间）

对于一个统计问题，如参数θ的点估计，区间估计及其他统计问题，我们常常要给予适当的回答。对参数θ的点估计，一个具体的估计值就是一个回答。在统计决策中，每一个具体的回答称为一个决策，一个统计问题中可能选取的全部决策组成的集合称为决策空间，记为A .

一个决策空间A 至少应含有两个决策，假如A 中只含有 2

一个决策，那人们就无需选择，从而也形成不了一个统计决策问题。

例如，要估计正态分布N (µ, σ2)中的参数µ，µ∈Θ=(−∞, +∞). 因为µ在(−∞, +∞)中取值，所以每一个实数都可以用来估计µ，故每一个实数都代表一个决策，决策空间为A =(−∞, +∞).

值得注意的是，在A 中具体选取那个决策与抽取的样本和所采用的统计方法有关。

例3.2 某厂打算根据各年度市场的销售量来决定下年度应该扩大生产还是缩减生产，或者维持原状，这样决策空间A 为

A ={扩大生产，缩减生产，维持原状}　

3.损失函数

统计决策的一个基本观点和假定是，每采取一个决策，必然有一定的后果（经济的或其他的），决策不同，后果各异。

对于每个具体的统计决策问题，一般有多种优劣不同的决策可以采用。例如，要估计正态分布N (µ,0.22)中的参数µ，假设µ的真值为3，那么采用3.5这个决策显然比10这个决策好的多。如果要作µ的区间估计，则显然[2，4]这个决策比[-5，10]好。统计决策理论的一个基本思想是把上面所谈的优劣性， 3

以数量的形式表现出来，其方法是引入一个依赖于参数值θ∈Θ和决策d ∈A .的二元实值非负函数L (θ, d )≥0,称之为损失函数，它表示当参数真值为θ而采取决策d 时所造成的损失，决策越正确，损失就越小。由于在统计问题中人们总是利用样本对总体进行推断，所以误差是不可避免的，因而总会带来损失，这就是损失函数定义为非负函数的原因。

例3.3设总体X 服从正态分布N (θ,1)，θ为未知参数，参数空间Θ=(−∞, +∞)，决策空间自然地取为A =(−∞, +∞)，一个可供考虑的损失函数是L (θ, d )=(θ−d )，

当d =θ，即估计正确时损失为0，估计d 与实际值θ的距离d −θ愈大，损失也愈大。 2

如果要求未知参数θ的区间估计，损失函数可取为

L (θ, d ) =（d 2−d 1）,θ∈Θ，d =[d 1, d 2]∈A ,

其中A ={⎡⎣d 1, d 2⎤⎦：−∞

也以区间估计的长度来度量采用决策d =⎡⎣d 1, d 2⎤⎦所带来的损失，

可以取损失函数为

L (θ, d ) =1-I ⎡d 1, d 2⎤(θ), θ∈Θ，d =⎡⎣d 1, d 2⎤⎦∈A , ⎣⎦

其中I ⎣⎡d , d ⎦⎤(θ)是集合的示性函数，即 12

⎧⎪0，θ∉⎡⎣d 1, d 2⎤⎦, I ⎡θ=()⎨⎣d 1, d 2⎤⎦⎪1, θ∈⎡⎣d 1, d 2⎤⎦. ⎩

这个损失函数表示当决策d 正确（即区间⎡⎣d 1, d 2⎤⎦覆盖未知参数的实际值）时损失为0，反之损失为1.

对于不同的统计问题，可以选取不同的损失函数，常见的损失函数有以下几种。

(1)线性损失函数

⎧k (θ−d ), d ≤θ⎪L (θ, d ) =⎨0 (3.1) ⎪⎩k 1(d −θ), d >θ

其中k 0和k 1是两个非负常数，它们的选择常反映行动d 低于参

数θ和高于参数θ的相对重要性，当k 0=k 1时就得到

绝对值损失函数

L (θ, d )=λ(θ)θ−d (3.2)

(2)平方损失函数

L (θ, d )=(θ−d ) (3.3)

(3)凸损失函数

L (θ, d ) =λ(θ)W (θ－d ) , (3.4) 2

其中λ(θ)>0是θ的已知函数且有限，W (t )是t >0上的单调非降函数且W (0)=0。

(4)多元二次损失函数，当θ和d 均为多维向量时，可取如下二 5

次型作为损失函数。

L (θ, d ) =(d −θ)A (d −θ) (3.5) 其中θ=(θ1, " θp )，d =(d 1, " , d p ), A 为p ×p 阶正定矩阵，p 为T T T

大于1的某个自然数。当A 为对角阵即A =diag (ω1, ω2, " , ωp )时，则p 元损失函数为

L (θ, d )=∑ωi (d i −θi ), (3.6)

i =1p

其中诸ωi (i =1, 2, " , p )可看作各参数重要性的加权。

将统计决策方法用于实际问题时，如何选择损失函数是一个关键问题，也是一个难点。一般来说，选取的损失函数应与实际问题相符合，同时也要在数学上便于处理。上面提到的二次损失（又称平方损失）函数是参数点估计中常用的一种损失函数。

二．统计决策函数及其风险函数

1．统计决策函数

给定了样本空间χ和概率分布族F ∗，决策空间A .及损失函数L (θ, d )这三个要素后，统计决策问题就确定了。此后，我们的任务就是在A 中选取一个好的决策d ，所谓好的决策是指有较小的损失。对样本空间χ中每一点x =(x 1, x 2, " , x n )，可在 6T

决策空间中寻找一点与此对应，这样一个对应关系可看作定义在样本空间χ上而取值于决策空间A 内的函数d (x ) .

取值于决策空间A 内的定义3.1 定义在样本空间χ上，

函数d (x ) ，称为统计决策函数，简称为决策函数。

。当有了形象地说，决策函数d (x ) 就是一个“行动方案”

样本X 后，按既定的方案采取行动（决策）d (x ) 。在不致误解的情况下，也称d (X )=d (X 1, X 2, " , X n )为决策函数，此时表示

当样本值为x =(x 1, x 2, " , x n )时采取决策d (x )=d (x 1, x 2, " , x n )，T 因此，决策函数d (X ) 本质上是一个统计量。

例如，设总体X 服从正态分布N (µ, σ2)，σ2已知，(X 1, X 2, " , X n )为取自X 的样本，求参数µ的点估计。此时可用1n =∑x i 来估计µ, d (x ) =x 就是一个决策函数。 n i =1

如果要求µ的区间估计，那么

d (x ) =[

－u α，

x +u α]

就是一个决策函数。

2.风险函数

给定一个决策函数d (X ) 之后，所采取的决策完全取决于样本X ，从而损失必然与X 有关，也就是说决策函数与损失函数 7

L (θ, d ) 都是样本X 的函数，因此都是随机变量。当样本X 取不同的值x 时，对应的决策d (x ) 可能不同，由此带来的损失L (θ, d (x )) 也不相同，这样就不能运用基于样本x 所采取的决策而带来的损失L (θ, d (x )) 来衡量决策的好坏，而应该从整体上来评价。为了比较决策函数的优劣，一个常用的数量指标是平均损失，即所谓的风险。

定义3.2 设样本空间和分布族分别为X 和F ∗,决策空间为A ，损失函数为L (θ, d ) ，d (X ) 为决策函数，则由下式确定的θ的函数R (θ, d ) 称为决策函数d (X ) 的风险函数.

⎡⎤⎤R (θ, d )=E θ⎡⎣L (θ, d (X ))⎦=E θ⎣L (θ, d (X 1, X 2, " , X n ))⎦ (3.7)

R (θ, d ) 表示当真参数为θ时，采用决策（行动）d 所蒙受的平均损失，其中E θ表示当参数为θ时，对样本的函数L (θ, d (X )) 求数学期望。显然风险越小，即损失越小决策函数就越好。但是，对于给定的风险函数d (X ) ，风险函数仍是θ的函数，所以，两个决策函数风险大小的比较涉及两个函数的比较，情况比较复杂，因此就产生了种种优良性准则，下面仅介绍两种。

定义3.3 设d 1(X )和d 2(X )是统计决策问题中的两个决策

问题，若其风险函数满足不等式

R (θ, d 1)≤R (θ, d 2), ∀θ∈Θ

且存在一些θ使上述严格不等式R (θ, d 1)

决策函数d 1(X )一致优于d 2(X )。假如下列关系式成立 R (θ, d 1)=R (θ, d 2), ∀θ∈Θ

则称决策函数d 1(X )与d 2(X )等价。

定义3.4 设D ={d (X ) }是一切定义在样本空间上取值于决策空间A 上的决策函数的全体，若存在一个决策函数d *(X )(d *(X ) ∈D ) ，使对任一个d (X ) ∈D ，都有

R (θ, d *)≤R (θ, d ), ∀θ∈Θ

则称d *(X ) 为（该决策函数类D 的）一致最小风险决策函数，或称为一致最优决策函数。

上述两个定义都是对某个给定的损失函数而言的，当损失函数改变了，相应的结论也可能随之而变。定义3.4的结论还是对某个决策函数类而言的。当决策函数类改变了，一致最优性可能就不具备了。

例3.4 设总体X 服从正态分布N (µ, 1), µ∈(−∞, +∞) ，X =(X 1, X 2, " , X n )为取自X 的样本，欲估计未知参数µ，选取损失函数为 L (µ, d )=(d −µ),

则对µ的任一估计d (X ) ，风险函数为

R (µ, d )=E µ⎡⎣L (µ, d )⎤⎦=E µ(d −µ).

922

若进一步要求d (X ) 是无偏估计，即E µ⎡⎣d (X )⎤⎦=µ. 则风险函数是 R (µ, d )=E µ(d −Ed )=D µ(d (X )), 2即风险函数为估计量d (X )的方差。

若取d (X ) ＝X ，则R (µ, d ) =D X =1.　 n 若取d (X ) ＝X 1，则R (µ, d ) =DX 1=1.　

显然，当n＞1时，后者的风险比前者大，即优于X 1。例3.5 设x 1和x 2是从下列分布获得的两个观察值

P (X =θ−1) =P (X =θ+1) =0.5, θ∈Θ=R 现研究θ的估计问题。为此取决策空间A =R ，取损失函数为 L (θ, d ) =1−I (d ),

其中I (d ) 为示性函数，当d =θ时它为1，否则为0。我们知道，

现从样本空间X ={(x 1, x 2)}到决策空间A 上的决策函数有许多，

考察其中三个。

（1）d 1(x 1, x 2)=(x 1+x 2)/2，其风险函数为

R (θ, d 1) =1−P (d 1=θ) =1−P (x 1≠x 2) =0.5, ∀θ∈Θ;

（2）d 2(x 1, x 2)=x 1−1，其风险函数为

R (θ, d 2) =1−P (d 2=θ) =1−P (x 1=θ+1) =0.5, ∀θ∈Θ;

⎧⎪(x +x )/2, x 1≠x 2, （3）d 3(x 1, x 2)=⎨12

x 1=x 2, ⎪⎩x 1−1,

其风险函数为

R (θ, d 3) =1−P (d 3=θ) =1−P (x 1≠x 2或x 1=θ+1) =0.25, ∀θ∈Θ;

假如只限于考察这三个决策函数组成的类D ={d 1, d 2, d 3}，那么d 3是决策函数类中一致最优决策函数，当决策函数类扩大

或损失函数改变时，d 3的最优性可能会消失。

与《3.1统计决策》相关的范文

04-10 高二数学下学期备课组教学计划

教学目标、教材的重点通过推理与证明的教学，进一步体会合情推理、演绎推理以及二者之间的联系与差异；体会数学证明的特点，了解数学证明的基本方法，包括直接证明的方法和间接证明的方法；感受逻辑证明在数学以及日常生活中的作用，养成言之有理、论证有据的习惯。通过计数原理的教学，使学生掌握两个基本计数原理、排列、组合、二项式定理及应用，会解决简单的计数问题；体验计数与现实生活的联系，充分体会两个基本计数原理 ...

09-11 节能环保社区考评标准

节能环保社区考评标准一、节能环保社区考评原则（一）总体要求以科学发展观为指导，按照《xx市环境保护三年行动计划》（20xx-2014年）和《xx市深入开展全民节能行动实施方案》的目标要求，紧扣资源节约、环境友好主题，深入开展节能环保社区创建活动，全面加强市民节能环保教育，引导形成良好行为习惯，为促进xx“两型”社会建设作出贡献。（二）概念和定义 1、三同时 “三同时”制度是指建设项目中需要 ...

01-21 控制室实习心得体会

控制室实习心得体会 20XX年04月01日至04月14日，我来到了xx航空销售处控制室进行了为期两周的实习，可谓是略有心得。在实习的前两天，我们参加了控制室杨甘敏老师的《IcS系统操作与控制指令》培训，对控制室的主要操作指令进行了学习和考察。主要指令包括基本指令：如修改密码指令AN：旧密码/新密码，城市名查三字码cNTD:T/城市名等；查询指令：查询座位可利用情况AV:城市对/日期，查询票价FD ...

06-08 厂务公开控制程序

　　1目的　　为规范本厂厂务公开工作，特制定本程序。　　2范围　　本程序适用于本厂厂务公开工作进行全过程控制。　　3职责　　3.1厂务公开领导小组　　3.1.1组织机构　　组长：党委书记、厂长　　副组长：工会主席、副厂长、党工部长　　3.1.2领导小组职责　　a)负责厂务公开的领导、策划、协调、沟通工作，组织全厂各级领导和单位按照本程序对厂务公开进行落实。　　b)负责对公开方 ...

10-19 生管部岗位职责及工作程序

生管部岗位职责及工作程序岗位职责 1. 生管主管 1.1 协助厂长安排生产进度,调度生产. 1.2 编排各车间生产进度表,并监督执行. 1.3 归纳统计所有数字,解决影响生产进度的相关问题. 1.4 追踪所有生产部门的生产情况,材料入库情况,确保进度按计划实行. 1.5 制定针车材料配套报表及成型物料配套报表,发现隐患解决问题,确保生产顺利. 1.6 对各部门会影响生产进度的瓶颈,协助沟通.调整

09-12 网上招投标服务合同

（1）国网招标网)是由国网物流服务有限公司（以下简称“甲方”）建设的主要为国网公司电网建设分公司招投标服务的电子商务平台。的服务内容和服务特色请详见《国网招标网会员章程》或浏览本网站相关内容。甲方同意按本合同的约定，为乙方提供本合同所述的服务；（2）公司(下称“乙方”)同意遵守《国网招标网会员章程》的内容，并按本协议的约定接受甲方的服务。为此，双方根据《中华人民共和国合同法》、《 ...

08-16 第八册数学教学计划-

一、教学内容乘法，升和毫升，三角形，混合运算，平行四边形和梯形，找规律，运算律，对称、平移和旋转，倍数和因数，用计算器探索规律，解决问题的策略，统计，用字母表示数，整理与复习。二、教学目标 1、知识与技能方面（1）使学生联系已有的知识和经验，经历从具体问题中抽象数量关系并探索算法和运算律的过程，掌握有关的计算方法和运算顺序，发现并初步理解一些简单的运算规律；初步认识自然数的一些特征；初步理解 ...

02-11 第八册数学教学计划

12-14 2014年春五年级数学教学计划

一、教材内容分析：　　本册教材整体内容分布：（一）数与代数1．因数与倍数2．分数的意义和性质3．分数的加法和减法（二）空间与图形1．图形的变换2．长方体和正方体（三）统计与概率统计（四）数学思想方法数学广角――找次品（五）综合应用1．粉刷围墙2．打电话　　二、学情分析　　五年级二班共有学生41人，这些学生具有较好的基础和良好的学习习惯。在本学期的数学教学活动中，既要重视学生学习习惯的培养，更 ...

11-15 集团公司职工代表巡视化工厂汇报材料

各位领导及职工代表：　　首先，我代表化工厂党政对集团公司首届职代会第五次职工代表巡视检查组到我厂来巡视检查及指导工作表示热烈的欢迎！对于集团公司一年一次的职工代表巡视检查制度，我厂党政始终高度重视，积极配合，充分尊重职工代表的权力和义务，对职工代表们对我厂各项工作所提出的质询和工作意见，我厂年年都是认真核实，采取得力措施加以落实解决。今年，我们依然会一如既往，如实地向各位职工代表汇报我厂的各项工 ...

随机推荐

猜你喜欢

3.1统计决策

·学生党员"遵纪守法,创建和谐校园"承诺书

·国土资源局信访工作典型材料

·2013社会实践的感想

·XX年个人半年工作总结

·网友关于几个热点问题的看法

·国家危废名录

·公司总经理建党就是周年会上致辞

·尘缘飞花,望断天涯

·世界十大酒店集团介绍

·作文让感恩走进心灵

·"百日安全检查"专项整治行动的实施方案

·大学生礼仪实训课总结

·冶金个人专业技术工作总结

·黄鼠狼给鸡拜年

·物业管理处长党员先进性教育党性党风剖析

·老虎山古人类文化遗址导游词

·关于北京法院审判信息网开通网上立案及案件查询功能的通知

·某机房消防工程施工组织设计

·鄂教版下册六年级语文原文填空

·"文明餐桌行动"宣传标语