_假设检验中的P值研究
第24卷第2期2012年6月河南工程学院学报(自然科学版)JOURNAL OF HENAN INSTITUTE OF ENGINEERING Vol. 24,No. 2Jun.2012
假设检验中的P 值研究
杨刚
(陕西理工学院数学与计算机科学学院,陕西汉中723000)
摘要:针对许多统计学教材中关于P 值的叙述抽象而零碎的现象,比较详细、全面地对P 值进行了研究,叙述了在3种
P 值服从的分布、检验中P 值的具体计算方法、用P 值进行假设检验的优点和缺点、如何用P 值进行决策等,并通过实例展示了
如何用临界值法和P 值进行假设检验.
关键词:P 值;假设检验;缺点;决策
中图分类号:C812文献标志码:A 文章编号:1674-330X (2012)02-0065-03
常规的假设检验(又称为临界值法)是根据检验统计量落入的区域作出是否拒绝原假设的决策.在确定α后,拒绝域的位置也就相应确定.α是一个通用的风险概率,这是用域表示的缺点.但根据不同的样本结果
所面临的风险事实上是有差别的,为了精确反映决策的风险度,可利用P 值进行决策.但许多统计进行决策,
学教材中关于P 值的描述常常比较抽象、简要、零碎,所以对其进行比较详细、全面和深入的探讨是十分必要的.
1P 值的概述
1.1P 值的提出
假设检验理论的创立者Fisher 在假设检验中首先提出了P 值的概念.他认为假设检验是一种程序,人们依照这一程序可以对某一总体参数形成一种判断.换句话说,他认为假设检验是数据分析的一种形式,是人们在研究中加入的主观信息.
1.2P 值的计算
P 值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率[1].这种描述比较抽象和含
P 值是抽样分布中大于或小于样本统计量的概率.当左混,下面这种描述就显得比较清楚:如果原假设为真,
P 值为曲线上方小于检验统计量部分的面积;当右侧检验时,P 值为曲线上方大于检验统计量部侧检验时,
分的面积.P 值被称为观察到的(或实测的)显著性水平.
一般用X 表示检验的统计量,当H 0为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的
[2]具体分布,可求出P 值.具体地说,左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即
P =P (X <C );右侧检验的P 值为检验统计量X 大于样本统计值C 的概率,即P =P (X >C );双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2倍,即P =2P (X >C )(当C 位于分布曲线的右端时)或P =2P (X <C )(当C 位于分布曲线的左端时).若X 服从正态分布和t 分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P =P (|X |>C ).
[3]P 值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的.通过P 值,可
以知道在P <α的情况下犯第一类错误的实际概率是多少.如果P >α,那么原假设不被拒绝,在这种情况下,第一类错误并不会发生.P 值也可以说是拒绝原假设的最小显著性水平,或观察到的(实例的)显著性水平,或显著性概率.P 值表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法.
收稿日期:2012-04-12
基金项目:陕西理工学院科研基金项目(SLGKY10-09)
作者简介:杨刚(1973-),男,陕西洋县人,讲师,硕士,主要研究方向为应用统计学与CAD.
·66·
1.3P 值的分布河南工程学院学报(自然科学版)2012年
P 值实际上是一个随机变量,通过对P 值的进一步研究发现,在无效假设(即原假设)H 0成立的条件下,
P 值的分布服从区间[0,1]的均匀分布[4];在无效假设H 0不成立的条件下,P 值的分布不仅受样本含量n 和检验功效1-β的影响,还受总体参数之差以及总体中个体变异的影响,因而理论上其分布较为复杂,不一定服从均匀分布.
1.42个概念的区分
P 值是在H 0成立的情况下,检验统计量X 大于或小于样本统计量C 的概率,而不是X 大于或小于C 条件下H 0成立的概率[5].从条件概率的角度,前者可以表示为P =P (X >C 或X <C |H 0),而后者可以表示为P (H 0|X >C 或X <C ),P (X >C 或X <C |H 0)很小时,P (H 0|X >两者之间并不是等价关系.实际上,
C 或X <C )不一定很小.
2
2.1P 值法的优点和缺点P 值法的优点
P 值法与临界值法处理问题的角度不同.P 值法的核心是计算出现样本值或更极端值的概率,而临界值
[6]法则着重于比较检验统计量的值与临界值的大小
(1)P 值法使用方便.P 值法比临界值法具有以下优点:
在统计推断中,只要涉及假设检验问题,无论是参数的假设检验(如方差分析和回归分析),还是非参数
尺度检验和总体分布的检验),统计分析软件均会给出P 值,从而可以很方便地的假设检验(如中位数检验、
“P -value ”表示,“Sig.”表示.而在临界得出是否拒绝H 0的结论.在统计软件中输出的P 值,有的用有的用
值法中常常需要查表求出临界值,这样比较麻烦.
(2)P 值法的结论更加准确
P 值本质上是在拒绝H 0时犯弃真错误的概率.事实上,在利用P 值法检验时,对于任何大于在P 值法中,
P 的显著性水平α,均可以拒绝H 0.在临界值法中,若拒绝了H 0,则只知道犯弃真错误的概率不超过α,但确切的犯弃真错误概率并不知道,故P 值法的结论更加准确.
2.2P 值法的缺点
(1)P 值是假定原假设为真时所得到的样本观察结果或更极端结果出现的概率,并不是原假设为真的概率的估计值.
(2)由著名的Jeffreys —Lindley 悖论可知,当样本容量很大时,由P 值检验几乎总是得出拒绝原假设的结论.因此,当样本容量很大时P 值并不太适用,几乎失效.
(3)对于多重假设检验问题,利用P 值检验法也不好做出判断.对于P 值检验法的不足之处,在实际工作中,可以借助贝叶斯学派的方法来弥补.
(4)P 值在解决医学领域的某些问题时存在缺陷.在医学领域中,假设检验的P 值虽然能提供精确的概率值,但提供的信息有限,常常仅能回答两组总体参数是否有差别,这种差别无统计学意义,不能回答临床医
[7]生更关心的差别程度和有无临床意义.而效应量的可信区间则能提供更多信息,同时能显示差别的大小
应该把P 值同可信区间的结果相结合,即同时报告P 值和可信区间信息,这样的结及有无临床意义等.因此,
果是才是完整和有效的,它将有助于临床医生结合专业知识得到相应的临床结论.
3
3.1P 值法的应用利用P 值进行决策
计算出P 值后,将给定的显著性水平α与P 值比较,就可做出检验的结论:如果α<P 值,则在显著性水
P 值越小,平α下不能拒绝原假设;如果α>P 值,则在显著性水平α下拒绝原假设.并且,拒绝原假设H 0的
证据越充分;P 值越大,不能拒绝原假设H 0的证据越充分.其实,没有足够的证据拒绝原假设只表明原假设中的参数具有存在的合理性,不排除其他参数存在的可能性,一次检验仅仅表明某个参数值是否合理[8].在
第2期杨刚:假设检验中的P 值研究·67·实践中,当α=P 值时,也即统计量的值刚好等于临界值时,为慎重起见,可增加样本容量,重新进行抽样检验.
3.2P 值法应用实例
2008年某地新生儿的平均体重为3190克,例:由统计资料得知,新生儿体重的标准差为80克,现在从
2009年的新生儿中随机抽取100个,测得其平均体重为3210克,问2009年的新生儿与2008年相比,体重有无显著差异?(α取0.05)
解:H 0ʒ μ=3190,认为2009年新生儿体重同2008年相比没有差异;
H 1ʒ μ≠3190,认为2009年新生儿体重同2008年相比有明显差异.
这是一个双侧检验问题,拒绝域位于分布曲线的两侧.
n =100,又由已知:α=0.05,σ=80,故这是一个大样本且σ已知的问题,故可以采用z 统计量,它服
从标准正态分布:
珋-μ0x 3210-3190z ===2.5.80/σ/查表可得z 分布在α/2处的分位数为z α/2=1.96,所以有z >z α/2,统计量落在了拒绝域,可以进行决策:在α=0.05的显著性水平下,有证据拒绝H 0,从而接受H 1,即认为2009年新生儿的平均体重同2008年相比有明显差异.
此题也可以由P 值进行检验:
因为z =2.5,故由概率的几何意义有:0.5P =1-Φ(2.5)=1-0.9938=0.0062,故P =0.0124,P <α,所以在α=0.05的水平上拒绝H 0,有证据表明2009年新生儿的平均体重同2008年相比有明显差异.4结语
采用临界值法进行假设检验的优点是进行决策的界限清晰,但弱点是进行决策面临的风险比较笼统.采
P 值越小,用P 值进行决策可以精确地反映决策的风险度.在P <α的情况下,拒绝原假设的理由越充分,故
还应注意P 值的缺点和该方法所使用的专业领域用P 值进行假设检验的优点是很明显的.但在具体应用中,
的特点,防止P 值被滥用或误用.
参考文献:
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]M ].4版.北京:中国人民大学出版社,2009:214-215.贾俊平,何晓群,金勇进.统计学[J ].郑州经济管理干部学院学报,2002,17(4):70-71.樊冬梅.假设检验中的P 值[J ].边疆经济与文化,2006(4):62-63.韩志霞,张玲.P 值检验和假设检验[James H ,Robert T ,Bauer P ,et a1.The behavior of the P -value when the alternative hypothesis is true [J ].Biometrics ,1997(53):11-22.J ].科学技术与工程,2010,10(34):8494-8496.吕佳,乔克林.浅谈假设检验中的P -值[J ].北方工业大学学报,2007,19(1):63-65.侯志强,柴文义,宗明刚,等.P -值法及其应用[J ].华西医学,2000,15(4):402-403.康德英,王家良,洪旗,等.循证医学中统计结果的准确表达:P 值与可信区间[J ].南京工程学院学报:社会科学版,2010,10(4):27-32.鲍贵,席雁.统计显著性检验:问题与思考[
The study of P value in the hypothesis testing
YANG Gang
(School of Mathematics and Computer Science ,Shaanxi University of Technology ,Hanzhong 723000,China )Abstract :The description of P value in many statistics teaching textbooks usually is abstract and fragmentary ,so it is necessary to describe relatively in detail and comprehensively study P value.It describes calculating means of P value in three kind of testing ,P val-ue distribution ,the merits and defects of using P value in the hypothesis testing ,and how to make decisions by P value ,etc.Then the study shows how to make hypothesis testing by P value and critical value method by an example.
Key words :P value ;hypothesis testing ;defects ;decision-making