q临界值.ψ值和λ值的含义及其计算
生国卫生缠让!!!!生!旦笠!!鲞笠!翅
g临界值、砂值和人值的含义及其计算
军事医学科学院生物医学统计学咨询中心(t00850)
周诗国胡良平△
【提要】目的进一步阐明qI临界值(用于Newman.Keuls检验)、廿值和A值(出现于某些场合下估计样本含量
或检验效能的公式中)的含义,并找到计算它们的方法。方法从研究口统计量及其概率密度函数出发,阐明q临界值的含义及其计算方法;基于沙值与方差分析及非中心F分布之间的联系,分析砂值与非中心F分布的非中心参数之间的关
系;基于A值与∥检验及非中心,分布之间的联系,分析A值与非中心矿分布的非中心参数之间的关系。结果明确了qI临界值、沙值和A值的含义,找到了借助特定的SAS函数计算出它们的数值的方法。结论砂=/∥v。,即妒值是特
定条件下非中心F分布的非中心参数值5除以试验因素的自由度v;=k一1后开算术平方根的结果;A值则是特定条件下非中心X2分布的非中心参数值6。q临界值、砂值和A值均可用特定的SAS函数计算出来。
【关键词】
多重比较Newman—Keuls检验g临界值吵值A值非中心,分布非中心∥分布非中心参数
若要采用Newman—Keuls检验对单因素多水平设绝域为
计一元定量资料进行两两比较,则需要用到q临界值;g≥q(a,v,仅)
(2)
若要进行多个总体均数比较时样本含量或检验效能的式中,q(a,v,ot)为统计量q的临界值,即统计量g所
估计,则通常需要获得相应条件下的沙值;若要进行服从的分布(不妨记为g分布)的第100(1一Ot)百分多个总体率的比较时样本含量或检验效能的估计,则位数,Ot的取值为小数,且有q≥q(a,v,ot)的概率为
通常需要获得相应条件下的A值¨。J。绝大多数统计ol,即尸[g≥口(a,v,o/)]=d。一般取ot=0.05或O/=
学教科书或专著都收录了有关这些参数在特定条件下0.01。q(a,v,ot)是所比较的两个经排序后的均数之的数值表供读者查阅H一1’,但明确阐述它们的含义及间的跨度口(即每次比较所涉及到的处理组的组数,其在特定条件下如何计算出它们的数值,却很难寻觅相最小值为2,最大值为试验因素的水平数k)、方差分析应的文献资料。本文的目的就在于介绍q临界值、沙中误差项的自由度v及完全无效假设下的试验误差率
值和A值的含义及其计算方法。
(EERC)d的函数。
口临界值的含义及其计算方法
2.q临界值的计算方法g分布的概率密度函数¨”为
1.g临界值的含义
当单因素多水平设计一元定量资料的方差分析结北)=(川[£“州r
d“
(3)
果为拒绝%,接受日。,得出“各总体均数不同或不全相同”的结论时,并不能说明各总体均数两两之间是式中,,(“)=鬻箬“州P…现
否不同,为此,可在前述方差分析的基础上,对均数进g。(,.)=k{中(,.)一①(r—q“)}4~妒(r)
一步作两两比较,也称多重比较(multiple
compari—
r(z)=l“’1已~du=lim
丝!竺!
z(Z+1)…(Z+,z)
SOrl)。均数间两两比较的方法有多种,Newman—Keuls检验只是其中之一。Newman—Keuls检验亦称Student—
Newman.Keuls(SNK)检验,简称q检验。其检验统计÷血蝉凡圳
量q的计算公式为
q:粤型:—竺兰生曰=——=——一=——二二=====三二二=
l(1)
lJ6贾。一弓1、
妒(r)2忑1
P埘2
1
^/丁(一ni+i’
/Ms。,1
q己讯
将正态密度函数看作一个简单函数,则q分布的式中,墨、贾,分别为两对比组的样本均数;s},一墨为两对
概率密度函数是一个二重积分的形式,其形状(或图比组样本均数差值的标准误;MS。为方差分析的误差形)随着宓、v两个参数的变化而剧烈变化。
均方;rt;、nj分别为两对比组的样本含量。统计量q又要求临界值q(a,v,01),则需求解概率方程P[q≥被称为学生化极差(studentizedrange)统计量,检验拒
g(口,v,a)]=仅,即I
P(q)dq=
o孽(口,v,a)
△通讯作者:胡良平,E—mail:LPHu812@sinn.corll
e。,,,。,{(以H)[,:。g。(r)dr]du
dg
2口。早期的q临
万方数据
-28・界值就是直接通过数值积分法计算出来的。
目前的SAS软件已经提供了一个可以用来计算g临界值的SAS函数,即PROBMC函数¨2’”]。其语法规则如下:
PROBMC(distribution,q,prob,u,nparms,
<parameters>、
式中各个参数的含义如下:
distribution:一个标识分布类型的字符串。对PROBMC函数有效的分布共有5种,见表1。
表1对PROBMC函数有效的5种分布及其对应的参数值
分布
参数值
One,sidedDunnett‘DIⅢD难TTl’
Two.sidedDunnett
‘DUNNETl2’MaximumModulus
‘Ⅳ【AXMOD’StudentizedRange
‘RANGE’
Williams‘WILLIAMS’
e:参数值中的任何一个字符既可以大写,也可以小写;每一个字符串的开头和结尾同时用单引号或双引号都可以,但不可以分别用单引号和双引号。
g:当g等于某个具体的数值时(此时,参数prob的取值必须用・代替),其表示服从参数distribution所代表的某种分布的统计量的值;当g的取值用・代
替时(此时,参数prob必须等于一个位于(0,1)之间的具体的数值),表示将通过PROBMC函数求取参数
distribution所代表的某种分布曲线下左侧概率为prob的分位数。
prob:相应分布的概率密度曲线下随机变量的取值位于特定分位数左侧的概率。
鸟与prob必须有且只有一个的取值用・来代替,而PROBMC函数所返回的值正是g和prob两个参数中取值用・来代替的那个参数的值。
":方差分析时误差项的自由度,其计算公式为t,
=(N一1)一(k一1)=N—k。式中的足表示试验因素
的水平数,Ⅳ表示总样本含量,即k个水平组的样本含
量之和。若t,的取值用・来代替,则表示自由度为无
穷大(∞)。
nparms:处理组的组数。对DUNNETTI和DUN—NETT2所对应的分布,组数不包括对照组。比如有一项单因素5水平设计,若以样本均值最小的那个组作为对照组,采用DUNNETT法比较其他组与对照组的总体均值差异有无统计学意义(此时,参数distribution的取值为‘DUNNETTl’或‘DUNNETT2’),在比较样本均值最大的那个组与对照组之间的总体均值的差异
有无统计学意义时,nparms的取值为4;若采用SNK
法对5个总体均值进行两两比较,在比较样本均值最
大的那个组与样本均值最小的那个组之间的总体均值
的差异有无统计学意义时,nparms的取值为5。
parameters:是一个可选项。该选项为一个序列,组成了“nparms”这个参数的具体内容。当试验因素
万方数据
ChineseJoumalofHealthStatistics.Fcb2012.V01.29.No.1
各水平组的样本含量不等时,必须指定该选项。nparms的含义取决于分布的类型。若不指定这些参
数,则意味着假定各组的样本含量相等。
对学生化极差,当自由度t,≠∞且各组的槎本含
量不等时,函数PROBMC无效。
对Williams检验,当各组的样本含量不等时,函
数PROBMC也无效。
【例1】设有某项单因素5水平设计,每个水平
组做4次独立重复试验,测量某项定量指标的取值,并假定资料满足方差分析的前提条件,取检验水准OL=0.05,经单因素5水平设计一元定量资料的方差分析处理,发现试验因素对试验结果的影响有统计学意义,
现欲采用SNK检验进行5个总体均值之间的多重比较,请用SAS计算所需的g临界值。
【分析与解答】
由题意可知,检验水准O/=0.05,
试验因素的水平数k=5,各水平组的样本含量n=4,
故多重比较时的自由度13=N—k:kn—k=k(n一1)=15。所需求取的q临界值为q(5,15,0.05)、q(4,15,0.05)、q(3,15,0.05)和q(2,15,0.05),共4个。可用下面的SAS程序计算出上述q临界值。
datac_q_v;alpha=0.05:
df=15;/母用df表示自由度"术/
doa=5to2by一1;
q=probmc(”range”,.,1一alpha,df,a);
output;end;
run;
odshtml;
procprintdata=c_q—Vnoobs;run;odshtmlclose;quit;
计算结果如表2所示。
表2例1所需的q临界值
沙值的含义及其计算方法
1.沙值的含义
从沙值表中可以看出,沙值是4个参数的函数,这4个参数分别为进行单因素多水平设计一元定量资料
方差分析时的I型错误概率a、I/型错误概率口以及
检验统计量F的分子和分母的自由度v,和v:。
此外,方差分析是以F分布为理论依据的。当%
生国里生筮盐!Q!!生!旦笠!!鲞筮!塑
成立时,方差分析的检验统计量F服从分子和分母的自由度分别为v.和1,:的中心F分布。当日0不成立时,方差分析的检验统计量F服从分子和分母的自由度分别为1,,和v:、非中心参数6≠0的非中心F分布。中心F分布只是非中心F分布的一个特例(非中心参数6=0)。根据非中心F分布的非中心参数值的计算方法及相应的SAS函数,笔者对非中心F分布的非中心参数值进行了探索性的计算,并将计算结果与统计学教材或专著中给出的相应条件下的砂值进行比较,结果表明:沙值并不是非中心F分布的非中心参数值,而是使方差分析同时满足下面两个条件时的非中心F分布的非中心参数值6除以试验因素的自由度v。(即检验统计量F的分子的自由度)后开算术平方根的结果,即沙
=∥v,。两个条件为:
(1)拒绝巩时可能犯错误的最大概率为Ot;(2)不能拒绝日0时,若接受风,可能犯错误的最
大概率为/3。
2.沙值的计算方法
(1)确定单因素多水平设计一元定量资料方差分析的I型错误概率Ot、Ⅱ型错误概率卢以及检验统计量,的分子和分母的自由度v。和v:;
(2)用F分布的分位数函数FINV求出与分子和分母的自由度分别为nay和day、分布曲线下左侧概率为1一d的中心F分布对应的分位数FINV(1一d,nay,
day);
(3)用非中心F分布的非中心参数函数FNONCT求出与分子和分母的自由度分别为nay和day,分位数为FINV(1一d,nay,day)、分布曲线下左侧概率为卢的非中心F分布的非中心参数值FNONCT(FINV(1一
Ot,nay,day),nay,day,卢);
(4)由公式沙=锣v。=桫州厂计算出沙值。
比如:当O/=0.05,nay=2,day=10,/3=0.10时,
函=
./FNONCT(FINV(1一a,nff,day),nay,day,f1)/nay
=SQRT(FNONCT(FINV(1—0.05,2,10),2,10,0.10)/2)
=2.9528593959
此结果与从统计学教材或专著中给出的砂值表中查到的结果相吻合。
A值的含义及其计算方法
1.A值的含义
从A值表中可以看出,A值是3个参数的函数,这3个参数分别为进行单因素多水平设计定性资料(结果为二值变量)疋2检验时的I型错误概率n、II型错误概率卢以及自由度V=k一1(尼为试验因素的水平数)。
万方数据
此外∥检验是以疋2分布为理论依据的。当凰成
立时掰2检验的检验统计量疋2服从自由度为V=(k一
1)(2—1)=k一1的中心r分布(结果变量为二值变
量)。当%不成立时掰2检验的检验统计勤2服从自由
度为v=(k一1)(2—1)=k一1、非中心参数6≠0的
非中心疋2分布(结果变量为二值变量)。中心疋2分布只
是非中心x2分布的一个特例(非中心参数6=0)。经
过对非中心疋2分布的研究及相应SAS函数的运用,笔者发现:A值就是使疋2检验同时满足本文“砂值的含义”一节所列出的两个条件时的非中心x2分布的非中心参数值6。
2.A值的计算方法
(1)确定结果变量为二值变量的单因素多水平设计一元定性资料疋2检验的I型错误概率O/、II型错误概率口及自由度v;
(2)根据Ot和v的值,用疋2分布的分位数函数CINV,计算出自由度为v、分布曲线下左侧概率为1一d的中心x2分布的分位数CINV(1一d,v);
(3)根据刚刚计算出来的中心x2分布的分位数CINV(1一O/,v)、v和口的值,用计算疋2分布的非中心参数值的函数CNONCT,计算出自由度为1,、分位数为CINV(1一Ol,1,)、分布曲线下左侧概率为卢的非中心疋2分布的非中心参数值6=CNONCT(CINV(1一Ot,v),v,口)。该非中心参数值就是所要计算的A值,即A=6。
比如:当Qt=0.05,口=0.i0,1,=4时,A=艿=CNONCT(CINV(1一Ot,V),v,/3)=CNONCT(CINV(1—0.05,4),4,0.10)
=15.40505l859
此结果与A值表中查到的结果相吻合。
讨
论
采用SAS函数PROBMC来计算Newman-Keuls检验用的q临界值,既克服了查g临界值表的不便,又提高了涉及q临界值的SAS程序的自动化水平,还降低了相关问题的求解难度。借助SAS函数PROB—MC,不但可以计算相应条件下Newman—Keuls检验的临界值或统计量对应的概率值,而且可以计算相应条件下其他四种检验(One—sidedDunnett、Two—sidedDuper、MaximumModulus、Williams)的临界值或统计量所对应的概率值。
此外,TUKEY法、DUNCAN法和REGWQ法三
种两两比较法用的q临界值或尾端概率值的计算问题也一并得到了解决,因为这三种方法跟Newman—Keuls检验法一样,都要用到q临界值,而且都可以通过SAS函数PROBMC来进行计算,唯一需要注意的是,它们各自所对应的临界值q(a,v,ot)中的参数以及ot的含
义有所不同。
・30・
£堕!!堕!!!婴!!!!坐坐坐.!!盟!堕堕:!进!堕!!:y!!:!!:盟!:!
在借助SAS函数FNONCT及FINV计算tf,值时,specialconditions;whiletheAvalues
are
exactlythenoncentralityparame—
我们发现:当与检验统计量F的分子和分母对应的两ters
ofcorrespondingnoncentralX2distributionunderspecialconditions.
个自由度中至少有一个过大时,SAS程序的返回值为Criticalq-values,沙valuesandAvaluesall
Call
be
computedwithspecial
SAS
functions.
缺失值。这是由于前述条件下SAS函数FNONCT因【Keywords】
Multiplecomparison;Newman—Keul陋test;
计算过程不收敛所导致的结果。可见,用SAS函数Criticalq-value;廿value;Avalue;Noncentral
Fdistribution;
FNONCT及FINV来计算沙值的方法并不完美,尚有Noncentral∥distribution;Noncentralityparameter
一些缺陷。不过,实际工作中几乎不会有检验统计量F的分子对应的自由度超过1万或分母对应的自由度参考文献
超过10亿的情况。因此,用SAS函数FNONCT及1.钱俊,陈平雁.假设检验中计算观察检验效能的意义的探讨.中国卫FINV来计算吵值,完全能够满足实际需要。
生统计,2005,22(3):133-137.
2.郭静,徐勇勇,何大卫.多组比较样本含量及检验效能的线性算图估计.中国卫生统计,2002,19(2):94-95.
DefinitionandComputationofCriticalq-valuesforNewman・3.钱俊,陈平雁.样本率多重比较方法的模拟研究.中国卫生统计,
KeulsTest,aswellas沙valuesandAvaluesforSampleSizeor
2009,26(2):131—134.
PowerEstimation
ZhouShiguo,HuLiangping.Consulting
Cen—
4.刘桂芬主编.医学统计学.第2版,北京:中国协和医科大学出版社,
ter
ofBiomedicalStatistics,AcademyofMilitaryMedicalSciences
2007:66-68,177—178,408,422.
(100850),Beijing
5.中国科学院数学研究所概率统计室编.常用数理统计表.北京:科学出版社,1974:14—16,108.112.
【Abstract】
Objective
To
give
furtherclarificationofthe
6.郭祖超主编.医用数理统计方法.第3版.北京:人民卫生出版社,
meaningsandfindthecomputingmethodsofcriticalq-valuesforNewman—
1988:899.
Keuls
test
as
wellas出values
andAvaluesforsamplesizeor
powerestima-
7.倪宗瓒主编.卫生统计学.第4版.北京:人民卫生出版社,2002:
don.Methods
251.
Based
on
thestudyofstatisticq
and
itsprobabilitydensi—
tyfunction,clarifyingthemeaning
andcomputingmethodofcritical8.马斌荣主编.医学科研中的统计方法.第3版.北京:科学出版社,
q-val—
ues
forNewman—Keulsa廿(orA)value,the
2005:192.
test;According
to
thecluethat
9.孙振球主编.医学统计学.北京:人民卫生出版社,2002:526.correspondinganalysis
of
variance(orX2test)and
noncentral
F(orr)dis—
tribution
ale
relatedeachother,someassumeda沙(or
10.杨树勤主编.卫生统计学.第3版.北京:人民卫生出版社,1996:148—
relationshipsbetween
A)valueandthecorrespondinganalyzed.酬ts
noncentrality
parameter
of
a
noncentralF
150,202,217,220.
11.LouisL,Francois—AD.StatisticalTables,Explained
and(orX2)distribution
were
Thecritical
Applied.World
q-values,廿val-
Scientific
PublishingCompany,NewJersey.London.Singapore.
ues
andAvalueswereclearlydemonstrated.Amethodforcalculatingthe
q-values,沙valuesandHongKong,2002:65-71.
critical
AvalueswithSASfunctionswasfound.
Conclusion
12.朱世武编著.SAS编程技术教程.北京:清华大学出版社,2007:519—
The驴valuesare
not
thenoncentralityparametersof
corre—
522
spondingnoncentralFdistribution,butthepositivesquareroot
ofthe
non—
centrality
parameters
divided
by
thenumeratordegreesoffreedomunder
13.http://www.sfu.ca/sasdoc/sashtml/lgref/z1016947.htm
(上接第26页)
Stat
Med,1998,17:2815-2834.
5.SandierA,GrayR,Perry
MC,eta1.Paclitaxel—carboplatinalone
or
with
9.SuttonAJ,AblamsKR,JonesDR,et
a1.MethodsforMeta—analysisin
bevacizumab
fornon—small—cellcancer.NmedicallungEnglJMed,2006,355
research,Wiley,Chichester,2000.
(24):2542-2550.
10.Cao
Y,TanA,GaoF,eta1.AMeta-analysisofrandomizedcontrolled
、
6.HerbstRS,O’NeillVJ,FehrenbacherL,eta1.PhaseⅡstudyof
efficacy
trialscomparingchemotherapyplusbevacizumabwithchemotherapya-
andsafetyofbevacizumabincombinationwithchemotherapy
or
erlotiniblonein
Metastaticcolorectalcancer.IntJColorectalDis,2009,24(6):
compared
withchemotherapyalone
fortreatmentofrecurrent
or
refracto—
677-685.
ry
non—small—celllungcancer.JCfinOncol,2007,25(30):47434750.
11.KabbinavarFF,Schulz
J,McCleodM,eta1.Additionofbevacizumab
to
7.Reck
M,yonPawelJ,ZatloukalP,eta1.PhaseHItrialofcisplatinplus
bolus
fluorouracil
andleucovorinin
f'trst—Line
Metastaticcolorectal
asfirst—Linetherapyfor
cancer:resultsofa
randomizedgemcitabinewitheitherplacebo
or
bevacizumab
phaseIItrial.JClinOncol,2005,23
nonsquamousnon—small—cell
lung
cancerAVAiL.JClinOnc01.2009.27
(16):3697-3705.
(8):1227—1234.
12.MillerK,WangM,GralowJ,eta1.Paclitaxelplusbevacizumab
versus
8.ParmarMKB,TorriV,StewartL.Extractingsummarystatistics
to
per-
paclitaxelaloneforMetastaticbreastcancer.NEnglJMed,2007,357:
form
Meta—analysesofthepublishedliteratureforsurvivalendpoints.
2666-2676.
万方数据