23 随机化的评价
中国循证心血管医学杂志2013年4月第5卷第2期 Chin J Evid Based Cardiovasc Med,Apr,2013,Vol.5,No.2•
•
101 •
循证理论与实践 •
Meta 分析系列之十一:随机化的评价
曾宪涛,黄伟,沈可
[中图分类号] R4 [文献标志码] A [文章编号]1674-4055(2013)02-0101-03的质量是影响Meta 分析是对原始研究的再次定量研究,故原始研究
Meta 分析整体质量的一个重要部分。若Meta 分析纳入的原始研究质量低,且未对原始研究方法学质量进行正确评价,其结果和结论可能是不正确的,甚至是有害的,从而对临床实践造成误导[1]。因此,需要Meta 分析制作者对纳入的原始研究进行正确、有效的质量评价,包括Handbook Cochrane 作为一个必须的环节在内的各种报告规范中也将纳入研究的质量评价[2]。本文将对从随机化的概述、评判标准、疑问及实例描述4个方面对如何评价随机化进行介绍。1 概述
1.1 相关定义 随机(random ):A Dictionary of Epidemiology(第determined by measurable factors5版)将随机定义为“Governed by chance; not completely [4]
”[3],因此,不难理解成“随机,是机遇而非选择”,即是自然产生的,没有人为的干预因素。
随机化(randomization ):随机化又称为随机分配(random allocation ),是临床科研的重要方法和基本原则之一,是指将研究对象随机地分配到对照试验的各个组(arms )。随机化包括随机序列的产生和实施两大要素,理想的结果是纳入研究的受试对象不知道该序列[5]。
半/类随机化(quasi-random allocation):半随机化也称为假随机化(pseudo randomization),是指纳入研究对象的分配方法并不是真正意义上随机(random ),但在分配研究对象时意在使用一种能够产生可比性好的组别的方法。半随机的方法包括:根据研究对象的生日、星期几或某个月、研究对象的门诊号或住院号或研究对象的入组顺序等。在实践中,这些非随机化的方法相对容易操作,但会导致选择性偏倚[5]。
1.2 随机化的方法 在研究设计中,随机化的方法有两种形式[3]:①随机抽样(random sample),指的是被研究的对象从被研究的目标人群中,借助于随机抽样的方法,使目标人群中的每一个个体,都有均等的机会被选择作为研究对象。②随机分组(random allocation),指将随机抽样得到的样本(或非连续性的非随机抽样的样本),应用非随机化分组的方法,使其都有均等的机会进入“试验组(intervention )”或“对照组(control )”接受相应的试验处理。
能够生产随机化序列的方法有很多种,常见的主要有[4]
randomisation :①简单/(restricted randomisation),如掷硬币等。②有限制的随机化法非限制性的随机法(simple/unrestricted ),如区组法、瓮随机法等。③分
(2012A050)基金项目:湖北省教育科学“十二五”规划(2011CZX01);湖北医药学院2011年度优秀中青年科技创新团队项目2012年度重点课题作者单位:;湖北医药学院442000 十堰2010, 湖北医药学院附属太和医院口腔医学年度教学研究项目(2010017)。
中心(曾宪涛, 黄伟); 武汉大学医学部学科建设与科研管理处(沈可)
通讯作者:沈可doi :10.3969/j.1674-4055.2013.02.002
,E-mail:[email protected]万方数据
层随机化法(stratified randomisation)。
1.3 随机化的益处 正确地使用随机化,可以带来以下三个方面的益处[4]:①最大限度的减少或消除分配治疗方案时的选择或混杂偏倚,产生无偏倚的对照组。②有利于对研究实施盲法,也使使用安慰剂成为可能。③允许使用概率论来表示研究的各组间的结局差异是由机遇造成的可能性。1.4 报告规范中的要求 在2008年发表的针对期刊论文摘要和会议摘要的“CONSORT for abstracts”[6]声明中,建议应该在“Instructions to Authors”中要求作者在摘要里应明确陈述研究对象被随机分配到各试验组,以及分配的方法。
在针对各种类型随机试验的CONSORT 声明及其扩展版中,均明确在条目“随机序列产生方法”中规定了应该报告的内容(表1)。2 评判标准
2.1 随机化的正误方法 至今已经有多种进行随机化的方法,然而,这些方法不一定都是正确的。目前认为非正确随机的方法有:依据出生日期(date of birth)、病例记录号(case record)、就诊日期(date of visting doctor)、星期几(day of the week)、身份证号尾数,研究对象出现的时间或入组的顺序(presenting or enrollment order)等等这样的人为指定的方法。这些看似随机化的方法其实却是非随机的,研究者们有时候可能是无意识的,有时候可能是未吃透定义所致。当然,与完全非随机化相比,这些非正确的随机化的方法也在一定程度上限制了选择偏倚和混杂偏倚,故也称之为“半/类/假随机化”。
正确的随机方法可分为手工的方法和计算机/计算器随机的方法。手工的方法有掷硬币法(coin-tossing )、掷骰子(dice-throwing )、抽签/抓阄法(lot-drawing )以及分发事先洗好的牌,这些方法是合理的生成简单完全随机序列的方法。但是,因这些手工的简单随机化方法的不可预测性,可能对随机性造成损害,执行困难,且缺乏验证试验,故现在已不再推荐使用[14]numbers table。简单随机数字表法(random 单中心进行研究时,是可行的,且因其克服了上述简单随)也是一种手工的方法,在样本量不大,仅在机化方法的缺点,故现在仍在广泛应用。
计算机/计算器产生随机序列的方法是伴随着计算机技术和信息科学技术高速发展而出现的。相对简单随机数字表法,计算机/计算器产生随机序列也可以用于单中心的研究,但更多的是应用于多中心的随机对照试验。常见的描述有:采用SPSS 软件、采用SAS 软件、电脑随机数字生成器等,这些均是正确的随机方法。
2.2 与临床对照试验的区别 较多Meta 分析制作者的一个疑惑就是随机对照试验(randomised controlled trial,RCT )与临床对照试验(controlled clinical trial,CCT )如何区别?其实这个在各版本Cochrane Handbook[1]均进行了较为详细的说
•
102 •中国循证心血管医学杂志2013年4月第5卷第2期 Chin J Evid Based Cardiovasc Med,Apr,2013,Vol.5,No.2
明,主要有以下3点:①若作者明确指出该试验采用随机分配设立对照组,则将之归为RCT ;②若作者未明确提到“随机分配”字眼,而读者亦不能排除其随机分配的可能,则将之归为CCT ;若未明确提到“随机分配”字眼,但可判定是真正的双盲试验,则应归入RCT ;③对于报告了随机分配方法,但未严格采用随机分配的半随机试验亦归入CCT ,半随机化方法包括交替分配、根据出生日期分配等。手册同时强调,因为这种对RCT 及CCT 的划分方式完全由作者决定,而非由读者自己判断,因此并不能反映出试验真实的分类或试验分配过程的质量。
2.3 质量评估工具中的要求 在各种针对随机试验的评价工具[15]中,均将随机化作为必须的评价条目之一,现在经常使用的几种质量评价工具中的要求如表2。3 实践中的疑问
3.1 进行Meta分析时低质量的研究需要剔除吗? 纳入研究的质量也可能是产生异质性的一个来源,且质量越高产生偏倚的可能性就越小。因此,当纳入的随机试验质量有高有低、特别是纳入研究的数目也较多时,Meta 分析制作者常会考虑是否要剔除低质量的研究?笔者认为,只要是符合合格标准[18]的研究均不应该剔除。此类情况,笔者建议无论是否有异质性存在,均根据研究质量的高低进行亚组分析;当纳入研究数目较少时,建议分别剔除合并结果中的低质量或高质量研究行敏感性分析。行亚组分析或敏感性分析的目的有二:一是探讨质量差异是否会导致异质性;
二是比较质量不同的研究合并结果的异同,以便提供更有价值的结果。
3.2 双臂之外的随机试验如何判断? 因为当前最常见的为基于随机平行双臂对照试验的Meta 分析,即只有两个比较组。因此,不少Meta 分析制作者对多臂随机试验随机化的判断感到疑惑。在实际中,除了两组比较,还有三臂、甚至四臂等多重比较[19];除了平行设计,还有区组随机、分层随机等[4]。对于这些随机试验,笔者认为仍然按照双臂的随机试验的判定方法进行判定,因为无论是何种设计方案,只要是随机设计,其随机序列的产生方法必然是一样的,自然其评定也是一样的。
3.3 随机对照试验各臂样本量必须相等吗? 普遍认为,随机试验各臂的样本量应该是大小相等的。真正意义的随机化因为其具有不可预测性,是很难产生样本量大小相等的各臂的。在随机对照试验中,尤其是使用排列区组随机法的非双盲试验中,绝对相等的样本量不仅对提高统计学把握度没有什么帮助,而且潜在的威胁了不可预测性[20]。因此,随机对照试验的各臂的样本量应该是具有差异的,但差异一定是在适当的范围内。实践中常见到的均等样本量的各臂是随机化结果经过人为修饰过的。无论如何,一定要保证各臂的受试对象保证来自同一样本人群。4 实例描述
4.1 真随机 若文中出现了如下类似的语句信息,则为“真随机”:分配受试者时,依据采用计算机生成的随机数
表1 CONSORT报告规范及其扩展版规范中对随机序列的报告要求
随机试验类型随机平行对照试验
[8]
发表年份(最早/最新)2004/20122006/[**************]1/2010最新报告规范中的要求
组及各区组的样本量)
报告分层/分组或匹配(如果使用了的话)的随机化细节
①报告产生随机分配序列号的方法;②报告随机化的类型和任何限定的细节(如如何分区组及各区组的样本量)
报告产生随机分配序列号的方法,包括任何限定情况(如分组、分层)
报告产生随机分配序列号的方法,包括任何限定情况(如分组、分层);如有可能,报告实施者是如何分配到各试验组的
①报告产生随机分配序列号的方法,如有可能,报告实施者是如何分配到各试验组的;②报告随机化的类型和任何限定的细节(如如何分区组及各区组的样本量)
表2 当前常用的质量评价工具中对随机化的评定要求
解释
低偏倚风险:报告使用随机数字表、计算机随机数字生成器、掷硬币、洗牌卡或信封、掷骰子、抽签、或最小化极限值法产生随机序列。高偏倚风险:根据出生日期/出生比、入院时间/日期、住院号/门诊号、医师的判断、受试对象的偏好、实验室检查/系列检查结果、干预措施分组如果报告说明受试者是被随机分配的,则认为该项研究采用了随机分配法。随机分配的具体方法不必详细说明。抛硬币和掷骰子之类的程序应该算是随机方法。半随机的分配程序,例如,按住院号或出生日期分配,或交替分配等,都不符合本标准。
整群随机试验
非劣性和等效性随机试验[9]草药的随机对照试验非药物干预的随机试验[11]针刺干预临床试验动物实验
[13]
[12]
[10]
评价工具名称内容
详细描述了产生随机分配序列的方法,以便(2011年)[1]
评估组间可比性
PEDro 量表(1999年)
[16]
受试者被随机分配到各组(在交叉研究中,受试者的治疗顺序是随机安排的)
Jadad 量表(1996年)
[17]
①未随机/不清楚/假随机;②提及“随机”但未描述具体的随机方法;③采用“随机”并描述了正确的随机方法
万方数据
中国循证心血管医学杂志2013年4月第5卷第2期 Chin J Evid Based Cardiovasc Med,Apr,2013,Vol.5,No.2
•
103 •
字。根据计算机生成的随机序列由一名不参与试验的人员负责分装安慰剂和药物。采用Stata 9.0软件生成随机序列,然后采用1:1的比例分配区组样本量。采用简单随机数字表按照1:1的比例分组。采用随机数字表按照2:1的比例将受试者随机分到实验组和对照组。将患者随机分为试验组和对照组,试验组64人,对照组69人。按照患者的入院顺序,采用掷硬币法,正面分入试验组,反面分入对照组。将患者按照1:2的比例随机分为两组,试验组50例,对照组98例。将患者分为两组,试验组50例,对照组55例;试验组使用A 药,对照组使用安慰剂,安慰剂的色泽、气味、大小及包装与A 药相同,患者及医生均不知晓何者为安慰剂。4.2 假随机 若文中出现了如下类似语句信息,则为“假随机”:将2005年3月~2007年2月间的患者随机分为两组,选择281月为试验组。将患者随机分为两组,试验组2005年3月~2006年2月为对照组,2006年503月~2007年外随机选取同一时期住院患者例。将80例患者随机分为两组,40例作为对照组。按照患者A 组40例,B 例,对照组组40例;另的入院顺序随机,依次分进入到试验组和对照组。按照患者的身份证尾数的奇偶数随机分组,奇数分入到试验组,偶数分入到对照组。根据手术方法随机分组,将使用髓内针内固定的患者作为试验组,使用钢板螺钉内固定的患者作为对照组。根据患者意愿随机分组,将选择使用髓内针内固定的患者作为试验组,选择使用钢板螺钉内固定的患者作为对照组。根据患者入院的单双日进行随机分组,单数日入院的为试验组、双数日入院的为对照组。
4.3 无法判断 此外,尚有很多研究仅提及“随机分组”,但没有报告随机方法(特别是在中文期刊上发表的更为多见),这时候需要评价者结合文中的信息进行判定。若有明显的信息提示为非随机或随机(见上述),则可果断进行判定;若文中信息不足以判定时,可以考虑联系作者,直到实在无法判定时才可以判定为“不清楚”。如:“将100此以外,文中无法获取任何与随机化判定的信息,联系文例患者随机分为A 组和B 组,A 组52例,B 组48例”,除章通讯作者也未获回复,此时应判定为“不清楚”。5 结语
正确的随机化是保证随机试验价值的一个重要前提,也是研究最大限度的避免选择偏倚和混杂偏倚的保证。因此,只有能够正确的对随机化进行判定,才能即避免因为看到“随机”字样就纳入了连“半随机试验”都算不上的研究、又避免了因为没有看到“随机”字样就舍弃了真正的随机试验的失误,从而保证纳入Meta 分析的研究为真正的随机试验。很明显,无论哪一种失误,均可能导致产生发表偏倚、夸大或降低干预效果、或导致异质性的可能。因此,Meta 分析制作者只有真正理解了“随机化”的内涵并能行之有效的鉴定,才能保证制作的Meta 分析的内部真实性。
万方数据
[1] Higgins JPT,Green S. Cochrane Handbook for Systematic Reviews of
参 考 文 献
Interventions Version 5.1.0[EB/OL]. The Cochrane Collaboration, [2] 2011 [2013-02-15]. http://www.cochrane-handbook.org.
曾宪涛, 李胜, 马钻, 等[3] Porta M. A Dictionary of Epidemiology. 5 edition [M]. Oxford: Oxford
[J]. 中国循证心血管医学杂志. Meta分析系列之八,2012,4(6):500-3.
:Meta分析的报告规范
[4] Schulz KF,Grimes DA. Generation of allocation sequences in randomised
University Press,2008.
[5] Glossary of Cochrane terms [EB/OL]. The Cochrane Collaboration
trials: chance,not choice[J]. Lancet,2002,359(9305):515-9.
[6] Hopewell [2013-02-15]. http://www.cochrane.org/glossary.
randomized controlled trials in journal and conference abstracts: S,Clarke M,Moher D, et al . CONSORT for reporting
[7] Schulz KF,Altman DG,Moher D,explanation and elaboration[J]. PLoS Med,2008,5(1):e20.
updated guidelines for reporting parallel group randomised trials[J]. et al. CONSORT 2010 Statement:
[8] Campbell MK,Piaggio G,Elbourne DR,PLoS Med,2010,7(3):e1000251.
[9] Piaggio G,Elbourne DR,Pocock SJ,extension to cluster randomised trials[J]. BMJ,2012,345:e5661.
et al. Consort 2010 statement:
and equivalence randomized trials. Extension of the CONSORT 2010 et al. Reporting of noninferiority
[10] Gagnier JJ,Boon H,Rochon P,statement[J]. JAMA,2012,308(24):2594-604.
randomized controlled trials of herbal interventions: explanation and et al. Recommendations for reporting
[11] Boutron I,Moher D,Altman DG,elaboration[J]. J Clin Epidemiol,2006,59(11):1134-49.
S treatment: t a t e m e n t t explanation o r a n d o m i z e and d t et alr elaboration[J]. i a l . Extending the CONSORT
s o f n o n p h a r Ann m a c o Intern l o g i c [12] Med,2008,148(4):295-309.
STandards MacPherson Acupuncture (STRICTA): extending the CONSORT statement[J]. for H,Altman Reporting DG,Hammerschlag Interventions in Clinical R, et al . Trials Revised
of [13] Kilkenny C,Browne WJ,Cuthill IC, et al. Improving bioscience
PLoS Med,2010,7(6):e1000261.
research reporting: the ARRIVE guidelines for reporting animal [14] Schulz KF. Randomized controlled trials[J]. Clin Obstet Gynecol,1998,
research[J]. PLoS Biol,2010,8(6):e1000412.
[15] 41(2):245-256.
曾宪涛[16] Maher CG,Sherrington C,Herbert RD,质量评价工具, 包翠萍[J]. , 曹世义中国循证心血管医学杂志, 等. Meta分析系列之三, 2012,4(3): 183-185.:随机对照试验的
scale for rating quality of randomized controlled trials[J]. Phys et al. Reliability of the PEDro
[17] Jadad AR,Moore RA,Carroll D,Ther,2003,83(8):713-21.
of randomized clinical trials: is blinding necessary[J]? Control Clin et al. Assessing the quality of reports
[18] Trials,1996,17(1):1-12.
曾宪涛, 孙竹, 汤红明. Meta分析系列之十:合格标准的制定[J]. 中
[19] Schulz KF, Grimes DA. Multiplicity in randomised trials I: endpoints
国循证心血管医学杂志,2013,5(1):6-9.
[20] Schulz KF,Grimes DA. Unequal group sizes in randomised trials:
and treatments[J]. Lancet,2005,365(9470):1591-5.
guarding against guessing[J]. Lancet,2002,359(9310):966-70.
(收稿日期:2013-01-10;修回日期:2013-03-12)