流行病学研究中的偏倚与混杂
中华流行病学杂志,,,年月第卷第期・3$$・
・回顾与思考・
流行病学研究中的偏倚与混杂
任涛
詹思延
沈霞
孟凡亚
胡永华
李立明
要争论集中在病例和对照的选择(特别是医院为基础的研究),如病例的纳入和排除标准,匹配的精确性等。在这一时期,除了一般的关于偏倚来源的讨论外,$B#2年C*-ED6和
偏倚可$B#B年F9%G,>>提出了偏倚的分类学。C*-ED6提出,以出现在以下几种情况:!没有控制的研究;"测量方法的
不同;#在处理自发疾病时的对照研究;$不同时间的比较;%估计的偏倚;&分析假设中的偏倚;’假设检验中的偏倚;(报告中的偏倚。
F9%G,>>等4/列举了48种偏倚可以简化为2种:!阅读相关领域资料时的偏倚;"在分类和选择研究样本时的偏倚;#实施试验过程中的偏倚;$在测量暴露和结局时的偏倚;%在分析数据时的偏倚;&在解释分析结果时的偏倚。在这48种偏倚中,其中有B种被F这些偏倚至今9%G,>>详细的描述过,还为人们所熟悉。包括:现患病例新发病例偏倚、入院率偏(倚、检出征候偏倚、无应答偏倚、选择偏倚、诊断怀疑偏倚、暴露怀疑偏倚、回忆偏倚、家庭信息偏倚。F9%G,>>试图证明这些偏倚的存在与错误估计相对危险度是有联系的。
混杂的历史在某种意义上可以反映研!.混杂的历史:
究设计的历史。可以认为,混杂不是一个统计的或分析的概念,对于混杂的认识,反映了科学推理的逻辑性。在旧约全书中提到,H9’;,=用一个对照组证实规律饮食的作用来反对巴比伦的国王,这经常被释为“第一个临床试验”。这个例子
[]在$作为临床试验研究历史的一B3!年被I;=;,’),=+8引用,页,标题为“其余情况相同”。圣经上的H“混杂”9’;,=理解的
[,]
对偏倚与混杂的认识和定义虽然在不断深入和改变,但流行病学家们从未忽略控制偏倚和混杂的重要性。历史上,对于偏倚的定义已经包含三个主要意思:!观察者的偏见;
"器械错误造成的偏差;#错误的研究设计造成的结果。!"世纪#"年代出现的偏倚类型学对于定义在流行病学研究设计、实施和分析过程中存在的偏离真实值的情况有很大的帮
[,]$!助。随后,偏倚逐渐形成了更加正式和系统的定义。现
代流行病学把偏倚归纳为选择偏倚、信息偏倚和混杂偏倚。混杂可以看作是偏倚的一个特殊类型,在简明牛津英文词典中提到它是一个中世纪的拉丁文词:“”,意思是混%&’()*’+,-,在一起,源自中世纪法语“”。%&’)&’+-,
一、早期的研究
关于偏倚和不精确的区分首先在物理学$.偏倚的历史:中进行了经典的阐述,这是发生在法国大革命时期关于测量的重要讨论,焦点是关于“米”的定义。最初,米是作为最绝对
12)和“直接的”测量单位(地球经线的/。但是,很快人"0$"
们就发现,在实际工作中“米”很难准确测量,后来还发现包括被收藏在国际档案室“米”的白金标准也有偏差。另外,用这种标准测量的“米”在不同的比较中也很不精确。一般而言,绝对的测量不是很精确但是更加真实,只是得到绝对测量的结果比较困难。与此相反,相对的测量结果会更加精确,但是当他们涉及到与自然标准进行比较时可能会有偏差。在医学调查中认识到偏倚已经有很长时间了。$3/4年
在排字工人中发现肺结5*6在研究职业与健康关系的时候,
核与其他疾病的比是$,而在印刷工人中为$,由74./#78.$!此提出由于排字工人缺乏体育锻炼而导致肺结核的高风险假设。5这种风险的差异可以通过工人的自身*6的假设是,选择来解释———那些自身体弱或多病的人可能会选择久坐的工作,这就是最初的选择偏倚;但5*"4名6随后走访了8工人,发现只有$$名工人是由于身体状况的影响而对工作进行了选择;于是选择偏倚被排除了。
流行病学中研究设计的概念被提炼出来以后产生了很多关于偏倚的重要讨论。!随机临床试验"世纪8"年代,(,被用于实践,在医学研究中扮-9’+&:;-;9=?@A)演着“金标准”的角色。同时,也导致了偏倚可以用随机化的方法避免的想法。但是,@&-’);,=+在$B8/年就指出,?@A只是各种推理工具中的一种。在#对于不同研究设计"年代,的优缺点开始了激烈的讨论,尤其是对于病例对照研究;主
作者单位:,北京大学公共卫生学院流行病与卫生统计学$"""34
万方数据系(任涛、詹思延、孟凡亚、胡永华、李立明),医学部图书馆(沈霞)
和我们理解的混杂的意义差不多,这确实让我们可能把混杂的历史延展得很远。然而,多数关于混杂的研究还是集中于近几十年。
研究设计的关键在于比较,任何观察性研究的要点也在于比较。比较可以是一个真实的有两组或两组以上之间的比较,也可以是与想象的比较(与我们的预期相比较)。$B22年J实,-’9-+曾经在医学研究的方法学方面清楚的阐述说,验性研究和观察性研究有一个共同点:这个共同点就是与对照进行比较。在一个实验性研究中,设计者自己制造对照,但是在观察性研究中,设计者要寻找对照。
有关在实验性研究和观察C;==关于因果关系的准则中,
性研究中如何进行比较的内容,在$,B#"年被C9%C9E&’
[]K*E2以及$B#4年F*MM,-引入到流行病学著作中。其中最L
有名的引文如下:“如果在观察性研究中一个事件发生了,或
者没有发生,那在这两种情况下除了一种现象以外,其他现象都相同,那么这种现象就是或可能是这件事例发生的效果或是原因。”;这种“求异法”的观点给医学和流行病学很多启
・4)B・
中华流行病学杂志,,,年月第卷第期示。当然,如,“求同法”、“共变!"##还描述了其他的方法,法”等。无论是从引用!或是从“其余情况都相"##的文字,同”的原则出发,我们让观察性研究尽量等同于实验性研究。一旦“其余情况都相同”的条件不能得到满足,比较就会出现错误,错误的信息导致混乱。这种错误的信息就是混杂,这就是混杂的本质。
$"%&’(可能是最早开始将混杂用于研究设计中的人。他在)《实验设计》一书中用很长的篇幅提到混杂;在他*+,年看来,混杂不是什么“洪水猛兽”,是可以避免的;混杂虽然会给研究设计带来麻烦,但是可以将其向好的方面转化。提到
[]混杂,我们还要提到-他曾经致力于社会科学的方法"%&,,
在历史上的两次飞跃都与C’(29’12(0D"’#@这个名字有关。
[)]
第一次是),在这篇文章中*5*年发表的一篇重要的论文)
他和6,,,:’0%E’#6:9920@F"#"’0D’#@G&"93"0以及H0@’一I起讨论是不是吸烟的人比正常人患肺癌的风险高)还A倍,是由于混入了其他因素所引起的。这篇文章关于吸烟会导致肺癌的基本观念遭到了反对,在反对者中就包括$。"%&’(即能够导致肺癌又使之有吸烟$"%&’(认为是某种潜在因素,的倾向。因而,吸烟与肺癌之间不是因果联系,仅仅是这个潜在因素导致了两者之间的联系。12(0D"’#@和他的同事是支持吸烟与肺癌之间存在因果关系的,但是在他们的论文中并没有用混杂这个词,而是用了“病因性物质”和“非病因性物质”,现在我们称之为“混杂因子”和“混淆变量”;问题的关键是,要想否认吸烟是肺癌的一个危险因素,就必须证明一些因素与吸烟有关,比如说,喝咖啡等是肺癌的真正原因。而且,它要比吸烟与肺癌之间的联系更紧密,否则就永远没有充足的理由推翻以前的论证。我们需要找出潜在的混杂,不能让他们成为不能控制的东西而破坏了研究。
那是关于)12(0D"’#@的下一个贡献甚至更微妙,*,)年的J(J)研究结果的讨论。?KL0"M’(%"/(2=":O’/’%%/=@I?NKI在此,12(0D"’#@阐述了在随机化分组以后混杂仍然存在。在
研究发现口服降糖药的人预J?KL的研究中有这样的情况,后较差,比用胰岛素或者依靠饮食控制的人更多地死于心脏疾病。很快有人指出该研究随机化较差,使口服降糖药组预后较差的原因是该组人群中更多地使用了洋地黄等药物,而且他们年龄偏大,男性较多,肥胖者也较多。
在针对这个问题上,他又没12(0D"’#@接受了这个挑战,
有用混杂这个词,而用了“随机且基线的不均衡性无显著性差异”。他构建了一个多变量预测模型,使用了一个指示变量,并且将其用于不同的治疗组。然后他做了两件事。首先,他演示了在每一个治疗组如何从基线资料估计预后,存在哪些差异,但是这些差异远不及结局中真正的差别;然后,他把所有组按危险因素进行分层,并且再次表明了这样的分层对不同治疗组结局的差异影响甚微。他预示了
B提出的多因素混杂因子。!"’//"0’0)12(0D"’#@的成就在于他说明了即使是在随机化以后,混杂仍需要进行判断。
[
]
学理论的研究;他的关于“一些研究设计的统计问题”仍然值得我们阅读,并且是当代参考书的主要的来源之一,当时确实是混杂开始的时期。关于研究设计,他提出四种变量:!说明性变量,或者“实验性”变量:包括独立的和非独立的;"受控的外来性变量(在选择和估计的时候);#未受控的外来性变量(经常与第一种变量混淆);但$未受控的外来变量,是是随机化的或可以按照随机化的方式进行处理。,混淆于测量-"%&,对于混杂这个词的理解来源于$"%&’(
和选择两种效果内。但是,区别在于-"%&认为这些不同的变量会影响研究的结局。尽管还不是那么明确,但-"%&好像已经将混杂同其他类型的偏倚区分开了。他所提出的第二种类型的受控变量就可以进行测量和选择。当今,混杂这个词确实用于两种结果混淆的一种特殊类型:混淆来自于外部原因,即,其他因素确实影响了疾病的发病率,比如,年龄、性别、习惯或者居住环境。混杂并不是由于测量或者选择的不同带来的问题,现在我们称其为“信息偏倚”和“选择偏倚”。
二、现代的研究
,偏倚是).现代偏倚的正式定义:!"’//"0’012234认为,实验性研究与其他流行病学研究相比真实性的差别。“一般来说,一个非实验性研究设计成功的关键是要仿效实验性研究。”作为金标准的随机临床试验,有三大特点:!安慰剂的使用,即效应的可比性;即人群的可比性;"随机化的应用,即信息的可比性。由此,#盲法的应用,)*45年6’07’和
选择偏倚和信息偏倚。!"’//"0’0提出将偏倚分为比较偏倚、这种分类法也出现在其他流行病学的教科书中,比如(),()的课本中。82/&9:0*4;)6’00’3’0以及
[,]A,选择偏倚是效应测量的一种失82/&9:0?(’00#:0@认为*)真情况,结果导致选择的人群样本与全人群(或目标人群)的效应估计之间存在差异。在研究健康结局时,选择偏倚是指选择的暴露与非暴露人群中的差异;在研究暴露因素时,是指选择有病患者与健康人群之间的差异。与此类似的,信息偏倚也可以概括为一种分类错误(暴露或结局)无法独立于另一种分类的情况。那么,所有类型的偏倚实际上就是在研究设计方面(人群的选择,信息的收集)无法独立于原先的假设,从而使逻辑上的关联替代了真实的关联。
谈到混杂概念B.现代流行病学关于混杂概念的讨论:
[]
[]
三、一些历史事例和争论
[+]
对医院为基础的流).
行病学研究的正确性提出质疑。
作为研究对象时,与仅利用医院服务的人相比较,存在的一种固定偏差;产生这种现象的原因主要是具有多种疾病的患者,入院的概率高于独立患有某种单一疾病的人。
万方数据
中华流行病学杂志,,,年月第卷第期・%#?・
不同;这种改变很有可能被一些现象所干扰,比如糖尿病、瘫痪、中风、先天性传到阻滞、高血压和胃溃疡等。
最初关于良性乳腺疾病与乳腺癌的关系!"检出偏倚:的研究表明,良性乳腺疾病患者倾向于患乳腺癌。后来研究表明这可能与检出偏倚有关,即,患良性乳腺疾病的人会比一般人做更多的检查,包括连续的胸片,这样就更容易诊断出乳腺癌来。#$%&年’()*+,和-.,/(01在一个病例对照研究中论证了这个偏倚。研究显示,早期乳腺疾病与乳腺癌的粗,统计上差异有显著性。但是,如果考虑了研究!"值为!"&
人群接受检查的不均衡性,这种关联就消失了。检出偏倚在病例对照研究中是很常见的问题,相关的讨论都集中在以下两方面:!服用利血平和患乳腺癌的关系;"妇女服用类固醇的危险性。在#有对$2$年的3.4,56).789,.5(:;(+00对偏倚的概括也发表
[]?在该杂志上。
:与控制杂志》赵宁教授所写“肝癌危险因素的@+06C656)
门用一个章节介绍流行病学研究中偏倚和交互作用,并将偏倚归类为选择偏倚、信息偏倚和混杂偏倚,同时对于混杂的概念、大小、方向以及控制进行了细致的探讨,其中一些经典的例子至今仍被不断引用。
然而,迄今为止,虽然流行病学家和统计学家曾对混杂进行过很多探讨,也提出过一些混杂判别的方法以及理论,但一直没有一个公认的、确切的混杂的定义。F.(I(5和Q6:9.)P+,提出的可压缩准则以及@(+00(5+5和8..>提出的可比较准则被一些学者认同,同时也被一些学者认为仅仅是混杂的必要条件,不能作为混杂因素的定义。在我国,北京大学、复旦大学和中山大学合作的国家自然科学基金重点项目“流行病学与统计学相结合进行因果探讨的理论方法与研究”着重对混杂进行了探讨,并提出了基于虚拟实事模型的混杂的形式化
[]#O定义。该研究在探讨混杂的概念和控制方面和世界处于
健康工人效应曾被认为是劳动力选?"健康工人效应:
择的结果,或者说是雇工自我选择以及雇主选择的结果。基于此种原因,在早期的文章中健康工人效应被认为是选择偏倚。但是,只有当有病的@.5
[E]关(从事相应的工作)。A,阐明了健康,,(9(-+,01CD(::(.00.#B
同步水平。明确研究中的偏倚和混杂并加以控制,将有利于流行病学的研究设计、分析和结论,获得更加真实准确的危险因素与疾病之间的关联信息,从而更好的为人类健康服务。
参
考
文
献
工人效应包含了两个过程:身体健康的!最初的选择过程,工人更倾向于选择或者获得特定的工作;"持续性的选择过程,维持工作的人健康状况要比那些放弃工作的人好。幸存者治疗偏倚是一个严重的问E"幸存者治疗偏倚:题,曾经在艾滋病的研究中进行过描述。F+,>
四、结语
随着流行病学的发展,关于偏倚和混杂的文章不断增多,在@从#J;KLMJ数据库中以*(6
从#O?2篇;$$N年开始到!NNE年E月为2OO$篇。人们对偏倚和混杂有了更加深刻的认识,逐渐明确了偏倚的定义,提出了一些偏倚分类的方法,寻求出偏倚的来源并设法加以控制。在我国,以“偏性或偏倚”为主题词,查找8截止@88数据库,到!共检索到文献!其中最早的检索文献为NN?年底,#?篇,
苏德隆教授所著《进入#$%N年全国流行病学术会议资料汇编,
万方数据索到中文文献其中最早的是发表在《中国慢性病预防%$篇,
率与样本的偏性》。以混杂为主题词,截止到!共检NN?年底,
:#F6()6,38LLL"@6RR.,69(:
,,$2%!#U#C#E"65P,(
!@(+00(5+5T’"@60:9(55PP+
,,
,,?’6:>+00;K"F(6
,V(:96,P+00;K,BQ,
::8R+P(:(5+9./0.S,6:0(:+65P0+6:9JF@"M+/W.,>94,:9()),K(I(5
:OK()(+57+)PA@"8+0+,(
,,F4))-(
2Y(
,,V+I#$O$!&U?!%C!?%"
,,%@(+00(5+5T’8..>J="8.57.45P(5+
,@:,6
,65P8.#$%&"
,G#NV.09R65Y3,++5)65P’"@.P+,5+(P+R(.)."!5P+P"SBH:,D9()6P+)9(6K((5:.00CV6I+5#$$%"SSS
##@650+)M,-6+5
,,7,.R,+0,.
2#$C2E%"#!@(+00(5+5T’"’0,60(7(:60(.5*6R4)0(I6,(60+:.57.45P+,
,,3J(P+R(.)#$2&#NEU&N$C&!N"S
#?F+,>
,,P606"F(.R+0F4))#$E&!UE2CO?",,
+77+:0R.P(7(+,+,BHQ
,J77+:0"3T@,#$$?OU%$NC%$#"
耿直"关于混杂概念的讨论"中华流行病学杂志,,#O胡永华,!NN#
!!UEO$CE&#"
(收稿日期:)!NNECN%CN?
(本文编辑:尹廉)