医学科研中的偏倚和交互作用
医学科研中的偏倚与交互作用与控制
第一节 概 念
一、误差
科研设计、实施及分析过程中产生的各种误差(error ),可能导致研究结果不能真实地、精确地反映实际正确的结果。
误差是指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差。因此,必须有“金标准”(golden standard )或相对可靠的标准来度量真实值才能度量误差。研究结果与真实情况的差异即为误差。误差有两类:(1)随机误差(random error),(2)系统误差(systematic error)或称偏倚。
随机误差(random error ):广义的随机误差,泛指因机遇不同估计总体参数时所产生的误差,机遇既可以指选择的机遇,也可以指时间的机遇。如果误差由机遇以外的原因所造成,则为非随机误差。狭义的随机误差指随机抽样所得均值对总体均值的误差。随机误差主要是由抽样误差引起,其中包括一些随机测量误差。抽样误差指随机抽样所得均值对总体均值的误差,它由总体中个体的变异引起,其大小决定于研究设计和评价指标的统计学特点。抽样误差无一定方向,可以相互抵消,并可通过改进抽样技术(如严格遵守随机化原则,分层抽样,增加样本含量,重复试验以及提高抽样对象的受检率,减少失访率等)加以控制,但不可能完全避免。因此在资料分析阶段,必须用统计学方法计算抽样误差的大小。
二、偏倚
偏倚是指在调查研究设计或实施阶段,由于某种或某些因素的影响,使得研究或推论的结果与真实的情况存在系统误差,或指在研究或推论过程中所获得的结果系统地偏离其真实值,属于系统误差。偏倚造成的结果与真值间的差异,具有方向性,它可以发生在高于真值的方向,也可发生在低于真值的方向。
偏倚是影响流行病学研究真实性的重要原因之一,由于有时难以得到判断真实性的金标准,因此即便在很严格的流行病学研究设计之下,也很难判断是否完全避免了偏倚。尽管如此,如果对偏倚的来源和产生原因有了深刻的认识,则有可能最大限度地减少偏倚的发生,以便取得有价值的研究结果。
误差与偏倚都是指测量结果与真值间的偏离。但它们两者之间有着本质的区别。随机误差是由于抽样而致的变异,它无方向性,这种误差是普遍存在的。它可以设法减少但不能完全防止(如随机化抽样,加大样本量)。偏倚是指随机误差以外的误差,是指观察到的均值与真值之间的系统误差,这种误差不能用统计学方法处理,它是由某些较为恒定的不能准确定量的因素造成,重复抽样或加大样本含量并不能使这种误差减少或消失,它只能依靠研究者
的周密设计和科学判断来加以解决。偏倚系非抽样误差,它是错误的,必须努力防止。
三、偏倚的方向
偏倚是一种系统误差,它或偏向于正方向,使原来的真值被夸大;或偏向于负方向,使原来的真值被缩小,因此偏倚是有方向的。
定量并精确地估计偏倚的程度(即偏倚的大小)有困难,而确定偏倚的方向相对比较容易。偏倚的方向指研究人员对事物所产生效应(effect )的估计值是大于或小于效应真值所做出的一种定性判断,不涉及偏倚的大小。
现假定某一欲观察或测量效应值的真实值为θ,而反映在样本中的观测值为θˆ。设定凡是夸大真实效应者为正偏倚,不论真实效应为危险效应还是保护效应,而缩小真实效应者为负偏倚。零效值(null value)是一个统计学中的概念,是指产生零效应的值。例如,对于RR 或OR =1时即为无效值。因此,研究中的真实效应用RR (θ )表示,当RR (θ )=1.0,即为零效应;RR (θ )>1为危险效应,RR (θ )
因此,在具有危险效应RR (θ )>1:
θˆ>θ >1,夸大危险效应,或远离零效应值(或无效值),称为正偏倚;
θ>θˆ>1,缩小危险效应,趋向零效应值,称为负偏倚;
当效应值为保护(预防)效应时,RR (θ )
θ
θˆ
举例说明:
①RR (θ )>1,RR =2.0,是危险效应;
ˆR ˆ=4.0时,它远离零效应值,夸大了原危险效应,R ˆR ˆ被判为正偏倚;R ˆR ˆ=1.5时, 当R
ˆR ˆ被判为负偏倚。 它趋近零效应值,缩小了原危险效应,R
②RR (θ )
ˆR ˆ=0.3时,它远离零效应值,夸大了保护效应,R ˆR ˆ被判为正偏倚; 当R
ˆR ˆ=0.7,它趋近于零效应值,缩小了保护效应,R ˆR ˆ被判为负偏倚。 当R
也有一种称颠倒偏倚(switchover bias),指无论θ >1或θ
第二节 偏倚的类型
一、偏倚的种类
目前将流行病学调查研究过程中出现的偏倚分为三类:
1. 选择偏倚(selection bias ) 指研究者在挑选研究人群时由于选择条件受限制或设计失误所致的系统误差。主要发生在研究设计阶段;
2. 信息偏倚(information bias) 指在收集和整理有关暴露或疾病资料时所出现的系统误差,主要发生在观察、收集资料及测量等实施阶段;
3. 混杂偏倚(confounding bias) 主要由调查中所涉及的混杂因素与疾病和暴露因素三者之间的内在联系所决定,研究者在设计阶段若不注意随机化原则,各比较组间除比较因素外其他非比较因素不均衡,同时在分析阶段又不设法加以控制,即可发生混杂偏倚。
(一)选择偏倚
在设计阶段选择观察对象时,被选入的对象同未选入的对象间在与研究有关的特征方面有系统的差别,同时在各比较组间除比较因素外,其他一些有关因素分布不均衡,导致研究结果系统地偏离真实情况,即为选择偏倚。在各类流行病学研究中选择偏倚均可发生,以在病例对照研究与现况研究中常见。选择偏倚既可产生于设计阶段的选择研究对象,又可产生于资料收集阶段的失访或无应答等。了解选择偏倚的目的是在设计阶段充分考虑其存在的可能性并尽量予以避免,在分析和作结论时要慎重从事。选择偏倚的种类很多,常见的有以下几种。
1. 入院率偏倚(admission rate bias) 又称伯克森偏倚(Berkson ’s bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率不同而导致的偏差。以研究恶性黑素瘤为例,产生的条件是:①研究某危险因素是否同恶性黑素瘤有关时,恶性黑素瘤病例取自医院,对照取自同时住院的其他病例,骨折病人;②恶性黑素瘤,骨折病人由于某医院在治疗某病(恶性黑素瘤或骨折)方面的疗效不同、距离医院的远近不同、病情的轻重程度不同,出现了不同的入院率;③暴露因素本身也有一定的独立的同疾病无关的入院率。于是就产生伯克森偏倚,现举例如下:
假定某研究者计划研究恶性黑素瘤同高血脂的关系,恶性黑素瘤病例取自医院,同时,他从同院某病区随机抽取相应人数的骨折患者作对照。
恶性黑素瘤病人在人群中约有5 000例,骨折患者也有5 000例,具有高血脂因素者在恶性黑素瘤病人和骨折病人中各占15%,并假定恶性黑素瘤、骨折、高血脂三者之间无任何关联(表1),三者的入院率又相对独立。
表1 人群恶性黑素瘤、骨折两病及高血脂的人群分布
病 种
有高血脂者 无高血脂者 总人数
恶性黑素瘤
骨 折 750 750 4250 4250 5000 5000
恶性黑素瘤伴有高血脂同骨折伴有高血脂间的OR =(750×4250)/(4250×750)=1.0 表1资料表明人群中恶性黑素瘤、骨折、高血脂三者之间并无关联,OR =1.0。
现假定恶性黑素瘤和骨折入院率不同,分别为60%及25%,同时伴有高血脂者的入院率为40%(表2)。
表2 来自医院恶性黑素瘤和骨折两病及高血脂的病例分布
病 种
恶性黑素瘤(病例)
骨折(对照) 有高血脂者 570 413 无高血脂者 2 550 1 063 总人数 3 120 1 476
根据不同的入院率计算住院病人数:
恶性黑素瘤伴有高血脂人数:(750×60%)+[(750―750×60%)×40%]=570
骨折伴有高血脂人数:(750×25%)+[(750―750×25%)×40%]=413
恶性黑素瘤住院而无高血脂人数:(5 000―750)×60%=2 550
骨折住院而无高血脂人数:(5 000―750)×25%=1 063
住院病例恶性黑素瘤同高血脂关联的OR =(570×1 063)/(2 550×413)=0.575
从表1和表2结果看,社区样本人群中恶性黑素瘤同高血脂本无任何关联,而以医院病例作为样本所得观察结果,高血脂是恶性黑素瘤的保护(预防)因素,而对骨折则是一危险因素。此即伯克森偏倚,因为它远离无效值1.0,本来是无效,现在则是夸大了其保护效应,或可以说是造成了一虚假的效应,不管它是危险效应还是保护效应,因此该伯克森偏倚是正偏倚。
不同疾病在不同医院的就诊或住院率各异,其原因是多方面的,如群众对某种疾病危害的认识水平,患者所患疾病的严重程度,患者的经济状况,以及就诊方便与否,不同医院的技术专长等等,均可影响入院率。当利用医院住院病人作为病例和对照时,由于对照是医院的某一部分病人,而不是全体目标人群中的一个随机样本;又由于病例只是该医院或某些医院的特定病例,因为病人对医院及医院对病人双方都有选择性,所以作为病例组的病例也不是病人全体的一个随机样本,因此,就同一病因学调查课题,在社区和医院同时做调查,其结论是否相同,取决于病例和对照到医院就诊或住院的就诊率(入院率)。在入院率为100%的情况下,两者的调查结果一致,但在实际工作中很难在医院观察到100%的病例,如果入院率不同,则表现为系统误差。因此利用医院的资料作病例对照研究分析病因时,要警惕可能出现这种偏倚,在解释研究结果时要慎重。
2.现患病例-新发病例偏倚(prevalence-incidence bias) 这种偏倚又称奈曼偏倚(Neyman's bias)。在病例对照研究或现况研究中,用于研究的病例一般是研究期间的现患病例,而不包括死亡病例和那些病程短、轻型、不典型的病例。存活病例中又有新发病例和现患病例。存活病例同死亡病例在所研究的因素方面往往有系统差异,同样新发病例同现患病例间也有这类系统差异;此外,某些病人在患病后,有可能会改变其原来的某些因素的暴露情况,这种用于研究的病例类型(现患病例)显然会与队列研究或实验研究不同(多用新发病例),由此而产生的偏倚即为现患病例-新发病例偏倚。
病例对照研究所得结论常与队列研究结果不一致,其原因除了各自的一般优缺点外,主要是病例对照研究收集的大部分是现患病例,而队列研究可观察新发病例。这两种不同的病例所提供的有关暴露等情况会有很大差别。比如,现患病例,尤其是慢性病的现患病例不能如实、详尽地回忆起较早时期的暴露情况,或因时间过久,某些同暴露危险因素有关的生活习惯等已有很大的改变,更重要的是已分辨不清哪个暴露发生在症状出现之前,哪个在后。而对队列研究来说,由于观察、调查的是新发病例,故很少发生上述问题。
3. 健康工人效应偏倚(healthy worker effect bias) 在生物学群体中,个体差异普遍存在,暴露于同一种危险因素后不同个体的易感性可能不同,高易感性的个体又有主动避免继续暴露的倾向,而低易感性者可能并不在意暴露。例如在进行职业性肿瘤的前瞻性研究时,选择接触职业性毒物的工人作为观察对象,很可能这些工人都是些留下来不易患肿瘤的人员,而对该毒物敏感的那些工人可能一开始就不选择该职业,或者虽然选择了这一职业但因不适应很快调离去从事其他职业或早已转出而失访了,这种偏倚称健康工人效应偏倚。
在流行病学观察研究中完全避免本类偏倚是困难的,特别当评论某些在短期接触后即使人们因能否耐受做出职业选择的危险因素时,应考虑到易感性不同所产生的偏倚。在这种情况下,如选择动物做实验研究或者选择无论被观察者易感性如何,都难以避免遭受暴露的某些偶然事件进行研究时(如广岛原子弹爆炸事件),则有利于获得较客观的结论。
4. 无应答偏倚(nonrespondent bias) 是因为研究样本中的无答复者,即调查对象中那些没有按照研究设计对被调查的内容予以应答或不依研究设计接受治疗者,由于其身体素质、暴露状况、患病情况、嗜好等可能与应答者不同,由此产生的偏倚称为无应答偏倚。这里应强调的是不应答者泛指研究设计中应予调查但因各种原因拒绝回答问题的人或失访的人。如临床研究中对治疗效果、治疗反应等不作回答者称为无应答者。不应答能否带来偏倚,取决于不应答者在疾病暴露等方面的特征与应答者是否有区别。如果差别显著,则产生无应答偏倚。对敏感问题调查时最容易引起不应答偏倚。例如有研究者调查我国南方某县农村婴儿死因时,有26.8%的家长拒绝提供其婴儿死亡原因,而现场调查旁证显示该县当年的新生
儿男女性别之比高达116.8%。这种现象的发生与当地存在重男轻女而溺死女婴的行为有关,由此得到的婴儿死亡原因构成比,显然发生了系统误差。无应答偏倚在观察性研究或实验性研究中均可发生。在队列研究中,无应答偏倚同样存在。
造成无应答的原因是多方面的,如对调查内容是否感兴趣、年龄、受教育程度、身体健康状况、对健康关心程度以及外出未遇等均可影响研究对象的应答率。失访是无应答的另外一种表现形式,指在随访性研究中,研究对象未能按照计划被随访。失访在队列研究中很容易发生,是此类研究选择性偏倚的主要来源之一。
应答率一般至少应达到90%,且各比较组间无多大差别。如某一组的应答率特别低应作专项调查,查明原因。
5. 检出征候偏倚(detection signal bias) 所谓检出征候,指在疾病和暴露之外存在一个征候因素,即一种临床症状或体征。这种症状或体征不是疾病的危险因素,但人们因具有这种征候去就诊,从而提高了早期病例的检出率,致使过高地估计了暴露程度,因而发生了系统误差,最终可能得出该征候因素与该疾病有联系的错误结论。在对一些慢性疾病如恶性皮肤肿瘤、动脉硬化、结石等进行病因研究时,这种偏倚的意义特别重要。例如,1975年Ziel 和Finkle 用病例对照研究设计,从美国加州洛杉矶妇女中研究口服雌激素同子宫内膜癌之间的关系,结果认为两者之间存在高度关联,结论是口服雌激素是妇女患子宫内膜癌的危险因素。1978年,Horwitz 和Feinstein 指出,以上关于口服雌激素与子宫内膜癌相关联的结论是一种检出征候偏倚,两者之间的高度关联是虚假的。因为进一步研究发现使用雌激素可以刺激子宫内膜生长,从而使子宫容易出血。因而服用者较早、较频繁地去求医,从而有可能使医生能较多地早期发现子宫内膜癌病人。相反,那些不服雌激素的无症状子宫内膜癌病人,由于没有或少有子宫出血的症状,因此不会去医院,因而也就不易于被诊断出来,导致子宫内膜癌病例中服雌激素的比重人为地增加了,其结果得出子宫内膜癌与使用雌激素有关的虚假关联。在同一医院不同科室进行的研究发现,服用雌激素的子宫内膜癌病人中,79%为早期病人;而非服用雌激素的子宫内膜癌病人中,早期病人仅占55%。以上实例说明发生选择偏倚的重要原因之一是选入的研究对象在所研究的特征方面同未选入的对象有差异。但有同等重要意义的是如何选择好对照组。它同研究者的临床知识,经验及关于研究变量的特性,对象选入的方法等都有关。因此,在设计中对观察对象进入样本的条件应作严格限制,比如病例组中的病例应严格限制在只选入稍晚期的子宫内膜癌病人,对照组的特征如去医院求治的机会、方便条件等非研究因素同病例组应相同。
6. 时间效应偏倚(time effect bias) 许多慢性病(如恶性肿瘤、冠心病等)自接触有效暴露(内、外环境的危险因素)之日起至出现临床症状止,其间经过一段漫长的潜隐过
程,在此期间他们实际上是有暴露史但未出现症状,用现有检测手段未能发现有症状的病人;但由于无明显的症状,因此常被错误地归入健康对照组内。例如,早在二战之后西方妇女吸烟的人数便迅速增加,但直到20世纪70年代以后才表现出妇女肺癌发生率的明显上升,原因在于开始暴露至发病的时间很长。
类似的情况在遗传性疾病中也有,比如,未到外显年龄的观察对象被分配到健康对照组,常发生结果估计过低的偏倚。因而进行遗传性疾病研究时应特别注意外显年龄,不到外显年龄的对象常排除在观察之外,不管是对照组还是病例组。因此,在进行病例对照研究时,那些暴露后即将发生病变的人,已发生早期病变而不能检出的人,或在调查中已有病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此可能导致研究结果的系统误差。在调查中尽量使用敏感的疾病早期检查技术,或开展观察期足够长的纵向研究,则可以尽可能地控制时间效应偏倚。
7. 排除偏倚(exclusive bias) 研究者在设计时除规定研究对象诊断标准、纳入标准外,还应规定哪些个体不能选作研究对象,即规定排除标准,这些标准在实施期间不得更改。因此,当在研究对象确定过程中,没有依照事先设计要求对等的原则或标准,从观察组或对照组中排除某些研究对象,这样导致因素与疾病之间的联系被错误估计,称为排除偏倚。例如在一项关于阿斯匹林与心肌梗死关系的病例对照研究中,病例组与对照组均不应包括患慢性关节炎者,亦不应包括慢性胃溃疡病人,因前者倾向服用此药,后者则不倾向服用此药。若患这两种疾病者在两组分布不均匀,可导致对阿斯匹林与心机梗死关系的错误估计。
8. 志愿者偏倚(volunteer bias) 这种偏倚在实验性研究中较易出现。一般来说,志愿参加观察研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有差异,因志愿者常被入选为观察对象,而非志愿者常被落选,故这样的观察或研究结果肯定有选择偏倚。例如,进行一项措施(如避免阳光晒伤)以预防恶性黑素瘤发生的观察研究,参加者都是志愿者,而将非志愿者作为对照,以此比较该项措施的效果,这显然难以得出正确结论。
(二)信息偏倚
又称观察偏倚(observation bias),指在研究的实施阶段,在资料的观察、测量及收集方法上,诊断试验的灵敏度、特异度以及患者在提供各种有关信息的准确性方面都可能有所不足,而且这种不足或缺陷在各比较组间有系统的差别或不一致,于是导致在研究的实施阶段产生系统误差。信息偏倚在各种类型的流行病学研究中均可发生,既可来自于研究对象、研究者本身,又可来自于测量的仪器、设备、方法等。信息偏倚的表现是使研究对象的某种特征被错误分类(misclassification ),如某病的患者被错误地认为是非患者,暴露于某因素被错
误地认为是非暴露者等等。常见的信息偏倚有以下几种。
1. 暴露怀疑偏倚(exposure suspicion bias) 研究者在收集并确定病例组的暴露比例时所具有的认真、细致、深入程度同对照组相比有重大的系统差别。这种偏倚主要见于病例对照研究。研究者若事前了解研究对象的患病情况或某种结局,可能影响采用与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认真地调查和询问病例某因素的暴露史,而漫不经心地调查和询问对照组,从而导致错误结论,此即暴露怀疑偏倚。对同一组研究对象以不同的调查方法进行调查,结果可出现很大差异。例如,采用病史记录作为分析资料进行病例对照研究时,因为询问病史的医师知道某些因素和某病发生有关,因此在询问病例病史时特别仔细,常有阳性的记录,而被选为对照的病史,因为医师们知道该因素和对照病例无关,因此询问马虎,阴性结果多,从而产生偏倚。如Nishiyama 等对儿童甲状腺癌过去放射性物质暴露史的调查发现,如以常规和查阅医疗记录方法调查有暴露史者分别为28%和0%;而经过细致的调查和询问,同一对象组的放射性物质暴露史变为47%和50%。可见不可比的调查获得的照射率有明显差异。上例也说明暴露怀疑偏倚往往会夸大可疑致病因素与疾病之间的关联。
2. 诊断怀疑偏倚(diagnostic suspicion bias) 这类偏倚常发生在前瞻性研究中。研究者带有“先入之见”的主观倾向性,以一种主观偏见或愿望来左右诊断,由于研究者事先了解研究对象研究因素的暴露情况,怀疑其已患病,或在主观上倾向于应该出现某种阳性结果,因此在作出诊断或分析时,倾向于自己的判断。于是对暴露者和未暴露者在询问暴露史、疾病史和作各种检查时,采取了不可比的做法,如对暴露者或实验组进行非常细致的检查,而对非暴露者或对照组则不然,这样各比较组所获得的资料就会出现系统误差,从而使研究结果出现偏差,即谓之诊断怀疑偏倚。诊断怀疑偏倚多见于临床试验和队列研究,在病例对照研究中也可产生,特别是在诊断亚临床病例、判断药物的毒副反应时,这种偏倚最容易发生。例如在一项研究口服避孕药与妇女下肢血栓性静脉炎关系的队列研究中,观察者对口服避孕药妇女,会更加频繁和仔细地寻求静脉炎的证据,认真地检查身体,并对更多的怀疑者,作进一步检查,这必然会更多地发现病例,尤其是那些病情较轻,需较复杂准确的诊断检查才能确诊的病例。相反有可能较马虎地检查未服避孕药的妇女,造成结果的偏倚。
此类偏倚亦可发生于研究对象。若研究对象知道自己暴露于研究因素的情况,或了解研究目的,主观因素可能会对研究结果产生很大影响,如对是否出现新症状的主观判断等。
3. 测量偏倚(detection bias ) 测量偏倚指对研究所需指标或数据进行测定或测量时产生的系统误差。如所用调查表设计的科学性、记录是否完整、调查人员对工作的认真程度以及访问方式、态度等等。均可导致不准确的信息,产生测量偏倚。此外如所用仪器、设备
校正不准确,例如调查时需测血压值,但血压计未经校正,而得到血压的偏值;试剂不符合要求,使用方法的标准或程序不统一,分析测试条件不一致以及操作人员的技术问题等等,均可导致测量结果的不正确,使测量结果偏离真值。
4. 报告偏倚(reporting bias) 与回忆偏倚不同,报告偏倚是研究对象的有意做假所造成,即有意的夸大或缩小某些信息而导致的偏倚,因此亦被称作说谎偏倚。最常见的报告偏倚见于敏感问题的调查,例如调查性乱史和中小学生吸烟史,有相当一部分有意掩盖阳性行为,有些人有冶游史,可能隐瞒实情。另一种情况,被调查者为了达到个人目的而有意说谎,例如征兵体检时,愿意入伍者会有意隐瞒病史,而不愿意入伍者有可能故意夸大病史甚至无中生有。在对某些职业人群进行健康调查时,一些研究对象可能会为继续从事该职业而故意缩小某些患病信息,而涉及劳保、福利等,对一些问题的调查如职业危害,研究对象可能会夸大某些暴露信息。因此,对有客观指征或记录在案的事件做调查,常可以避免一部分报告偏倚,或者隔一定时间重复调查,比较前后两次调查的重复性,也可以据Kappa 值判断报告偏倚。
5. 回忆偏倚(recalling bias) 回忆偏倚是指研究对象在回忆以往发生的事件或经历时,由于记忆失真或不完整在准确性和完整性上的差异所致的系统误差。回忆偏倚的大小取决于作对照的人群,例如病例组和对照组或暴露组和非暴露组产生回忆误差的相对比例和程度的不同,既可能产生正偏倚也可能产生负偏倚,偏倚的趋向可以趋近于零也可以远离零。回忆偏倚最容易发生于病例对照研究,在现况研究和回顾性的队列研究中凡涉及需要回忆的调查内容也都可能发生。
回忆偏倚在病例对照研究中最常见,其产生与以下原因有关:①对照组是来自社区的一般人群,与来自医院的病例组相比,对过去的暴露经历更易遗忘或不予重视,而病例组却会对过去暴露经历认真回忆并提供有关信息;②调查事件是很久以前发生的事情,研究对象记忆不清;③调查的事件或因素发生的频率甚低,未给研究对象留下深刻印象而被遗忘。例如Stolley 等研究发现,仅有9%的自费购药病人错误记忆了使用过的最新药品名称,而享受福利或公费医疗者有23%发生记忆错误;Wilcox 等在自发性流产回忆准确程度的研究中发现:由于流产发生的孕周不同对孕妇的重要性不一样,因而被遗忘的程度有显著区别,在受孕前6周内发生的流产者中能回忆起的仅有54%;而在受孕后13周发生的流产者中能回忆起的为93%。该偏倚也可见于疾病家庭聚集性的研究中,例如欲研究银屑病的家族史,发现银屑病的病人比对照组更可能提供银屑病的家族史。然而,再从病例家中未患银屑病的同胞兄弟姐妹中调查,则阳性家族史和对照组相比,这种联系就不存在了。另外,询问技术对研究对象的回忆也有影响,例如向被研究对象提供药物商品目录或展示药物或食物图片,有助于被调
查者的回忆。选择不易为人们所忘记的重要指标做调查,并重视问卷的提问方式和调查技术,将有助于减少调查中的回忆偏倚。
6. 归类错误偏倚(misclassification bias) 或称错分偏倚,错误分类偏倚。每项病症所用的客观诊断试验或测定仪器都有一定的灵敏度和特异度,而灵敏度和特异度都不可能是100%,于是就会产生一定的假阳性和假阴性错误即误诊和漏诊。这就发生了错分,即本应是病人,错将他分入了对照组,而本应是健康者,错将其分入了病例组。错分偏倚在病例对照研究和前瞻性研究中都可能发生。错分偏倚在对疾病状态和暴露状态判断时也都可能发生。混杂因素也可以导致归类错误偏倚。错分有均衡性与非均衡性之分,前者指的是病例组、对照组受到同等程度的错分,而后者指的是病例组、对照组错分的程度不均衡、不一致。如就灵敏度、特异度来讲,两比较组间不一样,比如病例组所用诊断方法的灵敏度为70%,特异度为90%,而在对照组内,则是灵敏度为80%,特异度为60%。严格地讲,错分和产生错分偏倚是两个不同的概念。在一定条件下,错分后可以不产生错分偏倚。例如在队列研究中,如病例的确定在暴露组和非暴露组都以相同比例减少或增加,那么其RR 不变,即虽然有错分发生,但无错分偏倚发生。
7. 诱导偏倚(inducement bias) 调查者的询问技术不正确,或为获得阳性结论,诱使被调查者做某一倾向性的回答,是产生诱导偏倚的原因。诱导偏倚往往表现为对病例组做诱导而对对照组不做诱导或负诱导,由此只能产生虚假的结论。加强公共卫生医师的医德教育,选择合适的人员参加调查,做认真细致的调查技术培训并由负责人复查调查结果,将可以避免或减少诱导偏倚的发生。
(三)混杂偏倚
在评价被研究的因素和疾病之间的关联时,由于一个或多个既与研究疾病有制约关系,又与暴露因素密切相关的外来因素(extraneous factor,或称第三因素)使得资料中研究因素的效应与外来因素的效应混在一起,从而全部地或部分地掩盖或夸大了所研究的因素与疾病之间的真实联系。这些影响谓之混杂偏倚或称混杂(confounding )。那些外来因素称为混杂因素(confounding factor)。混杂偏倚是一种系统误差,可发生在研究的设计阶段,常不易识别从而难以控制,但在资料分析阶段可以用统计学方法加以消除。
混杂因素仅见于多病因疾病的病因学研究中,而不会发生于单病因疾病的研究之中,混杂偏倚也见于由多种因素所致同一结局的某些研究中,如疗效评价或人群干预研究的效果评价等。其原因是因为疾病D 的发生,可以由所研究的暴露因素E 所致,也可由其它的因素,即混杂因素F 所致,因而在估计疾病D 和暴露因素E 之间的联系强度时,存在受其他因素歪曲其真实性的可能性。单病因疾病的病因研究中不存在其他因素的致病效应,因而也就不会
产生混杂偏倚的问题。
1. 混杂因素的基本特点 ①必须是所研究疾病的独立危险因素或效应修正因素;②与所研究的暴露因素有关,但不是暴露因素作用的结果;③混杂因素与所研究的疾病有因果联系或通过其他因素与疾病产生因果联系,但不应是疾病因果链中的中间变量;④混杂因素在人群中的分布与所研究的暴露因素(研究因素)的分布相关。这是混杂因素成立的基本条件。具备这几个条件的因素,如果在比较的各人群组中分布不均,即可导致混杂产生。如在关于长期口服避孕药与妇女血栓栓塞的病例对照研究中,年龄即具备这样的条件,如果病例组和对照组年龄分布不均衡,即可导致对长期口服避孕药与妇女血栓栓塞关系的错误估计。
2.混杂偏倚的判别 在评估一项病因研究(多病因疾病)的RR 值或OR 值真实性时,首先要判断有无混杂偏倚?如存在,混杂因素是什么?判别混杂偏倚可根据其产生的机制,结合专业知识(对该病病因学说和假设的病因因子有所认识),并按下述定量判别混杂因素和混杂偏倚的方法进行分析。
(1)根据专业知识提出研究中可能存在的混杂因素:在流行病学研究中,混杂因素可分为两类:其他未知的病因因子的相关因素或代表因素,常见的为与人口统计学有关的因素;除暴露因素以外的其他病因因素或危险因素。
①人口统计学因素:年龄、性别、种族、职业、经济收入、文化水平等人口统计学指标是经常遇到的可疑混杂因素。以年龄为例,不同年龄人群对疾病的易患程度不同。随着年龄的增长,人体会发生一系列生理、生化、解剖、病理和免疫学的变化,人的社会、经济地位也可能发生变化,在心理和行为等方面变化可能更显著。在流行病学研究中,往往要首先考虑到年龄与发病的关系。例如,在研究妇女使用月经棉(tampon )与中毒性休克综合征(TSS )关系时,因为年轻妇女的月经量丰富(生理变化),他们比中年妇女更喜欢使用高吸收度的月经棉(行为选择),而高吸收度的月经棉比一般的月经棉更容易导致发生中毒性休克综合征,因此,年龄与暴露于月经棉和发生中毒性休克综合征都存在统计学联系,具备了混杂因素成立的条件,如果病例组(中毒组)和对照组年龄分布不均衡,即可导致对月经棉暴露与中毒性休克综合征关联的错误估计。
②暴露因素(研究因素)以外的其他危险因素:研究中混杂因素广泛存在,表现形式多样,常常在隐匿中起到混杂作用。因此流行病学工作者往往要同基础医学家、临床医师及其他公共卫生专家密切合作,才能全面细致地考虑到这些因素的作用。例如研究饮不洁水与食源性腹泻,饮酒与银屑病,吸烟与肺癌之间的关系时,营养不良,吸烟,饮酒各自都可以起到混杂因素的作用。
(2)采用 Mantel-Haenszel的OR 值或RR 值进行判别:测量某一可疑混杂因素的混杂
作用,可以通过比较含有该因素时研究因素与疾病的效应估计值(如RR 或OR ),与排除该因素后效应估计值大小的变化来实现。设含有某可疑混杂因素(f )时,研究因素与研究疾病的效应估计值为cRR 或cOR ,称作粗RR 或粗OR ;按该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作用后的效应估计值为aRR (f )或aOR (f ),称作调整RR 或调整OR ,aRR (f )可用Mantel-Haenszel 分层分析方法计算。现以效应估计值RR 为例(OR 同),测量方法如下:
①若cRR =aRR (f ),则f 无混杂作用,cRR 不存在f 的混杂偏倚。
②若cRR ≠aRR (f ),则f 有混杂作用,cRR 存在f 的混杂偏倚。
③若cRR >aRR (f ),为正混杂(positive confounding ),亦称阳性混杂,即由于混杂因素(f )的混杂作用,使cRR 高估了研究因素与研究疾病之间的联系(指暴露因素为疾病的病因或危险因素时)。
④若cRR
混杂偏倚及其方向与程度也可如下测量:
混杂偏倚=[cRR ―aRR (f )]/aRR (f ) 若值=0,为无混杂。当值≠0,若为正值,为正混杂,高估了关联强度;若为负值,为负混杂,低估了关联强度;值的大小为混杂的程度。
(3)利用分层分析进行定量判别:所谓分层分析是将研究对象按是否暴露于提出的可疑混杂因素(f )分类(最简单可分为暴露组与非暴露两组)。按可疑混杂因素分层后的研究因素与研究疾病的效应估计值称为调整掉混杂作用的效应估计值,用aRR 1(f )和aRR 2(f )来描述。如果其他病因因素和危险因素在两比较组研究对象中的分布完全均衡,同时可疑混杂因素和研究因素之间在产生研究疾病时不存在交互作用,则aRR 2(f )和aRR 1(f )应完全相等。现以效应估计值RR 为例(OR 同),测量方法如下:
①若cRR =aRR 2(f )或aRR 1(f ),则无混杂作用,cRR 不存在混杂偏倚。
②若cRR ≠aRR 2(f )或aRR 1(f ),则有混杂作用,cRR 存在混杂偏倚。
上述测量也可转变为“混杂指数”RF i (index of the degree of confounding )来判别:RF i =cRR /aRR i (f ),式中:RF i 为混杂指数,i 表示分层后的某一层。
① 若RF i =1,则无混杂作用,cRR 不存在混杂偏倚。
② 若RF i ≠1,则有混杂作用,cRR 存在混杂偏倚。
二、 偏倚的控制
偏倚一旦发生就会导致研究结果与真实情况存在系统差异,甚至会得出完全错误的结
论。因此,在进行研究设计时应深入了解、认识各类偏倚,以便在研究过程中尽量加以避免或控制,从而保证研究结果的真实性。
(一)设计阶段
1. 强调严格的科研设计 多数偏倚发生于科研的设计阶段,研究者应充分了解,掌握该项研究工作中各种可能的偏倚来源及其发生情况,以便在具体设计过程中尽量予以避免。在设计阶段,偏倚可来源于选择研究对象或对照的不妥,如抽样方法不正确,诊断标准、排除标准、纳入标准不统一,样本大小不适当,各比较组间缺乏可比性等。例如一项有关两种药物治疗银屑病病人的试验,研究因素为两种药物,非处理因素可能有年龄、性别等,不同年龄,性别间治疗效果可能不一样,设计时应针对这些非处理因素,设法使之在各比较组间分布均衡,从而消除其对治疗效应的影响。偏倚也可来源于决定调查方法和资料收集方法时考虑不同,如调查表设计不好,实验室检测缺乏质控,判断结果缺乏客观指标等。例如在进行磷敷贴与神经性皮炎的关系研究时,发现社会经济地位可能是一潜在混杂因素,并可导致选择偏倚的产生,则设计中规定采取准确记录研究对象的社会经济地位,在分析过程中对该因素影响进行校正,而达到部分控制选择偏倚的目的。在病例对照研究中,理想的研究对象应是社区人群中的全体病例和非该病病例及正常人,或其有代表性的样本,但往往很难做到。虽然在医院选择研究对象易产生入院率偏倚,但对临床科研工作者来说由于方便、易行、应答率高等优点,在实际工作中常被采用。此时最好选用两个或两个以上的对照组,如不同病种对照,其中之一最好取自社区一般人群。如此通过比较不同对照组的结果,可对是否存在选择偏倚作出判断。在队列研究中,条件许可时,最好也应设立多种对照,如对暴露队列既应用内对照又设立比较队列(外对照),或用全人群资料作比较,从而减少选择偏倚对结果的影响。偏倚一旦发生,则一般很难在资料分析阶段加以消除,唯一的方法就是要求研究者进行严格的科研设计来预防这些偏倚的发生。
2. 限制(restriction ) 即对各比较组研究对象的条件加以某种限制。从理论上讲,两组进行比较,除研究因素外,其他因素(非研究因素,非处理因素)应当均相同,这样两组的均衡性好,才能比较研究因素在两组中是否有差异,但临床情况千变万化,事实上是做不到的。例如同一种疾病(如银屑病)发生在不同个体身上,病型、病情、病期及预后都可能不同。因此可在选择研究对象时,针对某一或某些可能的混杂因素,在设计时对研究对象的入选条件予以限制。例如研究吸烟与冠心病的关系时,考虑年龄与性别可能均为潜在的混杂因素,可规定研究对象仅限于某社区内40~50岁的男性居民。在研究口服避孕药与心肌梗死的关系时,考虑到年龄是可能的混杂因素,即仅对35~44岁年龄组的妇女做调查。另外,例如患胃肠道疾病者,不宜选作评价口服药物疗效的对象,因为可能影响药物的吸收。参加疗
效评价的患者也不宜同时患其他严重疾病,这是因为这些患者在研究过程中可能死亡或因病情加重被迫退出,这些在设计时都应限制。值得注意的是对研究对象针对潜在的混杂因素实行限制后,可得到同质的研究对象(homogeneous objective ),从而防止某些混杂偏倚,有利于对研究因素与疾病之间的关系作出较为准确的估计。但是在这种情况下,研究工作就丧失了概括性,即从研究对象中排除某些人群后,所选择的病例不能代表患者总体,对照也不代表一般人群,因而所获得的结论常具有很大局限性,影响研究对象对总体的代表性,使研究结果外推至一般人群时的外推真实性(external validity)受限。另外有一点要交待:采用限制的方法控制混杂因素,一方面只能针对特别重要的混杂因素,先决条件为限制后仍然能保证适当的样本数。另一方面,限制的结果使得研究者不可能对暴露和混杂两因素的交互作用加以分析和度量,只能确保对暴露与疾病之间关系的研究。限制的缺点还在于,在限制混杂因素的同时,对暴露和疾病发生的范围也做了限制,难于观察到暴露因素对研究疾病影响的全貌,因此,作结论时应该慎重。
3. 匹配(matching ) 匹配是指在为指示研究对象选择对照时,为病例组的每一个研究对象匹配一个或几个具有同样特征的对照,然后进行比较;也即使其针对一个或多个潜在的混杂因素(即匹配因素)与指示研究对象相同或接近,从而消除混杂因素对研究结果的影响。匹配在非实验性和实验性研究中均可应用。许多研究者常以年龄、性别、种族、职业、经济收入等人口统计学特征作为匹配条件,因为这些因素可能是最常见的混杂因素。根据具体疾病及研究因素,许多其他因素也可作为匹配条件,如疾病病型、病期、病情程度及先前的治疗等。匹配条件越多,寻找对照就越困难。但有一点必须强调,不能将研究因素作为匹配条件,否则就不能观察该研究因素在比较组间有何差异,这种情况称匹配过度(over-matching ),应注意避免,因此,匹配因素不宜太多,一般认为,以只列入主要的混杂因素为宜。
匹配可分为成组匹配和个体匹配。成组匹配(category matching),又称频数匹配(frequency matching ),是指为一组研究对象配上一个潜在混杂因素频率相似的对照组。成组匹配可看成分层抽样的变种,即先按某些特征将总体分层后,再从各亚层中随机抽取病例,然后按病例在各层的分布比例抽取对照样本。例如若抽得的病例样本中男、女各半,75岁以上者占2/5,则对照组中也应如此。个体匹配(individual matching )是为每一位研究对象根据需要控制的混杂因素配上一个或多个对照。其中1∶1匹配又称配对(pair matching),1∶2,1∶3,1∶R (或1∶M )匹配时,则称为匹配。一般不应超过1∶4。配比的目的是使某些潜在的混杂因素,在各个比较组间有相同或类似的分布,以达到消除混杂因素的目的。另外,匹配时配对变量的单位不应太粗,如年龄配对时应限制在上下2~3岁左右,不应粗到上下10岁的差别,这样便失去限制的作用。匹配的变量应当一致到什么程度,取决于变量的性质、实际可能与
必要,离散型变量(如性别)可以完全匹配。一般除年龄、性别之外,对于其他因素是否引入匹配须持慎重态度,以防止匹配过度及徒增难度和费用。
4. 随机化(randomization ) 指按随机化原则使研究对象都有等同的概率(同等的机会)被分配到各处理组中,从而使潜在的混杂因素,可测量或不可测量及无法预知的非处理因素(非研究因素)在各组间分布均衡。随机化方法常用于实验性研究,以在临床试验中最常用。随机化方法进行分组是消除选择性偏倚最好的方法,它不仅平衡掉治疗组和对照组的各种可能影响疗效或预后的因素,而且也平衡了各种未知的可能影响疗效和预后的因素。随机化分组后可以发现两组的一些基本特征极为相似,表明各比较组间除了研究因素外,其他非研究因素在各组间分布均衡,因此可比性好。随机分配方法可分为简单随机分组(simple randomization )和分层随机分组(stratified randomization )。前者指按照随机分配原则,利用随机化方法直接将研究对象分配在各组中。这种方法适合于对混杂因素不太了解时应用。后者是根据拟控制的混杂因素(如按年龄、性别、病情、病程等)先将研究对象分层,然后再将每一层的研究对象随机分配在各组之中。这种方法适合于对主要混杂因素充分了解时应用。如在一项有关不同药物治疗银屑病的疗效临床试验中,病型为混杂因素,可先将研究对象按不同病型分层,然后再将各层研究对象随机分配到实验组和对照组。
(二)实施阶段
在对结果的观察、测量及收集过程中,偏倚既可以来自研究对象,又可来自研究者本人。
1. 盲法(blinding 或masking ) 可分为单盲(single blinding ),双盲(double blinding )和三盲(triple blinding )。单盲指只有研究者了解研究对象的分组情况而研究对象不知道自己是在试验组还是在对照组。其优点是研究者可以更好地观察了解研究对象,可避免来自研究对象方面的偏倚。缺点是避免不了研究者方面带来的主观偏倚,易造成对试验组和对照组的处理不均衡。双盲指研究者和研究对象都不了解试验分组情况,而是由研究设计者来安排和控制全部试验,由于双盲使调查者和研究对象对分组情况及有关内容均不知晓,因而可以避免诊断怀疑偏倚、暴露怀疑偏倚或报告偏倚等。如此在调查过程中虽然仍有可能发生信息偏倚,导致错误分类,但由于对比组间资料的准确度相似,即使发生错误分类,属于无差异错误分类的可能性较大,可据此对研究结果外推的可靠性作出相应的估计。三盲指不但研究者和研究对象不了解分组情况,而且负责资料收集和分析的人员也不了解分组情况,从而较好地避免了偏倚。其优缺点基本同双盲,但实施起来很困难。
盲法是避免观察者和观察对象发生偏倚的最有效方法,也是消除信息偏倚的有效手段。在进行调查研究时,最好由同一个人对病例组和对照组进行询问调查,询问方式和时间均相同,最好对调查者保密,不让他们知道真正的科研假设。在考核疗效时要实行双盲,考核疗
效者和受试者都不知道真实的治疗内容, 而且在实验室进行各种检查的报告者也不知道谁是观察组,谁是对照组。但是盲法的应用亦有一定的限制,当药物具有特定的气味、颜色或某种显著的副作用;当某种诊疗程序会产生特殊的标记,如放射治疗的皮肤损害、外科手术的疤痕、化疗引起的脱发,这些将导致无法使用盲法观察实验结局。
2. 进行质控(quality control)培训 收集资料和测量指标阶段,对所有技术,包括调查员、实验操作人员和试剂等都要进行质量控制。对调查员要进行统一培训,使其充分了解调查项目的内容或含义,统一标准,统一方法,统一调查技巧。对研究对象要作好宣传、组织工作,以便取得研究对象的密切合作,使其能如实、客观的提供拟收集的信息。对研究中使用的仪器、设备事先应予标定,试剂、试药事先测定以确定是否符合要求。例如在以询问方式收集信息时,如对敏感问题的调查等,某些情况下报告偏倚很难避免,此时可通过调查知情人或采取相应的调查技术以获取正确的信息。对于暴露经历发生久远的调查可通过一定的调查技巧加以避免,如可选择一个与暴露史有鲜明联系的记忆目标帮助其联想回忆等等。
(三)分析阶段
有些偏倚在设计、实施阶段没有很好的注意避免,但在分析阶段可借助一定的统计学方法加以识别和纠正或消除。例如混杂偏倚在资料分析阶段也可以通过一定的统计处理方法予以控制。
1. 分层分析(stratification analysis) 分层是指将科研资料按某些影响因素分成数层(亚组)进行分析。分层是最常用的检出和控制混杂偏倚的方法之一,也是分析阶段控制偏倚的常用手段,特别适用于在设计阶段考虑不周或实施阶段执行不力,但尚有一定资料可寻的可疑混杂因素作分层分析处理。可以将研究资料按照混杂因素分层,可用Mantel-Haenszel 分层分析方法进行分析,得到将混杂因素调整后的效应估计值。例如比较两医院30年内胆道手术的病死率,甲医院共做1 200例,死亡48例,病死率为4.0%。乙医院同期共作2 400例,死亡64例,病死率为2.6%。如粗略比较似乎乙医院病死率较低,经按病情轻重程度分层分析后,结果两医院胆道手术后不同病情的病死率均相同。
2. 标准化(standardization ) 标准化的方法可以看成是对分层分析方法的补充手段。用于两个(或多个)样本(或总体)的指标进行比较时,排除由于内部构成不同对指标可比性的干扰。当不同暴露水平组间混杂因素分布不均匀时,可以选择一种标准构成,来调整原来分布的不均匀性。标化的实质在于考虑某因素分层后的权重,由此推论,OR MH 也可以认为是标化后的计算结果。率的标化分直接标化和间接标化两种方式。当比较两个率时,如果两组对象内部构成存在差别足以影响结论,可用率的标准化加以校正,亦即使可能影响结果的因素受到同等的加权,则这两个率可比且无偏倚,这种方法称为标准化法(或调正)。例如以
粗死亡率标化为例,其标准化的原理是利用某一指定的标准人口构成,消除不同地区在人口构成指标(如年龄、性别等)方面的差别,即计算按标准人口构成校正之后的总率,此率称为标准化率。率的标化有两种方法:①直接法(direct method)是利用标准人口年龄构成和实际年龄别死亡率计算求得死亡率。标准人口应选择有代表性、较稳定、数量较大的人群,例如以世界、全国、全省或本地区的人口为标准人口,时间最好与被标化资料一致或接近。②间接法(indirect method)指以全国或省市各年龄组的死亡率为标准,按下述公式计算间接调整死亡率。
间接调整死亡率=[r ×R /Σ(P i ×R i )]·Σp i
式中r 为各对比组的粗死亡率,R i 为各年龄组的标准死亡率,R 为总标准死亡率,P i 为对比各组的分年龄段人口数。常用的标准化指标有标准化率、标准化死亡比(SMR )、标准化死亡比例比、标准化相对危险度(SRR )。
3. 多因素分析法(multifactorial analysis) 当样本数量不够大,分层分析常不适用,因为应用分层分组的Mantel-Haenszel 方法只能平衡少数混杂因素的作用,且对连续性变量只能用等级分层法,常引起不合理的分组,或者希望研究多种因素(包括暴露因素和各种混杂因素)对研究疾病的综合影响时,可考虑应用多因素分析的方法。在多因素分析时,研究因素和每个混杂因素,都被放在同等地位做分析。常用的多元分析法有:多元协方差分析,logistic 回归模型,Cox 比例风险模型和对数线性模型(loglinear models)等。
(1)多元协方差分析:多用于一些例数不多的观察或实验研究资料的处理。它是通过回归的方法剔除混杂变量的效应,以保证在非处理因素水平相同的情况下用方差分析的方法比较几种处理因素的效应。
(2)多元回归分析:传统的单因素分析方法,在揭示暴露因素与疾病之间关系时,仅能分析单个暴露变量对疾病作用和控制单个的外部变量,而在现代流行病学研究中,尤其是在慢性疾病的病因学研究中,常常涉及到多种致病因素间相互联系,相互制约的复杂链条,对于多因素复合病因中各因素之间的相互联系、相互制约及因素间的联合作用的分析,单因素分析方法显然无能为力。而在设计阶段对研究对象进行限制和匹配的方法仅能控制数量很少的混杂变量,例如匹配法仅能使病例和对照在3~4个混杂变量上进行控制,应用Mantel-Haenszel 分层分析法,最多只能对2~3个混杂变量进行控制。不论在病因和发病因素研究或预后的研究中,危险因素或预后因素与疾病的关系是非常复杂,各种危险因素或预后因素之间可以互相影响,它们对结果的影响大小也不同,要研究上述多因素间的相互作用就必须用多元回归分析法。
在队列研究中,因变量通常为患病状况;在病例对照研究中,因变量常为暴露因素或人
的某特征。如果要想控制多个外部变量的混杂作用,因变量又为二值变量,最常用logistic 回归分析。它能在多变量复杂关系中平衡多种混杂因素的作用,进一步筛选出主要的危险因素或预后因素,及其在决定病因和发病以及预后中的相对比重。logistic 回归分析要求分析人员尚需通晓有关观察变量的生物学知识,以便能在运用logistic 回归分析之前选入恰当的可能成为混杂的变量进行均衡运算和分析,如不能将恰当的可能的混杂因素选入回归模型运算,混杂因素也将控制不了。这里要强调,logistic 回归是根据二项分布或多项分布原理推算出来的,而二项分布要求事件独立。传染病数据具有不独立的性质,一个人是否生病与他周围的人是否生病有一定关系。因此,传染性疾病不符合二项分布,因而原则上也不能用logistic 回归分析。所以logistc 回归分析大多用于恶性肿瘤、心血管疾病的研究。另外,多因素分析法的结果有时并不可靠,因为从理论上讲,多元分析法要求各自变量符合等同协方差矩阵的多元正态分布,且各变量间相互独立,而一般资料难于满足上述要求。
第三节 交互作用与效应修饰
在运用流行病学方法研究暴露因素与疾病或健康状态之间的关系时,常常需要考虑外部变量的影响。外部变量对暴露与疾病的关联可能产生两种作用:一是混杂作用,二是效应修正作用。混杂作用源于选择的各比较组中混杂因素分布不均而造成的,它会歪曲暴露因素与研究疾病之间的真实联系,是研究者极力希望防止的一种偏倚,属于偏倚范畴中的混杂偏倚,需要在研究中加以控制,可以通过恰当的统计技术(分层分析和多元分析)和匹配、限制等方法加以去除。而效应修正作用是外部变量对暴露与疾病关系的一种效应修正,这是在病因研究过程中需要积极探索并予以精确描述的一种效应,以便对研究因素与研究疾病或健康状态之间的关系作出正确的估计。
一、交互作用(interaction )
(一)协同作用与拮抗作用
1. 协同作用(synergism ) 是指两个或两个以上因素间的联合作用效果大于它们单独作用效果之和。例如5%+5%→12%,而不是10%的加成作用。协同作用常用来描述一项作用的生物学机制(biological mechanism)。
2. 拮抗作用(antagonism ) 是指两个或两个以上因素间的联合作用效果比它们单独作用效果之和为小。
(二)交互作用和效应修正作用
1. 交互作用 一般是指两个或多个因素相互依赖发生作用而产生的一种效应。在生物学上是指两个或多个因素互相依赖发生作用而引起疾病或预防和控制疾病。这种情况谓之生物学交互作用(biological interaction )。也有人称协同作用为生物学交互作用。当研究资料中各
研究因素之间存在交互作用时,说明各研究因素的作用不是独立的,一个因素水平改变时与它有交互作用的因素之效应也将发生改变;相反,如相互独立的,一个因素水平的改变不会影响其他因素的效应。
交互作用是描述资料本身所表现出来的关于两个或多个暴露因素联合效应的一个统计学术语,并不表示一定具有生物学意义,即有正交互作用并不意味一定具有生物学的协同作用,有负交互作用也并不等同有生物学的拮抗作用。因此,有交互作用可能有生物学意义,也可能没有生物学意义,而仅仅是一种纯粹的统计现象,所以应将交互作用的概念与生物学上的含义区分开来。
2. 效应修正作用(effect modification) 当暴露因素按第三变量分层后估计暴露在每一层中与疾病的联系强度时,效应修正被定义为暴露因素在各层中与疾病的联系强度(测量的效应)因第三变量的存在情况不一而大小不同,该第三变量称为效应修正因素(effect modification factor )。第三变量在一项研究中是否成为效应修正因素,取决于选用判断暴露和疾病之间联系的指标是用率差(rate difference, RD )还是用率比(rate ratio, RR )。如果暴露效应的测量值(发病概率,率差,率比)在按第三变量分层后在不同层次表现不一致,则可将每一层的效应测量值发病概率、率差、率比分别描述,以显示效应修正因素的效应修正作用。一个潜在的混杂因素在分析时可能发现还是一个效应修正因素。
3. 混杂因素与效应修正因素 进行多因素效应研究的目的是消除混杂作用,尽力发现并精确描述效应修正作用。
①混杂作用产生的机制是混杂因素在暴露组与非暴露组或各比较组中分布比例不均衡所致,它是一种系统误差,而效应修正作用是由于暴露因素与效应修正因素(即分层的第三变量)之间存在交互作用所致,它不是一种偏倚,而是因素间的联合作用。
②混杂作用是研究者希望并极力加以防止或控制的一种偏倚:它属于偏倚范畴中的混杂偏倚,是混杂因素(第三变量)对暴露因素与研究疾病两变量之间联系强度的一种歪曲,它可以通过在设计阶段运用限制法、匹配法或在资料分析阶段通过恰当的统计分析技术(如Mantel Haenszel 分层分析和多因素分析、标准化法)加以去除。而效应修正则是研究者极力希望报告的一种结果,不是极力要避免的一种偏倚,它不属于偏倚范畴,而是因素间的联合作用。效应修正作用是一种客观的效应,是效应修正因素对暴露因素作用的影响,应对此效应加以精确的描述。
③混杂被认为是不利于研究的偏倚,其存在与否取决于研究设计。混杂源于在选择的各比较组中混杂因素分布不均,有限制的选择研究对象可以有效地防止一个可以产生混杂效应的因素成为混杂因素。然而效应修正作用不会有损于研究结果的真实性,它的存在与否取决
于研究分析的指标(或确定交互作用时使用的模型有关),是研究中存在的一种客观现象,研究者应可能地把研究中的效应修正因素寻找出来。
二、效应修正作用与混杂作用的识别
医学研究中混杂作用可与交互作用并存,不仅常见于病例对照研究,也可出现于前瞻性的纵向研究或随访研究之中,因此,必须加以辨别。
从上述可知:混杂作用与交互作用两者是有区别的。对交互作用而言,暴露于两个或两个以上因素所产生的效应是恒定的,从数学上来说是个常数。这样,研究交互作用可帮助人们了解这些因素的生物学特性。但是,混杂因素不具有固定不变的特性,或谓在一项研究中它起混杂作用,而在另一项研究中,它却不是。因而在流行病学资料中可以出现以下四种情况,即:
①有混杂但无交互作用;
②无混杂但有交互作用;
③混杂和交互作用同时存在;
④混杂和交互作用均不存在。
如一项研究资料的cRR ≠aRR ,表明其中存在着混杂。将资料按某种特性分层(如按可疑的效应修正因素),计算各层相对危险度,若层别相对危险度不等,说明资料中存在着交互作用。
Kleinbaum 对15种研究资料按校正前值大小分为3类,进行了比较,如表6-3(资料经单纯随机抽样方法获得),可将之分为三组。
A 组:队列研究(例1、4、7、10、13),其粗相对危险度cRR 的大小为中等程度(即大于3)。
B 组:随访研究(例2、5、8、11、14),其粗相对危险度是无效值,即等于1.00。 C 组:病例对照研究(例3、6、9、12、15),其粗比值比略大于1.00。
RRs 表示计算相对危险度是根据样本资料而非根据总体资料。上述15个实例均按因素F 分为两层,即层1和层2,并计算相应估计效应值,见表6-3。
以实例1为例具体说明如下:校正前效应估计值cRR =4.00,表明资料中存在着较强的暴露与疾病的关联。但控制因素F 后层别效应估计值(stratum-specific-estimated effect)分别为aRR 1=1.02,aRR 2=1.86,cRR (4.00)>aRR (1.02,1.86), 故判定为有正混杂作用。 另外层别效应估计值aRR 1(F )和aRR 2(F )分别为1.02和1.86差别较大,表明在因素F 的两个水平内,可能有另外一种暴露-疾病关联在起作用。层别效应估计值如不等,且按控制因素F 分层后层间均匀性检验有统计学差异,说明资料中存在着交互作用。
表5-3 随机抽样资料中表明混杂和/或交互作用实例摘录
混杂/交互作用现象 混杂和交互作用均有
无混杂和无交互作用
有混杂,无交互作用
交互作用强大, 混杂作用不计
例次 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
研究类型 (效应指标) 队列研究(RR ) 队列研究(RR ) 病例对照(OR ) 队列研究(RR ) 队列研究(RR ) 病例对照(OR ) 队列研究(RR ) 队列研究(RR ) 病例对照(OR ) 队列研究(RR ) 队列研究(RR ) 病例对照(OR ) 队列研究(RR ) 队列研究(RR ) 病例对照(OR )
校正前效应值(cOR 或cRR )
4.00 1.00 1.83 4.00 1.00 1.83 4.00 1.00 1.83 4.00 1.00 1.83 4.00 1.00 1.83
分层2()
1.02 1.86 1.74 3.00 0.96 0.45 4.00 4.00 1.00 1.00 1.83 1.83 4.00 4.00 1.00 1.00 1.83 1.83 1.01 1.03 3.00 3.00 0.83 0.83 1.07 9.40 3.00 0.33 0.36 6.00
(王天根,略作修改,1991年) 三、交互作用的描述
如果暴露效应的测量值(RR 或RD )在按第三变量分层后在不同层间表现不一致,则可将每一层的效应测量值RR 或RD 分别描述,以显示效应修正因素的效应修正作用。常用的效应修正作用的描述方法有:
①根据按第三变量分层后计算每一层的aOR 或aRR 值,分别描述:如给出aOR (F )及aOR (F )值或aRR (F )或aRR (F )值。
②计算SMR 来描述效应修正因素对暴露变量与疾病之间联系强度修正后的总效应。其中SMR 是指实际观察到的(与暴露有关的)病例数同“期望”的(与暴露无关的)病例数之比,用公式表示为:
SMR =∑a i /[∑(b i c i /d i )]
SMR 表示消除混杂效应后,暴露与疾病之间的联系,但为效应修正后的联系,是分层后总的效应。
③用效应函数来描述效应修正因素对暴露变量与疾病联系强度的修正。当按一连续性指标(如年龄等)来描述效应修正因素的效应时,拟合一数学方程,即把效应测量值的变化看作效应修正因素的函数是有可能的。例如某一RR 值随年龄呈线性变化,则可建立一直线回归方程如以下描述:RR =a0+a1(x ),式中:RR 为暴露变量与疾病之间的联系强度;a 0截距,即x=0时的RR 值;a 1斜率,可由简单加权回归方程获得;x 第三变量——效应修正因素。如果拟合方程不理想可试用对数转换后再拟合方程。
i =1
i =1
n n
21