病例交叉研究
・341・
◇方法学◇
病例交叉研究
Case-crossoverstudy
胡以松
HUYi2song
A
R181.2
100826013(2001)0420341203 流行病学方法
传统流行病学方法多集中于对长期暴露所引起的慢性疾病研究,而对于急性病(如心肌梗死、车祸等)的研究相对较少,同时对照选择所造成的偏倚一直是传统流行病学研究难以克服的问题。因此,Maclure1991年首次提出病例交叉研究(case2crossoverstudy),它是一种用于研究短暂暴露对罕见急性病的瞬间影响的流行病学方法。该方法目前已被广泛应用于心脏病、伤害、车祸等方面的研究。1 定义及有关概念
1.1 定义 选择发生某种急性事件的病例,分别调
查事件发生时及事件发生前的暴露情况及程度,以判断暴露危险因子与某事件有无关联及关联程度大小的一种观察性研究方法。
1.2 暴露效应期 即因为暴露所致的危险度增加
或减少的一个时间段。如果暴露作用前有一迟滞期(delay)和 或暴露存在后遗效应期(carryover),暴露效应期则不同于暴露期。因此,暴露效应期可定义为暴露后遗效应期与迟滞期之差。每一次暴露都有一个效应期。例如,某一体力活动对身体的影响持续30min,那么在这30min内,个体对某些事件(如心肌梗死)的危险性增加。
1.3 危险期 即事件发生前的一段时间,其长度和
暴露效应期的长度相同。假设,在这一时间内,个体很有可能暴露于某一药物而引起急性事件的发生,
安徽省高等学校自然科学基金(2000J1113)
安徽省自然科学基金资助(项目编号:
98437231)
安徽医科大学流行病与卫生统计学系,安徽合
肥 230032
胡以松(1977-),男,安徽怀宁人,在读硕士生。
那么就要确定个体是否在这个时间有暴露。危险期的长短可以根据观察者过去的经验来确定。这个时间段非常重要,如果过度估计,许多“假暴露”将成为“暴露”,相反,如果低估,则有可能把许多“真暴露”排除在外。上述任何一种情况都会导致事件与暴露的关联程度降低。
2 与其他流行病学研究的关系
2.1 与实验性交叉研究的关系 “交叉”一词在流
行病学中主要是指实验性研究中,每一个实验对象经历两个处理阶段,而且各自作为自身对照以控制个体差异的影响;而病例交叉研究中研究对象同时经历不同的时期,“病例组分”定义为疾病或事件发生前的危险期,而“对照组分”为除危险期以外的一个特殊的时间段,然后把个体在危险期和对照期是
否暴露于某一行为或物质的信息进行比较,如果能够收集足够的个体有关某一疾病或事件的信息,就能得出疾病或事件与某一暴露的关联。但是,在观察性研究中,不可能像实验性交叉研究中那样做到有同等量的个体经历两个处理阶段,即不可能作到随机化。
2.2 与病例对照研究的关系 在病例交叉研究中,
由于每一个个体同时提供危险期和对照期信息,所以,它也可以看作病例对照研究的配对设计,但最大的不同是它仅仅包括病例,这样可以避免对照选择时所引起的偏倚,而且每一个病例作为其自身对照,这样,就可以避免各病例之间的一些不可控制的因素(如年龄、智力、遗传等)所引起的偏倚。2.3 与队列研究的关系 在病例交叉研究中,对照
数据可以不是“个数”,而是暴露人时,因此,它也可以看作回顾性的队列研究,其分析可以按许多样本只含有一个个体的队列研究的荟萃分析来处理。3 分类
3.1 单向病例交叉研究(unidirectionalcase-crossoverdesign) 这种研究设计类型所收集的对
【文献标识码】【中图分类号】【文章编号】【关键词】【基金项目】【作者单位】【作者简介】
・342・
照时间仅为事件发生前的时间,这是病例交叉研究最初的应用,这样收集信息的原因是考虑到事件的发生有可能影响到后来的暴露,在这种情况下,事件发生后的对照时间能够导致相反的因果关系偏倚。3.2 双向病例交叉研究(bidirectionalcase-crossoverdesign) 即收集的对照信息为事件发生
前及发生后的时间。因为单向回顾性对照样本信息可因暴露的时间趋势而产生偏倚。Greeland(1996年)指出,这是一种选择性偏倚,因为它可以导致对照的暴露多于或少于病例的暴露。实际上,在标准的病例对照研究中,如果对照的暴露在时间上早于病例的暴露,也可以产生这种偏倚,如果事件的结果不影响后来的暴露,可以收集事件发生前后的暴露资料进行评价,这种方法能够消除因暴露的时间趋势所造成的偏倚,常用于研究环境暴露(如空气污染)的作用,因为与行为暴露相比,事件发生后的暴露水平不会受到事件发生的影响。因此,有可能确定事件发生后,如果个体不发生急性事件的暴露水平。
另外,根据对照的数据类型,将病例交叉研究分为:①1∶1配对法:如在心肌梗死的研究中,可以将危险期(心肌梗死发生前1h)的暴露同心肌梗死发生前一天的同一时间的暴露进行比较。这种方法可以看作1∶1配对的病例对照研究,可用标准配对方法如Mantel2Haenszel估计或条件logistic回归模型进行分析。②1∶M配对法:在心肌梗死研究中可以将危险期的暴露同心肌梗死发生前许多对照期(每小时1个,共25个)进行比较,这个模型与病例对照研究中1∶M配对方法相似,也可以用条件logistic回归模型进行分析。③通常频率法:这个模型是以个体事件发生前暴露的通常频率为基础,将危险期的暴露同期望暴露进行比较,这种方法同高度分层的回顾性队列研究相似,每一层有一个病例事件,病例事件在发生前危险期有可能暴露也有可能不暴露,在每一层中,暴露的人时数是通过通常暴露频率同它的通常持续时间进行相乘而得到。非暴露人时为总人时减去暴露人时。数据能够用标准Mantel2Haenszel法或最大似然法进行分析。4 设计步骤
4.1 确定研究目的 多用于检测某个病因假设,但
也可以用于病因的探索性研究。
4.2 确定危险期 危险期的高估或低估都会使暴露与疾病的关联程度下降,得不出真正有意义的结果。危险期的确定一般是依据研究者或观察者的经验进行确定。如在研究心肌梗死与体力活动关系时,
()
危险期为心肌梗死发生前1h。
4.3 选择适宜的对照形式 实际上,这就是选择不同的病例交叉研究的种类。首先,要看是否以最小的样本获得尽量高的检验效率,如是则可用1∶M配对法,也可以用通常频率法。Mittleman等(1994年)利用重体力活动和心肌梗死发生的研究数据将1∶1、1∶M配对及通常频率法的相对效率作过一次比较,结果表明1∶1配对法所获得的RR值95%可信区间为通常频率法的2.7倍,而1∶M配对法位于两者之间,而且增加对照期数目对RR值的点估计影响不大,但标准误有所下降,95%可信区间随着对照期的增加而变窄。在所有方法中,通常频率法的相对效率最高。1∶1配对法的相对效率为其14%,而且随着对照期的增加相对效率逐步增加,但是即使选择最多的对照期,其相对效率仅为通常频率法的一半。但是,通常频率法不能控制个体内的偏倚,而其他两种方法可以通过条件logistic回归很好的控制个体内的偏倚。总的来说,通常频率法是值得推荐的一种方法,因为它的估计最为精确,而且其个体内偏倚可以忽略。如果有可能的话,最好收集适合于所有研究方法的暴露信息,这样可以在各种方法间取长补短,但具体情况还要视研究目的及研究条件而定。
4.4 病例的选择 在选择病例时,尽量采用国际或国内统一的诊断标准。其来源可以从医院、门诊的病案、出院记录中得到,也可以从社区的疾病监测、普查、抽查的人群资料中获得。
4.5 研究因素的选择 如果是证实病因的研究,其研究变量应尽量分解分细。如体力活动与心肌梗死的研究中,要估计过去一年的每个水平的通常频率和心肌梗死发生前26h的体力活动时间、类型及水平等,而且包括日常所有的体力活动以及暴露的定义等,所有这些对研究结果均有很大的影响。4.6 资料的收集 以现场询问的方式、填写调查表收集病人的一般情况、暴露资料及可能考虑到的协变量资料。特别在询问病人过去很长时间的暴露及急性事件发生前的危险期暴露时要注意不同的询问方式和技巧。
4.7 资料的分析 见第5部分
4.8 质量控制 与病例对照研究相似。5 资料的统计分析及结果的解释
5.1 1∶1配对资料分析 与1∶1配对病例对照
研究分析一样,只不过病例和对照分别为危险期和
对照期,其结果整理成表1:
表1 1∶1配对资料分析表对照期暴露非暴露
危险
暴露
c
期非暴露
→OR=b 5.2 通常频率法分析
5.2.1 计算发生观察比(concurrenceobserved
odds) 即计算危险期暴露的发生观察比(a∶b),如
果某个体在危险期有暴露,其比值为1∶0,如果没有则为0∶1。
5.2.2 计算发生期望比(concurrenceexpectedodds) 假设事件的发生和暴露纯属偶然,也就是说疾病为一随机事件,期望比是事件可能发生在暴露效应期的一个比值。如果在过去一个星期内,个体有x小时暴露于体力活动的影响,那么剩余的y小时即为非暴露时间。因此,事件在暴露效应期发生的比值为x∶y,这里暴露人时的估计为暴露的通常频率乘以暴露效应期的长度,非暴露人时为总人时减去暴露人时。例如,体力活动的效应期长度为1h,其通常频率为每周2次,则过去一年的暴露人时(x)为:2×52×1=104(h),而非暴露人时(y)为:24×365-x=8656(h)。
5.2.3 相对危险度的计算
RR=
2bixi
,分子即为观察比为1∶0个体yi之和,而分母即为观察比为0∶1个体xi之和。如表2计算RR值:
表2 通常频率法资料分析表
个体
观察比期望比()()11∶010∶2020∶18∶22
30∶15∶25RR=(20+19)
(8+5+12)=1.5641∶011∶195
0∶112∶18
5.3 多因素分析 如果病例交叉研究涉及多因素
分析,可以用条件logistic回归进行,现在可用于拟合条件logistic模型的统计软件很多,最常用的有SAS、SPSS、BMDP等。6 优缺点(主要与病例对照研究比较)
6.1 优点 ①特别适用于罕见急性事件,如车祸、
伤害、心血管事件、支气管哮喘等研究;②由于不另设对照,所以避免了因对照选择而产生的偏倚;③由于病例以自身为对照,排除了病例之间的偏倚(如年龄、智力、遗传、社会经济状态等);④在统计分析时
・343・
避免了一些复杂的数学模型,便于计算;⑤节约样本量;⑥节省人力、物力、财力,便于组织实施。
6.2 缺点 ①病例交叉研究要求暴露非常短暂,暴露到事件发生的时间很短,而且暴露有很少的遗留效应。因此,病例交叉研究不能用于评价某项干预措施所引起的累积效应或者慢性病的进展情况;②其结果代表短期的危险,而不是累积危险,是相对危险度而不是绝对危险度。
6.3 可能存在的偏倚 除了在病例资料收集过程中的回忆偏倚以及选择病例所出现的偏倚(如存活病例偏倚)外,病例交叉研究还存在个体内偏倚,这种偏倚是由于个体内某一特征随时间改变而引起的。例如,某一个体在锻炼后经常喝咖啡就是一个个体内偏倚,因此很难区分是喝咖啡还是锻炼导致事件发生,如果存在这种情况,则可以用分层分析或条件logistic回归进行相应的校正。7 应用实例
Mittleman等1994年作了一项关于重体力活
动和心肌梗死发生关系的研究:
7.1 目的 探讨重体力活动时及重体力活动后心肌梗死的发生危险和重体力活动到症状发生的时间(诱导时间),以及经常体育锻炼是否可以降低心肌梗死的发病风险。
7.2 方法 对1228例发生心肌梗死的病人进行询问,所有病人均在心肌梗死发生后4d内提供一年内体力活动的通常频率,以及心肌梗死发生前26
h内体力活动的时间、
类型、强度。本研究采用两种类型的自身配对分析(1∶1配对和通常频率法)将重体力活动(代谢当量为6以上)的观察频率与预期值进行比较。
7.3 结果 4.4%的病人在心肌梗死发生前有重体
力活动。1∶1配对结果表明,危险期有重体力活动者,心肌梗死的RR值为5.6(95%CI:2.7~12.8)。通常频率法结果:重体力活动后心肌梗死的RR值为5.9(95%CI:4.6~7.7)。经常锻炼每星期少于1次、1~2、3~4、5次以上的RR值分别为107(95%
CI:67
~171)、19.4(95%CI:9.9~38.1)、8.6(95%CI:3.6
~20.5)、2.4(95%CI:1.5~3.7)。可见,习惯性体力活动水平越高,相对危险度越低。从体力活动到心肌梗死发生的诱导期时间不到1h,而且疾病经常发生在体力活动时。
7.4 结论 重体力活动能够引发急性心肌梗死,特
别在习惯于静坐的人群中更易发生。
(收稿日期 2001208211)