数模论文摘要
艾滋病疗法的评价及疗效的预测模型
摘要
艾滋病是当前人类社会最严重的瘟疫之一,自从第一次被发现以来,它已经吞噬了近3000万人的生命。迄今为止人类还没有找到能根治AIDS 的疗法。
本文主要是关于爱滋病治疗试验的统计与预测问题。在数据处理的过程中我们较多的使用了Eecel 软件,因为其在统计方面有着强大的功能,尤其筛选和作图等功能给解题带来了极大的方便。
我们根据已有的治疗情况的记录,对各种状况下的病人情况进行了科学的统计和预测。发现不同初始病状和不同年龄的病人的治疗情况是不同的, 而且在一定的病症区间病人的治疗效果具有很大的相似性. 所以我将病人合理的分组。然后再用软件进行统计和预测。
在题目2和题目3的求解过程中,我们讨论了不同病症的病人采用不同的四种方案的疗效, 并给出了最佳方案. 对病人继续治疗效果的预测我们采用的是神经网络算法,然后用Matlab 软件拟合了CD4细胞数量随时间变化的曲线,并得出CD4细胞数量随时间变化的函数F (x ),通过对其进行求导的方法得出最佳治疗终止时间。
在题目3 中我们还要考虑经济的因素,也就是说,在治疗过程中, 病人往往不能选取治疗效果最佳的治疗方案. 而是在医药费和疗效中选取一个平衡点——既要疗效比较好, 又要有比较低廉的治疗费用. 我们根据线性规划的方法得出在相应约束条件下疗效好费用低的方案, 使病人在最合适的时间停止治疗, 此时病情稳定.
关键字:Excel 软件 Matlab软件 神经网络 导数
一、问题的重述
艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。
艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS ,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV )引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV 的入侵中起着重要作用,当CD4被HIV 感染而裂解时,其数量会急剧减少,HIV 将迅速增加,导致AIDS 发作。
艾滋病治疗的目的,是尽量减少人体内HIV 的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。
迄今为止人类还没有找到能根治AIDS 的疗法,目前的一些AIDS 疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS 疗法。
现在得到了美国艾滋病医疗试验机构ACTG 公布的两组数据。 ACTG320(见附件1)是同时服用zidovudine (齐多夫定),lamivudine (拉美夫定)和indinavir (茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV 的浓度(每毫升血液里的数量)。193A (见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV 浓度,它的测试成本很高)。4种疗法的日用药分别为:600mg zidovudine 或400mg didanosine (去羟基苷),这两种药按月轮换使用;600 mg zidovudine 加2.25 mg zalcitabine(扎西他滨);600 mg zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。
请你完成以下问题:
(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。
(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。
(3) 艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。
二、问题的分析
由于迄今为止人类还不能根治艾滋病,只能根据现有的医疗手段及药物控制艾滋病病毒对人体的攻击,缓解艾滋病人的疾病痛苦, 而且人们已知的药物和AIDS 的疗法对人体有很大的副作用,成本也很高。因此医生需要根据病人初期病检的各项指标以及病人具体的身体状况,确定对病人施用何种治疗方案以达到最优的治疗效果。
但是病人的情况千差万别,病史不同身体免疫情况各异。因此,同一治疗方案不见得能够对所有的病人都有很好的效果。再次,由于患艾滋病的病人的经济
状况也各不相同,对治疗费用和治疗时间的承受程度不同。这就需要根据病人的具体病情以及经济的承受能力来确定对病人施用何种治疗方案,以使病人的治疗效果达到最优。
为了给出不同情况的艾滋病患者的最佳治疗方案,需要对病人的病史资料进行统计分析。首先我们给出建立统计图表的原则:
(一)、HIV 病毒对同年龄层的人的作用是相同的。
在使用药物的时候我们大多要考虑的是病人的年龄,根据病人的年龄来选择合适的药物。年龄往往反应了病人的客观生理和免疫能力,以及病人的心理承受力。我们划分同年龄层的原则是认为生理心理特征相近的原则,认为HIV 在同年龄层的作用效果具有相似性。
(二)、HIV 病毒浓度只与体内CD4浓度量相关。
正常人CD4浓度是处于稳定的水平,当感染HIV 病毒时,会出现CD4骤然增加的正常的免疫反应,当HIV 跨过抬头点时,CD4就会急剧减少,病人病情恶化。我们建立了HIV 病人体内HIV 浓度与CD4浓度的相关曲线。在患者体内HIV 病毒的浓度与CD4的浓度的关系是此消彼长的,如下图所示:
图 1
它很好地反映了病人随着病情的加重体内的CD4和HIV 的浓度的变化情况,给我们分析病人的病情带来了方便。
(三)、CD4含量反应了人体的免疫机能。
当病人感染HIV 病毒,那么内部的生理条件可以认为是相同的。在使用这种药物之前监测的病人的HIV 或CD4的相关数值是有现实意义的——能够说明病人体内的生理环境是处在某种状态下,此时我们不需要那么严格的去考虑年龄所起的作用。我们认为HIV 或CD4初始数值能够客观反应了包括年龄在内的众多因素的影响。
基于以上的三个原则,我们认为不同病人(HIV 浓度或CD4浓度(Log(CD4 count+1))的初始数值不同)对药物的敏感度和以及药物对病毒的抑制作用是不同的,但是对于相同数据区间的病人作用效果极其相似,以致于我们无法区分它们。因此我们采取有选择的、分段式的统计数据。
基于上述分析,我们采取了分阶段数据统计方法,对附件1的数据进行处理得到病人属性相同或相近的一系列的类。
然后我们应用Excel 软件对每一个小方格中数据画图处理,每组数据对应一个图形(见附录)。
对第二问,为了确定不同状况的病人施用什么治疗方案效果最佳,我们分析附件2的数据的并对之进行了处理,得到了我们的医治结论——一个很优秀的艾滋病治疗医生的丰富经验。
对于不同的病人,CD4细胞的数量以及HIV 病毒的数量就在很大程度上能够反应病人的病情以及身体状况。基于此我们对各种不同病人的状况进行分析,以求得各种治疗方案的效果,对不同的病人施用不同的治疗方案,以使病人在最短的时间内得到有效的治疗,减轻病人的痛苦,而且能够让病人在不同的经济层次上的到满足——在经济上能够接受,且达到治疗费用和治疗效果的最优。
由于不同的病人具有不同的病态,而且个人的身体状况各异,价格高的药物并不一定能够获得最好的治疗效果。因而,当医生初次接触病人时并不能根据病人的CD4细胞以及HIV 病毒数量就能很好的确定病人应该施用何种治疗方案,只能根据以往的统计数据找到某种治疗方案,达到治疗效果的最优化——施用此种方案可以使病人的“治愈”率最高。对于用药初期就获得很好的效果,但是经过一段时间后出现CD4细胞减少或者减少的速度增大的情况,一般对应于HIV 病毒数目的增多或增多的速度增大的情况。就应在合适的时间(最佳的终止治疗时间)停止此种治疗方案,然后再经过专家的会诊根据病人的具体情况确定更好的治疗方案,避免延误病人的最佳治疗时机。当治疗达到一定的效果时还应该及时停药,避免病人受到药物副作用的进一步侵害。
三、符号说明
0CD 4细胞的的浓度 1. Q CD 4„„„„„„„„表示正常人体内
02. Q HIV „„„„„„„„表示正常人体内HIV 病毒的浓度
3. C i „„„„„„„„„表示第i 种治疗方的日药费
4. T 最佳终止 „„„„„„„表示病人的最佳治疗终止时间
5. W i „„„„„„„„„表示病人采用第i 种治疗方案至终止治疗时刻的
治疗总费用
6. t „„„„„„„„„„表示病人开始治疗的时间
7. T 中 „„„„„„„„„表示病人治疗无明显效果提前中止治疗
8. Q t CD 4 „„„„„„„„表示病人在t 时刻CD 4细胞的浓度
9. Q t HIV „„„„„„„„表示病人在t 时刻HIV 病毒的浓度
i 10. {X n } „„„„„„„„表示第i 个病人的CD 4细胞浓度检测序列
11. {Y n i } „„„„„„„„表示第i 个病人的HIV 病毒浓度检测序列 12. F (t ) „„„„„„„„表示病人的CD 4细胞浓度随时间变化的函数 13. G (t ) „„„„„„„„表示病人的HIV 病毒浓度随时间变化的函数 14. D „„„„„„„„„表示病人的检测时间的区间
15. F i (t ) „„„„„„„„表示第i 种方案CD 4细胞浓度随时间的变化 16. W i (t ) „„„„„„„„表示第i 种方案随时间变化的费用
17. T i 最佳终止 „„„„„„„表示第i 种方案的最佳终止时间
18.i „„„„„„„„„„表示方案的代号i=1,2,3,4
四、模型假设
1. 病人的治疗初期的身体状况可以通过CD4细胞以及HIV 病毒的数量来衡量。
2. 病人如果出现CD4细胞和HIV 数量的反弹就认为此方案已失效。
3. 病人在确定是否进行治疗以及使用何种治疗方案是通过CD4细胞的含量和HIV 病毒的数量(考虑HIV 的测试成本时此项指标缺省)进行确定的。
4. 病人治疗过程中具有疾病好转的稳定性。
5. 只考虑治疗不同的治疗方案和病人的病情和身体状况对病人治疗效果的影响。
6. 认为病人在治疗初期的身体状况在某个确定的状态区间是无差别的。
7. 认为不同的病人如果病态指标相同则认为他们是无差别的人。
五、模型的建立
为了更准确的说明某一方案对不同情况的病人的治疗效果,我们将病人分成不同的区间,在每个区间中病人的病情是极其相似的。这样我们就可以针对经过测试治疗的病人的初始病态给出合理的方案,甚至对只知病人初始病态的情况下给出病人如何选择治疗方案,以及如何操作治疗过程。
我们可以根据各个区间内的病人的测试治疗过程的检测状态得到CD4细胞的浓度变化序列,或病人HIV 病毒浓度的变化序列。在每个区间内病人检测时刻是相同的,对个时刻的病人的CD4细胞或HIV 病毒浓度进行平均,从而消除随机因素的影响确定了治疗效果的趋势,就可以得到此区间内平均的变化趋势{X n 0}或{Y n 0}。
我们可以将它们拟合成多项式函数F (t ) 、G (t ) ,进而求得这两个函数的一次和二次导数F '(t ) 、F ''(t ) ,G '(t ) 、G ''(t ) 。从而根据函数的指标值来确定治疗效果的好坏,以及确定病人应在什么条件下继续治疗,以及如何对提前中止治疗做出决策。我们对治疗效果较好的情况预测了病人在什么时间应该停止治疗,对效果不好的情况给出了最佳的提前中止治疗的时间。
12m X n +X n + +X n X = m 0
n
Y n 1+Y n 2+ +Y n m Y = m 0
n
如果F (t ) 、G (t ) 两个函数满足下面条件之一就认为对应的治疗方案是有效的。 ①F '(t ) >0;②F '(t ) 0, G ''(t )
其它情况下我们认为此种治疗方案对病人没有太大的治疗效果,我们选择提前中止治疗,再由医生根据病人的具体情况选择更好的治疗方案。
在预测病人最佳的终止治疗时间时我们考虑将病人体内CD4细胞和HIV 病毒的浓度变化的指标F '(t ) 、F ''(t ) ,G '(t ) 、G ''(t ) 限定在某个区间。如果它们满足以下条件就认为此时已经达到了最佳的停药时间①F '(t )
F '(t ) -δ1;③G '(t ) >-ε2;④G '(t ) -δ2,其中ε1, ε2, δ1, δ2分别表示停药时间的特征量,此时艾滋病人达到了短期的“治愈”。ε1, ε2, δ1, δ2的确定需要通过大量的临床观察。
上面的①②③④意义分别是①病人的CD4细胞浓度增加量几乎没有变化或很小②病人的CD4细胞浓度的减少速度很小或几乎不变③病人HIV 病毒浓度减少很小几乎没有变化④病人的HIV 病毒的浓度增加的速度很小或几乎不变
在分析第(2)个问题时,如果只考虑治疗的效果,对1,2,3,4不同的治疗方案,类似(1)的方法我们可以分析得到每个方案的最佳终止时间或确定应用此种方案是没有效果的应该提前中止治疗,然后我们选取最佳终止时间最小的方案作为治疗此类病人的最好方案。
min T i 最佳终止, i =1,2,3,4使满足以上式子的i 值所对应的治疗方案作为不考虑医{}
药费用的最好的治疗方案。
如果考虑到治疗的费用问题,则问题可以进一步描述为,如果某些方案有较好的效果,那么最好的治疗的方案,即为医药费用到最佳终止时间达到最少:min C i ⨯T i 最佳终止, i =1, 2,3, 4。使满足以上式子的i 值作为考虑医药费用的最好的{}
治疗方案。
其中,T i 最佳终止的值由下面的非线性规划问题进行确定。
min H i (t ) F i (t ) , i =1, 2,3, 4„„„„„„„„(△) W i (t )
⎧F i '(t ) ε⎪i ⎪F i ''(t ) or μ⎪W i (t )
i ⎪F '(⎩i 't )
约束条件中,μi , εi , ξi , δi 分别表示病人可以停药的指标量,均为正数。
上面的(△) 式是指在病人的治疗阶段内如果病人所花费的每单位的医药费所带来的病情的好转程度达到最小值,此时停止治疗。
目标函数的约束条件(※)式表示病人采用第i 种治疗方案,CD4细胞浓度的增加量比较显著以及病人单位医药费所带来的病情好转比较显著,需要继续治疗。当CD4细胞的浓度减少速度相当显著,或者病人单位医药费所带来的CD4细胞的减少速度相当显著,此时也需要继续治疗
以上是用框图表达的模型解决问题的过程。
由于高次多式函数在拟合中具有龙格现象,因此在有些变化复杂的曲线面前无能为力。为了避免上述问题的发生,当上述情况发生时利用加权移动平均的方法预测后来的数值点。
加权移动平均方法进行预测的具体操作如下:
{X n }为一数值序列,如果我们需要根据它的变化趋势预测X n +1的数值是多少,可以用下式计算:X n +1=(1-λ) X n -1+λX n 。进而可以得到它后边的多组序列值。观察法(有经验的专家为如此去做) 就是基于此法进行预测的。
另外,预测一个数列总体的趋势,还可以应用自相关系数的进行判断,方法如下: 对于数列 {Y n },可以做出如下的数列集 {Y n -1}, {Y n }, {Y n +1}, {Y n +2} 其中r k 为{Y n }, {Y n +k }的协相关系数。
r k =∑(Y -)(Y t
t =1
n
t
t =1n t +k -) 2∑(Y -)
1n
=∑y t n t =1
如果序列{r k }是单调减少的,且{r
k }中有多个大于即与0有很大的差异则认为数列{M n }是d 单调的趋势,从而进一步判断治疗效果的好坏。
利用这种方法可以弥补上述方法的不足。
另外,我们给出如下的医药费用的模型:
另外我们对统计的数据进行在模型下评价,我们使用模型得到如下数据:
我们认为药物对Log(CD4 count+1)起作用的情况下,因为HIV 自身的变异性,没有那种药物会一直促使Log(CD4 count+1)而抑制HIV 增长。所以总是会有突变的时候,根据这样的过程我们画出图示,在图中Log(CD4 count+1)) 的值是过t i 时刻突变的,要使Log(CD4 count+1)值降到起初用药的程度总是有段时(t '-t i ) ,
在这段区间我们可以得到用药的最佳终止时间T i 最佳终止,然后我们在判断疗法的
优劣的时候用到的参数即为t i 。
T i 最佳终止= t i + t ( t →0, 由于是突变)
W i =C i ⨯T i 最佳终止与Log(CD4 count+1)近似的符合二次函数
f(T i 最佳终止)=-ax2+bx+c,a>0。
我们用Y i =X i ⨯T i 最佳终止来衡量经济因素对病人的选择疗法的影响。
七、 模型的求解
题目所给的数据无疑是非常大的,如果采用手工统计的方法基本上是不可行的。所以我用Excel 软件进行统计。在问题的分析中我们提到爱滋病人的初始状态是不一样的,他们的最佳治疗截至时间也会因为 初始状态的不同而不同。在预测最佳治疗终止时间是,我们根据接受测试的艾滋病人的初始状态将他们分为若干组。然后再预测各个组病人的最佳治疗终止时间。最后我们求出各组人数占总人数的平均值,计算出各组病人最佳治疗终止时间的加权平均值并将其最为此种治疗方案的最佳治疗终止时间。
(1) 先将病人分组,并计算各组病人的人数和他们占总人数的比例,这些工作
可以由Excel 软件的筛选功能解决。
各段人数的分布百分率情况如下
:
(2)对于第二题:我们根据先前提到的三项原则来统计数据. 结果如下. 经统计我们发现在
从上面的统计数据表中我们可以看出年龄段在25-45和45-65之间的病人比例占总体样本的比例为96.3%(即78.50%+17.8%).所以我们只要对年龄段在25-45和45-65之间的病人进行分析就可以了.
首先看年龄曾在45-65区间的病人分布情况,并且我们用图型比较估计最优终止时间来判断疗法的优劣。
紧接着我们需要预测各组病人的最佳治疗终止时间,我们采用的方法是用
Excel 软件做出各组病人CD4细胞和HIV 病毒随着治疗进行数量变化的趋势图。我们根据各组CD4细胞和HIV 病毒数量的变化趋势可以得出各组病人的最佳治疗终止时间。(CD4细胞和HIV 病毒部分数量变化趋势图见附录)。 下面是病情相似的艾滋病患者典型的恢复曲线图:
从图中我们可以看出出个别外病人的病情具有相似的变化情况,或者某个区间断的病人对此种治疗方案效果不好,或者效果良好,有着明显的趋势特征。因而我们可以由此推断治疗方案的优劣,以及病人何时停止治疗才是最佳的时机。
各组病人的最佳治疗终止时间
我们通过作图的方法,在不同Log(CD4 count+1)段、采用不同的治疗方法的情况下判断最优的治疗方法。
我们对年龄层在25-45之间的病人分阶段来分析,并根据观测方法判断4种疗法在每阶段的最优疗法,我们为了查阅方便,于是在方格中作(a) 为标记。
(2) 我们将每种方案的治疗状况的数据进行平均,以抵消随机波动的影响。然
后将均值数据进行多项式拟合,多项式的最高点对应的时间作为停药的最佳时间。最终得到每种方案对于不同类型病人的最佳终止时间:
对于某一类病人(我们随机抽取了一组数据进行运算),每种方案的最佳终止时间如下:
方案一:22.511;方案二:26.322;方案三:9.5698; 方案四:26.8136。 时间单位为周。
其中方案一,三为较劣方案需要提前中止,对于方案二,四到终止治疗之日的医药费分别为90.8109 97.8696 单位:美元 考虑到医药费用则可知第二种方案比较好。
八、模型的使用说明
在艾滋病愈演愈烈的今天,艾滋病的治疗是比较复杂和困难的。现在在临床医学上很难给出一套固定的方案治疗艾滋病。医生们需要根据病人的不同情况给出不同的治疗方案,而我们论文的成果也在此,对不同病人给出了不同的最佳治疗终止时间。我们还将不同的病人状况分成若干类,并列成表格的形式,以便查阅。
这样,不同的病人就可以根据不同的病状查锝病人的最佳的治疗方案,并合理选择最佳的停药时间。例如:某一病人的CD4细胞的浓度为75,HIV 的浓度为5,由此我们可以在表格中找到与之相对应的治疗方案和治疗过程的某些建议。并得到最佳的终止治疗时间为23周。
在现实生活中,有些病人的治疗费用十分有限,难以承担治疗费用,即使是家庭很富裕的病人对巨额治疗费用也很难吃的消。这就给治疗带来了很大的麻烦,也给我们带来了问题:怎样在治疗费用最小的情况下得到最好的治疗效果呢?我们第三题的解答也正应用于此。
九、模型的推广与评价
我们根据此模型的分析方法可以得到很多难以根治的疾病的治疗方案,在经济上和治疗效果上都达到最优。从而可以在最短的时间内,确定病人的最佳治疗方案,获得有效的治疗效果,达到花费最少的费用缓解病人病痛的目的。
我们建立的根据病人的初始状态确定病人的治疗方案的方法在艾滋病的临床治疗上有很大的帮助作用。由于治疗方案的不成熟——不能根治而且有很大的副作用,病人在CD4细胞在最低水平线以上或者HIV 病毒的数量在最高的水平以下是不需要进行治疗的。
2005年,艾滋病抗病毒治疗的新进展为“选择何时开始进行抗病毒治疗”,具体内容总结如下:①对诊断为艾滋病期和出项严重临床症状的患者,推荐开始抗病毒治疗;②CD4+T淋巴细胞计数>500/mm3时不推荐进行抗病毒治疗; ③ 对于CD4+T淋巴细胞计数为 200~350/mm3的无症状HIV 感染者,建议在考虑患者的依从性、耐受性等多方面因素前提下,可开始抗病毒治疗;④对于CD4+T淋巴细胞计数为351~500/mm3且血浆病毒载量≥100000拷贝/ml的无症状HIV 感染者,建议定期检测CD4+T淋巴细胞计数和血浆病毒载量,暂不予抗病毒治疗。
我们的分析模型能够给出不同初始症状的病人在最好的治疗效果和最优的费用治疗方案,方便且简洁。它能够迅速准确地确定出病人按照如何的方式进行最优的治疗,以使医生能够迅速的根据病人的测试状况及时的选择更好的治疗方案。在很大程度上减少了医生的工作量,增加了医生对不同病人进行医治的科学性。
十、参考文献
[1].飞思科技产品研发中心 编著《神经网络理论与Matlab7实现》 电子工业出版社 2005.3
[2].邓聚龙 著 《灰色预测与决策》 华中理工大学出版社 1986年8月 [3]. 傅立 编著《灰色系统理论及其应用》科学技术文献出版社 1992年10月 [4].张志涌等 编著 《精通Matlab6.5版》北京航空航天大学出版社 2003.3 [5].薛毅 主编《数学建模基础》 北京工业大学出版社 2004.4
[6].杨世莹 编著《Excel 数据统计与分析范例应用》 旗标出版社股份有限公司
附录(程序)
clc
clear all
t1=[0 4 8 25 40]; t2=[0 4 9 23 40]; t3=[0 4 7 24 40]; % t4=[]; % t5=[]; % t6=[];
f1=[178 228 126 171 99]; f2=[14 62 110 122 320]; f3=[10 11 30 137 225]; % f4=[]; % f5=[]; % f6=[];
t0=(t1+t2+t3)/6; f0=(f1+f2+f3)/6; p=polyfit(t0,f0,2); mat0=max(t0(:)); mit0=min(t0(:)); xt=mit0:0.02:mat0 yf=polyval(p,xt);
plot(xt,yf,'-b',t0,f0,'r-'); syms x;
pp=poly2str(p,'x')
可见拟合的函数图像与测得数值点是吻合的,且它的变化趋势与原曲线吻合。