医学数据挖掘的现状分析
62
福建电脑2010年第5期
医学数据挖掘的现状分析
刘莘1.王
(1.徐州医学院计算机教研室江苏徐州221004
【摘
飞2
2.江苏电信徐州分公司江苏徐州221000)
要】:随着医学信息化时代的到来,积累了大量的各种形式的医学信息。本文针对数据挖掘技术在医学领域的应
用现状从各种层面上做了分析。
【关键词】:数据挖掘医学
1.前言
随着医学信息化的飞速发展.在医疗卫生领域中有大量关于病人的病史、诊断、检验和治疗的临床信息.以及药品管理信息、医院管理信息等医疗信息可以被精确地记录下来.从而导致医疗数据资料呈爆炸性增长.促进了医学信息的数字化、自动化和智能化应用和研究的快速发展。在这些激增的数据背后隐藏着许多重要的信息.如何从这些海量的医疗数据中.挖掘出有用的信息.为了解各种疾病之间的相互关系和各种疾病的发展规律、为疾病的防控、为诊治方案的总结优化等各方面提供科学依据,这将对疾病的防控、诊断、治疗和医学研究的发展具有重大意义。
2.医学数据挖掘概述
速度和医疗成本。同时,医学数据库的类型较多,并且又是动态变化的.要求挖掘算法具有一定的容错性和鲁棒性。2.2.4提供知识的准确性和可靠性
医学数据挖掘的主要目的是为医疗活动和管理提供科学的决策.因此必须保证挖掘算法所提供的知识具有较高的准确率和可靠性。如何降低医学数据挖掘过程中的风险,提高挖掘结果的准确性和科学性.是医学数据挖掘能否得到实际应用的关键所在。
3.医学数据挖掘国内研究现状
用数据挖掘方法抽取医学数据中的趋势及规律性.可以辅助医务人员快速准确地诊断、预测、监控和确定最优的治疗方案。目前,数据挖掘已经运用在很多医学应用领域中。
3.1医院信息系统中的应用
2.1医学信息的特点2.1.1数据类型的多样性
医学中的数据类型多种多样.如电子病案中关于人El学特征的数据为纯文本型.检验科中有关病人生理、生化指标为数字型。影像科中如B超、CT、MR、X光片等图像资料.如肌电、脑电等信号数据。医学数据的复杂性要求与之适应的数据挖掘方法学的研究。2.1.2动态性
很多医学数据如脑电图、心电图的检测数据呈非规则的波形、血压、心率等数据与时间呈函数关系;某些疾病病人的门诊、急诊、住院就诊与季节、地域有时间序列关系。2.1.3冗余性
医学数据呈指数增长并不意味着与信息呈正比.有大量与诊疗及管理无关的数据.需要与之相适应的数据整合、特征提取等方法。总之医院数据的多样性及特殊性。需要该领域方法学的研究。
2.2医学数据挖掘的关键技术
医学数据的特点使得医学数据挖掘与常规的数据挖掘之问存在较大的差异,医学数据挖掘的关键技术如下:2.2.1数据预处理
医学数据库中含有海量的、不同来源的原始信息,其中包括大量模糊的、不完整的、带有噪声和冗余的信息。在数据挖掘之前,必须对这些信息进行清理和过滤.以确保数据的一致性和确定性,将其变成适合挖掘的形式。2.2.2信息融合技术
医学信息是由文字、数据、波形信号、图像、以及少量的语音和视频信号组成。对这些不同物理属性的医学数据,应采用不同的技术和措施进行处理.使其在属性上趋同或一致.再对处理的结果进行综合。医学信息的多源性、时序性和非时序性数据共存、数字型数据和非数字型数据共存的特点.加大了信息融合的
难度。
目前医院信息系统大多停留在医学数据库的低层次应用上缺乏对数据的集成和深层分析更谈不上对医学知识的自动获取。在激烈竞争的医疗市场中管理人员需要分析各类病人的行为模式、需求与偏好、忠诚度与满意度:基于病种病例分型模式构造、门急诊量的预测、成本效益分析等。总之,对于医院科研水平和服务质量的提高.数据挖掘技术的研究与应用有很旺盛的生命力171。
3.2疾病诊断、预测
数据挖掘可以通过对患者大量的数据资料的处理,挖掘出有价值的诊断规则.建立预测模型.再对这个模型进行测试训练。得到合适的算法模型.利用这种模型可以辅助l临床医学诊断。挖掘技术已应用于胸痛发展结果的预测诊断、ICU应急诊断、类风湿类型的辨别诊断、乳腺疾病的诊断、胎儿早产的诊断、肝病分类诊断、急性阑尾炎分类等诊断。
利用数据挖掘确定某些疾病的发展模式.根据病人的病史预测病情的发展趋势.从而可以有针对性的预防疾病的发生。如借助数据挖掘技术中的贝叶斯(Bayes)网络技术,结合中医理论、专家经验及其它各种统计方法来研究抑郁症的中医证候规律f11=
3.3医学图像挖掘
医学图像(如CT、MRI、PET等)是利用人体内不同器官和组织对X射线、超声波、光线等的散射、透射、反射和吸收的不同特性而形成的.它为对人体骨骼、内脏器官疾病和损伤进行诊断、定位提供了有效的手段。医学领域中越来越多地使用图像作为疾病诊断的工具。理论上图像数据挖掘是数据挖掘的分支,但是由于挖掘对象的复杂性.自2000年召开第一届多媒体数据挖掘年会至今.这方面研究尚未形成完整的理论框架和技术方法,仍处于探索阶段。孙蕾等人利用数据挖掘技术,针对乳腺影像数据库开发了相应的计算机辅助诊断系统咀
3.4生物信息学一一DNA分析
人类基因组计划的开展随之产生了巨量的基因组信息,区分DNA序列上的外显子和内含子成为基因工程中对基因进行识别和鉴定关键环节之一。如何建立良好的系统模型将基因组数据进行有效地存储、分析和挖掘,仍是难题。使用有效的数据挖掘方法从大量的生物数据中挖掘有价值的知(下转第73页)
2.2.3快速的、鲁棒的挖掘算法
医学数据库是一个涉及面广、信息量大的信息库。要在这样庞大的数据库中提取知识.需要花费比其它数据库更多的时间,因此必须考虑医学数据挖掘的效率问题。研究快速挖掘算法对于远程医疗和社区医疗具有更深远的意义.将直接影响其响应
2010年第5期福建电脑
73
务。这种特殊体制,限制了兵团对电子政务的资金投入力度,束缚了发展电子政务的前进步伐。各部门、师团各级在电子政务建设上的财政支持差异.也影响到电子政务建设的整体化。甚而会导致数字鸿沟的出现。
三、对策建议
切实落实安全管理责任制。明确各级、各部门行政主管领导作为信息安全保障工作的第一责任人:技术部门主管或项目负责人作为信息安全保障工作直接责任人.强化对网络管理人员和操作人员的管理。
4.加大信息化与电子政务培训力度。加大培训力度.进一步做好由兵团党委组织部、人事局、兵团信息办协同组织的兵团信息化与电子政务培训工作。应真正摸清机关公务员的计算机应用水平.根据其水平高低建立相关资料库.划分不同的培训群体,培训内容也应有所侧重。结合多种计算机信息技术培训和考试共同开展.加强工作人员的操作和应用水平。同时也要兼顾对公众电脑使用技术的培训和使用政务系统的宣传和培训.提高系统的安全操作和高效率的使用。
5.以节约高效为标准.合理使用投入.并建立健全绩效评估体系。在有限的资金投入下,要以观念、服务和技术创新为基础.尽可能采用循序渐进、集中建设、外包建设等有效的集约式建设模式推进电子政务发展,把握电子政务建设规律.探索一条低成本、集约化、见实效的电子政务建设路径。
建立以提高用户满意度、增强政府服务质量和服务能力为目标.日常考核、公众考核、专家考核、第三方专业评估四位一体的电子政务绩效评估体系。根据各部门电子政务建设情况.将电子政务建设和使用的效益好坏逐步纳入政府部门、部门主要负责人和相关项目人员的政绩考核范畴中.逐渐建立一整套考核指标体系。
小结
针对兵团电子政务发展中存在的问题.本文提出以下几点建议:
1.统一思想、提高认识.统筹规划、统一技术标准。推动电子政务要统一思想.加强创新.不断优化政务流程。电子政务建设是一项综合运用信息技术和管理科学的系统工程.涉及各级部门的各个方面。各师、各部门应按照兵团信息化领导小组的统一部署.遵照”统一领导、统一技术方案、统一规划建设、统一指挥调度、统一软件开发.分步实施、相互协作、共同推进”的原则.落实各部门的建设任务和建成后的运行工作责任.防止各自为政、盲目投资、重复建设。
为保障电子政务快速发展.应尽快构建适应电子政务发展的法规体系.加快政府信息公开共享、信息安全、政府网站、电子政务专网、网上办公等方面法律法规建设。对与电子政务发展不相适应的规章和文件进行修订。必须坚持标准统一原则。在加强对已有的国家、行业和地方标准的贯彻实施的同时.制定全兵团统一的电子政务总体技术框架,贯彻自上而下、顶层设计的原则。各政务、业务系统均要遵照执行。
2.加快推进政务信息资源数据库的建设和完善.以公众为中心.加强网上服务功能。加快整合兵团各师、机关各部门分散的业务信息资源.实现信息交换和互联互通互用,打破各职能部门对信息资源的垄断和封闭.加大信息资源开发和整合力度.建设一批跨部门、基础性、公益性的兵团政务信息数据库和办公信息资源库。加强政府门户网站、业务应用系统的建设,建立起跨部门的、综合的业务应用系统。使公众、企业与政府工作人员都能快速便捷地接入相关政府部门的业务应用、组织内容与信息.并获得个性化的服务.使政务应用系统能够广覆盖、广服务。
3.建立健全兵团政务网络与信息安全保障体系.落实安全责任制。高度重视网络和信息安全。严格遵守国家有关信息安全和保密法规,增强安全意识和保密观念;建立健全规章制度,完善管理措施.加强对信息网络的监控,建立统一的电子政务安全保障体系。整个系统应严格控制信息的访问权限.保证信息的完整性和容错与恢复系统。要在健全信息安全保障体系的基础上,
虽然兵团体制极为特殊.发展过程中也有很多问题和不足.但发展电子政务是政府信息化必经之路.也是顺应社会信息化发展的必然趋势.随着兵团国民经济和社会发展”十一五”规划的稳步实施。兵团电子政务的发展必将进入一个快速成长时期。
参考文献:
【1】贾转红.我国电子政务的现状厘发展策略Ⅱ】.山西经济管理干部学院学报.2007年3月.第15卷,第1期
【2】任晓香,电子跛务建设现状与对策Ⅱ】.信息化论坛,2007年第4期【3】鱼明.新疆电子政务建设的现状分析及对策研究Ⅱ】.农业网络信息。2007年第12期
’
【4】《新疆生产建设兵团国民经济和社会发展信息化”十一五”规划)【5】中国电子政务网:http:llwww.e—gov.org.on/Index.html
——卜——■_—+_-—卜+-+-+—+-..—+-+—+—+—+一+——卜・+・+-+—+-+・+-+—+・+—+—+—+—+———-+—+—+-+—_.——+—+—+——--—●——卜_—卜_—卜噜—卜叫+—+・+・
(上接第62页)
识,提供决策支持。目前已有大量研究者努力对DNA数据分析进行定量的研究.从已经存在的基因数据库中得到导致各种疾病的特定基因序列模式。一些DNA分析研究的成果已经导致了许多疾病和残疾基因的发现.以及对疾病的诊断、预防和治疗的新药物、新方法的发现同。3.5在中医药领域中的应用
当前在中医领域.数据挖掘应用最广泛的是在中药(复方)的研究中,并已经取得了一定的进展。对中医药来说,大量治疗同一病症的复方里面必定蕴含着对疾病认识和治疗的科学规律.有些规律已经被掌握了.如一些治法和治则等。也有些更深层次的规律需要从中挖掘出来.而数据挖掘作为~种高级的信息处理技术.可以在一定程度上帮助人们发现和认识那些隐藏的模式和规律.如搜寻临床病症与复立组方关系、复方药物的配伍关系、药味之间的相互作用关系等。国内秦中广等将粗糙集理论应用于中医类风湿的诊断.大大提高了诊断准确率嘲。北京中医药大学利用数据挖掘技术开发的中医处方智能分析系统【羽.
4、结束语
资源,服务于医学、受惠于患者。必须选择适合医学数据类型的数据挖掘工具及挖掘技术.尽可能大的发挥数据挖掘技术在医学信息获取中的价值。为医学的发展开辟了一条新的途径。
参考文献:
f11包祖晓.基于贝叶斯(Bayes)网络技术的抑郁症中医症侯规律研究,北京中医药大学博士学位论文.
f2]JHan,MKamber.范明。孟小峰译.数据挖掘概念与技术.第二版.北京.机械工业出版社.2007.146—176
f3】张万水,陈利固。黄运坤.陈咏梅,王风珍.数据挖掘技术及其在中医遣方用药规律中的应用m.辽宁中医药大学学报.2006.8(04):62—63.f41孙蕾.医学图像智能挖掘关键技术研究.西北工业大学博士论文.f51秦中广.粗糙集在中医类风湿症候诊断中的应用FI.中田生物医学工程学报.2001.20(4):357~363.
【6】程建固.神经网络在基因序列预测中的应用研究o】.徽计算杌信息.
2008.24(11):264~265.
吲徐元熙.数据挖掘在医院信息系统中的应用研究D】.徽计算机信息.2008.24(11):188.,-190.
【8】汤尔群.基于教据挖掘方法的《伤寒论>非衡量器药物剂量研究田.中田中医药报2009.16(10):90-.'93
医学数据库的信息量非常庞大.且其数据和其他类型的数据相比.又具有自身的独特性。要想充分利用丰富而宝贵的医学
医学数据挖掘的现状分析
作者:作者单位:刊名:英文刊名:年,卷(期):被引用次数:
刘莘, 王飞
刘莘(徐州医学院计算机教研室,江苏,徐州,221004), 王飞(江苏电信徐州分公司,江苏,徐州,221000)福建电脑
FUJIAN COMPUTER2010,26(5)1次
参考文献(8条)
1. 孙蕾 医学图像智能挖掘关键技术研究
2. 汤尔群 基于教据挖掘方法的《伤寒论》非衡量器药物剂量研究[期刊论文]-中国中医药报 2009(10)3. 徐元熙 数据挖掘在医院信息系统中的应用研究[期刊论文]-微计算机信息 2008(11)4. 程建国 神经网络在基因序列预测中的应用研究 2008(11)
5. 秦中广 粗糙集在中医类风湿症候诊断中的应用[期刊论文]-中国生物医学工程学报 2001(04)
6. 张万水;陈利国;黄运坤;陈咏梅,王凤珍 数据挖掘技术及其在中医遣方用药规律中的应用[期刊论文]-辽宁中医药大学学报 2006(04)
7. JHan,MKamber;范明;孟小峰 数据挖掘概念与技术 20078. 包祖晓 基于贝叶斯(Bayes)网络技术的抑郁症中医症侯规律研究
引证文献(1条)
1. 方胜吉 浅谈医学数据挖掘技术[期刊论文]-硅谷 2010(20)
本文链接:http://d.g.wanfangdata.com.cn/Periodical_fjdn201005041.aspx