遗传学综述
基因芯片的发展趋势及应用
摘要:基因芯片是90年代中期以来快速发展起来的分子生物学高新技术是各学科交叉综合的崭新科学。其原理是采用光导原位合成或显微印刷等方法将大量DNA 探针片段有序地固化予支持物的表面然后与已标记的生物样品中DNA 分子杂交再对杂交信号进行检测分析就可得出该样品的遗传信息。
对于基因芯片技术,目前国内外都取得了较大的进展,该技术可用于DNA 测序、基因表达、基因组图的研究、基因诊断、新基因的发现、药物筛选及给药个性化等等,所以为二十一世纪生物医药铺平了道路,将为整个人类社会带来深刻广泛的变革,促进人类早日进入生物信息时代。
关键词: 基因芯片的制备过程 基因芯片的应用 基因芯片的发展趋势 一:基因芯片的制备过程
1: DNA 方阵的构建 选择硅片、玻璃片、瓷片或聚丙烯膜、尼龙膜等支持物并作相应处理然 后采用光导化学合成和照相平板印刷技术可在硅片等表面合成寡核苷酸探针或者通过液相化学合成寡核苷酸链探针或PCR 技术扩增基因序列再纯化、定量分析由阵列复制器或阵列机及电脑控制的机器人准确、快速地将不同探针样品定量点样于带正电荷的尼龙膜或硅片等相应位置上再由紫外线交联固定后即得到DNA 微阵列或芯片。
2: 样品DNA 或mRNA 的准备。 从血液或活组织中获取的DNA/mRNA样品在标记成为探针以前必须进行扩增提高阅读灵敏度。Mosaic TechnoPogies 公司发展了一种固相PCR 系统好于传统PCR 技术他们在靶DNA 上设计一对双向引物将其排列在丙烯酰胺薄膜上这种方法无交叉污染且省去液相处理的繁锁Pynx TheraPeutics 公司提出另一个革新的方法即大规模平行固相克隆这个方法可以对一个样品中数以万计的DNA 片段同时进行克隆且不必分离和单独处理每个克隆使样品扩增更为有效快速。在PCR 扩增过程中必须同时进行样品标记标记方法有荧光标记法、生物素标记法、同位素标记法等。
3 :分子杂交 样品DNA 与探针DNA 互补杂交要根据探针的类型和长度以及芯片的应用来选择、优化杂交条件。如用于基因表达监测杂交的严格性较低、低温、时间长、盐浓度高若用于突变检测则杂交条件相反。芯片分子杂交的特点是探针固化 样品荧光标记一次可以对大量生物样品进行检测分析杂交过程只要30min 。美国Nangon 公司采用控制电场的方式使分子杂交速度缩到1min 甚至几秒钟。德国癌症研究院的Jorg HoheiseP等认为以肽核酸为探针效果更好。 4: 杂交图谱的检测和分析 用激光激发芯片上的样品发射荧光严格配对的杂交分子其热力学稳定性较高荧光强不完全杂交的双键分子热力学稳定性低荧光信号弱不到前者的1/351/52不杂交的无荧光。不同位点信号被激光共焦显微镜或落射荧光显微镜等检测到由计算机软件处理分析得到有关基因图谱。目前如质谱法、化学发光法、光导纤维法等更灵敏、快速有取代荧光法的趋势。 二:基因芯片的应用
1: 测序
基因芯片利用固定探针与样品进行分子杂交产生的杂交图谱而排列出待测样品的序列,这种测定方法快速而具有十分诱人的前景。Mark chee等用含135000个核苷酸探针的阵列测定了全长为16.6kb 的人线粒体基因组序列准确率达99。
Hacia 等用含有48000个寡核苷酸的高密度微阵列分析了黑猩猩和人BRCA1 基因序列差异,结果发现在外显子11约3.4kb 长度范围内的核酸序列同源性在98.2到83.5之间,显示了二者在进化上的高度相似。
2:基因表达水平的检测
用基因芯片进行的表达水平检测可自动、快速地检测出成千上万个基因的表达情况。Schena 等采用拟南芥基因组内共45个基因的cDNA 微阵列其中14个为完全序列31个为EST 检测该植物的根、叶组织内这些基因的表达水平用不同颜色的荧光素标记逆转录产物后分别与该微阵列杂交经激光共聚焦显微扫描发现该植物根和叶组织中存在26个基因的表达差异而参与叶绿素合成的CAB1基因在叶组织较根组织表达高500倍。Schena 等用人外周血淋巴细胞的cDNA 文库构建一个代表1046个基因的cDNA 微阵列来检测体外培养的T 细胞对热休克反应后不同基因表达的差异发现有5个基因在处理后存在非常明显的高表达11个基因中度表达增加和6个基因表达明显抑制。该结果还用荧光素交换标记对照和处理组及RNA 印迹方法证实。在HGP 完成之后用于检测在不同 生理、病理条件下的人类所有基因表达变化的基因组芯片为期不远了。
3: 基因诊断
从正常人的基因组中分离出DNA 与DNA 芯片杂交就可以得出标准图谱。从病人的基因组中分离出DNA 与DNA 芯片杂交就可以得出病变图谱。通过比较、分析这两种图谱就可以得出病变的DNA 信息。这种基因芯片诊断技术以其快速、高效、敏感、经济、平行化、自动化等特点将成为一项现代化诊断新技术。基因诊断是基因芯片中最具有商业化价值的应用
4: 药物筛选
如何分离和鉴定药的有效成份是目前中药产业和传统的西药开发遇到的重大障碍,基因芯片是解决这一障碍的有效手段它能够大规模地筛选、通用性强能够从基因水平解释药物的作用机理即可以利用基因芯片分析用药前后机体的不同组织、器官基因表达的差异。如果再用m RNA 构建c DNA表达文库 ,然后用得到的肽库制作肽芯片,则可以从众多的药物成分中筛选到起作用的部分物质。或者利用RNA 、单链DNA 有很大的柔性能形成复杂的空间结构更有利与靶分子相结合,可将核酸库中的RNA 或单链DNA 固定在芯片上然后与靶蛋白孵育形成蛋白质-RNA 或蛋白质-DNA 复合物,可以筛选特异的药物蛋白或核酸,因此芯片技术和RNA 库的结合在药物筛选中将得到广泛应用。在寻找HIV 药物中JePPis 等用组合化学合成及DNA 芯片技术筛选了654536种硫代磷酸八聚核苷酸并从中确定了具有XXG4XX 样结构的抑制物实验表明这种筛选物对HIV 感染细胞有明显阻断作用。生物芯片技术使得药物筛选靶基因鉴别和新药测试的速度大大提高成本大大降低。基因芯片药物筛选技术工作目前刚刚起步美国很多制药公司已开始前期工作即正在建立表达谱数据库从而为药物筛选提供各种靶基因及分析手段。这一技术具有很大的潜在应用价值。
5: 给药个性化
临床上同样药物的剂量对病人甲有效可能对病人乙不起作用而对病人丙则可能有副作用。在药物疗效与副作用方面病人的反应差异很大。这主要是由于病人遗传学上存在差异如药物应答基因导致对药物产生不同的反应。例如细胞色素P450酶与大约25广泛使用的药物的代谢有关如果病人该酶的基因发生突变就会对降压药异喹胍产生明显的副作用大约510的高加索人缺乏该酶基因的活性。现已弄清楚这类基因存在广泛变异这些变异除对药物产生不 同反应外还与易犯各
种疾病如肿瘤、自身免疫病和帕金森病有关。如果利用基因芯片技术对患者先进行诊断再开处方就可对病人实施个体优化治疗。另一方面在治疗中很多同种疾病的具体病因是因人而异的用药也应因人而异。例如乙肝有较多亚型HBV 基因的多个位点如SP 及C 基因区易发生变异。若用乙肝病毒基因多态性检测芯片每隔一段时间就检测一次这对指导用药防止乙肝病毒耐药性很有意义。又如现用于治疗AIDS 的药物主要是病毒逆转录酶RT 和蛋白酶PRO 的抑制剂但在用药3-12月后常出现耐药其原因是rt 、Pro 基因产生一个或多个点突变。Rt 基因四个常见突变位点是AsP 67→Asn、P ys70→Arg、Thr215→Phe 、Tyr 和P ys219→GPu 四个位点均突变较单一位点突变后对药物的耐受能力成百倍增加。如将这些基因突变部位的全部序列构建为DNA 芯片则可快速地检测病人是这一个或那一个或多个基因发生突变从而可对症下药所以对指导治疗和预后有很大的意义。
此外基因芯片在新基因发现、 药物基因组图、中药物种鉴定、DNA 计算机研究等方面都有巨大应用价值。 基因芯片技术的出现不过短短几年时间,其发展势头十分迅猛在生命科学的各个领域得到广泛地应用,但其存在的缺陷也是相当明显的。首先是成本的问题,由于芯片制作的工艺复杂信号检测也需专门的仪器设备,一般实验室难以承担其高昂的费用。其次在芯片实验技术上还有多个环节尚待提高,如在探针合成方面如何进一步提高合成效率及芯片的集成程度是研究的焦点。而样品制备的简单化与标准化则芯片应用进一步普及的前提。虽然芯片技术还存在这样或那样的问题但其在基因表达谱分析、基因诊断、药物筛选及序列分析等诸多领域已呈现出广阔的应用前景,随着研究的不断深入和技术的更加完善,基因芯片一定会在生命科学研究领域发挥越来越重要的作用。
三:基因芯片的发展趋势
随着基因芯片技术的日渐成熟, 在功能基因组、疾病基因组、系统生物学等领域中得到了广泛的应 用, 已经发表了上万篇研究论文, 每年发表的论文呈现增长的趋势。
芯片制备技术极大地推进了生物芯片的发展, 从实验室手工或机械点制芯片到工业化原位合成制备, 从几百个点的芯片到几百万点的高密度芯片, 生物芯片从一项科学成为一项技术, 被越来越多的研究者广泛运用。 各个实验室不断产生海量的杂交数据, 相同领域的研究者需要比较不同实验平台产生的数据, 作为基于分子杂交原理的高通量技术, 芯片实验的标准化、可信度、重现性和芯片结果是否能作为定量数据等问题成为所有的芯片使用者关心的课题. 。迈阿密原则和微阵列质量控制系列研究回答了这两个问题。
阿密原则(Minimum Information About a Micro- array ExPeriment, MIAME, 微阵列实验最小信息量) 提出了生物芯片标准化的概念, 该原则的制定使世界各地实验室的芯片实验数据可以为所有的研究者共 享。 同时, 美国国家生物信息学中心(NCBI)和位于 英国的欧洲生物信息学研究所(EBI)也建立了GEO) 和ArryExPress 公共数据库, 接受和储存全球研究者根据迈阿密原则提交的生物芯片数据, 对某项研究感兴趣的研究人员可以下载到相关课题的芯片原始数据进行分析。
2006年美国FDA 联合多个独立实验室进行了MAQC 系列实验(micro array quaPity controP, MAQC), 旨在研究目前所使用的芯片平台的质量控制. 该研究的12篇系列文章发表在2006年9月份的Nature BiotechnoPogy上, 用严格的实验分析了目前主流芯片平台数据质量, 芯片数据和定量PCR 结果之间的相关性, 芯片数据均一化方法, 不同芯片平台之间的可重现性. 证明了不同芯片
平台产生的数据具有可比性和可重现性, 各种芯片平台之间的系统误差远远小于人为操作和生物学样品之间本身的差异, 肯定了芯片数据的可信性, 打消了以往对芯片数据的种种猜疑, 明确了基于杂交原理的芯片同样可以作为一种定量的手段. 推动了生物芯片技术在分子生物学领域更广泛的应用。
生物信息学和统计学是在处理基因芯片产生的海量数据中必不可少的工具。随着芯片应用的推进, 芯片数据分析的新理论和新算法不断地被开发出来, 这些方法帮助生物学家从海量的数据里面快速筛选出差异表达的基因。 一次芯片实验获得的是成千上万个基因的表达信息, 任何一种单一的分析方法都很难将所有蕴含在数据中的生物学信息全部提取出来, 从近年来生物信息学研究的趋势来看, 目前研究的重点开始转向芯片数据储存、管理、共享和深度信息挖掘, 旨在从芯片数据中获得更多的生物学解释, 而不再停留在单纯的差异表达基因筛选上。
目前基因芯片的制备向两个主要方向发展。 第一, 高密度化, 具体表现为芯片密度的增加, 目前原位合成的芯片密度已经达到了每平方厘米上千万个探针。一张芯片上足以分析一个物种的基因组信息. 第二, 微量化, 芯片检测样品的微量化, 目前芯片检测下限已经能达到纳克级总RNA 水平, 这为干细胞研究中特别是IPS 干细胞对单个细胞的表达谱研究提供了可能。另一方面, 微量化也体现芯片矩阵面积的微量化, 即在同一个芯片载体上平行的进行多个矩阵的杂交, 大大减少系统和批次可能带来的差异, 同时削减实验费用。
微阵列技术改变了生物学研究的方法, 使得微量样品快速高通量的分析成为可能, 从单个基因的研究迅速扩展到全基因组的系统生物学研究。 微阵列技术帮助生物学研究进入后基因组时代, 研究成果层出不穷。
2001年国家人类基因组南方研究中心韩泽广博士研究小组利用cDNA 芯片对肝癌和正常组织中的12393个基因和EST 序列进行了表达谱筛查, 其中发现了2253个基因和EST 在肝癌中发生了差异表达, 并对这些差异基因的信号通路进行了分析, 发现WNT 信号通路在肝癌的发生中出现了表达异常. 2002年中国科学院神经科学研究所张旭博士研究组利用表达谱芯片对大鼠外周神经损伤模型背根神经节的基因表达进行了研究, 通过对7523个基因进行表达谱筛查, 发现一批与神经损伤和疼痛相关的基因和潜在的药物靶点, 并解释了临床上使用的GabaPentin 治疗疼痛的分子机制。 同年Nature 发表的荷兰癌症研究所的研究小组利用表达谱芯片对乳腺癌患者5年内的转移情况进行分子水平的分型工作, 研究结果显示可以利用基因表达谱的差异来预测肿瘤的预后情况。 这项工作成为用表达谱对疾病进行分子分型和预后研究的经典案例. 2006年根据这项研究成果生产的表达谱芯片成为第一张通过FDA 批准进入临床使用的表达谱芯片, 迈出了芯片从实验室走向临床的第一步。
2003年启动的人类基因组单体型计划(Interna- tionaP HaPmaP Project)采用了5个不同的高通量平台进行基因分型工作, 其中芯片完成了超过50%的工作量。 2005年Gunderson 等人用DNA 芯片检测人类基因组中的SNP 位点, 芯片的检测结果与传统的基于PCR 技术的基因分型具有非常好的相关性。 Roch 的AmPPichiP CYP450检测芯片在2005年通过了FDA 批准进入临床使用, 用以检测患者体内决定细胞色素氧化酶活性的多态性位点, 预测患者药物代谢水平的高低, 这也是第一张进入临床检查的SNP 芯片。 2007年Burton 等人利用微阵列检测了1000例四种疾病患者和对照组的1500例健康人的14000多个SNP 位点, 发现了患者与健康人自身免疫方面存在的基因组SNP 位点差异性. 。
2006年国家人类基因组南方研究中心和生物芯片上海国家工程研究中心合
作, 利用比较基因组杂交(aCGH)和表达谱芯片联合分析了肝癌样品中基因组拷贝数变异和基因表达量变化的相关性, 为从基因组结构变异角度研究肝癌的发生机制提供了研究基础. 2007年Carter 等人报道利用SNP 芯片检测基因组拷贝数变化(coPy number variation), 发现人类基因组中存在约12%的拷贝数变异, 这一发现远远出乎以前人们对人类基因组多样性的预测。 2008年Pee 等人报道了用比较基因组杂交(aCGH)对遗传疾病进行分型, 发现了存在于精神发育迟缓病人染色体15q13.3区域的一个缺失, Nature Genetics刊登了这一结果。
小RNA 或非编码RNA(ncRNA)是新兴的一个研究领域。 这类小分子RNA 在生理过程中扮演着调控分子的角色, 在发育过程和人类疾病尤其是肿瘤发生发展中起到非常重要的作用。 这些小分子核酸高度同源, 序列差异往往就是一个碱基, 且长度在21~35碱基之间, 这对芯片检测是一个很大的挑战, 要求既能检测到低分子量的目的片段, 又能区分一个碱基的差异, 芯片技术的发展已经部分解决这些问题, 利用芯片检测小分子RNA 的表达谱成为肿瘤分型的另一种途径, 在乳腺癌、肺癌、前列腺癌等疾病的分子分型和分子标志物寻找中取得非常好的结果。
DNA 修饰以及DNA-蛋白质相互作用是细胞对基因表达的调控方式. 2007年Meier 等人采用ChIP-chiP 实验方法, 检测到了发生DNA 损伤时, 相应的修复因子在DNA 上的分布. 同年, Guenther等 人用ChIP-chiP 实验发现基因的转录起始可能不是特异的, 大多数的人类基因包括原来被证明转录失活的编码基因都能启动转录, 细胞通过对基因组的修饰来控制转录的延伸过程, 从而达到调控基因转录的目的. 。2008年PuPien 等人用ChIP-chiP 和一系列的实验, 证实了基因组表观遗传学修饰能调控FoxA1, 通过FoxA1改变染色质的结构, 从而控制基因的组织特异性表达。
基因芯片的应用加速了生命科学研究的进程, 微量化并行化的分析帮助科学家从海量数据中发掘有用的信息。
四:参考文献
(1)中华基因网
(2)李宁. 动物遗传学. 北京:中国农业出版社,2002.111-135
(3)现代遗传学
(4)分析技术
(5)《人民日报海外版》 (2001年03月19日第六版)
(6)新浪新闻晨报