基因组分析6
基因组分析的四个只要任务:
1、 确定基因在染色体上的位置
2、 提供遗传信息
3、 探讨基因之间的联系
4、 探讨基因与经典遗传学,一血诸多方面之间的联系
基因组是指一个生物体,细胞器或病毒的整套基因。
基因组学:以基因组分析为手段,研究基因组的结构组成,时序表达模式和功能并提供有关生物物种及其细胞功能的进化信息。
人类基因组计划的两个方向:1、大规模测序2/建立大型数据库并对序列数据开展生物信息学分析
非编码区DNA的作用调节\结构\酶方面的作用。
基因组信息学:有关基因组信息的储存、获取、处理、分配、分析和注释等方面的研究。 基因组信息学的主要工作:根据各种生物基因组作图和测序的资料与数据,应用:数学与统计学、计算机科学、遗传学和分子生物学等多种手段和工具,综合分析处理基因组图谱、DNA 序列和蛋白质序列等信息,阐明这些资料和数据所包含的生物学意义。
不编码蛋白质或RNA 的DNA 对10%的编码DNA 具有重要作用,占大约90%的非编码的DNA 的作用主要是:1、调节作用2、结构作用3、酶方面的作用。
单核苷酸多态性(single nucleotide polymorphism,SNP):指基因组内特定核苷酸位点上存在两种不同的碱基,其中每种在群体中的频率不小于1%。
SNP 具有以下特点:1、SNP 在基因组中数量大,分布密。2、SNP 在单个基因或整个基因组中的分布不均匀。3、许多SNP 并不影响细胞功能,但有些可能会使人易患病或影响对药物的敏感性。
环境因素:细菌、病毒、毒素、化学物质、辐射。
基因组结构与染色体稳定性的重要性可以通过组蛋白的分子进化研究反映出来。
组蛋白是真核生物染色体中与DNA 分子结合的一类蛋白质,它负责将DNA 包装并储存为染色体的高密度形式。
在细胞分化过程中,染色体浓缩成双联体结构, 但在细胞的正常的静息期,染色体松散地聚合与附着在将基因转录成RNA 的蛋白质(多聚酶) 和 其他一些控制DNA 转录的蛋白质(转录因子) 上。这就是基因调控(转录或表达) 的本质。
基因编码蛋白质,蛋白质又控制着细胞中的每个过程,组蛋白基因在真核生物界的所有物种中都是高度保守的。
基因功能和染色体结构之间的关系 所反映的一种生物的独特性不仅在于它是由哪些基因组成的,还在于它有何种染色体结构。
基因组作图(genomic maooing)目的是:1确定界标或基因在构成基因组的每条染色体上的位置。2、确定同条染色体上各界标或基因之间的相对距离。
基因组作图领域的工作主要涉及:遗传连锁图,物理图、表达图。
遗传连锁图(genetic linkage map):用遗传模式来描述DNA 标记在染色体上的相对位置。 多态性——即DNA 序列变异(突变) ——平均300~500 bp 发生一次。基因组非编码区的突变可用作DNA 水平的分子标记, 它们通常被看做是“隐藏突变(hidden mutation)”, 只能在DNA 分析中被“看到”。
物理图:标明一些界标(如限制酶切点、单一序列、基因等)在DNA 分子或染色体上锁处位置的图。最终的物理图将是基因组或是染色体的完整、连续的DNA 序列。
人类基因组计划的一个具体目标就是对人类基因组构建一幅高分辨率的序列标签位点图。 目前常用的测序方法是鸟枪法,其步骤:1. 先将整个基因组打乱,切成随机碎片2然后测定
每个小片段序列3最终利用计算机对这些切片进行排序和组装4并确定它们在基因组中的正确位置 优点:速度快、简单易行、成本较低
物理图的最精细的图谱就是全基因组的核苷酸序列图。
功能基因组学funtional genomic利用结构基因组学研究所得的各种来源的信息,建立与发展各种技术和实验模型来测定基因 及 基因组非编码序列的生物学功能
非确定读码(URF ):是指DNA 序列中识别出的一个可读框,但其生物学功能不明确。 直系同源基因(orthologous gene)是指在不同物种之间同源相似的基因
并系同源基因(paralogous gene)是指一个物种内的同源基因
同源体是指一个生物物种的基因组中,两个基因或可读框在各自全长的60%以上范围内,同一性不少于30%时,称为同源体。
比较基因组学(comparative genomics) 通过模式生物基因组之间或模式生物基因组 与人类基因组之间的比较与鉴别, 可以为研究生物进化和分离人类遗传病的候选基因 以及预测新的基因功能提供依据。
基于计算的比较基因组学的方法主要有系统发育概形法,Rosetta stone法,基因邻居法 融合蛋白序列Rosetta stone如果一些相互间存在作用的蛋白,其同源物在另一种生物上融合成一个单一的蛋白,这个蛋白序列就称为融合蛋白序列。