转座子标签技术是利用转座子作探针克隆出突变基因
转座子标签技术是利用转座子作探针克隆出突变基因,再用突变基因做探针,从野生型个体中分离并克隆出野生型基因,最终得到完整的基因的技术方法。转座子标签(transposon tagging)技术是研究功能基因的有效的工具之一。转座子标签法不但可以通过上述转座突变分离基因,而且当转座子作为外源基因通过农杆菌介导等方法导入植物时,还会由于T-DNA整合到染色体中引起插入突变,并进而分离基因,因此大大提高了分离基因的效率。
转座子标签(transposon tagging)技术是研究功能基因的有效的工具之一。转座子标签技术克隆基因的基本原理:
转座子是染色体上一段可移动的DNA片段,它可从染色体的一个位置跳到另一个位置。当转座子跳跃而插入到某个功能基因时,就会引起该基因的失活,并诱导产生突变型,而当转座子再次转座或切离这一位点时,失活基因的功能又可得一恢复。遗传分析可确定某基因的突变是否由转座子引起。由转座子引起的突变便可以转座子DNA为探针,从突变株的基因组文库中钓出含该转座子的DNA片段。并获得含有部分突变株DNA序列的克隆,进而以该DNA为探针。筛选野生型的基因组文库,最终得到完整的基因。
根据转录因子的作用特点可分为二类;第一类为普遍转录因子它们与RNA聚合酶Ⅱ共同组成转录起始复合物,转录才能在正确的位置开始。TFⅡD以外,还发现TFⅡA,TFⅡF,TFⅡE,TFⅡH等,它们在转录起始复合物组装的不同阶段起作用。第二类转录因子为组织细胞特异性转录因子,这此TF是在特异的组织细胞或是受到一些类固醇激素,生长因子或其它刺激后,开始表达某些特异蛋白质分子时,才需要的一类转录因子。
人类Ⅱ型基因的转录因子
因子 分子量
TFⅡA
TFⅡB
TFⅡD
TFⅡE
TFⅡF
TFⅡH
TFⅡI
TFⅡJ
TFⅡS 功能 稳定TFⅡD和DNA的结合,激活TBP亚基 RNAPolⅡ ≥10K 依赖模板合成RNA 12, 19, 35K 33K 结合模板链(-10~+10),起始PolⅡ结合,和TFⅡE/F相互作用 (TBP, 30K) TBP亚基识别TATA,将聚合酶组入复合体中,TAFs识别特殊启动子 34K(β),57K(α) 结合在PolⅡ的前部,使复合体的保护区延伸到下游 38, 74K 大亚基具解旋酶活性(RAP74),小亚基和PolⅡ结合,介导其加入复合体 具激酶活性,可以磷酸化PolⅡC端的CTD,使PolⅡ逸出,延伸 在TFⅡF后加入复合体,不改变DNA的结合方式 RNA合成延伸 120K 识别Inr,起始TFⅡF/D结合
TBP作为第一个和DNA接触的因子十分引人注目,有是它被看成是一种“束缚”因子(commitment factor)其实是和RNA pol Ⅱ结合,使启动子转录,它起到介导的作用。由于TATA框离转录起始位点的距离是固定的,识别它对RNA聚合酶来说是重要的。TBP在启动上对各种聚合酶所起的一个相同的作用是将它们组入转录复合体中。
TFⅡA含有几个亚基(在酵母中有2个,在哺乳动物中有3个),当它加入复合体中时,TFⅡD所保护的DNA区域就延伸更上游的区域。它可能通过解除TAFs的阻遏作用而激活TBP,它的参与使TFⅡD和TATA框结合得更稳定
TFⅡB分子量为33Kda,它在起始点邻近区域,从-10到+10可以部分地保护模板链在TATA框下游与DNA松散结合。形成复合物,和DNA双链结合是不对称的,它还可以使TFⅡE/ⅡF相互作用。
TFⅡF含有2个亚基,大亚基RAP74,具有ATρ-依赖性DNA解旋酶活性,它和起始时DNA链的熔解有关。它的小亚基是RAP38,和细菌的σ因子有部分同源,紧密地和RNA pol Ⅱ结合。介导polⅡ和其它蛋白结合转录成复合体。TFⅡF-polⅡ和复合体连接时,与TFⅡB的相互作用是重要的。RNA PolⅡ结合位点在模板链上达到下游+15,在非模板链上达到+20,其长度贯穿了整个复合体 ,上游也被其保护了。TRⅡE结合在pol的前部,使复合体的保护区延伸到下游双链的+30处。
TRⅡH和 TRⅡJ在TRⅡF之后也加入复合体中,但并不改变DNA的结合方式。TFⅡH具有激酶活性,可以磷酸化RNA pol Ⅱ尾巴上的CTD,CTD的磷酸化使polⅡ从转录因子中释放出来,这样就能离开启动子开始延伸。
表RNApolⅢ启动子的转录因子的结构和功能
因子 结构 功能
TFⅢA 38Kda,有9个锌指 结合于1型内部启动子(5sRNA基因)的C框,使ⅢC结合在C框下游,辅助ⅢB定位结合
TFⅢB 含TBP和另外二种蛋白 定位因子,使Pol结合在起始位点上
TFⅢC 含τA和τB,有5个亚基 τA结合A框,起启动子的作用;τB结合Ⅱ型内部启动子(tRNA基因)的B框,起增强子的作用。辅助ⅢB定位结合
TⅡD 含TBP亚基 结合TATA框,确定选择PolⅢ
PBP 次近端结合蛋白 可能和ⅡD一道辅助ⅢB定位结合的另一途径
Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于—25~—30 bp处的TATAAAAG,也称TATA框(TATAbox)。
RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RAN聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnowbox),这个框的中央位于起点上游10bp处,所以又称—10序列(—10 sequence),后来在—35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于—25~—30 bp处的TATAAAAG,也称TATA框(TATAbox)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptreamactivatingsequence,UAS)。另外在—70~
—78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)
TBP: 转录因子TFⅡD的组分之一。特异地与TATA框结合并指导起始复合体的形成,也可以是与RNA聚合酶Ⅲ(或Ⅰ)共同发挥作用的转录因子之一。即使基因无TATA框,也能通过与TBP结合因子间相互作用而起调节作用。并起到将RNA聚合酶“束缚”在启动子的作用。又称螺旋失稳蛋白,DNA解链蛋白,单链DNA结合蛋白。 它是解链酶(unwinding enzyme)类中的一种类型,发现于原核生物的大肠杆菌细胞内,由相同亚基组成的四聚体,分子量8×104,与单键DNA亲和力极大,与双链DNA结合力较差。因此,当DNA发生暂时性熔化时,它与DNA单链区结合而促使反应偏向单链的形成,使DNA在大大低于Tm(解链温度)的温度下发生双链的分离,双螺旋则在复制叉的前方分开,并在复制叉处稳定单链结构,阻止再形成双螺旋。DBP与单链DNA的结合还显示出如下协同效应,即第二个DBP分子的结合能力比第一个要大103倍之多,这一结合可以影响某些其他蛋白质或酶与该单链DNA结合和识别作用。如DNA-DBP复合物能保护DNA免受核酸酶水解;也可抑制RNA聚合酶的作用,从而防止复制和转录同时在一段DNA上发生。虽然在真核细胞中也可分离到DBP,但所得的DBP和单链的DNA结合时无协同效应,与双链的DNA则具有一定的结合力,并且又不能促使变性DNA复制。真核生物的DBP的作用方式是,DBP先与双链DNA结合,并使之熔化。端体(telomere)即端粒,是染色体的末端,存在着特殊的结构。 端粒主要有三方面的功能: 端体①防止染色体末端被DNA酶酶切; ②防止染色体末端与其它DNA分子结合; ③使染色体末端在DNA复制过程中保持完整。 对不同物种染色体末端的结构分析发现,所有染色体的末端都存在着串联的重复序列。尽管不同物种的重复序列有所不同,但均可用下列通式表示:“5-T1-4-A0-1-G1-8-3”。如人类为TTAGGG,原生动物嗜热四膜虫(Tetrahymena thermophila)为TTGGG,而植物拟南芥 (Arabidopsis thaliana)为TTTAGGG。但这种保守序列重复的次数在不同生物、同一生物的不同染色体,甚至同一染色体在不同的细胞生长时期也可能不同。端粒的结构与功能是当前分子生物学研究的热点之一。 端粒DNA是由简单的DNA高度重复序列组成的,染色体末端沿着5'到3' 方向的链富含 GT。在酵母和人体中,端粒序列分别为C1-3A/TG1-3和TTAGGG/CCCTAA,并有许多蛋白与端粒DNA结合。端粒DNA主要功能有:第一,保护染色体不被核酸酶降解;第二,防止染色体相互融合;第三,为端粒酶提供底物,解决DNA复制的末端隐缩,保证染色体的完全复制。端粒、着丝粒和复制原点是染色体保持完整和稳定的三大要素。同时,端粒又是基因调控的特殊位点, 常可抑制位于端粒附近基因的转录活性(称为端粒的位置效应,TPE)。在大多真核生物中,端粒的延长是由端粒酶催化的,另外,重组机制也介导端粒的延长。乙酰化修饰功能主要集中在对细胞染色体结构的影响以及对核内转录调控因子的激活方面 。但是,复旦科研人员通过通量化的蛋白质组研究和不同物种的代谢通路研究发现,在生理状况下,存在着大量非细胞核的蛋白被乙酰化修饰。他们这些具有重大意义的发现包括: 1)蛋白质的乙酰化修饰不是少数,极可能影响着细胞生理状态下各个方面的广泛修饰,譬如在人的肝脏细胞中有超过1000个蛋白是被乙酰化修饰的,其中超过900个是新发现的,改写了原来西方编写的教科书中的传统概念。这对科学家未来深入研究这一领域,无疑具有突破性的里程碑意义。 2)首次发现了乙酰化修饰普遍存在于人体的代谢酶之中,并且调节代谢通路及代谢酶的活性。据相关专家介绍,由于蛋白质修饰后的调控功能与各类药物在人体中的效用发挥息息相关,这一新发现,将为现实生活中各类药物或维生素的使用提供重要的依据。 3)复旦科研人员还发现,乙酰化对代谢的调控发生在从低等原核细胞到包括人在内的高等哺乳动物翻译后修饰过程,因此,可以认为这一过程是在生命进化进程中极为保守的。 4)另一个重要发现是,蛋白质的乙酰化具有很高的功能特异性——在代谢器官(如肝)中代谢酶被高度乙酰化,而在白血病中参与肿瘤发生的信号通路蛋白也被高度乙酰化。据介绍,这一最新发现指明,人们应该针对不同的疾病或不同的组织功能筛查乙酰化修饰蛋白质图谱,从而有可能以不同的蛋白质修饰特性与特点指导有关疾病临床新药的研发,使未来的药物更加能够针对“病灶”、“对症下药”,从长远来看,复旦的这一发现将为百姓的健康带来更多的福音。换言之,该项最新研究成果除了具有开拓性的科研意义外,还将为药物研发的打开新思路。 5)鉴于现在人体80%疾病与代谢有关,《Science》杂志的评论认为:该研究为开发调控代谢的药物提供了新的思路,为包括肿瘤在内的新的治疗手段的发展提供了可能。这一发现为代谢类疾病的药物研发提供了重要依据和全新的思路。人类有80%的疾病是代谢疾病,如果能通过调控乙酰化从而调整代谢的速度,那么就意味着可以调控疾病 2010年2月19日出版的国际权威期刊《Science》杂志同时发表了两篇题为《代谢酶的乙酰化协调碳源的利用和代谢》和《蛋白赖氨酸的乙酰化调控》文章,披露复旦大学在生物医学研究领域的最新成果。并配发评论认为,中国科学家进行的这项研究,开辟了生命代谢研究的新领域,为开发调控代谢的药物研究提供了新的思路,为包括肿瘤在内新的治疗手段发展提供了可能。而且,细胞蛋白、代谢酶等大量非细胞核蛋白的乙酰化修饰,都是在研究中首次得到确认。 这项研究也表明,教科书中关于代谢调控内容将有可能被改写,乙酰化修饰的概念将可能成为代谢调控新内容隐蔽mRNA在卵母细胞中与蛋白质结合的mRNA。可长时间稳定存在,贮存母体信息。在早期胚胎发生中脱去蛋白质,进行翻译。比起tRNA和rRNA,为什么mRNA的寿命短啊?
因为tRNA和rRNA在蛋白质翻译过程中,是可以重复使用的.tRNA携带特定氨基酸与mRNA上相应密码子结合,氨基酸脱水缩合连在肽链上后,tRNA就会离开去寻找新的特定氨基酸,然后继续帮助完成翻译,就象一辆来回运货的汽车,往返于货源地和销售地之间.
rRNA和某些蛋白质结合后形成的核糖体,也是可以多次使用的,在某一条mRNA的指导下合成一条肽链后,它还会寻找新的mRNA去合成新的肽链.而mRNA则不同,它在指导合成完一条肽链后,会迅速分解成核糖核苷酸,从核孔进入细胞核,继续转录新的,和刚才不一样的mRNA,再出核孔来指导合成新的肽链.也就是说,tRNA和rRNA的种类有限,产生后可以多次重复使用.而mRNA的种类则千变万化,由该种生物的基因数量而决定.转录和mRNA降解的协调在许多方面是有吸引力的想法。首先,在转录产物的合成和降解速度之间的相互协调可增加参与细胞调节基因表达的酶和底物的利用效率。第二,这两个过程的协调可在响应各种细胞信号时,更精细地调节RNA累积动力学。一、mRNA寿命的调节mRNA进入细胞浆后与核糖体复合物结合,进行翻译。mRNA在胞浆中存在的时间的长短直接影响到翻译的成果。调节mRNA寿命的信号主要位于3’非翻译区。有研究表明3'非翻译区的长短与mRNA的寿命成正比。还有些非正常的转录,例如过度转录、错误转录,正常状况下,都用相应的酶对它们进行降解。有研究表明核糖体蛋白的mRNA如果进行了错误的转录,一旦进入胞浆中就会被迅速降解。激素对特定mRNA的稳定作用:许多激素通过延长特定mRNA的半衰期而发挥作用。如:催乳素可促进乳汁分泌,增加乳汁中的酪蛋白量。这一效应正是通过延长酪蛋白的mRNA的寿命实现的。沉降系数(sedimentation coefficient)用离心法时,大分子沉降速度的
量度,等于每单位离心场的速度。或s=v/ω2r。s是沉降系数,ω是离心转子的角速度(弧度/秒),r是到旋转中心的距离,v是沉降速度。沉降系数以每单位重力的沉降时间表示,并且通常为1~200×10-13秒范围,10-13这个因子叫做沉降单位s,即1s=10-13秒,如血红蛋白的沉降系数约为4×10-13秒或4s。大多数蛋白质和核酸的沉降系数在4s和40s之间,核糖体及其亚基在30s和80s之间,多核糖体在100s以上。大多数tRNA由七十几至九十几个核苷酸组成,分子量为25000~30000,沉降常数约为4S(个别tRNA的沉降常数为3S,含63个核苷酸)。曾用名有联接RNA、可溶性RNA、pH5RNA等。一种tRNA只能携带一种氨基酸,如丙氨酸tRNA只携带丙氨酸,但一种氨基酸可被不止一种tRNA携带。
同一生物中,携带同一种氨基酸的不同tRNA称作“同功受体tRNA”。 编辑本段影响
同义突变
无论是碱基置换突变还是移码突变,都能使多肽链中氨基酸组成或顺序发生改变,进而影响蛋白质或酶的生物功能,使机体的表型出现异常。碱基突变对多肽链中氨基酸序列的影响一般有下列几种类型。
基因突变
⑴同义突变(same sense mutation):碱基置换后,虽然每个密码子变成了另一个密码子,但由于密码子的简并性,因而改变前、后密码子所编码的氨基酸不变,故实际上不会发生突变效应。例如,DNA分子模板链中GCG的第三位G被A取代,变为GCA,则mRNA中相应的密码子CGC就变为CGU,由于CGC和CGU都是编码精氨酸的密码子,故突变前后的基因产物(蛋白质)完全相同。同义突变约占碱基置换突变总数的25﹪。
错义突变
错义突变(missense mutation):碱基对的置换使mRNA的某一个密码子变成编码另一种氨基酸的密码子的突变称为错义突变。错义突变可导致机体内某种蛋白质或酶在结构及功能发生异常,从而引起疾病。如人类正常血红蛋白β链的第六位是谷氨酸,其密码子为GAA或GAG,如果第二个碱基A被U替代,就变成GUA或GUG,谷氨酸则被缬氨酸所替代,形成异常血红蛋白HbS,导致个体产生镰形细胞贫血,产生了突变效应。
无义突变
无义突变(nonsense mutation):某个编码氨基酸的密码突变为终止密码,多肽链合成提前终止,产生没有生物活性的多肽片段,称为无义突变。例如,DNA分子中的ATG中的G被T取代时,相应mRNA链上的密码子便从UAC变为UAA,因而使翻译就此停止,造成肽链缩短。这种突变在多数情况下会影响蛋白质或酶的功能。
基因突变
终止密码
终止密码突变(terminator codon mutation):基因中一个终止密码突变为编码某个氨基酸的密码子的突变称为终止密码突变。由于肽链合成直到下一个终止密码出现才停止,因而合成了过长的多肽链,故也称为延长突变。例如,人血红蛋白α链突变型Hb Constant Spring比正常人α珠蛋白链多了31个氨基酸。
基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。
基因组学能为一些疾病提供新的诊断,治疗方法。例如,对刚诊断为乳腺癌的女性,一个名为“Oncotype DX”的基因组测试,能用来评估病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性化医疗。基因组学还被用于食品与农业部门。
基因组学与遗传学发展里程碑
基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定。基因组学是研究生物基因组的组成,组内各基因的精确结构、相互关系及表达调控的科学。基因组学、转录组学、蛋白质组学与代谢组学等一同构成系统生物学的组学(omics)生物技术基础功能基因组学
基因组DNA测序是人类对自身基因组认识的第一步。随着测序的完成,功能基因组学研究成为研究的主流,它从基因组信息与外界环境相互作用的高度,阐明基因组的功能。功能基因组学的研究内容:人类基因组 DNA 序列变异性研究、基因组表达调控的研究、模式生物体的研究和生物信息学的研究等。
(1)基因组表达及调控的研究。在全细胞的水平,识别所有基因组表达产物mRNA和蛋白质,以及两者的相互作用,阐明基因组表达在发育过程和不同环境压力下的时、空的整体调控网络。
(2)人类基因信息的识别和鉴定。要提取基因组功能信息,识别和鉴定基因序列是必不可少的基础工作。基因识别需采用生物信息学、计算生物学技术和生物学实验手段,并将理论方法和实验结合起来。基于理论的方法主要从已经掌握的大量核酸序列数据入手,发展序列比较、基因组比较及基因预测理论方法。识别基因的生物学手段主要基于以下的原理和思路:根据可表达序列标签(STS);对染色体特异性cosmid进行直接的cDNA选择;根据CpG岛;差异显示及相关原理;外显子捕获及相关原理;基因芯片技术;基因组扫描;突变检测体系,等等。
(3)基因功能信息的提取和鉴定。包括:人类基因突变体的系统鉴定;基因表达谱的绘制;“基因改变-功能改变”的鉴定;蛋白质水平、修饰状态和相互作用的检测。
(4)在测序和基因多样性分析。人类基因组计划得到的基因组序列虽然具有代表性,但是每个人的基因组并非完全一样,基因组序列存在着差异。基因组的差异反映在表型上就形成个体的差异,如黑人与白人的差异,高个与矮个的差异,健康人与遗传病人的差异,等
等。出现最多基因多态性就是单核苷酸多态性(SNPs)。
(5)比较基因组学。将人类基因组与模式生物基因组进行比较,这一方面有助于根据同源性方法分析人类基因的功能,另一方面有助于发现人类和其他生物的本质差异,探索遗传语言的奥秘 。
Jacob和Monod认为诱导酶(他们当时称为适应酶)现象是个基因调控问题,可以用实验方法进行研究,因此选为突破口,终于通过大量实验及分析,建立了该操纵子的控制模型。
① Z、Y、A基因的产物由同一条多顺反子的mRNA分子所编码。
② 这个mRNA分子的启动子紧接着O区,而位于I与O之间的启动子区(P),不能单独起动合成β-半乳糖苷酶和透过酶的生理过程。 ③ 操纵基因是DNA上的一小段序列(仅为26bp),是阻遏物的结合位点。
④当阻遏物与操纵基因结合时,lacmRNA的转录起始受到抑制。
⑤诱导物通过与阻遏物结合,改变它的三维构象,使之不能与操纵基因结合,从而激发lacmRNA的合成。当有诱导物存在时,操纵基因区没有被阻遏物占据,所以启动子能够顺利起始mRNA的合成。
乳糖操纵子发现历程
1927年 H J Muller 用X-光进行诱变
1941年 George Beadle, E L Tatum
提出one gene-one enzyme 假说
1944年 Oswald Avery等 证明基因是DNA
1940年,Jacques Monod开始研究E.coli 进行乳糖代谢的一些特征研究,观察到乳糖和其他半乳糖苷可以诱导β-半乳糖苷酶的产生。他和MelvinCohn用抗β-半乳糖苷酶抗体检测酶蛋白,发现诱导后酶量增加。进一步研究发现事情更复杂。一些神秘的突变株“cryptic mutants”能产生β-半乳糖苷酶,但是却不能在以乳糖为碳源的培养基中生长。这是什么原因呢?为了回答这个问题,他们用放射性标记的半乳糖苷进行研究。发现野生型菌在乳糖诱导后会摄取半乳糖苷,而这种突变型菌不能。
Cryptic mutant这个实验结果有什么提示呢?
1)在野生型菌中,有一种物质与β-半乳糖苷酶一起被诱导,它负责输送半乳糖苷进入细胞。
2)突变株中,这种物质的基因被破坏。
Monod将这种物质命名为半乳糖苷透过酶。但为此他遭到了同事们的批评,因为他在这个蛋白未分离到之前就进行命名。Monod对当时的情形作了如下描述:
This attitude reminded me of that of two traditional English gentlemen who, even if they know each other well by name and by reputation, will not speak to each other before having been formally introduced.
Monod和同事努力分离纯化得到了半乳糖苷透过酶。在这个过程中,他们还分离到了另一个蛋白:半乳糖苷转乙酰酶,该酶与β-半乳糖苷酶和半乳糖苷透过酶一起被诱导。这样,到了50年代末,Monod已经知道有三种酶共同被半乳糖苷诱导。他们也发现了一些组成型突变株,不需要诱导就可以产生这三种酶。Monod认识到用遗传学分析可以加快实验进展,所以与同在Pasteur Institute工作的Francois Jacob开展了合作研究。在Arthur Pardee的协作下,Jacob和Monod构建了局部二倍体(merodiploid),携带着野生型和组成型的等位基因。野生型等位基因证明是显性的。野生型细胞可以产生某种物质使lac基因关闭。这种物质也可以使组成型基因表达关闭,从而局部二倍体也是诱导型的。这种物质他们命名为repressor。组成型菌株的repressor基因有缺陷性突变,即lacI-。
Jacob和Monod推测,repressor和某特定DNA序列结合。(称之为operator)。这种结合是特异的,基因突变会影响这种结合。Operator的某些突变可以破坏它和repressor之间的相互作用。这样也会导致组成型表达。那么,如何区别这两种组成型突变呢?他们俩想,如果上述假设是正确的话,那末就可以跟据这个突变是显性还是隐性来进行区别。Jacob打了一个很形象的比喻。同样也要构建局部二倍体。他把局部二倍体中的两个operator比作两个无线电接收器,分别控制进入一个房间的两扇门中的一扇。两个repressor象无线电发射器,发射同样的信号使门关闭。如果一个repressor基因发生突变(不表达),就像一个发射器坏了,另一个发射器仍会工作,两扇门仍然是关闭的。换句话,二倍体中的两个lac operon仍然是阻遏的。这种突变是隐性的。如果是一个operator发生了突变,就像一个接收器发生了故障,所控制的门市开的。另一扇门的接收器是正常的,门仍然关闭。这样,突变的lac operon仍然是去阻遏的,表现为显性。这种突变叫顺式显性(cis-dominant)。Operator组成型用Oc表示。在实验中,Monod等还发现两个突变株,无论有无诱导物存在都不表达lac gene。而且将该突变基因和野生型基因构成局部二倍体时,也表现出不表达lac gene。这种突变是显性的。这也是lacI基因的一种突变结果(lacIs),其产物可以与operator结合,但不能与lactose结合。另外,还有一种突变lacI-d(dominant negative),不能与operator结合。
Repressor-operator相互作用的实验证明
Lac repressor的纯化 (1960s Walter Gilbert and Benno Muller-Hill)在当时的条件要完成这件事是非常了不起的工作。Repressor在细胞内含量很低,而且没有简易的方法可以鉴定。当时最敏感的是用标记的合成诱导物IPTG。但是,即使应用这种方法在野生型细胞的抽提液中也难以检测到repressor。为了解决这个问题Gilbert等,应用了突变株,lacIt,其与IPTG结合更紧密。这样突变的repressor可以结合足够的IPTG,来检测目的蛋白,即使在很不纯的抽提物中。于是,Gilbert就可以纯化该蛋白了。在此基础上,Melvin Cohn等用硝酸纤维素膜结合实验方法研究了repressor与operator的相互作用。ssDNA和蛋白质-DNA复合物可以与硝酸纤维素膜结合,而dsDNA不能。他们用32P标记Operator。结果确实证明,repressor可以和operator结合,而且IPTG可以抑制它们结合。组成型突变的Oc与repressor的结合能力大大降低。这个实验证明了Jacob和Monod用遗传学方法确定的operator确实是repressor的结合位点。阻遏的机制起初,人们认为repressor(R)可以阻止RNAP与启动子(P)结合。
1971年,Ira Pastan等用实验证明即使有R存在,RNAP也可以与lac P紧密结合。将RNAP与DNA(含有lacP、lacO)以及R一起孵育,然后加诱导物IPTG和rifampicin。如果未形成开放型启动子复合物,rifampicin将会抑制转录。但是转录确实发生了。说明lacR并没有阻止开放型启动子复合物的形成。所以,R并不能阻止RNAP与lacP结合。实际上,RNAP与R可以同时与启动子结合。那么,R的阻遏机制是什么?
Barbara Krummel and Michael Chamberlin提出一种解释:R阻断了起始转录复合物向延伸状态的转变。换句话说,R把RNAP困在起始状态,只能合成很短的转录体。
Jookyung Lee and Alex Goldfarb为这一解释提供了实验证据。应用了run-off转录方法,使用一旦123bp DNA(含lac控制区和lacZ基因的起始部分)。先将R与DNA一起孵育10min,让R-O结合。再加RNAP,20min后(让开放型启动子复合物形成)加heparin。Heparin能与游离的RNAP或与DNA结合不紧密的RNAP结合,抑制RNAP与启动子结合。然后加入RNAP反应的其他成分,但不包括CTP。5min后,加入α-32P-CTP及IPTG,并设立不加IPTG对照。反应10min后,通过电泳观察是否发生run-off转录。实验结果显示,确实观察到了转录题。因此,R不能抑制RNAP与laP之间的紧密结合。实际上lac操纵子有3个operator。除了主要的O1,还有两个辅助的O,一个在上游,一个在下游,都与阻遏作用有关,但O1起主要作用。两个O之间可以通过R相互作用。
Lac操纵子的正调控当E.coli在含葡萄糖和乳糖的混合碳源培养基中生长时,菌体首先利用葡萄糖,仅当葡萄糖消耗完后才利用乳糖。在葡萄糖存在时,即使无阻遏物存在(lacI-),lac基因也不表达。进一步研究表明,葡萄糖对lac基因表达的抑制是间接的,是葡萄糖的某些代谢产物抑制了lac基因表达,因此这种效应被称为代谢物阻遏效应(catabolite repression)。无论真核生物还是原核生物,cAMP对基因表达的控制都具有普遍作用。
1958年,E. Sutherland在研究动物激素作用的过程中发现了cAMP,可以激活糖原磷酸化酶(1971年获nobel奖),cAMP由腺苷酸环化酶产生。ATP在腺苷酸环化酶的作用下产生cAMP和PPi。一些激素,如肾上腺素,可以激活腺苷酸环化酶。研究发现这个分子在体内有各种不同的功能。
Monod&Jacob有句格言(aphorism) "what is true for Escherichia coli is true for the elephant"。一些生化学家开始用细菌系统来阐明cAMP的功能。Mackman&Sutherland发现在葡萄糖饥饿的E.coli细胞内cAMP含量上升。加入葡萄糖后cAMP含量下降。后来Ira Pastan等证明加入cAMP可以解除代谢物阻遏效应(包括lac、gal、ara操纵子)。那么cAMP是正调控因子吗?(注:Pastan 1961年在NIH和Jim Field一起研究甲状腺刺激激素(TSH)的功能。在Earl Stadtman实验室做了一段博士后,然后又转向研究TSH。当时Earl Sutherland已发现很多激素可以激活腺苷酸环化酶,从而增加胞内cAMP水平。这也启发Pastan研究起甲状腺中的cAMP水平的变化。他发现TSH也能激活腺苷酸环化酶,使组织内cAMP水平增加;而且,在组织内加入cAMP的类似物也能产生TSH的许多作用。指出cAMP是TSH作用的中介。那么cAMP是怎样起作用的呢?他想也许通过对E. coli的研究更容易找到答案。他和Robert Perlman就开始一起研究。受Sutherland工作的启发,做了上述实验。)
Geoffrey Zubay和Pastan两个小组几乎同时发现与cAMP结合的蛋白。Zubay称为catabolite activator protein (CAP),Pastan称为cAMP receptor protein(CRP),其编码基因名称为crp。Pastan还测定了cAMP-CAP的解离常数,为1-2´10-6M。
CAP作用机制
Zubay等发现一系列突变株,CAP和cAMP均不能促进其lac基因转录。突变位点在lac启动子内,后来分子生物学家确定了cap的结合位点就在lac启动子的上游(Activatorsite)。Pastan等人证明CAP-cAMP与A位点结合后,可帮助RNAP形成开放性启动子复合物。(P188 Fig7.10)首先将RNAP和lac启动子结合,加或不加CAP-cAMP。然后同时加入核苷酸和利福平。看是否已形成开放性复合物。如果没有,利福平就会抑制转录的进行。如果已形成开放性复合物,利福平则不能抑制转录进行。结果,加入CAP-cAMP转录可以进行,不加则转录不能进行。
CAP-cAMP可使DNA弯曲,或与RNAP发生作用,或者两者皆有,使RNAP与启动子形成一个开放性启动子复合物。(证据:CAP-cAMP可与RNAP共沉淀;CAP-DNA晶体结构显示DNA发生弯曲。)
真核生物启动子:
启动子(promoter):真核基因启动子是在基因转录起始位点(+ 1)及其5’上游近端大约100~200bp以内(或下游100bp)的一组具有独立功能的DNA序列,每个元件长度约为7~20bp,是决定RNA聚合酶转录起始和转录频率的关键元件。
启动子包括:A。核心启动子(core promoter):是指足以使RNA聚合酶Ⅱ转录正常起始所必需的、最少的DNA序列。其中包括转录起始位点或起始子(initiator)(+1):一般是A或G及转录起始位点上游-25/-30bp处富含TA的典型元件TATA框。
B。上游启动子元件(upstream promoter element,UPE):包括通常-70bp附近的CAAT框:GGCCAATCT和GC框:GGGCGG等,能通过TFⅡ-D复合物调节转录起始的频率,提高转录效率。
RNA聚合酶II的启动子:
第一个部位为帽子位点,即转录起始位点。其碱基大多为A(指非模板链),两侧各有若干个嘧啶核苷酸。
第二个部位为TATA框(Hogness box)。它位于-25个bp其共有序列为:TATAA/TAA/T,基本上由AT碱基对所组成,只有很少启动子中有GC碱基对的存在。
第三个部位 为CAAT框。其共有序列为GGC/TCAATCT,一般位于-75(-100~-200)附近。虽然此序列名为CAAT框,但其中头两个G的重要性并不亚于CAAT部分。CAAT框为上游控制元件,为转录所需。
第四个部位是增强子(enhancer),又称远上游序列(far upstream sequence)。一般都在-1OO以上。增强子的作用主要是,对依赖于TATA框的转录和不依赖TATA框的转录都有增强效应,但对前者增强效应高;距离效应和极性效应。
内含子(introns)在转录后的加工中, 从最初的转录产物除去的内部的核苷酸序列。术语内含子也指编码相应RNA内含子的DNA中的区域。内含子可能含有“旧码”,就是在进化过程中丧失功能的基因部分。正因为内含子对翻译产物的结构无意义,它比外显子累积有更多的突变。大多数真核结构基因中的间插序列(interveningsequence)或不编码序列。它们可以转录,但在基因转录后,由这些间插序列转录的部分(也可用内含子这个术语表示)经加工被从初级转录本中准确除去,才产生有功能的RNA。基因的编码部分称外显子。内含子常比外显子长,且占基因的更大比例。真核基因所含内含子的数目、位置和长度不尽相同,如鸡卵清蛋白基因的外显子被7个内含子隔开,鸡卵伴清蛋白基因有17个内含子,α-珠蛋白基因有2个内含子,卵粘蛋白基因有6个内含子等。内含子(Interveningregion)是一个基因中非编码DNA片断,它分开相邻的外显子。更精确的定义是:内含子是阻断基因线性表达的序列。DNA上的内含子会被转录到前体RNA中,但RNA上的内含子会在RNA离开细胞核进行转译前被剪除。真核生物的基因含有外显子和内含子,是前者区别原核生物的特征之一。内含子在选择性剪接扮演重要角色,一个基因可以因此而产生多种不同的蛋白质。内含子的意义在于转录mRNA的时候可以进行切割,这样子就保证了在进行转录的时候只转录DNA上有用的信息。内含子分为自我剪接内含子,剪接体介导剪接内含子和酶促剪接内含子三类。一般认为内含子的作用是调控基因表达,但是目前对内含子的存在意义还是没有深入了解,但是要知道线粒体和叶绿体的基因里也是有内含子的。
可变剪切(或选择性剪切)是一个过程,即主要基因或者mRNA前体转录所产生的RNA的外显子以多种方式通过RNA剪切进行重连。由此产生的不同的基因可能被翻译成不同的蛋白质构体,因此,一个基因可能编码多种蛋白质。变为剪切是用不同方式剪接一个相同的mRNA前体,从而使一个mRNA前体得到不同mRNA经过转录和翻译,使一段相同的DNA序列可以产生不同功能的蛋白质。
在人体内大约有60%的转录机制都是变为剪切,剪切变位剪切可以决定基因产生哪种蛋白质因此可以控制基因的表达。当外界环境剧烈变化的时候,机体可以通过变位剪切使基因产生特殊的蛋白质来抵抗外界变化。
可变剪接是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA剪接异构体的过程。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制。剪接过程受多种顺式作用序列和反式作用因子相互作用调节。包括SR和hnRNP家族蛋白在内的多种剪接因子参与这一调节过程。转录机器(machine)也参与可变剪接的调节。
可变剪接的功能和生物学意义1. 可变剪接是在RNA水平调控基因表达的机制之一。一个基因通过可变剪接产生多个转录异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,它们分别在细胞/个体分化发育不同阶段,在不同的组织,有各自特异的表达和功能。因此,可变剪接是一种在转录后RNA水平调控基因表达的重要机制。目前已知的可变剪接异构体中,只有一小部分明确确定了功能和生物学意义。第一个确定的可变剪接异构体功能是 IgM基因,其末端最后两个外显子的可变剪接,决定了所编码的膜型/分泌型IgM的产生。最著名的例子是果蝇性别决定系统,在此系统中,至少5个基因(sxl, tra, msl2, dsx, and fru) 转录体的可变剪接级联反应最终决定了果蝇雄性和雌性性别特征的表达。有些基因,可变剪接造成的蛋白质异构体之间功能上的差异没有被实验检测出来。不过阴性的结果不能代表没有功能差异,只是目前没有检测出来而已。也有很多异构体造成读码框架改变,不能被翻译为蛋白质,而是直接被降解了。真核生物也有mRNA监视系统NMD(nonsense-mediated degradation),检测 mRNA中异常提前出现的终止密码子,一经发现,立即降解异常的mRNA,防止其翻译。在大多数情况下,检测可变剪接造成的蛋白质异构体之间功能上的差异的实验还没有开展。最近发展的RNAi技术,可以适应高通量的从功能基因组水平研究各基因可变剪接异构体的功能的要求。2000年已经有人将RNAi技术应用于模式生物线虫的可变剪接异构体的大规模研究上。(目前已经大量开始用于哺乳动物系统)2.多样性与复杂性 可变剪接是从相对简单的基因组提高蛋白质组多样性的重要机制,蛋白质组的多样性与多细胞高等生物的复杂性相适应。从可变剪接涉及的基因分布格局分析,可变剪接多发生在参与信号传导和表达调节等复杂过程的基因上,如受体,信号传导通路(凋亡),转录因子等。对个体分化发育和一些关键的细胞生理过程如凋亡、细胞兴奋等的精确调控有重要意义。从可变剪接涉及的基因系统分类分析,可变剪接多发生在免疫和神经等复杂系统。正如Dscam 基因所示,可变剪接产生的多样性,赋予这些系统精确处理复杂信息相适应的潜力。
实验室多用琼脂糖水平平板凝胶电泳装置进行DNA电泳实验。在电场中, 在pH值为8.0-8.3时,核酸分子带负电,在电泳时由负极向正极移动。阳离子聚合物是目前非病毒基因载体中研究较多的一类材料,如聚乙稀亚胺(PEI)、聚氨基酸和壳聚糖等,与DNA的结合能力对其转染效率有着至关重要的影响。以PEI为例,其与DNA通过静电作用形成一个复合物微粒,通过凝胶阻滞实验即可直观的反应其浓缩DNA的能力。在实验过程中,需计算聚乙烯亚胺与DNA的比例。从研究中发现,对聚乙烯亚胺的研究较多的是采用纳摩尔比(nmol/nmol),即聚乙烯亚胺中所含“氮”的纳摩尔(nmol):DNA中“磷”的纳摩尔(nmol),也就是通常所表示的N/P比。以25KDa的聚乙烯亚胺为例,称取90 mg的PEI溶于20ml的去离子水中,其浓度为4.5ug/ul,因为其分子量为25000,故其浓度为0.18 nmol/ul。由于聚乙烯亚胺中的基本单元结构为-CH2-CH2-NH2,-CH2-CH2-NH和-CH2-CH2-N三种单元结构的质量分别为44,43,42平均为43,另外对于分子量为25000的聚乙烯亚胺而言,共有个581个结构单元,即25000/43=581。所以聚乙烯亚胺中的“N”含量为0.18×581(nmol/ul)=100 nmol/ul,也就意味着质量浓度为4.5 ug/ul的聚乙烯亚胺(分子量为25000),其“N”的浓度为100nmol/ul。其他分子量的聚乙烯亚胺溶液可以按照以上的方法进行质量浓度与摩尔浓度的换算。对质粒DNA而言,根据其结构中碱基对的数量,每微克的DNA含3nmol的磷,即“P”的浓度。这样,PEI与DNA的N/P即为PEI中所含“N”的nmol与DNA中所含的“P”的nmol之比。如聚乙烯亚胺储存液的浓度为10 nmol/ul,DNA储存液的浓度为0.33 ug/μL(即“P”的浓度为1nmol/ul),在实验中取PEI和DNA各1ul,则两者的N/P比即为10 nmol/1 nmol=10/1,当然在研究中可以调节两者的浓度,使得N/P为整数倍,如1/1,2/1,3/1„„。
也可以用聚阳离子材料与质粒DNA的重量比进行凝胶电泳实验,即微克载体材料比微克质粒DNA。下图是阳离子材料聚乙烯亚胺/DNA复合物的凝胶电泳照片。