Chapter 9 蛋白质组研究中的翻译后修饰
第九章 蛋白质组研究中的翻译后修饰
1. 磷酸化蛋白质组研究
1.1 概况
1.1.1 蛋白质磷酸化
在生命现象的许多关键调节机制中,蛋白质磷酸化是最主要的翻译后修饰。在1950s 发现磷酸化酶a 和磷酸化酶b 原来是同一种酶的磷酸化和去磷酸化形式,从那时开始,人们就开始将蛋白质的磷酸化看作是一种动态的生物调节过程,一直受到生物学家的广泛重视,重大研究成果层出不穷。在原核生物中,磷酸化位点主要位于组氨酸、谷氨酸和天冬氨酸残基,但在真核生物中的磷酸化主要发生在丝氨酸、苏氨酸、酪氨酸残基上(组氨酸和赖氨酸残基也可能被磷酸化),传统的磷酸化分析依赖于放射性同位素标记、Edman 降解以及薄层层析等方法,这些方法冗长,需要具有高超的实验技巧和较多的蛋白质样品,并且对操作者还存在放射性危害。
蛋白质磷酸化在真核生物中是非常重要而且是非常普遍的现象,据估计,在任何一个给定的时刻,细胞内有1/3的蛋白质存在磷酸化,其中丝氨酸磷酸化最多、苏氨酸磷酸化次之、酪氨酸磷酸化最少,三者的比例约为1800:200:1。
磷酸化对于蛋白质是非均一性的,大多数磷酸化蛋白质都有多个磷酸化位点,但这并不意味着某个蛋白质分子的所有潜在的磷酸化位点都是磷酸化的,人类基因组中有2%的序列用来编码磷酸化蛋白质,主要是蛋白质激酶和磷酸酯酶,其中丝氨酸和苏氨酸激酶的数量是酪氨酸激酶的4倍,其他的磷酸化激酶的数量基本相同。
蛋白质可逆磷酸化在调节信号转导过程中有重要作用,是细胞生命活动的调控中心。磷酸化反应是泛指把磷酸基团通过酶促反应转移到其他化合物上的过程。蛋白质的磷酸化则是指由蛋白激酶催化的把ATP 或GTP γ位的磷酸基转移到底物蛋白质的氨基酸残基上的过程,其逆转过程是由蛋白磷酸酶催化的,称为蛋白质的脱磷酸化。蛋白激酶 (Protein kinase, PK)催化蛋白质的含羟基氨基酸(丝/苏和酪)的侧链羟基形成磷酸酯。蛋白质磷酸酯酶 (Protein phosphatase, PPase) 催化磷酸蛋白的磷酸酯键水解而去磷酸化。细胞内任何一种蛋白质的磷酸化状态是由蛋白激酶和蛋白磷酸酯酶的两种相反酶活性之间的平衡决定的。
1.1.2 蛋白质磷酸化过程中的质量与结构变化
要对蛋白质磷酸化进行分析,首先要对蛋白质磷酸化的化学有所了解。丝氨酸和苏氨酸磷酸化是不稳定的,在碱性条件下,磷酸基团易脱去,发生β消除作用,再脱去一分子水,如下图所示。
丝氨酸和苏氨酸残基磷酸化的不稳定性及磷酸基团脱落时发生的结构变化和质量变化 (R=H、CH 3)
而酪氨酸的磷酸化则由于磷酸基团连在苯环上(如下页图所示),不会发生β消除,相对是较稳定的。
磷酸化酪氨酸残基上的磷酸基团脱落时发生的结构变化和质量变化
正是由于酪氨酸无法进行β消除反应,所以丝氨酸、苏氨酸残基上的磷酸基团脱去后的质量变化与酪氨酸残基上的磷酸基团脱去后的质量变化不同。前者分子量减少98Da ,而后者则失去80Da (因为H 3PO 4的分子量为80,而多脱去的水分子量为18)。所以在质量变化上,酪氨酸比丝氨酸和苏氨酸少一步,减少的分子量是80Da ,而不是98Da ,这些细节的质量变化是磷酸化质谱检测中所必需注意的。
1.1.3 蛋白质磷酸化分析的困难
分析蛋白质的磷酸化是困难的,尽管现代质谱技术的发展非常迅猛,但是磷酸化分析所面临的难点仍然存在,具体有以下几点:
① 磷酸化蛋白质在细胞内的蛋白质中是相对较低丰度的;
② 即使我们找到一种磷酸化蛋白质,也不能排除有该蛋白质的其他磷酸化形式存在,在体内磷酸化与其
像是一座山(静态),不如像是一条河(动态);
③ 细胞内有许多磷酸酯酶,在进行样品处理时,这些酶很容易将磷酸基团脱掉,因而加入磷酸酯酶抑制
剂是很必要的;
④ 磷酸化蛋白质酶解后的磷酸化肽段,因为其化学性质的负电性,在质谱技术中面临着难以质子化的困
难;
⑤ 磷酸化肽段在质谱图中还往往受到非磷酸化肽段信号的强烈抑制,这一点在MALDI 质谱中尤为明显。
1.2 磷酸化蛋白质组研究策略
蛋白质的磷酸化研究是蛋白质组学诞生以来,第一次将一个整体的研究对象对准一项翻译后修饰,这样的选择是顺理成章的。因为磷酸化是生命活动中最重要的一项翻译后修饰,与信号转导、细胞周期、生长发育以及癌变机制等诸多生物学问题有着密切的关系,另外,从另一方面来说,磷酸化研究也是蛋白质组学研究的一个真正意义上的难题,无法回避。如果不能充分理解蛋白质的磷酸化现象,就无法认识蛋白质在生命中的意义。
目前,蛋白质的磷酸化研究还未达到常规的实验水平,应该说还处于技术准备阶段,就目前大多数情况而言,磷酸化蛋白质的研究就是磷酸化肽段的研究,由于蛋白质磷酸化研究目前还存在上面所讲的5个方面的不足或特点,因而在蛋白质的磷酸化研究中,样品制备就显得非常重要,除了在进行样品制备时加磷酸酯酶抑制剂等措施外,对磷酸化蛋白质和肽段的富集是很必要和关键的,除此以外,各种各样的化学修饰在磷酸化蛋白质组中的应用是很有效果的。因而,要研究蛋白质磷酸化,选择合理有效的化学策略是必要的,可以预期,在不久的将来,磷酸化蛋白质组研究技术积累到一定程度后,就会使用这些方法来研究解决具体的生物学问题,到那时,磷酸化蛋白质将真正成为一项更大的事业。
磷酸化蛋白质组研究的具体策略如下:
1.3 磷酸化蛋白质的富集策略
由于磷酸化蛋白质丰度低,而且分析检测磷酸化肽段存在困难,使得富集技术(策略)在磷酸化蛋白质组中的研究显得十分重要、必要。富集的策略应用在磷酸化蛋白质组研究中,有两种不同的应用阶段,包括富集磷酸化蛋白质和富集磷酸化肽段。
1.3.1磷酸化蛋白质的富集
⑴ 磷酸化蛋白质抗体
这是目前富集磷酸化蛋白质的主要手段,而磷酸化蛋白质的抗体主要分成两种:一种是丝氨酸磷酸化蛋白质和苏氨酸磷酸化蛋白质的抗体,另一种是酪氨酸磷酸化蛋白质的抗体,其中,酪氨酸磷酸化蛋白质抗体的应用较早,现已有专一性强、效率高的抗体试剂产品,因此也较早用于免疫共沉淀;最近也已经有人使用丝氨酸磷酸化蛋白质和苏氨酸磷酸化蛋白质的抗体,而且这些抗体不但可以用于Western 印迹检测,还可用于免疫共沉淀纯化磷酸化蛋白质,这将大大地促进免疫共沉淀在磷酸化蛋白质富集中的应用。
⑵ 化学修饰
在富集磷酸化蛋白质中,也可采用化学方法进行修饰,改变磷酸基团的化学性质,然后特异性地分离纯化,就可以定量地分析这些磷酸化蛋白质。但在使用这些方法中,无一例外地要涉及主要的化学修饰的效率问题,并且在实验中蛋白质的损失也是难免的,这也间接地影响了此类方法的应用。
① 第一种化学修饰方法
该种化学修饰的基础是利用磷酸基团脱去后的β消除反应,通过加减反应,共价连接新的化学修饰基团。
β消除反应后生成的脱磷酸氨基酸直接由质谱检测 (MS/MS),或由EDT (二硫酸乙烷,ethanedithiol) 作为亲核试剂,提供一个新的巯基以便连接一个生物素的亲和标签,为下一步的亲和纯化和同位素的标记定量 (ICAT) 提供条件。
肽段中的半胱氨酸和甲硫氨酸会和EDT 产生副反应,因此首先要对这两种残基进行强烈氧化,使其丧失活性。
这种化学方法的优点是:所有的反应都在同一个反应体系中进行,没有很多的反应步骤,反应的产率有一定的保证。
但这种方法也有明显的缺点:就是对酪氨酸的磷酸化无能为力。
② 第二种化学修饰方法
是对第一种方法的合理补充,它可以应用于对酪氨酸磷酸化的修饰。
这种方法在保护肽段的氨基和羧基端的基础上,对磷酸基团进行化学修饰,然后用具特异性化学表面的微球进行纯化。
很明显,这种方法的化学基础复杂,其核心是对磷酸基团的修饰,以便使有特异性化学表面的玻璃珠结合纯化。
该方法的缺点:步骤太多、产率相对较低。
1.3.2 磷酸化肽段的富集策略
(1) 固定金属螯合亲和层析
在磷酸化蛋白质组研究中应用的抗体只是对磷酸化蛋白质有效,对磷酸化肽段进行富集使用较多是固定金属螯合亲和层析(immobilized metal affinity chromatography, IMAC)法。
IMAC 技术最初用于纯化含组氨酸的蛋白质,现在常被用于选择性地富集磷酸化肽段,对磷酸化蛋白质的富集无效。
IMAC 柱填料的基本构成是色谱填料-交联剂-金属螯合剂。色谱填料与金属螯合剂亚氨基二乙酸或次氮基三醋酸交联成为固定相,常用的金属离子为Fe 3+、Ga 3+或Cu 2+等,被螯合到固定相上。磷酸基团与固相化的金属离子通过静电作用吸附,可选择性地亲和提取磷酸化肽段,在碱性环境下或有磷酸盐存在时,这种相互作用被破坏从而使磷酸化肽段被洗脱。据报道Ga 3+的富集效果要好于Fe 3+,但大多数实验表明,Fe 3+的效果是也可接受的,而且由于Fe 3+价格便宜和易于操作的优点,因而,Fe 3+比Ga 3+的应用更广泛些。
IMAC 技术对丝氨酸、苏氨酸和酪氨酸的磷酸化都有效,但是IMAC 柱上的正电荷位点同样可与肽段中的天冬氨酸、谷氨酸和组氨酸残基结合,从而对特异性和非特异性肽段同时富集,所以IMAC 方法面临的最主要的缺点是特异性不强。据文献报道,如果对磷酸化肽段中的酸性残基预先进行甲基酯化,封闭上述氨基酸的酸性侧链,从而可大大提高IMAC 方法的特异性,这一方法弥补了IMAC 技术的最大缺陷,为大规模磷酸化蛋白质组学的研究展现了美好的前景。
(2) 磷酸基团亲和取代
将磷酸化肽段上的磷酸基团用另一种亲和基团取代,再用亲和提取的方法从混合物中分离富集磷酸肽,是近几年出现的一种新技术。主要有两种取代方式:一种是使磷酸基团在碱性条件下发生β-消除反应生成双键,再用巯基乙醇通过加成反应取代磷酸基团的位置,最后通过交联剂在巯基上连接生物素,并用亲和素色谱柱分离,这种方法只适合于磷酸化丝氨酸和苏氨酸的取代;另一种是通过化学反应在磷酸基团上连接一个半胱胺基团(cysteamine),修饰后的磷酸肽用固相化的碘乙酰凝胶亲和提取,这种方法适合对各种磷酸化氨基酸的取代。
这两种磷酸基团的亲和取代方法都需要进行化学反应,为了避免副反应的影响,都需要对蛋白质中的一些活性基团进行保护,整个反应体系比较复杂。
1.3.3 磷酸化蛋白质/肽段富集策略的优缺点
以抗体为基础的对磷酸化蛋白质的富集策略有效但很昂贵,现阶段酪氨酸磷酸化蛋白质的抗体比丝氨酸、苏氨酸的要有效些,对于大多数国内实验室而言,也是同样有效的,但受财力所限使用困难;而以色谱方法为基础的对磷酸化肽段的富集策略(IMAC),同样是有效的,甚至于在有化学修饰辅助下更加有效,而重要的是试验花费与前者相比微不足道,因而会有更好的应用前景。
1.4 磷酸化肽段的质谱检测
质谱技术的发展,一是离子源,二是检测器。就离子源而言,自1980s 发明了ESI 、MALDI 之后,就少有新的技术出现,至今生物质谱技术中的离子化方式就是这两种;而就检测器而言,种类较多,有经典的三级四级杆、离子阱和飞行时间检测器,也有稍后发展的Qq-TOF 、TOF-TOF 、FTICR 。近年来,质谱技术的发展主要集中在离子源和检测器、检测器和检测器的“杂交”上,研发出了多种新款质谱应用于生物学研发中的各个领域,现就从生物质谱技术的特征出发,介绍其在蛋白质组研究中的应用。
1.4.1以MALDI 为离子源
以MALDI 为离子源的生物质谱通过PMF (peptide mass pingerprint) 技术,在鉴定蛋白质的工作中取得了良好的结果,但将MALDI 离子源的质谱应用于蛋白质组磷酸化研究遇到了难题。这是因为:
磷酸化肽段是带负电性的,而生物质谱常常用正离子模式,因而它的离子化就显得不够,更糟糕的是在进行磷酸化研究时,磷酸化肽段常常和非磷酸化的肽段混合在一起,在MALDI 源的情况下,磷酸化肽段的质谱信号会被非磷酸化肽段的质谱信号抑制;在未富集的情况下,一个磷酸化蛋白质的磷酸化肽段在MALDI 时,经常会淹没在其他非磷酸化肽段的信号中,连信号都没有,更甭说研究磷酸化的位置、数量和变化;此外,因为以MADLI 为离子源的质谱靶点上的样品几乎同时离子化,所以蛋白质必须先进行分离纯化。目前在蛋白质组学研究中,应用最广的分离纯化方法还是双向电泳和HPLC 。因而MADLI 质谱分析磷酸化时,就会需要一些必要的前处理。
⑴ 磷酸酯酶被应用于磷酸化肽段的检测中
磷酸酯酶处理蛋白质的前后,磷酸化肽段的质量数有变化,这为磷酸化肽段的检测提供了前提条件,更主要的是,很多磷酸化肽段在脱去磷酸基团后,质谱信号会有很大的提高。这样比较前后图谱,寻找质量数变化80 Da或98 Da和强度增大的信号就很可能是磷酸化肽段。
在磷酸酯酶反应时,丝氨酸和苏氨酸磷酸化肽段的质量变化可能是80 Da,也可能是98 Da,后者的发生是因为在磷酸基团脱落后发生了β消除反应,酪氨酸磷酸化肽段只有80 Da 的质量数变化。
磷酸酯酶的另一种应用方式就是固定化磷酸酯酶,使脱磷酸的作用发生在亲和柱上,这就提高了酶反应的效率和该方法的自动化程度。
⑵ 磷酸化肽段的富集
以MADLI 为离子源的质谱检测磷酸化肽段时,对磷酸化肽段的富集显得更为重要,其中,IMAC 技术与之结合使用较为多见。
磷酸化肽段经过富集,在MALDI 质谱上的检测信号会有较大的提高,对于这一点,如果能对酪蛋白的酶解产物进行IMAC 富集,其磷酸化肽段的信号将得到明显的增强。
1.4.2 以ESI 为离子源
ESI-MS 在磷酸化肽段的检测中,有着比MADLI-MS 更广泛的应用和更好的前景。在大多数情况下,ESI-MS 都会与HPLC 连用,这使其可以分析较为复杂的系统,而不像许多MADLI-MS 只能分析相对较
纯的样品或者是不太复杂的肽段混合物。近年来,MS 技术与毛细管HPLC 结合,而且越来越多的实验室开始使用nano-spray 的ESI 技术,大大提高了ESI 技术的灵敏度和应用的范围;同时,也是由于ESI 与色谱技术的良好兼容性,多种现代色谱技术参与其中,与ESI-MS 连用,从而也大大推动了质谱技术的发展,如多维色谱技术、IMAC 技术、微柱HPLC 以及填料技术等都越来越多地在质谱技术中发挥作用。可以说,ESI-MS 是蛋白质组学研究的主力,同时也是磷酸化蛋白质组研究中的重要武器。
⑴ 前离子扫描 / 母离子扫描(precursor / parent ion scan)
前体检测的思路是:利用磷酸基团的化学性质,检测它在各种条件下生成的有特点的离子,这其中有带负电荷的-PO 43-,也有带正电荷的亚氨离子 (immoniumion: 1995年, Hoffman R首先描述了immonium ion 是酪氨酸磷酸化肽段的特征性的碎片离子)。该方法的离子源都是电喷雾的,而质量分析器主要是串联质谱,如三级四级阱、Qq-TOF 等。
在三级四极杆串联质谱仪中,连续扫描第一个分析器Q 1,使各种质荷比的离子依次通过Q 1,Q 2为碰撞室,将Q 3分析器设定为只能传输某一特定质荷比的子离子,如m/z为79 (PO3-) 的离子,这样得到的质谱图仅显示会产生m/z为79的谱峰。由于多肽产生的各种碎片离子几乎没有质量数在79 Da附近的,所以用这一质量数进行磷酸化肽段母离子扫描的特异性很高,但必须在负离子检测模式下分析,进行序列分析较困难。Annan 等以这种扫描方式为基础建立了一套分析磷酸化肽段的系统方法,肽混合物先经LC-MS 分析,在负离子检测模式下经母离子扫描找出含有磷酸化肽段的液相馏份,收集该馏份再次用母离子扫描方式确定磷酸化肽段,最后在正离子模式下对该磷酸化肽段进行序列分析。该方法后来又优化为采用毛细管液相色谱和微量馏份收集装置,灵敏度有了很大提高。
如果能在正离子模式下进行磷酸肽的母离子扫描,则分析步骤会简化很多,这需要磷酸肽能够产生合适的特征离子。如酪氨酸磷酸肽能产生m/z为216.043的特征离子,这是磷酸酪氨酸的亚氨离子,选择该离子进行母离子扫描,可以在正离子检测模式下选择性检测酪氨酸磷酸肽。但是由于各种氨基酸残基产生的质量数在216.043附近的碎片离子也有不少,而四极杆质量分析器的分辨率较低、选择性会较差,飞行时间质量分析器又不是扫描型分析器,所以Q-TOF 型质谱仪不能实现真正意义上的母离子扫描。解决这一问题的主要设计方案是Q 2 pulsing策略,就是使子离子在进入TOF 分析器之前先被一个脉冲电场俘获(trap)很短的一段时间,离子的释放与TOF 分析器正交加速电场的脉冲电压同步,这样可以使小分子碎片离子的传输率提高到95%以上。在具有Q 2 pulsing功能的仪器上(如AB Qstar)可以成功地进行母离子扫描分析。Steen 等对三级四极质谱仪与Qq pulsing-TOF质谱仪的母离子扫描功能进行了比较,结果表明二者均可在负离子模式下进行m/z为79的母离子扫描。而在正离子模式下对m/z为216.043的母离子扫描只适用于Qq pulsing-TOF质谱仪。他们还用m/z为216.043母离子扫描方法结合免疫沉淀技术对EGF 受体信号通路中的酪氨酸磷酸化蛋白质进行了鉴定和磷酸化位点分析。为了使丝氨酸和苏氨酸也可以在正离子模式下进行母离子扫描实验,Steen 等基于磷酸化氨基酸的β-消除反应设计了一种化学修饰方式,使这两种磷酸化氨基酸在正离子检测模式下可以产生特征的碎片离子用于母离子扫描实验。
正离子模式下母离子扫描的最大优点是可以直接对磷酸化肽段进行序列和磷酸化位点分析。
⑵ 中性丢失扫描(neutral loss scan)
在三级四极杆串联质谱仪中,使第一个质量分析器 (Q1) 和第三个 (Q3) 质量分析器同步扫描,但扫描范围保持一个特定的电压差值,这个电压差所代表的m/z值为中性磷酸分子的质量(m/z 97.9或m/z 49)。
Q 1输送过来的离子在Q 2内裂解后进入Q 3,只有在Q 2中能裂解产生磷酸分子的离子才会被Q 3传输到检测器。此法的优点是以正离子模式进行扫描分析,找到磷酸化肽段后可以直接分析序列及磷酸化位点,但是它的特异性不高,比较容易产生假阳性结果,需要从串联谱图中加以确认。
1994年,Hunter 等最早阐述了磷酸化肽段在CID 前后的质量数变化,在大多数情况下,磷酸化肽段的质量数变化是98 Da,以这一特异性的质量变化为判断磷酸化是否存在的依据。中性丢失扫描在磷酸化质谱检测的方法中占有主要的地位,该方法的主要优点在于思路比较简洁,可以完全在正离子模式下操作,不会像前离子扫描那样碰到负离子模式下的灵敏度下降的问题。此外,此方法在离子阱分析器中也有很好的应用。
从理论上讲,在MS 的正离子模式下,使用中性丢失扫描是检测磷酸化肽段的好方法。在方法学的层面上,就有学者研究后认为是有效的。但是,在面对未知蛋白质样品时,就显得很困难,其原因是多方面的,但最大的困难是磷酸化肽段混合物在没有富集的情况下,磷酸化肽段的信号和非磷酸化肽段的信号相比是较弱的,如果母离子的信号很弱,选择作CID 时就会相当困难,这一点无论是手工选择还是程序选择都一样会很困难。当然如果采用更有效的富集手段,或者离子化前的分离效果很好(比如使用多维色谱分离肽段混合物),还是会有良好的效果的。
此外,中性丢失扫描的困难还在于,当磷酸化肽段太大 (>2000 Da) 时,在作中性丢失扫描时,就会出现信号的信噪比不好,这是因为相对分子质量较大的肽段本身的信号就不好,更何况还有磷酸化。针对此困难,有人提出用低特异性的蛋白酶(如弹性蛋白酶elastase )酶解磷酸化蛋白质,产生小分子的肽段来解决这一问题,肽段碎片序列的信息在一定程度上可以弥补低特异性蛋白酶造成的数据处理困难。
1.5 磷酸化位点的质谱分析
磷酸化位点分析是肽段磷酸化分析中的难点。
1.5.1 CID 碎片分析
CID :collion induceddissociation 碰撞诱导解离(分裂)
一般在蛋白质组学研究中要获得氨基酸的序列信息,所依赖的是在质谱中获得相关肽段的碎片信息,然后用一些算法(如SEQUEST 等)将碎片离子的质谱图谱与数据库进行比对打分,获得统计结果,以确定肽段的序列。
而那些碎片离子的获得,主要是采用CID 获得的,CID 技术是引入惰性气体将肽段离子撞碎,也即是引入的是能量,是能级的升高迫使肽键断裂,磷酸基团的酯键的键能比肽键的要低,因此,在CID 时,磷酸酯键比肽键更容易断裂,这一点直接造成了磷酸化位点判断的困难。有学者报道,在肽键的氨基末端进行化学修饰,会使较多的磷酸基团保留在肽段碎片中,使磷酸化位点分析更为简单。因此,通过化学修饰,使磷酸基团转化成相对稳定的基团,在进行低能量的CID 时,尽可能保留磷酸化位点(尽管此时已经不是磷酸基团),可以对磷酸化位点信息进行解析。
1.5.2 ECD 碎片分析
ECD: electron capture dissociation 电子俘获分裂
FTICR (傅立叶离子回旋共振)是一种相对较新的用于生物合成的质谱,具有相当高的分辨率和精确性,是几乎现有生物质谱中功能最强大的一种。
对于磷酸化肽段的分析,FTICR 也有非常重要的作用,其原因就是FTICR 的碎片模式是所谓的电子
俘获分裂技术。该技术的原理是:照射一束亚热态 (subthermal) 的电子到电喷雾所产生的磷酸化肽段或者是小分子的蛋白质分子本身,使其形成碎片。与CID 撞击肽段时产生的大量b 和y 族碎片不同,ECD 技术产生的多是c 和z 离子碎片,更为重要的是,磷酸基团在ECD 中保留在碎片分子中,使得直接判断磷酸化位点成为一种可能。
FTICR 的分辨率极高,是其他生物质谱的10倍左右,正因为此,它甚至还可对小分子蛋白质不经酶解而直接分析磷酸化状态。
1.6 磷酸化蛋白质组学中的定量问题
这是难点中的难点,无论是蛋白质组学研究的那个分支都要遇到。
主要方法:同位素标记在磷酸化定量中的应用,该方法有2种类型。
1.6.1 稳定性同位素标记
磷酸化研究的同位素标记策略是:
在细胞系的培养基中加入稳定性同位素(主要是15N ),与在普通培养基中生长的细胞进行比较而得到定量的结果。这种实验方法的具体操作是将在两种不同培养基中培养的细胞等量混合,裂解细胞后分离所感兴趣的蛋白质,经酶解并由质谱检测分析。选定的蛋白质的非磷酸化肽段的同位素比例是相对固定的(并不是一定相等,而是比例大致不变),而同时磷酸化肽段及其非磷酸化部分的比例并不会发生变化,这种变化应该是向相反方向发展的。
这种试验方法的设计非常巧妙,让人发现同位素标记技术与质谱技术的结合产生的“化学反应”式的效果,这种方法将蛋白质的鉴定与磷酸化的定量同时完成,而且还可以了解磷酸化的程度,一举多得。
但这种思路也有其缺陷:
① 15N 同位素标记的培养基的获得有一定的困难;
② 这种方法只能应用于培养细胞,对其他生物样本有困难,标记的效率和均一性也是一个问题; ③ 质谱分析前需要对蛋白质进行分离,而低丰度蛋白质能否实现有效分离,值得怀疑,以及分离酶
解后是否能找到感兴趣的磷酸化肽段也并非完全由实验者的意愿决定。
1.6.2 同位素标记的亲和试剂
同位素标记的亲和试剂与磷酸化肽段在磷酸化位点结合,从而给磷酸化肽段加上亲和尾部,引入质量数的差异,以便在质谱分析时根据信号的强度进行定量。
该方法的思路实际上来自ICA T ,因此被称为PhIAT (phosphoprotein isotope-coded affinity tag),只是肽段上的磷酸基团参加反应而不是巯基。这种定量思路比前者要直接一些,更重要的是,要想合成实验所用的PhIAT 试剂,这对于生物学实验室是有难度的,而购买商品化的试剂又比较昂贵。但是从ICA T 方法在蛋白质组学中的一般定量的应用来看,PhICA T 应该有良好的前景。
1.7 蛋白质磷酸化的动力学研究
蛋白质磷酸化的过程是一个动态的过程,因此可以说静态的磷酸化定量研究是不完善的,磷酸化的研究在技术条件允许的情况下,总是要进行动态、定量研究的。现在,对蛋白质磷酸化的动力学研究才刚刚开始,技术上还处于初级阶段,不过已有人在探索。Ruse 等人用液质联用,计算的是色谱面积,在有标准肽段进行校正的情况下,对体外的磷酸化反应,进行了动力学分析,不过其工作仅限于标准的,总的来说,磷酸化的动力学研究还有待开拓。
2.糖基化蛋白质组研究
2.1 糖基化蛋白质的研究概况
2.1.1 问题的提出及发展
1988年,牛津大学的生物化学学家Raymond Dwek在“Annual Review of Biochemistry(生物化学年评)”杂志上发表了题为“Glycobiology (糖生物学)”的综述文章,标志着糖生物学这一新的研究领域的诞生。近些年来,随着不同物种基因组计划的陆续完成,以及蛋白质组研究的开展和各种分离鉴定技术的进步,推动了糖生物学的迅速发展。如美国新罕布什大学 (UNH) 化学系的结构生物学研究中心启动了一次“线虫糖组学研究”计划,分析测定线虫的糖组(glycome, 定义为细胞内所有的糖链组分),开展糖组学 (glycomics) 研究,目的在于确定基因所携带的遗传信息与其功能之间的关系。
蛋白质糖基化是蛋白质翻译后的一种重要的加工过程,它是指蛋白质与葡萄糖(醛基糖)之间发生的非酶反应而生成糖化蛋白的过程,即指在肽链生物合成的同时或合成后在酶的催化下糖链被接到肽链上的特定糖基化位点的过程。
人类基因组计划完成后,美国于2001年9月正式启动了“功能糖组学”研究项目,项目的总体目标是阐明由蛋白质-糖链相互作用所介导的细胞通讯机制。
基因组计划提供了最基本的遗传信息,而许多基因的功能仍需要阐明,其中的关键就是要了解蛋白质的翻译后修饰,而蛋白质糖基化便是最主要的翻译后修饰之一。
尽管糖组的定义与基因组及蛋白质组类似,但其研究应该主要集中在蛋白质糖基化上,而蛋白质糖基化研究的基本目标是:
① 寻找编码糖蛋白的基因,即基因组信号;
② 寻找糖基化位点,即糖基化位点信息;
③ 解析糖链及糖基化肽段的结构,即结构信息;
④ 研究糖基化的功能,即功能信息。
为了实现上述目标,应当更好地将蛋白质组学的技术和研究策略应用到大规模的蛋白质糖基化研究中。
2.1.2 糖基化蛋白质研究的必要性
生物信息流
现代分子生物学中心法则认为,生物信息的流向是从“DN A →RN A →Protein ”,如上图红虚框中所示。而实际上,糖类和脂类也是组成生物体所需的两类主要分子,其生物信息流应补充如上图所示。因而,应从基因组水平上来关注蛋白质的糖基化,在真核生物的细胞中,有一半以上的蛋白质被糖基化,因此非常有必要对蛋白质糖基化进行研究。这是因为:
⑴ 蛋白质糖基化存在于细胞生命活动的各个方面
所有的细胞表面都由很多不同类型的糖链所包被,并且在细胞内也存在各种类型的糖基化;蛋白质糖基化在蛋白质折叠、蛋白质定位和转运、蛋白质溶解性、抗原性以及细胞与细胞的相互作用等方面都有着重要的作用。
最近还发现构成细胞膜的许多脂肪或蛋白质是以糖脂或糖蛋白的形式存在,而且糖低聚物在细胞间信号传递中也存在主要作用。
⑵ 糖基化蛋白质在病理中的作用
由于糖在HIV 或其他致病源与血细胞结合过程中扮演重要的角色,它成为免疫与控制和治疗癌症的最主要的线索之一。
⑶ 多样性 具有足够多的多样性是作为任何信息分子的基础,而糖链比核酸和蛋白质在结构上更具有可变性。如由六个核苷酸组成的寡核苷酸,可能的序列仅有46=4096种;由六个氨基酸组成的多肽,可能的序列有206=6.4×107;由六个单糖组成的寡糖链,可能的序列则多达1.05×1012。 聚糖极高的复杂性明显地归因于“连接方式异构体”和“分枝形成”,而这种现象在其他的生物信息分子中并不存在。
由于糖链结构的复杂性,其可能包含的信息量比核酸和蛋白质多几个数量级。
⑷ 在分子进化中的作用
聚糖中许多令人感兴趣的方面可能反映了生物与它们的分子的进化作用。如①多糖中少数稳定构成单位的自然选择;②甲醛聚糖反应(formose)可能是前生物期合成糖类的反应,而糖酵解逆反应中的醇醛缩合并生成果糖的过程又和甲醛聚糖反应的最后一步相同;③Lotry-de-Bruyn 重排反映了果糖、葡萄糖及甘露糖之间的亲缘关系;④复杂的单糖如唾液酸和脱氧己糖可由葡萄糖或甘露糖产生,反映了生物合成的保守性;⑤乳糖的出现可能是在分子进化过程的后期;⑥核糖和核酸的起源仍是一个未解的迷题;……。
2.1.3 糖基化蛋白质的类别
在真核细胞中,寡糖链与蛋白质多肽链中的氨基酸以多种形式共价连接,构成糖蛋白的糖肽连接链,简称糖肽链。根据糖肽链的类型,蛋白质糖基化可以分为四类:即以丝氨酸、苏氨酸、羟赖氨酸和羟脯氨酸的羟基为连接点,形成-O-糖苷键型的O-连接糖蛋白;以天冬酰胺的酰胺基、N-末端氨基酸的α-氨基以及赖氨酸或精氨酸的ω-氨基为连接点,形成-N-糖苷键型的N-连接糖蛋白;以半胱氨酸为连接点的氨基葡萄糖多聚糖糖蛋白;以天冬氨酸或谷氨酸的游离羧基为连接点,形成酯糖苷键型的磷脂酰肌醇糖蛋白。 ⑴ N-连接糖基化蛋白质
N-糖基化通常是指糖链共价连接在蛋白质肽链上的天冬酰胺 (Asn) 残基的酰胺基、N-末端氨基酸残基的α-氨基、赖氨酸或精氨酸残基的ω-氨基处。糖链与天冬酰胺残基的连接发生在三个残基的特殊识别序列 (Asn-X-Ser/Thr,其中的X 为除脯氨酸和天冬氨酸以外的任何氨基酸)处。N-糖链通常可划分为三种类型:甘露糖型、复杂型和混合型。
所有的N-糖链都有一个相同的五糖核心,其结构式与分子式分别为Man α1-3(Manα1-6)Man β1-4GlcNAc β1-4GlcNAc 、GlcNAc 2Man 3,如下图所示。
Proteomics
Chapter 9 On Modification After Translation
N-连接葡萄糖胺的五糖核心结构
其中:
① 高甘露糖型可在这个五糖核心上再连接2~9个甘露糖(Man);
② 复杂糖型则有更多的N-乙酰葡萄糖胺(N-GlcNAc)、半乳糖(galactose)、唾液酸(sialic acid) 、岩藻
糖(fucose)及木糖(xylose)与五糖核心相连,其中唾液酸提供了额外的负电荷。
③ 混合型的糖链结构则兼具以上两种糖链结构的特点。
⑵ O-糖基化蛋白质
通常是指糖链通过N-乙酰葡萄糖胺连接在蛋白质的丝氨酸、苏氨酸、羟赖氨酸或羟脯氨酸残基侧链的羟基处。也有其他类型的连接,如通过O-甘露糖。
其中,多细胞的真核生物中存在细胞核和细胞质蛋白质丝氨酸或苏氨酸残基的动态糖基化 (O-连接的N-乙酰葡萄糖胺即O-GlcNAc) 。在一些蛋白质中,O-GlcNAc 糖基化与O-磷酸化发生在相同或相近的位点上,从而出现一种假说,认为O-GlcNAc 可暂时阻断O-磷酸化。蛋白质的O-GlcNAc 在生理、病理以及信号转导等过程中都具有重要的作用。
⑶ 糖基磷脂酰肌醇锚 (GPI-Achor) 糖基化蛋白质
通常是指蛋白质通过天冬氨酸或谷氨酸残基的游离羧基的C 端共价连接的糖基磷脂酰肌醇锚定在膜脂上,这将细胞外蛋白质和细胞膜连接。通过GPI 连接到细胞膜上的蛋白质与穿越细胞膜的蛋白质不同,因为他们可以被PI-PLC (磷酸肽肌糖特异性磷酯酶C )分离到细胞外的空间。在真核细胞中,很多胞外蛋白质(包括一些水解酶、细胞表面抗原、细胞黏着蛋白等)都通过糖基磷脂酰肌醇锚结合在质膜上。 ⑷ 以半胱氨酸残基为连接点的氨基葡萄糖多聚糖糖蛋白
2.2 研究蛋白质糖基化的常用方法
与核酸和蛋白质不同,糖链很少以线性、非分枝方式出现,而是存在许多可变的修饰。因此,对糖链完整序列的测定很难通过一种方法来完成,而是需要物理的和化学的方法反复组合,最终确定糖链详细的结构信息(如质谱和核磁共振的方法)。糖蛋白的分析流程如下:
研究蛋白质糖基化的工具和方法包括酶(内切糖苷酶和外切糖苷酶)、凝集素(糖结合蛋白)、化学的修饰及断裂、新陈代谢放射性标记、糖基化抑止剂、抗体、糖基化转移酶的分子克隆以及在生物体及细胞中的遗传操作等。
2.3 糖基化蛋白质的分离技术
从“基因组学、蛋白质组学和糖组学”的整体观念出发,应以基因组信息为基础,以研究糖蛋白为中心。
糖基化蛋白质组学研究糖肽比研究单纯的聚糖更合适,其首要任务是从蛋白质混合物中分离纯化糖蛋白,再采用“糖捕获”法从糖蛋白中分离纯化糖肽,然后再分别对肽链和糖链进行分析。其中:多种凝集素可被用来分离带有不同糖链结构的糖蛋白和糖肽,如半乳糖苷结合凝集素 (galectin) 可分离包含N-乙酰乳糖胺 (LacNAc) 的N-连接的和O-连接的糖链;伴刀豆凝集素A (ConA) 可分离N-连接的糖链;花生凝集素 (PNA) 可分离包含T 抗原 (Galα1-3GalNAc 结构) 的O-连接的糖链;橙黄网孢盘菌 (Aleuria aurantin , 一种蘑菇)凝集素 (AAL) 对含有L-岩藻糖的糖链具有广泛的特异性;等等。如何选择这些凝集素在“糖捕获”法中是最为关键的步骤。
因而,非常有必要了解一些具有代表性的凝集素的典型特征,如亲和性、特异性、热稳定性、是否需要金属离子和多共价键的情况等。伴刀豆凝集素A (ConA) 和galectin LEC-6 (Gal6) 可特异性地结合到高甘露糖型或复杂型的N-连接的糖链上;而花生凝集素 (PNA) 则对存在于O-连接的糖链的T 抗原 (Galβ1-3GalNAc 结构)具有很高的亲和性。伴刀豆凝集素 (ConA)、galectin LEC-6 (Gal6) 、PNA 是常用的三类凝集素,分述如下:
⑴ ConA
ConA 是一种典型的对于一系列高甘露糖型的N-连接的糖链有高亲和性的植物凝集素。ConA 同时也能结合复杂型的N-连接的糖链及双分枝的复杂型的N-连接的糖链。
⑵ galectin LEC-6 (Gal6)
galectin 是一类分布广泛、依赖于金属离子的可溶性lectin ,其对于β-半乳糖苷的特异性在很多多细胞生物中具有保守性。
到目前为止,在哺乳动物中已发现了几种galectin 并被命名为galectin-1到galectin-6,根据结构,可分为三类:原型、嵌和型和串联重复型。
通过前沿层析法 (FAC) 对Gal 6的结合特异性进行了研究,结果表明:Gal 6和具有分枝结构的的复杂型N-连接的糖链的结合力最强,随着分枝的增加,亲和常数也随之增加。
Gal 6最倾向于结合含半乳糖且具有分枝结构的N-连接的糖链。
⑶ PNA
在组化分析中,PNA 是用来检测T 抗原(Gal β1-3GalNAc 结构)的,T 抗原在黏蛋白(如白细胞唾液酸蛋白、血型糖蛋白A )的O-连接的糖链中广泛存在。
PNA 一般选择性地结合在广泛存在于O-连接的糖链的T 抗原上。
2.4 糖基化蛋白质的检测技术
2.4.1 放射性标记方法
可将3H 、14C 标记的糖加入到培养的细胞或组织中,通过放射自显影检测糖蛋白。此法灵敏度高,
但是放射性标记过程长、缓慢、危险、花费较大。
2.4.2 荧光染色检测法
丹磺酰肼作为酸性品红染料的荧光替代试剂可用来检测聚丙烯酰胺凝胶中的糖蛋白。胶中的糖蛋白先经过高碘酸氧化,形成醛,然后与丹磺酰肼反应,形成腙,接着用硼氢化钠还原成肼的衍生物。这一连串的反应需要将胶置于酸化的DMSO 中,60℃温育2小时,并且需要高浓度的丹磺酰肼染料(0.5-2.0 g/L)。
2.4.3 与凝集素联用的染色检测方法
蛋白质经过PAGE 分离,印迹在聚偏二氟乙烯 (PVDF) 膜上,然后与结合了碱性磷酸酯酶(alkaline phosphase, AP) 的凝集素一起温育,再经过碱性磷酸酯酶酶解十二烷基二甲基氧化胺 (DDAO, AP 的荧光底物)磷酸盐,生成长波的红色荧光的DDAO 来检测。
此法的灵敏度为15ng ,依赖于蛋白质的性质和糖基化程度。
2.4.4 其他检测方法
可用酶解或化学裂解法将糖链从糖蛋白中释放出来,经过2-氨基苯丙酸等标记,用毛细管电泳或HPLC 等分离,再由诸如MS 、NMR 等检测器来进行检测。
2.5 质谱法在蛋白质糖基化研究中的应用
2.5.1 糖基化蛋白质分析
组成糖链的糖基种类繁多,连接方式多样,主要包括N-连接糖链和O-连接糖链。糖蛋白存在着复杂的微观不均一性(microheterogencity),即在蛋白质的氨基酸序列完全相同的情况下,由于糖链的组成或连接方式的不同而形成多种糖蛋白亚型。糖蛋白的这种复杂性在其生理功能上有其重要意义,但却给糖蛋白的分析带来了极大的困难。糖蛋白的分析主要包括以下几个层次:
⑴ 糖蛋白位点的确定
其困难在于有的糖蛋白的糖基化位点多,而且包括了N-和O-糖基化位点,不容易采用单一方法确定。传统的方法是通过Edman 降解和糖苷酶酶解或化学降解法相结合来确定位点,但对于多位点糖基化和不容易被糖苷酶去除的O-糖链,此法难以奏效。
⑵ 糖链的组成,即糖链是由哪些单糖组成
N-糖链有固定的五糖核心GlcNAc 2Man 3,核心外再连接有不同长度的糖链,而O-糖链则比较多样化。 传统方法采用酶解或化学降解方法获得糖链后,水解成单糖,用阴离子交换色谱,然后与标准图谱对照。但这种方法仅能确定糖蛋白总的糖基组成,而无法获得某一位点的糖链组成。
⑶ 糖链不均一性的鉴定及各成分间的比例
困难在于难以分离得到每种成分并进行分析。
⑷ 糖链的连接顺序
⑸ 糖链的分枝和连接方式
⑹ 糖基异头构型的分析
这是由于糖基化的分析困难,更需要一种有效的分析手段。在1980s 年代,Carr 和Robert 采用快原
子轰击质谱分析了经N-糖苷酶F 处理前后的糖肽,确定了糖基化位点,观察到糖链的不同成分、部分序列及糖基化程度。用这一方法分析了组织型纤溶酶原激活物的N-糖链结构,还通过甲基化衍生对糖链连接方式进行了分析。Sasaki 等则应用HPLC 、FAB-MS 和Edman 降解结合的方法,鉴定了重组红细胞生成素的3个N-糖链的组成,天线型和不均一性,以及一个O-糖链的不均一组成。1990s 年代,ESI-MS 和MALDI-TOF-MS 的应用,糖蛋白的分析出现了突飞猛进的进展。
2.5.2 糖蛋白糖基化位点的分析
用MS 法分析糖基化位点,目前常采用特征离子检测 (selected ion monitor, SIM),以及蛋白质酶酶解和糖苷酶酶解相结合的方法。
在LC-ESI-MS 上,采用CID 和SIM 来寻找糖基特征离子,进而确定糖肽。如GlcNAc 的特征离子的质荷比为204,乙酰唾液酸 (NeuNAc) 的特征离子的质荷比为292。SIM 则可选窄带含这些糖特征离子的肽段。
2.5.3 糖链的组成、连接顺序及连接方式分析
ESI-MS 、MALDI-TOF-MS 在分析糖链方面各有优缺点。
ESI-MS 较易获得糖链的结构信息,但糖链的离子化程度较差;MALDI-TOF-MS 则适于检测糖链复杂的不均一性,但不适合于分析细微结构。
2.6 糖基化蛋白质组学的研究策略
2.6.1 凝胶电泳技术及MS 联用
传统的糖基化研究需要高纯度的蛋白质样品,而凝胶分离技术在糖基化研究中一个最明显的优势便是能分离混合物,并且对蛋白质的纯度没有特殊要求。可针对不同的糖基连接方式采用不同的途径进行分析。
⑴ N-糖基化蛋白质分析
混合物或经过凝集素预分级的糖蛋白混合物通过SDS-PAGE 或2D-PAGE 来分离蛋白,用免疫染色或凝集素染色从胶中找到感兴趣的条带或点;用糖苷酶(如肽-N-糖苷酶,即PNGase F)胶内酶解释放出糖链,释放出的糖链可用荧光标记(如2-氨基苯甲酰胺,即2AB )、外切糖苷酶酶解以及HPLC 分析或用内酶解,抽提出肽段,用MALDI-TOF-MS 或LC-MS/MS等进行鉴定。其流程如下:
⑵ O-糖基化蛋白分析
将蛋白质或其混合物经过SDS-PAGE (如胎牛球蛋白,Direct blue 染色)或SDS-琼脂糖/PAGE(如黏蛋白,Alican Blue染色)及2D-PAGE (如人血浆蛋白,Direct blue染色)后转移到PVDF 膜上,染色
脱色后切取目标蛋白条带进行β-清除反应(甲醇浸湿后于20微升的50mmol/L NaOH和0.5mol/L硼氢化钠溶液中,50℃温育16小时,1微升乙酸中止反应),所得到的样品脱盐干燥后重溶于水中进行LC/ESI-MS分析。
2.6.2 非凝胶技术和质谱连用
蛋白质混合物经过凝集素琼脂糖柱1亲和层析,得到与凝集素特异性结合的糖蛋白混合物;将糖蛋白混合物用胰蛋白酶或无色细菌蛋白酶I (一种赖氨酸内切酶)酶解,得到的肽段混合物再经过与凝集素琼脂糖柱1相同的凝集素琼脂糖柱1’(凝集素相同,柱体积可能不同)亲和分析,得到相应的糖肽混合物,再经过HPLC 进行分步收集;糖肽的肽段序列可通过测序仪或MS 等进行测序,一些糖链结构可通过MS 或前沿亲和层析法 (FAC) 等方法进行解析;未被凝集素琼脂糖柱1吸附的蛋白质混合物可经过凝集素琼脂糖柱2进行亲和层析,依此类推。
2.6.3 O-β-GlcNAc 糖基化的研究
O-GlcNAc 糖基化和去O-β-GlcNAc 的酶(O-GlcNAc 转移酶和O-GlcNAc 酶)已被克隆和鉴定。 研究表明,O-GlcNAc 糖基化和磷酸化之间是一种“阴阳”关系。我们一直认为磷酸化是调控蛋白质功能的基本机制,而较少有人意识到O-GlcNAc 糖基化修饰的特殊作用。
与磷酸化蛋白质相比,O-GlcNAc 糖基化蛋白也能被筛选,并进行鉴定。现在磷酸化研究已成为功能蛋白质组学的一个研究热点,我们也应当对蛋白质O-GlcNAc 糖基化给以关注,且应用蛋白质组技术大规模研究O-GlcNAc 糖基化也势在必行。