蛋白质结构研究
文章编号 :1004-0374(2007)03-0289-05
蛋白质结构研究
林亚静,刘志杰,龚为民*
(中国科学院生物物理研究所,北京 100101)
摘 要:生物大分子的功能主要取决于它们的三维结构、运动及相互作用。对蛋白质结构的解析可以
从根本上阐明蛋白质功能的分子机制和基础,同时也是研究蛋白质功能的一个重途径。本文简述了当前蛋白质结构研究的主要手段,如X射线晶体学、核磁共振波谱学和三维电镜重构方法学等及其优缺点和适用性,总结了目前蛋白质结构研究进展并对将来的发展方向进行了一些探讨。尽管上述三种主要的研究方法已经比较成熟,而且在适用对象和实验方法上有很好的相互补充,但还是有相当多的生物学问题在结构水平上得不到解释和支持。因此,本文对目前蛋白质结构研究的热点和难点——膜蛋白和蛋白质复合物的研究现状和方法做了简要的概述,希望能够引起广大同行的关注。关键词:蛋白质;三维结构;膜蛋白中图分类号:Q51;Q503 文献标识码:A
The research of protein structure
LIN Yajing, LIU Zhijie, GONG Weimin*
(National Laboratory of Biomacromolecules, Institute of Biophysics,
Chinese Academy of Sciences, Beijing 100101, China)
Abstract: The functions of biomacromolecules are mainly determined by their 3D structures, movements andinteractions. Structural analysis on proteins constitutes the ultimate way to elucidate the molecular mechanismand basis of their functions. This article summarizes the methodology, advantages and limits of three majormethods in the current protein structural study, X-ray crystallography, nuclear magnetic resonance and 3-dimension electron microscopy reconstitution. In addition, progress and future directions of protein structuralstudy are discussed. Although the above three methods have been developed to maturity and well complementeach other, many biological problems still lack explanation and/or support at structural level. Present “hotand difficult”spots in the protein structural study are membrane proteins and protein complexes. The methodsto study these two classes of protein and current progress are therefore briefly introduced to bring up moreattentions.
Key words: protein; 3-dimension structure; membrane protein
人类进入21世纪之际,生命科学也迎来了一个崭新的时代。2001年2月12日参与人类基因组计划的六国科学家共同向世人正式公布了人类基因组图谱及初步分析结果,这是生命科学史,也是人类科学史上的又一次飞跃,同时标志着后基因组时代的来临,但是随着大量生物体全基因组序列的获
收稿日期:2007-04-05
作者简介:林亚静(1975—),女,助理研究员;龚为民(1968—),男,博士生导师,*通讯作者,E-mail:wgong@ibp.ac.cn
290生命科学第19卷
得,人们发现仅从基因组序列的角度根本无法完整、系统地阐明生物体的功能。蛋白质作为生命体的主要组成成分和生命活动的主要执行者,正在成为新的研究热点;而蛋白质结构则是蛋白质研究领域中的一个重要环节。以蛋白质为主体的生物大分子的功能主要取决于它们的三维结构、运动及相互作用。只有全面了解相关蛋白质及其复合物、组装体的精细三维结构、运动和相互作用网络,及其在亚细胞、细胞层次上表现出来的生命活动的功能关系,才能最终阐释人类个体发育、生长、衰老和凋亡机理,才能在分子和原子水平上理解神经活动、认知等脑功能表现机理,细胞增殖、分化和凋亡机理,信息传递和作用机理,疾病发生、发展机理等一切生命科学问题。
在不同的细胞中,由基因编码的遗传信息都是相同的,但是不同的细胞在不同的时空所表达的蛋白质是不同的。不同的蛋白实现着细胞的不同功能,而功能的实现往往与蛋白质的三维结构有关,只有知道蛋白质的空间结构才能了解它的功能。20世纪50年代,Anfinsen提出蛋白质的特定三维结构是由氨基酸排列顺序决定的,并因此获诺贝尔奖。Max Perutz在1959年解开第一个蛋白质三维结构,即血红蛋白的三维结构时用了整整22年时间;而今天,以核糖体为代表的复杂的蛋白质机器都陆续得到了解析。自20世纪90年代以来,已解蛋白结构的数量呈指数增长趋势,现在大约有42 000个蛋白质的结构已经被解析,并被存入蛋白质结构数据库(Protein Data Bank,PDB)。从当前的发展趋势来看,蛋白质结构研究必将成为整个生命科学领域的前沿和带头学科,仅在蛋白质晶体学领域中就有11名科学家获得过诺贝尔奖,可见其重要性。1 蛋白质结构研究的方法
蛋白质结构测定方法主要包括X射线晶体学(X-ray crystallography,X-ray)、核磁共振波谱学(nuclear magnetic resonance, NMR)技术和三维电镜重构(3-dimension electron microscopy reconstitution)。这三种方法都可以完整独立地在原子分辨水平上测定出蛋白质的三维空间结构。
1.1 X射线晶体学 X射线晶体学是最早也是最主要的测定蛋白质结构的方法,第一个蛋白质的三维结构——血红蛋白的结构就是通过X-ray方法解析的。目前PDB中收录的蛋白质的结构85%左右是利用X射线晶体学方法解析的。蛋白质晶体结构的X射线衍射分析包含样品制备、蛋白质结晶、衍射数
据收集和处理、相位求解、模型建立和修正等五个主要步骤。五个步骤彼此密切相关,每一个部分取得进展可以加快下一步的研究,同样任何一个部分的瓶颈也可以成为下一步的限速步骤。其中样品制备和蛋白质结晶阶段是要获得足够量的蛋白样品以及可以用于衍射数据收集的高质量单晶,前者可以通过针对所选目的基因的特性构建和改造高效表达质粒,而后利用多种表达系统,如大肠杆菌、酵母、杆状病毒、哺乳动物细胞表达系统以及无细胞(Cell Free)表达系统进行表达,利用亲和层析、离子交换、分子筛、疏水层析和反相层析等多种层析技术,大量表达、分离和纯化目标蛋白,为晶体的生长提供合适足量的样品。高质量单晶的获得是蛋白质晶体结构研究的主要瓶颈之一,由于不同蛋白质的物理化学性质差别很大,而且蛋白质的各种修饰和相互作用更增加了蛋白质的复杂性,所以不是所有的蛋白质都可以获得单晶的。近年来一些新技术的应用增加了晶体培育的成功率,如加利福尼亚大学圣地亚哥医学院的研究者利用一种氢氘交换质谱技术(enhanced amide hydrogen/deuterium-ex-change mass spectrometry, DXMS)来观察那些不能结晶的蛋白中究竟是哪一部分不能很好折叠,然后设计重组蛋白去除这一部分。结果,去除不能正确折叠部分后,已折叠的部分结构没有变化。试验的24个蛋白在经过这样的检测和操作后有6个成功结晶并解出结构[1]。此外,五个主要步骤中相位求解也是关键环节,因为衍射效应包含衍射波的振幅和相位,而目前能够普遍使用的试验方法只能记录到衍射波的振幅,要推算出蛋白的结构,就必须先找回丢失了的相位。用于解决相位问题的主要方法有分子置换法、多对同晶型置换法(MIR)、多波长反常散射法(MAD)和单波长反常散射法(SAD)。第一种方法用于测定有已知同源类似物的蛋白质结构;后三种方法用于测定未知的蛋白结构。
1990年以后,利用X射线晶体学解析蛋白质结构取得了突飞猛进的发展,目前平均每天有15个蛋白质通过该方法获得结构。国际上很多难度高、意义重大的三维结构,均是在近十几年实现突破的。2004年3月18日,世界上权威性的著名杂志Nature以主题论文的方式发表了由中国科学院生物物理研究所和植物研究所合作完成的“菠菜主要捕光复合物(LHC-II)2.72Å分辨率的晶体结构”研究成果。该晶体的结构彩图被选作本期杂志的封面图片。该成果首次基于精确的结构数据对高等植物的光能吸
第3期林亚静,等:蛋白质结构研究291
收、传递和光保护等光合作用机理研究的热点问题进行了探讨,发现了膜蛋白结晶的第三种类型,命名为“TYPE-III”膜蛋白晶体,并建立了包括膜蛋白、色素分子和脂分子在内的蛋白脂质体的完整的LHC-II结构模型,提供了近3万个(29 038)独立的精确的原子坐标[2]。2005年7月1日,清华大学-中国科学院生物物理研究所结构生物学联合研究小组经过3年努力,率先在世界上解析了线粒体膜蛋白复合物II的精细结构,填补了线粒体结构生物学和细胞生物学领域的空白,成为线粒体呼吸链研究领域的一个新的里程碑。进一步研究发现复合物II是一个跨膜蛋白复合物,从而纠正了教科书中认为“复合物II是一个外周膜蛋白”的传统认识。这一结构的解析,为研究与人类很多疾病,诸如嗜铬细胞瘤、副神经节瘤和李氏症等相关线粒体疾病提供了真实可用的模型[3]。
X射线晶体学的缺点是分子在晶体中往往是被锁定于某一状态,所得到的晶体往往是分子处于基态或不同构象的平均,而分子行使功能时多发生在激发态、过渡态、X-射线晶体技术很难捕捉到分子的动态信息[4]。但是无论怎样,X-射线晶体学方法无论过去、现在或将来都会是蛋白质结构研究的主要方法。
1.2 核磁共振波谱学(nuclear magnetic resonance,NMR) 核磁共振波谱学是对X-射线晶体学的有力补充。1971年,比利时科学家J Jeener提出二维核磁共振的概念,1985年,Kurt Wüthrich在此基础上发明了一种新的方法,他选择生物大分子中的质子(氢原子核)作为测量对象,连续测定所有相邻的两个质子之间的距离和方位,这些数据经计算机处理后就可形成生物大分子的三维结构图。KurtWüthrich用该方法测定了一个蛋白质的三维结构,从而奠定了NMR 作为确定生物大分子的主要手段之一,他也因此获得了2002年诺贝尔化学奖。时至今日,NMR已经成为确定生物大分子溶液三维空间结构的主要手段[5]。NMR技术在蛋白质-蛋白质、蛋白质-DNA等分子间的相互作用方面,具有高分辨率的特点,仅次于X-射线晶体学技术,可以在溶液中操作,在近似蛋白质生理环境下测定其结构,甚至可以对活细胞中的蛋白质进行分析,获得“活”的蛋白质结构。NMR技术在分析蛋白质折叠稳定性、运动性和蛋白质复合体中各亚基的相互作用方面具有优势。最近科学家就是用NMR方法解析了啤酒酵母ubiquitin相关修饰因子1(ubiquitin-related modifier-1,Urm1)的溶液结构,发现Urm1是ubiquitin超家族中一个独特的“分子化石”,并找到了真核生物中ubiquitin和一系列ubiquitin-类似蛋白修饰因子 (Ubls) 的进化起源[6]。
NMR技术的缺点是只能测定小蛋白和中等大小的蛋白质分子(相对分子质量一般在30 000以下),并且图谱分析工作极为费时,往往需要数月到一年的时间,导致实验周期延长,速度缓慢;另外核磁共振衍射技术的反应是在溶液中进行的,研究对象必须是可溶的蛋白,对不溶蛋白的研究就比较困难;而且样品需要同位素标记等,这些在一定程度上制约了NMR技术的应用。随着一些新技术的发现,如G矩阵傅立叶变换式NMR(G-matrix fouriertransform NMR,GFT-NMR)技术等,使得NMR的发展速度也很快,目前PDB中收录的蛋白质的结构15%左右是利用NMR方法解析的,其快速发展主要归功于以下几个方面:仪器技术的不断发展,计算速度的飞速提升和实验方法上的不断创新和发展[7]。1990年以前平均每年只能解10个结构,现在平均每天可以解2个结构,相信随着NMR技术不断的改进和发展,NMR技术在未来结构生物学上的贡献将会越来越大。
1.3 三维电镜重构(3-dimension electron microscopyreconstitution) 电子显微镜在结构生物学中的应用近年来变得越来越重要,成为解析大型蛋白质复合体、病毒乃至细胞器的三维纳米分辨率结构的有力手段,同时电子显微镜二维晶体学在膜蛋白的三维精细结构解析上也有特殊的优势。冷冻电镜三维重构的基本技术路线为:利用快速冷冻技术对样品进行冷冻固定,然后利用冷冻电镜和低剂量成像技术对样品进行电子成像,利用高灵敏底片进行成像记录,利用高分辨率扫描仪对底片进行数字化,对数字化的图像进行二维图像分析——选点、分类、校正和平均,最后完成样品的三维重构计算。自从1968年DeRosier和Klug[8]第一次用电子显微镜对T4噬菌体的尾部进行了结构解析至今,已有140余种蛋白质通过该方法获得了结构,尤其是最近5年随着计算机图像处理技术和显微镜设备的不断发展,使得三维电镜重构技术成为继X-ray和NMR技术后,蛋白质结构研究的另一种重要方法。三维重构技术的优势在于:(1)可以直接获得分子的形貌信息,即使在较低分辨率下,电子显微学也可给出有意义的结构信息;(2)适于解析那些不适合应用X射线晶体学和核磁共振技术进行分析的样品,如难以
292生命科学第19卷
结晶的膜蛋白、大分子复合体等;(3)适于捕捉动态结构变化信息;(4)易同其他技术相结合得到分子复合体的高分辨率的结构信息;(5)电镜图像中包含相位信息,所以在相位确定上要比X射线晶体学直接和方便[9]。
2 蛋白质结构研究的展望
根据预测蛋白质结构大概有2 000种不同的折叠类型,3 000-5 000蛋白质超家族,当前仅发现1 000余种不同的折叠类型和1 600种蛋白质超家族。人类基因组测序研究揭示,人体大约有3万个编码蛋白质的基因,这就是说,人类生命过程中大约需要3万种不同的基础蛋白质,它们在生命活动中发挥着重要功能,而这些功能的发挥则依赖于这些蛋白质的三维结构。因此,获得这些蛋白质并阐明它们的精细三维结构及与其生物功能的关系,成为揭示生物体活动本质的关键一步。近年来基因组工程的迅猛发展及生物信息学的新进展,给结构生物学开创了道路,使此目标的实现成为可能。1998年4月,美国国立卫生研究院和Wellcome Trust发起了结构基因组研究。结构基因组是利用多种结构生物学方法和基因(DNA或RNA)序列数据,结合计算机分析查明和确定蛋白质的三维结构,再利用X-射线衍射技术测定蛋白质的晶体结构来确认对蛋白质三维结构的推测。2000年,美国NIH启动了蛋白质结构计划(protein structure initiative, PSI),目标是10年内解析10 000个蛋白质的三维结构。日本在蛋白质研究中也表现出极大的热情,提出了蛋白质“3000”计划,目标是5年内确定出3 000个蛋白质的结构。随着蛋白质结构基因组技术的成熟与进步,越来越多的蛋白质或其结构域的结构被获得,2006年平均每天有18个蛋白的结构被解析;但是令人遗憾的是,对于构成极为复杂和多样的蛋白质复合物和膜蛋白这两类极为重要的、生命活动所必需的生物大分子而言,高通量的结构解析技术并不能“包治百病”。
蛋白质复合物是一类庞大的“分子机器”,可分为结构型蛋白质复合物和功能型蛋白质复合物,前者比较稳定;后者是许多蛋白质在执行功能时聚合在一起形成复合物,任务完成以后分开,如转录蛋白复合物。蛋白质复合物的组装过程和功能执行都受到严格而精细的调控。近些年,伴随着生物化学和细胞生物学等手段的改进和提高,蛋白质复合物的组成、功能及它们在所参与的生物学途径中的重要作用被不断揭示出来,对某些蛋白复合体
结构生物学的研究也取得了丰硕成果。比如,核糖体(Ribosome)结构生物学研究使人们对核糖体作用机制产生了革命性的认识。核糖体作为生命体中最复杂的动态的分子机器,其功能涉及蛋白质合成的各个步骤[10],1999年,美国耶鲁大学的Ban等[11]和英国剑桥医学研究中心分子生物学实验室的Clemons等[12]分别获得了5 Å分辨率的50S大亚基的结构和5.5Å分辨率的30S小亚基的结构,并在此结构基础上为已知三维结构的蛋白质和多个双链rRNA区进行了定位。随后科学家发现尽管核糖体是由大小亚基与几十种蛋白质组成的核糖核蛋白体,但是50S核糖体中的23SrRNA具有肽酰转移酶的功能,也就是说,核糖体事实上是一种核酶(ribozyme)[13] 。这一革命性的结论揭示了核糖体作为蛋白质合成机器的作用机制,解决了人们对核糖体机制上的疑团,彻底改变了人们的固有印象,并对核酶的认识有了进一步的提高。这些发现是以核糖体作为整体进行结构研究得到的,仅靠研究其中的单一成分是不可能揭示的。然而,当前解析蛋白质复合物结构也面临着一些难题,主要是因为复合物内部用于维护其完整性的相互作用较为复杂。由于核磁技术的内在限制,目前蛋白质复合物的结构研究多采用电镜和晶体学,尤其是晶体学,因其研究对象可大可小,特别适合进行复合物整体及单独亚基的结构解析,但是用于结晶的试剂对于复合物内部间相互作用的影响具有相当的不可预见性,因此,复合物的结晶成功比例远低于一般单体蛋白。对于不易结晶的蛋白质复合物则常常采用电镜进行研究,以得到其整体结构,细节结构可通过将其亚基的晶体结构“填充”入电镜结构而获得。
膜蛋白作为担负复杂生物学功能的一类重要蛋白质,在各种各样重要生物学的基本过程中起着关键的作用,如光合作用、呼吸作用、神经信号传导、免疫反应和营养物质的吸收等。此外,目前药物研究中发现近70%的药物作用靶点是膜蛋白[14],因此,膜蛋白结构与功能研究既是蛋白质研究领域中的基本问题,也是国际生命科学研究中的前沿问题。对于膜蛋白所承担的重要生物学功能的深入理解还有赖于高分辨率膜蛋白三维结构的解析。1998年,美国洛克菲勒大学的Mackinnon成功获得世界第一个高分辨率的离子通道三维结构,来自于青链霉菌的KcsA钾离子通道。位于通道上面的selectivityfilter恰好完美地容纳钾离子,但却能将体积较小的钠离子拒之门外,这样在原子水平上解释了为何此
第3期林亚静,等:蛋白质结构研究293
离子通道蛋白对钾离子有高度选择性,以至于每秒钟可以通过一亿个离子。这张照片观察到的离子通道呈现关闭状态。随后在2002年 Mackinnon解出了钙离子活化型钾离子通道MthK的三维结构,并且是离子通道的开放状态[15]。Mackinnon在钾离子通道蛋白结构与功能研究的贡献,不但解释了离子选择性和通道开关的机制,而且为研究多种疾病的分子机制和药物设计提供了可能,他也因此获得了2003年诺贝尔化学奖。这说明膜蛋白结构与功能关系的研究不但是国际研究的热点,而且它的突破可以使人们更加清楚地了解生命的基本过程,在实际应用中具有重大的意义,但是由于膜蛋白天然含量低和分离纯化困难以及疏水特性等,从而制约了膜蛋白的研究。截至2007年1月,占蛋白总数近1/3的膜蛋白仅有242个结构被PDB收录,占所有存入数据的0.6%,其中独立结构仅为122个。关于膜蛋白的结构研究在1988、1997和2003年都获得了诺贝尔化学奖,由此可见解析膜蛋白结构的困难度和重要性。与水溶性蛋白相比,膜蛋白的纯化要困难得多。因为膜蛋白常常需要与生物膜,甚至是特殊的脂环境结合才能稳定地存在,所以目前已知结构的膜蛋白绝大部分是天然组织提取纯化的,而非重组表达获得的,这样在蛋白产率和均一度上很难得到可满足结构解析所需要的样品。膜蛋白自身存在的疏水区容易造成蛋白的非特异性聚集,对于传统的晶体学和NMR研究不利,但通过添加去垢剂可以模拟膜蛋白的天然存在环境并在一定程度上解决膜蛋白的稳定性问题,因此去垢剂的选用非常关键。尽管电镜方法不受膜蛋白疏水性的严格制约,但其在精细结构和小分子蛋白上的局限性也是显而易见的。近年来发展出两个新的膜蛋白结构解析方法:二维晶体学法和固相NMR法[16],前者结合了电镜和晶体学的方法对膜蛋白的二维晶体进行X射线衍射研究;后者则是将膜蛋白定向固定于支撑物表面,而非在液相中进行NMR研究,值得一提的,是这两种方法的共同之处都是将膜蛋白构建于脂双分子层中,因此使得膜蛋白的生理结构和功能得到了最大限度的重现。相信随着新研究方法的成熟,膜蛋白的结构研究可以获得快速的发展。
总体来说,就目前积累的关于蛋白质复合物和膜蛋白的结构研究看来,成功的工作多带有一定的“个性”,相对来讲“共性”比较少,因此,也必将成为未来结构研究工作的重点与热点。
总之,从分子、亚细胞、细胞乃至整体等不
同层次上研究蛋白质及其复合物、复杂体系的结构,对于揭示其功能、实施蛋白质工程、解决各种生命科学问题的共同科学基础具有巨大的科学意义,而且通过结构研究,认识疾病发生的分子机理,理性药物设计在保障人类健康等与社会经济发展密切相关的重大问题上都具有重要的意义和广阔的应用前景。
[参 考 文 献]
[1]
Pantazatos D, Kim J S, Kolck H E, et al. Rapid refinementof crystallographic protein construct definition employingenhanced hydrogen/deuterium exchange MS. Proc Natl AcadSci USA, 2004, 101(3): 751-756
Liu Z F, Yan H C, Wang K B, et al. Crystal structure ofspinach major light-harvesting complex at 2.72Å resolution.Nature, 2004, 428(6980): 287-292
Sun F, Huo X, Zhai Y Z, et al. Crystal structure of mito-chondrial respiratory membrane protein complex II. Cell,2005, 121(7): 1043-1057蛋白质结构研究方法进展. 科学热点[Z].江南大学图书馆情报部, 2006, (2)
阎隆飞, 孙之荣. 蛋白质分子结构[M]. 北京: 清华大学出版社, 1997: 131-154
Xu J J, Zhang J H, Wang L, et al. Solution structure of Urm1and its implications for the origin of protein modifiers. ProcNatl Acad Sci USA, 2006, 103(31): 11625-11630
余亦华. 蛋白质三维空间结构研究的里程碑.科学, 2003,55(2): 57-58
DeRosier D J, Klug A. Reconstruction of three dimensionalstructure from electron micrographs.Nature,1968,217(5123):130-134
王大能, 陈 勇, 隋森芳. 电子显微学在结构生物学研究中的新进展.电子显微学报, 2003, 22(5): 449-456
明镇寰.核糖体结构研究进展.浙江大学学报,2001,28 (1) :67-71
Ban N, Nissen P, Moore P B, et al, Placement of protein andRNA structures into a 5 Å resolution map of the 50S riboso-mal subunit. Nature,1999,400:841-847
Clemons W M J, May J L C, Wimberly B T, et al, Structureof a bacterial 30S ribosomal subunit at 5.5Å resolution.Nature,1999,400:833-840
Carter A P, Clemons W M, Brodersen D E, et al. Functionalinsights from the structure of the 30S ribosomal subunit andits interactions with antibiotics. Nature, 2000, 407(6802):340-348
Stahlberga H, Fotiadisa D, Scheuringa L, et al. Two-dimen-sional crystals:a powerful approach to assess structure, func-tion and dynamics of membrane proteins. FEBS Lett, 2001,504: 166-172
Jiang Y X, Lee A, Chen J Y, et al. Crystal structure andmechanism of a calcium-gated potassium channel. Nature,2002, 417(6888): 515-522
金 聪, 陈慰峰. 膜蛋白结构研究方法新进展. 生命科学,2003, 15(5): 312-316
[2]
[3]
[4][5][6]
[7][8]
[9][10][11]
[12]
[13]
[14]
[15]
[16]