对病毒结构和生物分子在细胞内装配的研究,使我们认识了这些大分子在复杂的生物系统中的功能。
在生物体细胞内进行着各式各样的生物化学过程。生物大分子,特别是蛋白质和核酸,参与或控制着这些过程。这种大分子一旦分离,便失去了功能。它们常常相互作用,形成了有序的聚合体或复合物,它们有时在形式和功能上竟是如此的富有特色,以致决定了细胞器的名称。30多年来,我对核酸和蛋白质以及由此形成的大分子复合物间的相互作用进行了研究。
1953年我从卡文迪什实验室取得固体物理学哲学博士学位后,来到了伦敦别克拜克学院(Birkbeck College)贝纳尔(J. D. Bernal)所在的系,开始了我对生物结构的研究工作 · 很幸运,在那里我遇见了罗莎琳 · 弗兰克林(Rosalind Franklin),那时她的研究工作刚转入对烟草花叶病毒DNA的研究。她把我引上了对病毒结构的研究。
作为一位昔日的物理学家,从研究“简单”的病毒着手开始研究生物结构,这对我来说正是一个很合适的起步。一个病毒就像其自身所表明的那样,它是一个包裹得很紧密的整体,因此相对说,很容易把它从细胞中分离出来。人们可以先用简单的步骤处理病毒,然后再逐渐深入地了解其蛋白质和核酸的特性。病毒结构是那样的复杂,以至令人神往,同时也是如此的简单,而引起了我们想去了解它们的结构和这些结构装配的方式。
对病毒结构研究得越深入,就能使我们对病毒在细胞内的装配方式了解得越细致。许多大的生物结构,诸如肌蛋白微丝、细胞微管和细菌鞭毛,都比病毒具有更多的蛋白质亚基,但是在这些亚基中,仅少数是与众不同的。现在我们知道,这样的蛋白质要进行装配的关键取蛋白质之间的专一性结合及其调节方式。从研究简单的病毒结构的结果中我们知运,一种有序结构的整体布局能够在其各组成部分之间的联接特性上体现出来。
符合这种“自我装配”原理的一个经典例子是烟草花叶病毒(TMV)。它的杆状外形是由其基本的结构布局所决定:相同的蛋白质亚基以规则的螺旋形式排列,包埋在中间的是一个盘旋而起的单个RNA分子。这样的总体描绘,在1958年弗兰克林去世之前就已经形成。那时,我们与肯尼思 · 霍尔姆斯(Kenneth Holmes)—起,已描绘出烟草花叶病毒结构的总轮廓。
似乎很容易把相同蛋白质亚基在构筑这类结构时所采用的方式理解成:亚基像装配在一部盘旋楼梯上的台阶,层层向上,在盘旋梯中间是一个像螺旋线一样的RNA分子,它随棒杆一起伸展。20年后,我们才知道这样的简单描绘在根本上是错误的,该病毒事实上是以远为复杂的方式进行装配的。后来我们认识到,这种装配都具有很明确的物理学和生物学意义。
由于烟草花叶病毒的蛋白质分子本身的缘故,它们在形成聚合体时不是形成一个纤长的螺旋体,而是一个“盘状物”——一种双层的圆柱体结构,每层由一个含17个分子的环组成。我们得到这个盘状物的结晶后试图用X射线晶体学方法来对其进行分析。这是当时第一个进行深入研究的大型结构体。由于这种盘状物的体积大(分子量高达600,000),所以在用X线方法精确测定其结构时,遇到了棘手的技术上和分析方法上的困难。在剑桥的实验室里,我们通过研制强度更高的X射线管和仪器设备来克服这些困难,为的是从如此巨大的病毒结构体中获取资料。经过12年努力,最后多亏了安妮 · 布鲁默(Anne Bloomer)的帮助,我们建立起了一个原子模型,解释了这种蛋白质亚基的组合结构以及它与周围物质相互作用的方式。
我们之所以自始至终坚持这项研究,不仅仅是出于要了解这种蛋白质的结构。在早些时候,我与乔 · 巴特勒(Jo Butler)和托尼 · 杜海姆(Tony Durham)就已经指出,在病毒从RNA与蛋白质开始进行自我装配过程中,蛋白质盘状物起着重要作用。盘状物首先与病毒RNA分子上有专一性序列的化学碱基结合,然后再脱位,开始形成螺旋体。盘状物对于没有这种所谓的“起始位点”的外来RNA分子具有排斥作用。戴维 · 齐默恩(David Zimmern)在测定这个起始位点的碱基序列时发现,这段序列在一个“发夹”结构的顶端会形成卷曲,从而暴露出起始结合的状态。
同时,x射线研究的结果表明,这个病毒的双层盘状物的结构之所以如此排列,是为了在盘状物中心孔处使它们彼此间保持间隙,像一对“钳子”那样等着去“咬”RNA分子。这样,我们就形成了对烟草花叶病毒装配方式的描绘。RNA分子的发夹环穿过盘状物的中心孔粘在盘状物上,而张开着的发夹杆被蛋白质双层体形成的“钳子”夹住。然后,盘状物脱位形成螺旋体结构并裹住RNA分子。随着新的盘状物的加入,螺旋体结构不断延长,同时通过其中心孔接上更多的RNA片段。对于病毒装配经过起始阶段后其螺旋体延长的描绘,现在仍有一些不同的看法,但是,盘状物是病毒装配的起始物,这是确信无疑的。
由此,盘状物就成为烟草花叶病毒装配过程中的必然媒介物,同时盘状物也满足了结集这种螺旋体颗粒生长的物理上的需要和专一性识别病毒RNA分子的生物学上的需要。一个错综复杂的结构形成机理的演化,使这一过程变得富有效率和意义。
在推测烟草花叶病毒装配方式过程中得出的总的教训是,必须将一个生物体的结构布局与达到这种结构的组合过程区分开来。在烟草花叶病毒中,所有的蛋白质亚基(除在这颗粒末端的几个亚基外),彼此都形成了相同的微弱结合。这种重复多次的专一性结合方式,最终形成一个对称结构。在病毒整体的结构布局中,并没有任何迹象提示一个病毒在自我装配时具有不同的结合方式。然而,对于球形病毒来说,应该把它的结构布局与相同亚基的装配方式区分开来。
1956年弗朗西斯 · 克里克(Francis Crick)和詹姆斯 · 沃生(James Watson)作了首次尝试,他们试图解开球形病毒的蛋白衣壳的组建方式。他们争辩道,如果像烟草花叶病毒那样,在球形病毒中,相同的单位体进行有规则的自我排列(或者如同晶体学家们所说的等量的自我排列),并形成球形而不是圆柱形的衣壳,那么,这些亚基就必定要采取某一种经典的对称的立方体点群形式。这就是说,这些亚基将以正四面体或八面体或二十面体的形式出现,那样的话,亚基数就将是12、24或60。不可能会有别的亚基数可以形成一个完善的规则的图形,而且亚基数超过60是不可能的。第一个实验性证据来自于唐纳德 · 卡思帕(Donald Caspar)对番茄丛缩病病毒的X线研究与约翰 · 芬奇(John Finch)和我对芜菁黄花叶病毒和脊髓灰质炎病毒研究结果。所有这些证据都指出了上述病毒的20面体对称性结构。这个一致性的结论是令人满意的,同时也提示在这一领域的研究中,另一个特殊的原理也在起着作用。此外,从电镜和化学分析研究中获得的首批资料似乎与X射线研究的结果相悖:在芜菁黄花叶病毒外部具有32个形态学单位——在电子显微图谱上推断为“染色纽”,该病毒本身约含有150个蛋白质亚基。然而X射线研究的结果则要求具有60个亚基,或者是60的倍数。经过很长时间的困惑,卡思帕和我协调了这些似乎彼此相悖的结论。我们提出疑问,如果放弃对称结构是最完善的形式的假设,那么球形衣壳体是怎样把更多数目的结构单位体构筑起来的呢?生物分子结构的形成毕竟不能精确地与数学概念相一致,而是以能够使系统保持最低的能量状态为准则。我,们放弃了完美规则(数学上的等量性)的原则,在允许亚基排列存在略微不规则方式(“准等量性”)的条件下,我们认为这种衣壳体的最佳结构布局为20面体对称结构。这样的排列最大限度地降低了专一性结合键的扭曲。我和卡思帕发现这种结构布局也能容纳某些——而不是所有——亚基数为60的倍数的情形存在。建筑设计师布克明斯特 · 富勒(Buckminster Fuller)设计的许多半球形的圆穹屋顶,也是根据类似的几何学原理建造起来的。砖瓦匠必须遵循一套精心编制的操作程序来安装这样的圆穹屋顶。然而,可以这么说,病毒衣壳由于其蛋白质亚基的可塑性,它能够进行自我装配。
1960年代,芬奇和我以及一些我们其他的同事证明,许多——事实上是我们研究中的每一个——球形病毒的亚基都是根据某个我们所预测的方式进行排列的。我们可以将每个病毒纳入20面体的分类。即使—些外貌看上去不同的病毒也可以归入同样的结构分类。在一个立方体内构筑一个20面体是希腊时代的几何学问题中的皇冠命题(这是欧几里德的最后一个命题)。我想,如果柏拉图当初知道了在形形色色的表面事物背后隐藏着共同的基本形式,他会高兴的。
在过去几年里,其他实验室的研究工作者利用高分辨率的X射绞晶体学方法,已经测出了许多小的球形病毒的结构。所有这些病毒都与卡思帕和我所发现的20面体晶格相一致。在美国,哈佛大学的斯蒂芬哈里森(Stephen Harison)和普渡大学的迈克尔 · 罗斯曼(Michal Rossmann)已经解决了两个RNA植物病毒的结构问题。这些病毒都是由180个化学上相同的结构单位组成。这种结构单位彼此间几乎都以相同的方式结合,但是在达到总体装配时存在着微弱的扭曲。有两个人类致病病毒也是以类似的方式装配的。脊髓灰质炎病毒装配方式的高分辨率的研究结果,已由美国拉霍亚的斯克利普斯研究所(Scripps Institute at La Jolla)的詹姆斯 · 霍格尔(James Hogle)获得,鼻病毒的装配方式,则由罗斯曼研究获得。这两个病毒在结构布局上与植物病毒具有惊人的相似之处。但是,脊髓灰质炎病毒与鼻病毒是以不同方式来达到其准等量装配的,它们各含有60个蛋白质亚基,每三个蛋白质亚基之间在化学性质上各具特点但又相似。这种细微的化学性质差异,意味着在病毒取得准等量装配时,这些蛋白质亚基并没有使其化学键出现扭曲。
“三维”电子显微镜
我们对球形病毒的实验研究工作,开始时采用的是X线衍射法。来到剑桥后,我们改用了电镜,因为电镜能使我们加快处理新样品的速度,同时也因为我们当时认为电镜能提供直观的图像。借助于病毒结构布局的理论和X线的研究结果,我们对病毒球形衣壳的组建方式有了某种概念。当时我们认为,从电子显微图谱上能够看到病毒的精细结构。这样的话,我们就可以知道正在探索的东西,但是我们很快发现,我们并没有理解我们所看到的东西:电子显微图谱没有展现标本的简洁直观图像。不久我们发现了电镜的局限性。首先,制作电子束的标本技术会带来标本的膺像,而电镜本身的辐射,又损伤了所观察的标本特性。第二,由于生物标本中的原子太小,以致不能呈现标本本身足够强的反差衬度,所以我不得不采用人为的方法来增强标本的衬度。第三,由于所形成的标本图像取决于电镜的安装和操作方法,所以每次所得到的图像之间存在差异。特别是,由于电镜无法在不同层次上进行严格聚焦,所以在视线方向上的图像出现了附加的细节。
由于这些原因,如果没有其他方法来校正电镜操作条件,人们在祖糙的图像中所看的标本细节往往是不可信的和不易作出解释的,同时,也会将人们的注意力分散至标本的不同层次的图像上去。研究人员必须能够判断标本保存完好的程度。我和同事们花了10多年时间,为加工和重建电镜图像建立了光学和电子计算机的方法。这些方法旨在从电子显微图谱中获取最大量的二维或三维标本结构的可信资料。在傅里叶综合法(Fourier Synthesis)的基础上,我们建立了一种分析法,使之与大量的二维图像结合,并且在计算机的辅助下获取三维的重建图像。这种方法为解释许多生物系统的结构组成提供了模型。但是在好些年以后。这种方法才为大多数研究工作者所采用。戴维 · 德罗西亚(David De Rosier)和我首次运用了傅里叶方法后,又有一些研究工作者提出了新的设想,而且似乎更为简单。经过几次争辩,人们发现没有一种新的方法比傅里叶方法更优越。这种方法至今还用于医用X射线放射照相术的计算机辅助测试扫描(CAT)上。
就傅里叶方法而出现的其他一些争辩,都是围绕原始的电子显微镜图像本身的特性而展开的。一种认为二维图像与原始结构之间有直接关系的想法,遭到了材料科学领域内的研究工作者的怀疑,他们遇到的问题是出自于“动态的”或多层的散射。为了研究这一问题,哈罗德,艾里克森(Harold Erickson)和我着手对过氧化氢酶晶体进行了实验研究。我们证实,对于薄层标本来说,校正后的图像确实再现了标本本身的真实情况。而且我们也证实了一组取自不同聚焦点的显微图谱经过加工能够给出一个“真实的”对比图像。这似乎是一项很富有学术性的研究,但是事实证明,在还没有其他更为简便的方法来获得反差衬度的情况下处理不染色的标本,所采用的技术是至关重要的。“散焦对比”方法的建立,克服了在使用电镜时组建等同于相衬显微镜的困难,就像弗里茨 · 泽恩尼克(Fritz Zernike)用光学显微镜观察透光标本的仪器设备一样。
获取电镜衬度的一个简单实用的方法,是利用散焦的物镜来记录图像。尼格尔 · 思维恩(Nigel Unwin)和理查德 · 汉德森(Richard Henderson)在他们的一项引人注目的研究工作中,就采用了这一方法,他们对嗜盐菌光敏紫色膜进行了研究。他们先利用模糊的聚焦获得微弱的衬度,然后再通过电子计算机图像重组进行补偿。这样才第一次在电镜下“看到了”蛋白质分子的内部结构。
在研究像病毒这样的生物大分子聚合体时我们遇到的困难,使我们建立了一系列同样可运用于其他系统的方法和技术。我想,有一个例子能够说明当初如果没有我们早先的经历,如今就不可能发展得那么快,这个例子就是对染色质的研究。人们把从细胞内抽提出来的染色体物质称之为染色质。它主要由DNA组成,该DNA分子则与一小组等分子量的高度碱性组蛋白紧密结合在一起。我决定在剑桥着手研究染色质是在1970年代初,当时,研究蛋白质的化学家们证明组蛋白只有五大类。
动植物染色体中的DNA可能是一个单个的分子,如果把它拉直,可达数厘米之长。所以它必定是高度卷曲的,以形成人们在染色体中看到的紧密结构。同时,DNA又有若干个独立的功能单位——基因组成。目前世界各地的研究人员正着手研究是什么控制着基因至RNA的转录,从而在细胞内最佳地合成该基因所编码的蛋白质。这种“基因表达”受着染色质折叠方式的影响。
所以,我们对染色质的结构进行了研究。1972年,当罗杰 · 康伯格(Roger Kornberg)来到剑桥时,我们开始采用X线衍射来分析组蛋白与DNA之间的关系。X射线的研究结果表明,当四个组蛋白分子以双双成对形式放置在一起时,很容易重新形成其原来的天然结构,而一旦组蛋白分子彼此分离时,则不会出现这种现象。康伯格结合组蛋白的化学研究结果,最终发现了染色质是由一组连续的亚基组成,称之为核小体。核小体含有四种主要组蛋白中的两种,它们又与一段200个碱基对的DNA分子结合。后来我们能够结晶出一种叫作核心颗粒的核小体,这种物质已被酶所剪切。这种晶体的析出,表明在细胞核中的所有DNA都是以高度规则的方式组织在一个精细的结构层次上。
多年来,这项研究工作继续沿_两个主要的方向进行。一方面,我们探察了核小体的内在结构;另一方面,我们试图解释如果染色质具有更高层次的结构,核小体微丝在细胞核内所采取的进一步卷曲的情形。
对核小体的研究工作又分两个阶段进行。在第一阶段的约八年的时间里,我和同事们汇集了来自各种方法研究的资料,这些方法包括晶体的X线衍射和电镜分析、结合化学交联研究的八个组蛋白分离聚合体的图像重建以及用酶作探针对DNA组成的研究。结果得到了一个分辨率为20埃的核小体模型。在该模型中,DNA双螺旋链是以两个超螺旋体盘绕在一个由组蛋白八面体形成的卷筒(或称核心)上,这个DNA分子再被第五个组蛋白(H1)分子封闭在它出入卷筒的位点上。这个H1分子又使核小体微丝线圈转换成一个螺旋或“绕线状”结构,使之形成另一个层次的线圈。
更近一段时期内,实验室的研究人员直接通过X射线晶体学方法,在7埃的分辨率的水平上测出了核小体核心颗粒(即不含H1)的结构。这项研究工作汇聚了许多人的努力,从而才可能取得这一进展。丹尼拉 · 罗德斯(Daniela Rhodes)和雷 · 布朗(Ray Brown)起初制得了更出色的晶体,提姆 · 利奇蒙德(Tim Richmond)则建立了更先进的衍射技术,我们也采用了多重原子云技术来解决X射线分析中的“相问题”。因为单个原子不适合于如此之大的结构,电子密度图证实了我们早先的推测描绘。但是也揭示了许多在较低分辨率下所没有观察到的细节。现在利奇蒙德正把核小体核的X射线分析推向更高的分辨。他用核小体核重新组成和结晶出含有DNA确切序列的颗粒。
在过去的几年里,我沿着一条新思路,对活性染色质结构的问题进行了更深入的研究。基因激活后,就开始将DNA 编码转录成RNA,这一转录是从调节蛋白(“转录因子”)的结合点开始至基因的控制区(“启动基因”)上。我选择从一个能形成5 S-RNA(核糖体的组分)的特殊基因入手进行研究。未成熟的卵巢含着大量的这一基因的转录因子。我和同事们纯化了这个蛋白(称为TFIIIA),证实它具有明显的重复结构。每个结构单位由一个约含30个氨基酸的小环状体构成,它们折叠在一个锌离子的周围。我们把这样的结构单位称作“DNA结合指”(DNA-binding fingers)。我们的研究进一步显示,每个结合指与大约半圈DNA双螺旋段结合,并由此识别这一片段上的序列。
正如我们所预料的,在许多其他调节蛋白中也存在这种DNA结合指。譬如,一些细胞膜外雌激素受体就含有DNA结合指。这样,TFIIIA似乎代表着一类新颖的蛋白质。它的可变的结构布局给专一性地识别和结合许多不同的DNA序列提供了相当大的结合机率。现在我们已经参与了对TFIIIA分子本身以及一个有关控制酵母细胞DNA至RNA转录的物质结构的研究。
如果说在我的研究工作中以及在剑桥分子生物学实验室内我那些组织性很强的同事们中有着一个指导性目标的话,那就是我们旨在根据生物体系统的三维结构及其组分分子间的相互作用来认识生物体系统的功能。而我们着重研究了大分子的装配机理,因为正是在这种装配过程中——比如肌肉微丝或染色质——独立的生物分子在细胞中体现了它们特性。为了建立用来研究这些大分子和复合物细微结构的方法,我们化了大量的时间和精力,但是我们感到欣慰的是,我们没有作出仓促的或者是短期研究的结论。
[New Scientist1987年5月21日]
————————
* A. 克鲁格(Aaron Klug)因从事病毒及其他核酸蛋白质结合颗粒(核小体)的三维结构研究,并建立了晶体学电子显微镜技术,荣获1082年诺贝尔化学奖。