科学家们的工作可分为3个方面:研究、教学和科研管理。我尽量避免作教学和管理工作,部分原因是我觉得自己不擅长于此,另外还出于自私心理,不愿做这类事情,然而却发现从科学研究中,可以得到无穷的乐趣和报偿。科学研究包括思考、讨论与实践三个主要活动。我最喜欢也豪擅长于实践。我当然也很会思考,但不很善于讨论。1940年,当我开始在艾伯特 · 纽伯格指导下作博士论文研究时,就选择了实验室工作作为我的职业。从那时起,我在剑桥工作直到1983年我65岁退休。和大多数在大学期间成绩优异的同事们不同,我从没获得过奖学金,要不是父母相当富裕,我就不可能进入剑桥读书了。当然,一到科学研究中,实验成为最首要的手段,而且专业领域又相当狭窄时,对我就相当适合了。于是我竭力要使自己&杰出的人物中能占有一席之地。这篇文章讲的是我个人的研究生涯,主要与测序方法的发展相关。考虑到在以前的一些文章中曾经从各方面作过总结,又限于篇幅,所以在这里我尽量删去大量研究过程的细节,只着重有系统地按时间顺序作个概述性的介绍,不记载细节与失败,也很少提及那些帮助过我的同事们。在这里也许提供了一个合适的地方来澄清一些事情,并讲述某些鲜为人知的工作内幕,其中有些是从未见诸过文字的。

当我开始在剑桥作大学生时,在课程表中注意到一门我从未听说过的课程:“生物化学。督学:欧内斯特 · 鲍德温”。这门可用化学来解释生命现象的科学,对我似乎充满了吸引力,特别是见到热情的鲍德温博士后,更增加了我的兴趣。1939年,我在剑桥多呆了一年,进一步学习高级生化课程,这是我在学术上能取得成功的首次机遇。在考完最后一门课,觉得难以取得好成绩而失望地离开剑桥两星期后,我在报纸上看到我的成绩竟位居榜首,这大大出乎我的意料之外,增加了我争取成为博士生的可能性。我把自己的想法与愿望写信给剑桥大学生化系询问是否能行。由于未得到回音,我索性到剑桥去看看。当时尽管发生了二次世界大战,学院里许多科研工作仍照常进行,有些导师还乐意接受博士生(特别乐意接收像我这样不需资助的学生)。此外,我还不愿服兵役,并得到了豁免许可。系里的工作集中在皡学及中间代谢的研究上,主要研究工具是瓦氏测压器及亚甲蓝管。在学习高级生化课期间,是弗里德曼先生指导我,我对他怀有深深的敬意。他是德国逃亡者,一位化学家。在生化研究中,他相信分离和结构,并认为用亚甲蓝管做实验毫无用处,也是因为他的影响,使我选择了在皮里指导下工作,皮里是实验室中的蛋白质专家。他那时的主要兴趣是从禾本科植物中提取食用蛋白质。他对待博士生的方法是非常有效的,“把他们扔进深渊,让他们自己寻找出路”。他给了我一大桶冻结的植物萃取液供我研究。可惜的是还没等它融化,皮里就离开实验室去干新的工作了。但我还是从他那学到了一些生化知识,并很欣赏他对实验室其他工作人员缺点的尖锐评论。皮里走后,我有幸在纽伯格手下继续工作,那时他是实验室的博士后研究人员,正打算接纳我。我把纽伯格当作是我的主要老师。最重要的是,他通过指导和示范教会了我怎样做研究工作。我一直非常感激他的友善和耐心。他也有极广博的生化知识,这一点使軚非常羡慕,但却从没能赶上他,我的论文题目是“赖氨酸的代谢”,虽然没有很大意义,但我从中获得了氨基酸化学研究的经验,一个很好的研究“顺序”的入门课题。

在生化系里工作很有趣,也很令人兴奋。这个系主要是为了纪念霍普金斯而建的,这里的大多数工作人员都是他的追随者,同时也是他们各自研究领域的带头人。那时,生化是门新学科,有许多可研究的问题,大家积极性很高。对我来说,实验室的良好气氛在很大程度上决定了研究质量。我对那时周围人们的友好和热情留有深刻的印象。研究人员们似乎不只对他们自己的研究感兴趣,而且还关心我所从事的研究。他们总是在讨论生化问题,而不把时间浪费在闲聊上。我喜欢这样的环境,很激励人。我能待在这种气氛的实验室中真是很幸运。1962年,在我们自己新建的分子生物学实验室中始终保持这种气氛,而且不存在由于私人间的相互摩擦而影响研究工作进行的任何干扰,这种动力似乎至少一直延续到我退休。

胰岛素的工作

当我在1943年完成了博士论文时,纽伯格已离开了实验室,我得到了在奇布诺尔小组工作的机会。那时奇布诺尔刚担任生化教授,是霍普金斯的继承人,并正要带一批工作人员从伦敦皇家学院到剑桥去工作,他们那时主要的研究兴趣是蛋白质,特别是胰岛素的氨基酸分析。选择研究胰岛素是因为它重要的医疗价值,并且是当时少数几种可被纯化的蛋白质之一,而不是因为它的分子量小(那时还不知道它的分子量是6000道尔顿)。当然,在后来的工作中,我们发现选择了这么小分子量的蛋白质测序真是件幸事。在那时氨基酸分析是一件艰苦的工作,在许多情况下很难得到准确的结果。奇布诺尔小组的分析结果在当时可能是最好的。

我约在40年前开始研究胰岛素,而且由于这段工作使我与蛋白质测序研究工作结下不解之缘,所以在各种综述及书中都已多次准确程度不一地描述过了。如洛伊等人曾富于浪漫色彩地写道,我是完全独立地测定了胰岛素的一级结构,并且无视同事们的劝告,因为他们认为蛋白质是难以确定的乱七八糟的混合物,无法用化学方法进行研究。事实上,虽然以前在某些文章中曾有过这样悲观的见解,但这完全不是我的同事们的想法。我想,我们都是在埃米尔 · 费希尔的领导下,完全是用化学方法来研究蛋白质的。要说稍有区别的话,恰好相反,就是把化学计量法过多地应用于蛋白质的研究。在英国,化学计量法的主要支持者是X射线结晶学专家阿斯特伯里。在X线胶片上的一些点的基础上,他提出了蛋白质链折迭的详细结构,一时被广为接受。当时伯格曼等人的理论特别流行,他们认为特定的氨基酸残基有规律地沿着多肽链间隔出现,而且每种氨基酸的含量可以用公式2m ×3n表示。这种理论的唯一有益的地方就是刺激了大家进行氨基酸分析的兴趣。由于分析方法准确性不够,及许多小肽符合这一公式,所以用这种公式来解释一些蛋白质并不太难。奇布诺尔的研究小组可能是第一个用准确及足够的证据对这一理论提出质疑的。

所以,我所处的环境真是太理想了。我开始做的工作是组里工作的一部分,事实上是奇布诺尔建议我这样做的。若没有他的建议,我可能还在继续研究赖氨酸的代谢。奇布诺尔等人发现胰岛素中自由氨基的数目较胰岛素中含有的赖氨酸所占的数目为多。他们认为多出的是自由α氨基,这表明链很短,所以特别适于作化学研究。奇布诺尔建议我对链中有自由α氨基的氮基酸作出定量判断并定位,我的胰岛素研究工作就这样开始了。事实上,纽伯格对胰岛素链的末端基团所做的一些初期的工作,而且开始了胰岛素的研究,他在这方面的兴趣与经验传给了我。毫无疑问,是我最终完成了整个胰岛素氨基酸顺序的测定工作。整个过程中,可能只有那么一次使我真感到有阻力,就是在工作的最后阶段还要确定剩下的1个二硫键和1个酰胺基团的位置。

我发明了用氟二硝基苯作为确定蛋白质末端基团通用试剂的方法。在看过那时的实验记录后,我发现寻找合适试剂的过程并不那么简单。虽然当时已有些方法可以标记自由氨基基团了,但其中只有一种可标记并确定N末端残基。1935年詹森等人用异氰酸苯脂(类似于埃德曼试剂——异硫氰酸苯脂,但反应性较弱)在胰岛素N末端测出了苯丙氨酸,这是所有蛋白质中第一个被定位的氨基酸。对于一种通用的方法,需要这样一种试剂,它可在温和的条件下和氨基反应,形成的衍生物在酸水解反应中也很稳定,而且用较简单的方法就可分离和鉴定,这些条件都是很重要的,为了这个目的,我们赶紧采用了那时新发明的分配层析法,这是较以前用过的任何方法都好的分离手段。它能很好地分离乙酰化氨基酸。

除了异氰酸,最具有条件可以使用的就是磺酰氯或苯磺酰氯。苯磺酰氯曾被使用过,并容易得到,但它的产物似乎溶解性差些。我试的第一个试剂是甲磺酰氯。因为我觉得甲磺酰氨基酸与乙酰氨基酸在分配层析中的行为是相似的。但我没能从中得到任何明确的结果,所以就转向了苯磺酰氯。阿伯德豪顿(Abderhalden)等人于1923年就曾研究过2,4 - 二硝基氯苯,但它只在高温下才与氨基酸反应,此时肽键之间会发生部分水解。我用它制成了二硝基苯氨基酸,发现它们在硅胶层析中分离得很好。而且还有一个很大的优点就是二硝基苯衍生物呈黄色。那时的层析技术实际上是颜色的记录,没有真正可靠的分步收集器,所以在柱子中能见到有颜色的带是非常重要的。显然,氯化物反应不完全,相应的氟化物或硝基化物可能反应更完全。我合成了少量1,2,4 - 三硝基苯,我们隔壁化学实验室的桑德斯还给了我们一些氟化物。这两种化合物都可在较冷的状态下较好地与氨基酸反应。因为我们有充足的氟二硝基苯来源,所以在以后的工作中就一直用它了。第一次实验结果,当然有点令人灰心丧气。我想让氟二硝基苯与甘氨酸反应,但将产物过柱时得到的不是二硝基苯甘氨酸的一条带,而是2条带。另一条可能是在甘氨酸的一个氮原子上带有两个硝基苯的化合物。我为解决这个问题花了许多精力,但后来证明甘氨酸发生的这种情况只是一个例外,其它氨基酸并无第二产物,而且从磷酸缓冲液改为碳酸缓冲液后,就完全消除了这种现象。当我将这个技术用于胰岛素的研究时,就测定了二硝基苯苯丙氨酸及二硝基苯甘氨酸。它们都是每6000道尔顿才有一个残基(虽然当时我们认为胰岛素的分子量是12000道尔顿)。这说明胰岛素有两条链。由二硫键在胱氨酸残基之间相联,可用酸氧化打断这种连接,还可分离这两条链。

这时到了1947年,我有机会访问了瑞典的梯苏流斯(Tiselius)实验室。梯苏流斯是蛋白质研究中最著名的人物之一。这是因为他发明了以他名字命名的被广泛应用的蛋白质电泳分析技术。我向他说明了两条链间的二硫键可被氧化打断,并正在寻找方法来分开这两条链。实际上,对于分子这么小的产物,在当时没有什么好办法将它们分离开,但梯苏流斯同事们的活性炭吸附层析系统看起来似乎很有希望。我在这方面工作了一段时间。这对我似乎是个好机会,特别是当时英国仍处在战后的萧条中,而瑞典则较富有。

我用活性炭柱做的实验不是很满意。检测从柱底流出的带,用的是非常复杂的计算折射率的方法。即必须通过目镜,才能观察到由折射率决定的条纹位置。糟糕的是当折射率变化时,条纹可能会消失,而且只有在折射率再一次稳定后,条纹才能在其它位置上重现,这样就可能只在坐标图上标出很少的点,使实验结果不甚精确。在通常情况下,实验室中有一个熟练的技术员做这个工作,我就请她帮我做。用此方法,在每个产物过柱后,就能在图上画出一个级。技术员做了几次后,有一次在图中出现了四级,我非常激动,因为那时我们认为胰岛素分子量为12000道尔顿,这样就有四条链。我把图拿给梯苏流斯看,他立刻建议我把这个结果及以前我在剑桥做的肽链的氧化断二硫键的结果,用他和我的名字寄到《自然》杂志发表。由于我从没见过他在实验室工作,也没有对这些结果作出任何贡献,所以他的这种态度使我震惊。我设法说服他,我不准备发表以前的肽链氧化的工作,但作为他的客人,而且资历又很浅,我不能坚决反对发表这个很有前途的结果。幸运的是这一发表的文章,是我较少为人知的文章之一,而且是我唯一感到惭愧的文章。当然,在一个胰岛素分子中只有两条链,我想当时技术员画的四级可能是她读条纹时的方法错误,若条纹消失,她可能假设没有变化,并且在条纹再出现时只记录较高的读数,这样就产生了人工的级。梯苏流斯实际上是非常友好和有魅力的人,而且我自然也非常感谢他对我那时及以后的帮助。但这次经历使我认识到,我在奇布诺尔手下工作是多么幸运。这一实际上是他创始的工作,可以名正言顺地署上他的名字,他却同意我用自己的名字发表胰岛素氨基基团分析的文章。我访问瑞典还有个收获,就是见到了辛格,他在那工作并向我介绍了淀粉区带离子电泳的方法,这是成功的纸或聚丙烯酰胺凝胶电泳的祖先。

用酸完全水解二硝基苯胰岛素得到的是二硝基苯氨基酸。若部分水解则只得到二硝基苯肽。通过对二硝基苯肽的研究,我测定了氨基末端的4 ~ 5个氨基酸。实际上只得到了2种顺序,这再次证明胰岛素只有2条链,而更重要的是用酸的部分水解可测定蛋白质的特定顺序,从而否定了蛋白质是纯化学计量法化合物,只能用有机化学方法研究的看法。在那以后的蛋白质与核酸研究过程中,部分水解都是一种主要的测序手段,只是在最近的DNA测序中才有较大的改进。虽然我研究氨基末端残基的第一篇文章被广泛引用,但我对部分水解得到肽链的结果更感兴趣,并认为这个结果在我以往的工作中占有很重要的地位。用它第一次测定了蛋白质分子中氨基酸顺序及位置,而且还消除了化学计量法的影响。虽然这是我创始的工作,但第一篇文章的发表则更多地是仰仗奇布诺尔的鼓励。

除了我的两位老师,纽伯格和奇布诺尔外,我的第一个实际合作者是罗德尼 · 波特。他比我岁数大,却是我的博士生。因为在战时,他在服兵役,而我在实验室。波特不是能作领导的人,但他却是个非常好的合作者,我认为我从他那学到的多于他从我这里得到的,最主要的可能就是他教会了我对实验轻松愉快的态度,这使实验工作更有趣,并能完全保持实验过程中实事求是、正直、诚实的准则。刚好在二硝基苯方法发现后,我们把它用于肽和其它一些蛋白质时,波特与我开始合作。他对γ珠蛋白很感兴趣,并想测定它的末端基团。我提醒他,γ珠蛋白是个非常复杂的混合物,测定它的末端基团不值一试。当然,这并不能阻止他,而且出乎人们意料,他得到了合理的简单结果。从那时起,他就与γ珠蛋白结下了不解之缘,而且对科学作出了有益的贡献。

这段时间,我们在一个位于地下室并紧邻大鼠动物房的实验室工作。尽管周围充满了难闻的气味,但它可能是我曾工作过的最喜欢的实验室。我们与肯尼思 · 贝利及他的博士生佩里共用这个实验室。佩里曾服过兵役并和波特在利物浦大学是同学。这样,贝利和我,两个认真的科学家作为后盾,与这两个刚从军队回来的野小子凑到了一块儿,这当然使我们能保持清醒的头脑。佩里和波特都有唱歌的癖好,佩里最喜欢唱的是“伟大的山”,简直是保罗 · 罗伯逊风格的翻版,波特最喜欢唱的是“没有人知道我遇到的困难”。在这种良好的气氛里,我们完成了大量的工作。这期间只发生了一件不愉快的事,就是有一次一个烧瓶在波特眼前爆炸,损坏了他的角膜。虽然视力没有完全丧失,但我想他那只眼睛再不会恢复到以前的视力了。

虽然用二硝基苯的方法较以前有了较大的改进,而且已得到了一些重要的结果,但仍有某些缺陷,最严重的就是二硝基苯氨基酸在酸中不很稳定,还须用一个校正值。不同的氨基酸校正值不同,有的值很大,如甘氨酸。这种问题在血红蛋白的研究中导致了对自由氨基数目的错误估计。因此,我仍然尽力寻找更好的方法。氨磺酰键比二硝基苯更稳定,所以磺酰氯可能效果较好。我急着寻找一种颜色更深的物质,以增加灵敏度。我在二甲氨基苯偶氮基苯磺酰氯这个试剂上花了大量的时间。它的氨基酸衍生物在层析柱中呈非常美丽的红色带,并且在酸中也稳定。但它与蛋白质反应却得不到满意的结果。这可能是由于它的偶氮基团的影响。实验室的其他工作人员又抱怨他们的东西都染上了红色。以致我们最终放弃了这个化合物。后来哈特利(Hartley)等人用另一种磺酰氯,二氨基萘磺酰氯(丹磺酰氯)获得了成功。它的氨基酸衍生物很稳定,并有很强的荧光,使它们在低浓度下即很易检测。

二硝基苯的方法在发现后得到了广泛应用,但现在已被其它更优越的方法取代了,特别是埃德曼(Edman)试剂。埃德曼试剂的优点是不仅可用于检测氨基末端残基,而且可用于检测多肽链的顺序降解产物。有趣的是埃德曼方法虽与二硝基苯的方法几乎同时产生,但起初并没广泛应用。主要原因是二硝基苯衍生物有颜色,使它们在没有分步收集器及微量检测方法时也易处理。

对测序的要求来说,二硝基苯的方法有很大局限性,因它只能用于测定氨基末端的少数几个残基,所以整个肽链的部分水解似乎对进一步测序是必须的。技术上的最大问题是怎样分离部分水解的肽链混合物。在几乎所有测序工作中,分离确实是关键的一步,分离方法的改善常常决定了测序方法的进展。在胰岛素的工作中,我们再次幸运地有了马丁(Martin)和他同事们刚发明的纸层析方法,用这个方法,当时已测定了短杆菌肽S的五肽顺序。使分离小肽的方法比以前有了很大进步。当看到迄今难以驾驭的产物,在一张简单的滤纸上终于能彼此分开时,简直是发生了奇迹。用这种方法,我们能分离从酸水解下的小肽,并通过它们的测序推导出整个蛋白质的顺序。当然,单用酸水解的方法,我们不能得到链的完整顺序,我们显然需要能测定更长的肽顺序。更特异的水解方法是使用蛋白水解酶因为酶反应是可逆的,而且已有大量工作说明蛋白水解酶的合成活性,它们可能参与蛋白质的合成,所以我们担心用这些酶时,它们即能打断又能合成肽链/肽链的顺序可能就因此被打乱了。尽管有这些疑虑,我们仍决定冒险一次。我想我们会得到两条链的完整顺序。我们已从酸的部分水解中得到了大量顺序分析结果,而且使用这两种方法都证明没有异常重排现象。在后来的工作中,使用蛋白水解酶就成了一种可供选择的方法。其实在酸的部分水解中,肽链也会发生重排。

胰岛素的顺序分析工作在很大程度上应归功于我的两个合作者,塔皮(Tuppy)和汤普森(Thompson)。前者来自维也纳,而且就我所知,是工作最勤奋的人之一。战后的奥地利可供研究用的仪器设备是有限的,所以他很乐意到我们装备良好的实验室来,做他想做的工作。我们从酸部分水解的胰岛素中收集肽链。当时他是收集较长的苯丙氨酸的肽链,我则做甘氨酸的肽链。当时许多工作都需要用纸层析的方法,层析室在地下室走廊的另一头。我们常可见到塔皮托着层析谱在走廊里匆匆地走着。他从来不跑,但其他人只有跑着才能跟上他。他只待了一年就完成了苯丙氨酸链的测序工作。而甘氨酸链只能等着我的另一个合作者了。汤普森是澳大利亚人,我曾与一些澳大利亚人一起工作过,发现他们都很好相处。他们有种在研究工作中不讲条件的态度,“若实验需要,就去做好了”。汤普森也是这样,我们在一起工作得很愉快。我们完成了甘氨酸链的测序工作,它实际上比那较长的苯丙氨酸肽链更难搞。汤普森对最后酰胺基团决心追查到底的毅力最终得到了报偿。

当我们完成了两条链全部氨基酸顺序的检测后,就只剩下一个问题了,即确定二硫键在两条链中的位置。与以前所有的工作相比,这段工作特别困难,并耗费了大量的时间,而且遇到了很多挫折。实验步骤是这样设计的:水解完整的胰岛素分子后,分离含胱氨酸的肽链,再氧化它们,然后检测哪条肽链产生磺基丙氨酸。得到的结果非常模糊。最后才发现酸水解时,二硫键发生了互换反应。后来我们用酶解测定了两条链间的一个键,但另两个在甘氨酸链上的键,半胱氨酸 - 半胱氨酸的顺序,就不能用酶切分开了。显然,从这点来说,我们选择胰岛素测序是错了,几乎所有其它蛋白质都不存在类似问题。我们花了很长时间才解决了酸解时避免互换反应的问题,从而完成了整个一级结构的测定工作。

胰岛素是第一个被完全测序的蛋白质。但它的链较短,能否用同样方法测定其它一般来说较长的肽链还有疑问。这就需要改进分离方法。最重要的就是穆尔(Moore)等人发明了离子交换层析,它可分离蛋白酶水解下的大肽段。他们还在离子交换层析的基础上,发展了一种准确的氨基酸分析方法,这种方法后来虽经多次改进,仍是今天常规采用的方法之一。他们用这些方法测定了完整的核糖核酸酶顺序(120个氨基酸),从那以后,蛋白质顺序的研究方法,采用的多是类似于他们的技术,而非研究胰岛素时所用的技术。

(待续)