免疫学中长期存在着一个悬而未决的中心课题:抗体多样性的遗传起源,种系说认为,遗传学上的多样性是在进化过程中形成的;个体发育说则认为多样性是在发育过程中发生的。利根川进试验证实了个体发育说。

1970年秋的一天我收到了里纳托 · 杜尔贝科的信。他写道:“位于瑞士巴塞尔的免疫学研究所定于下月开办。他们已经邀集了不少出色的免疫学家,但是没有足够的分子生物学家的配合,我已经向该所所长推荐了你,他们乐于邀请你去工作…他们发现了RNA粗制品的许多有免疫学价值的现象,但是不能充分肯定,因为他们不能鉴定RNA。总的说来,这是从分子水平了解发育的一个最佳系统,而且你可能喜欢迈进这一领域”。

部分是因为这封充满了科学预见的来信,部分是因为美国移民法限制我继续在美国居住,于是我1971年2月来到了瑞士。我很快就意识到,在这一个完全由免疫学家所组成的研究所里,对这样的课题是不会有人感到很大兴趣的;而且这样的课题又不能发挥同事们的优势。

课题

免疫学家曾经认为,脊椎动物的个体即使在遭遇抗原之前也会合成数百万种结构不同的抗体。但是多年以来,分成两个学派,一派认为合成这些蛋白所需要的遗传学上的多样性是在进化过程中形成的;另一派认为这种多样性是在发育过程中发生的,也就是说它们存在于体细胞之中而并非存在于生殖细胞之中,多年来出现了支持和反对的种种意见。但是统统都是依据免疫球蛋白多肽链氨基酸顺序的解释,或者依据进化和遗传的原理,而都没有直接的证据。

基因计数

七十年代初解决了提纯真核细胞的技术;加上建立起了通过核酸杂交动力学分析来计算特定基因的拷贝数的方法。有了这些技术前提,科学家开始考惠,有可能测定基因组中含有的免疫球蛋白基因数,从而决定抗体多样性的两大理论哪一个是正确的。

我取来小鼠骨髓瘤细胞,试图提纯免疫球蛋白mRNA以进行杂交研究。研究的是为小鼠λ轻链编码的基因。实验测定的小鼠λ基因数(最多也只有几个)远远少于在各种蛋白质中所发现的不同的Vλ区的数(至少是8个,很可能比8个多得多),根据这些结果,我开始相信,在这个基因系统中出现了一个体细胞的多样化过程。

基因重排

一次我偶然看到了一个巨大的有机玻璃盘。我想为什么不可以利用这样大小的凝胶盘来把相当量的酶解分层呢?因为这样一来,从凝胶块中洗提出来的DNA可以用作液相杂交。这项试验的结果清楚无误,令人喜出望外:胚胎(作为种系的代替品)DNA和к骨髓瘤DNA的杂交型不仅明显地不同,而且和别的V和C“基因”以及连接的V+C基因的出现均表现出一致性。对这些结果可能作这样的解释:这表明为这两型DNA中的一型出现了酶切的偶然变异。但是我们认为,对其结果作这类解释似乎不妥,因为这些解释都要求多种的偶然事件。不久以后我们的信念便向着下述的方向增强起来,因为索瑟所建立的吸印杂交技术允许我们使用一系列的限制梅和骨髓细胞去进行更多的分析。

基因片段的连接

虽然用限制酶所做的试验的结果对我们有启迪,但是基因重排的细节却难以在这个研究方向中阐明。幸运的是,当时重组DNA技术刚刚问世,而这一技术对于这一目标的研究正好是理想方法。

我们认为,从胚胎DNA开始,就可能分离到专门和λmRNA杂交的克隆。根据该项试验结果,再加上另外一些试验结果,我们确信,我们已经成功地克隆了一个没有C“基因”粘连在一起的Vλ基因;从而在DNA克隆的水平上证实了,V和C“基因”在种系基因组中确实是分开的,后来我们和美国哈佛大学合作进行了DNA顺序测定,结果表明,这一DNA克隆相当于负责λ2亚型的V“基因”。

我们的另一项发现——在种系基因中Vλ“基因”分裂为Vλ和Jλ两个基因片段——是完全出乎意料之外的。但是一旦作出了这一发现,它对抗体多样性的体细胞发育说的影响就是十分明显了,如果种系基因组能够携带不同的V和J基因片段的许多拷贝,那么由这两型基因片段之间的随机连接所产生的这种完全的V“基因”的数量便可能大大超过被遗传的基因片段的总数。这样一来,DNA重排可能为抗体分子的体细胞多样化提供许多重要手段。我们的另一项实验和美国国立卫生研究院的一项实验证实了,种系基因组合有多个V和J基因片段,而且在每个骨髓瘤细胞中这些基因片段是以不同的组合进行连接的,在Cк基因片段上游好几千碱基对的地方找到了4个不同的Jк基因片段。虽然直到今天Vк基因的确切数量仍然没有搞清,但估计为200—300个。

重链基因

由于免疫球蛋白的重链也是由V和C区组成的,所以有理由指望,其基因也会发生在轻链方面所记述过的那一型DNA重排。这个假设为加州理工学院与我们的实验分别证实。

当重链基因的组织的特性被证明基本上和轻链基因的组织相同时,有一项观察表明,基因片段的体细胞组装在重链多样化中所起的作用,比在轻链多样化中所起的作用甚至更加突出。我们发现,存在于组装基因的V-J结合区的一两个至十来个氨基酸密码子却不存在于相应的种系V或J基因片段之中,这一点提醒我们,被称作为D的第三型短基因片段可能参与了重链基因的体细胞组装。果然我们的实验室不久以后便发现了十来个D基因片段,后来这些片段则被画进种系基因组的J簇上游区的图谱之中。由此可以推知,1个完全的重链V“基因”的结构要求两个DNA重组事件:1个把V基因片段和D基因片段连接起来,另1个把D基因片段和J基因片段连接起来。

重组作用

V-J或V-D-J的连接包含了一种位点专一性的重组,从而可以推断,这些基因片段可能在连接终端附近携有氨基酸顺序,它们可被假定的位点专一性重组酶识别。后来的试验表明,果然在每个Vк基因片段的下游区中恒定地保存着一个七聚体和一个九聚体。后来在每一个Jк基因片段的上游区中也发现了与该七聚体和九聚体相补的顺序。在七聚体和九聚体之间存在着长度为12个或23个左右碱基对的间隔。

在连接部位发生的多样性

当我们将推论而得出来的种系基因片段的Jк氨基酸顺序和实际测定的这些к链的氨基酸顺序加以比较时,发现Jк基因片段的5'端并不是位于前端的,而是飘移至不同连接部位的上游或下游几个碱基对处。后来了解到,确切的连接部位的可塑性竟然是其他基因片段的连接端的一项特征。

后来的实验表明,抗体对界定抗原的亲和力可被一个连接顺序中的一个轻微的改变所剧烈地改变。由此可见,连接部位的变异也是抗体多样性的一种强有力的体细胞发生器。

体细胞突变

当伯奈特提出无性系细胞选择学说时,他把体细胞突变看作为最讲得通的机制。索克研究所的试验,提供了一个极好的机会来直接检验抗体多样性的体细胞突变的作用。我们用杂交动力学所进行的基因计数试验说明了,种系BALB/C基因组携带的Vλ1“基因”数不过是几个罢了。但是当我们用索瑟吸印法来重新评价拷贝数的时候,这个数字便降到了1。

以后的研究都确证,体细胞突变进一步放大了编码于种系基因组上的多样性。有几位科学家随后又证明了,单个碱基改变可能是剧烈的,然而却限制于连接性的VDJ顺序及其直接邻接区。

重排和超突变的发育调控

为什么参加免疫系统旨在完成抗体多样性这一任务的有两个远非寻常的体细胞遗传机制(即重组和超突变)呢?我认为,其回答可能在于这两个遗传机制具有不同的功能。由于若干个彼此独立的细胞免疫学家和分子免疫学家小组的努力,这样一幅总的画面已经清晰可见了:它描述了B细胞发育的各期和体细胞重组或突变之间的关系。'

一旦某种抗原第一次进入淋巴系统,它就会遭到原始B细胞的筛选。在这些B细胞中对相应决定簇具有亲和力的那一小部分,便会起而反应,并沿着如下两个途径之一继续活动:要么它们产生原发性的抗体反应,要么它们导致记忆B细胞的产生。沿着前一途径,这些被选择的B细胞便要增生,并分化为分泌抗体的浆细胞。在这一过程中,突变是很少发生的。与此相反,沿着另一途径,即是沿着由抗原激活的原始B细胞所取的途径,也就是在产生记忆B细胞的过程中,免疫对球蛋白则仍然以细胞表面受体的方式存在下来。在这一过程中,超突变装置似乎最为活跃,突变率接近每细胞10-3碱基取代。抗原是以阶梯式进行着选择,这种选择越来越适应于突变的需要,其结果则为在记忆B细胞表面的免疫球蛋白达到了一个大大高于祖代原始B细胞的免疫球蛋白的亲和力。开关重组也经常出现在这一过程之中。

对抗体基因的体细胞发生可以看作为一个两阶段的过程。在第一阶段,一批批基因片段按照不依赖抗原的方式用来建造一组基因,它们所编码的抗体具有很大的多样性,但是亲和力很低,在第二阶段,一旦该抗原已经确定,被选出来的一小组具有低亲和力的B细胞作为细胞表面受体发生了体细胞突变;出现的结果是,其中一部分对该抗原产生了高亲和力,并可被选出作进一步的扩大。后来证明,体细胞突变也可能发生于那些受体的常规部分,它们对过去没有进入过免疫系统的抗原有特异性。

T细胞受体

当抗体多样性的遗传起源之谜尚未解开之际,我们自然而然地想把研究工作延伸到淋巴系统的“另外一半”,即T细胞中去。尽管人们已经知道,T细胞识别抗原能力的精确程度不下于B细胞,但是人们对于负责这一任务的分子(即T细胞受体——TCR)的生化本质却一无所知。这方面信息的缺如和关于抗体信息的海洋形成强烈的对照。七十年代后期所进行的研究已经表明,T细胞识别抗原的方法和B细胞迥然不同:T细胞反应的是细胞表面的抗原,T细胞受体同时既识别抗原,又识别存在于糖蛋白之上的决定簇(该糖蛋白是由主要组织相'容性复合物——MHC——基因所编码)。这一发现提出了另一个问题:T细胞识别的是一个受体的两个决定簇呢?还是说它有两个受体,其中一个受体负责抗原,另一受体负责MHC产物?T细胞受体蛋白最早是于1983年发现的。

当年发现T细胞受体蛋白的科学家在一组试验中所鉴定的该受体是由两个多肽亚单位(被称为α和β亚单位)所组成,这两个亚单位之间由一个二硫键所连接。可是这种蛋白在T细胞表面上数量极少,而且该受体又存在被分泌型,这些都决定了极难进一步研究该分子的结构,特别是其氨基酸顺序。

α和β基因

与此同时,分子生物学家曾经企图鉴定为T细胞受体编码的基因。结果表明,实现这一期望的困难远远大于免疫球蛋白基因的克隆、1984年斯坦福大学的科学家完成了一项突破,他们从一个不能与B细胞源性mRNA杂交的T细胞cDNA组分中获得了一个基因组库,并且测定了每个T细胞特异性cDNA克隆对相应基因在T细胞上的重排。他们得到了同类cDNA克隆,其核苷酸顺序表明,相应的多肽链明显地(30 ~ 50%)相同于免疫球蛋白链;而且cDNA克隆含有和V与C相同的顺序。由此可以肯定,由这一类cDNA克隆所代表的基因可编码T细胞受体两个亚单位中的一个,不久以后有人确定了人β链上部分的氨基酸顺序,从而确认了,这一基因编码的是β亚单位。

我们试图从另一型T细胞(为Ⅰ类MHC分子特有的细胞毒性T细胞克隆)中分离α和βcDNA克隆。1984年我们应用了一种改良的cDNA减数基因组库法,鉴定了也能满足T细胞受体基因要求的cDNA克隆。其中一类这样的克隆称为β亚单位。把我们的结果和斯坦福大学的结果加在一起,就足以说明,两大类T细胞,即辅助T细胞和细胞毒性T细胞,共同享有一套基因,至少是其β亚单位是如此,后来在α单位方面也得到了同样的结论。这一结论之所以颇有价值,是因为这两型T细胞是为两类不同的亚类MHC基因产物特异所有。相同的T细胞受体基因就是这样地导致了Ⅰ类和Ⅱ类MHC的识别。

一旦编码α和β链的cDNA得到了鉴定,我们便直接走向基因组DNA中相应基因组织的测定。这些试验证实了,α和β基因部是在种系基因组中组织起来的,并且在T细胞中以明显地相似于免疫球蛋白的方式重排,测定了编码T细胞受体的基因的结构和组织,便可确定这些基因和免疫球蛋白的关系,便可了解它们多样性的遗传起源。

一种新的T细体——γδ

由于明确了第三个T细胞特异性的重排基因是负责α亚单位的,第二个T细胞特异性的重排基因便成为一个孤儿了;但是该基因和其他两个基因是紧密相关的,所以似乎可以肯定它在T细胞识别方面应该起些作用。可是以往的免疫化学研究并未揭示任何可被视作为该基因的蛋白产物的候补者的多肽链。γ基因也是从V、J和C基因片段在体细胞内组装而成的,该基因具有与α和β基因以及免疫球蛋白基因所共有的许多特征。

关于假设中的链的直接作用,曾经有过种种推测。但是嗣后在我的和若干别人的实验室中所做的实验研究却揭示了基因及其表达的许多特性,而它们均不能支持以上种种推测。我们所阐明的特性可以归结如下5点:1. γ基因产物看来并非在一般的、αβ受体阳性的毒性的和辅助的3类T细胞中广泛表达,2. γ多肽链作为被称为γδ异双体的一个组成部分,只表达于一小部分(0.5多以下)周围血液中T细胞的表面。3. γδ异双体也和αβ异双体一样,是和另外一个糖蛋白GD3相当紧密地连系着的。4. 在胚胎和成人的胸腺细胞的CD4-、CD8-组分中,存在着相对大量的γδ受体携带细胞。5. γδ受体表达的另一个主要部位是在表皮组织。

虽然γ和δ基因及其产物的鉴定方面进展迅速,但是最引人注目的课题,即γδ受体携带细胞的生理学作用现在仍然不明。γδ受体携带细胞的效应器功能现在还没有充分肯定,但是最近应用人和鼠的γδ细胞克隆所进行的研究表明,这些细胞中的许多细胞是有细胞中毒能力的。发现一种新型T细胞,它在表皮组织中具有一套明显的T细胞受体,这一点发人遐想。很可能这一型T细胞的发生并不限于外层的上皮组织,而且还扩及所有的上皮层,如果情况确是如此,那么这些细胞可能已经发展成为机体中最容易发生感染的部分,即和环境有直接接触的内外上皮表面。但是/细胞显著地多见于胸腺这一点足以说明,这些细胞还具有胸腺内的作用。

结论

因为使用了限制酶和重组DNA方法,所以才有可能解决免疫学中一个长期悬而未决的中心课题:抗体多样性的遗传起源问题。研究表明,机体并不能遗传哪怕是负责抗体多肽链的单个的完全基因。诚然,遗传信息在种系中的传递不会多于几百个基因片段。通过一系列特异地发生在B淋巴细胞分化过程中的专化体细胞重组,这些基因片段便组成几万个完全基因。在这些组装的基因中发生的体细胞超突变进一步使抗体多肽链多样化起来,从而在B细胞分化后期可以选出那些具有免疫球蛋白受体的B细胞。这样一来,机体在免疫系统中便可以利用两种修饰DNA的方法(重组和突变)来把数量有限的遗传下来的基因信息通过体细胞多样化起来,以对付无穷无尽的抗原世界。

体细胞多样化为什么是免疫系统进化所必需的呢?微生物和它们产生的物质是有重大生物学意义的抗原的主要来源,脊椎动物为了抵御它们就必须产生抗体以维持生存。因为微生物的世代交替时间比脊椎动物的世代交替时间短好几个数量级,所以前者产生遗传变异体的速度比后者快得多。由此可见,如果种系基因组变化仅汉是抗体多样性的来源的话,那么脊椎动物就不能有效地对付这个快速变化的抗原世界了,有了体细胞多样化,机体个体才能够产生出数量真正无限的不同变种的淋巴细胞。正如处于生态系统中的机体一样,这些淋巴编胞也遭受抗原的选择,而且只有其中的最能适应者才得以生存。

分子生物学研究方向在分析T细胞受体方面所起的作用甚至可以说是更具关键性的。有一点也得到了证实,这就是为组成受体蛋白的多肽链编码的,是与免疫球蛋白基因具有共同祖先的基因,T细胞受体和免疫球蛋白相同之点是,它们是通过体细胞重组而多样化起来的;和免疫球蛋白不同之点是,人们没有观察到,它们进一步的多样化也是通过体细胞突变进行的,造成这一差别的原因尚未阐明,但是看来可用下列说法加以解释:1. T细胞受体和免疫球蛋白不同,其功能完全限于细胞表面受体,而且这种受体已经转化为和细胞结合的抗原相互作用。2. 部分地组成配体是一种基本上不变的成分,即自身MHC。因为T细胞是在发育和对自身免疫的两个过程中遭到选择的,所以通过体细胞突变所获得的高度可变性不仅不是必需的,而且甚至于是不利的。3. T细胞似乎是在自身耐受力发育早期遭到选择的,而这个时期则是不能识别自身抗原的。在抗原刺激过程中的体细胞突变(例如见之于B淋巴细胞)可能导致自身反应性的产生。自身反应性的B细胞是依赖于自身反应性辅助T细胞的附加性存在以产生自身免疫力的;但是自身反应性T细胞在这一点上则不然,它们可能直接引起疾病的发生。这第3点在我看来是最重要了。

最后、有一点值得提一下,在我研究免疫系统的15年中,分子遗传学在免疫学研究中的作用已经发生了根本性的变化。当我们开始研究抗体多样性课题的时候,关于抗体分子的结构和功能已经积累了大量的信息;但是关于它们的基因,则几乎一无所知,与此相反,在重排基因γ被发现的时候,在关于T细胞识别的最近的试验研究中,还是没有了解到基因产物。从该基因的结构及其重排特性可以推导出一个受体基因,而这一发现已经直接导出了关于T细胞发育和T细胞生物学的新观点。淋巴细胞受体这一领域中的简短研究史又一次证明了DNA工艺学的强大有力,证明了这个研究方向不仅可能解释已知的生物学现象,而且有助于新的生物学系统的发现。

[Les Prix Nobel,1937,198-227]