有关基因表达的知识大多来自诸如细菌之类简单的原核生物的研究。这些细胞的基因表达过程比较简单。首先一基因的DNA拷贝成一种对应的信使RNA分子(mRNA);然后,mRNA决定蛋白质的合成,这种蛋白质作为细菌的一种海或结构组分行使它的功能。但是,高等生物的真核细胞远比细菌复杂,因此,对于那些从事研究真核细胞遗传信使表达的人员来说是事倍功半。

现在情况正在起变化。研究人员从揭示真核细胞基因表达的奥秘所作出的努力中开始看到了一些进展。他们发现的情况,显然不同于已了解的细菌基因的表达过程。一些研究人员最近发现,真核细胞的许多基因本身带有一些称为间隔顺序或空白顺序的核苷酸顺序,在对应与该基因的信使中找不到这些顺序。相反,我们所知细菌信使是基因的直接拷贝,并不缺失任何片段。因此,真核细胞显然有一种在细菌中找不到产生mRNA的机制,由于这种机制基因的一些顺序被略去或缺失了。

去年夏季,关于动物病毒mRNA结构的报道也提出了类似的结果。由于病毒用受它们感染的真核细胞的酶系来制造病毒组份,其中包括mRNA,研究人员假定病毒和细胞的信使都用相同的方式合成。那时,已有一些直接的但还是初步的证据支持这种推论,但研究细胞基因和信使结构的人员还没有打算这样来解释他们的发现。但是在此以后又积累了大量证据支持这种假说。

真核类(真核生物指细胞有核的生物)基因结构的研究进展得如此迅速,以致已发现含有间隔顺序的基因名单,在出版前就可能过时了。至今,在构成血红蛋白分子的一条蛋白链(称为β-球蛋白链)的基因中,在免疫球蛋白和卵清蛋白的基因中,以及在转移性核糖核酸(TRNA)和核糖体核糖核酸(rRNA)的基因中都已确定有间隔顺序。

例如国立儿童健康和人类发育研究所(NICHD)的Philip Leder和他的同事们发现两种老鼠的β-球蛋白基因都含有550个核苷酸的间隔顺序。他们通过测定一个基因的一部分核苷酸顺序,确证间隔顺序紧接在为β-球蛋白第104个氨基酸,密码子后(密码子是规定某个氨基酸的三个核苷酸的排列顺序)。他们还证明在靠近基因一端(那里是mRNA合成的起点)有一段较短的间隔顺序。同时,英国累斯特大学的A. Jeffreys和荷兰阿姆斯特丹大学的R. Flavell在兔子β-球蛋白第110个氨基酸密码子旁边识别出一段长约600个核苷酸的间隔顺序。

用测定基因顺序的方法,证实在得自老鼠胚胎细胞株的一种免疫球蛋白(抗体)基因中也有一段间隔顺序。瑞典巴塞尔免疫研究所的Susumn Tonegawa和他的同事们发现在靠近基因的一端有93个核苷酸的一段顺序,在免疫球蛋白分子中找不到相应的氨基酸顺序,这段核苷酸顺序显然是免疫球蛋白的mRNA所没有的;如果mRNA有这段顺序,那它必定会翻译成蛋白质结构。

此外,巴塞尔的研究人员还在另一种免疫球蛋白分子的两个遗传密码区之间,找到了一段更长的约有1250个核苷酸的间隔顺序。Tonegawa早些时候就证明这种免疫球蛋白的两个遗传区域,在分离出这种免疫球蛋白基因的细胞中是彼此相邻的;但当他进一步研究发现它们之间有一间隔区时,他还是有点感到意外的。

小鸡卵清蛋白基因中存在间隔顺序的证据,如今还不像血红蛋白和免疫球蛋白基因那样充分;但是法国斯特拉斯堡国家科学中心真核生物分子遗传研究室的R-Breachnach,J. L. Mandel和P Chambon以及英国G. D Searle研究室的M. T. Doel,M. Houghton,E. A. Cook和N. H. Carey的两个研究小组已经得到证据表明存在着间隔顺序。

老鼠、兔子和鸡在进化上是比较高级的,但是在比较低等的真核生物中也有间隔基因顺序。有关这方面的最早报道之一是斯坦福大学医学院的David Hogness和他的同事们提出的,果蝇(Drosophila)有两种rRNA,编码较大的rRNA的一些基因有间隔顺序。这些基因在果蝇的基因组中重复几次,但并不是所有的重复部分都有间隔顺序。因此这些基因间隔区的生理意义还不清楚

最近,华盛顿入学的Benjamin和他的同事们测定了酵母的四个基因的顺序,每一基因编码一种不同的酪氨酸tRNA分子。四个基因都含有一段相同的十四个核苷酸的间隔顺序,这段顺序紧接在决定tRNA反密码子的三个核苷酸旁边。(反密码子是三个核苷酸排成的顺序,它识别mRNA上相应的密码子并和它结合。)在任何一种tRNA中都没有发现有插入顺序。

因此,许多种真核生物显然都有间隔顺序,基因中有这些顺序可能是一种普遍现象。它们的作用还不清楚。实际上,所有研究人员都在猜测间隔顺序可能的作用,但至今还没有证据能支持或反对这些猜测。

一种可能性是间隔顺序和基因表达的开启或关闭有关。Jeffery和Flavall已经证明:不合成血红蛋白的细胞的基因中,以及产生血红蛋白的细胞的基因中,都有间隔顺序。因此,他们的结论是间隔顺序不大可能是使不进行合成的细胞中的基因失活。

另一种可能性是在信使合成后的某一阶段上,间隔顺序有助于调节蛋白质的合成。动物病毒信使的研究表明,间隔顺序是转录到RNA中去,的,以后在形成活性信使时被切割掉了。病毒间隔顺序是位于控制信使和蛋白质合成的遗传区域内,而不是位于为蛋白质结构编码的区域内。和这个工作的一个显著不同点是细胞基因的间隔区常常发现位于结构基因的片段内。但它们仍能作为某种信号,它们从RNA分子上切割下来,可能是调节着蛋白质合成的另一步骤。

Leder的实验室证明,β-球蛋白基因的间隔顺序在转录到RNA中后,才被切割掉。其他的研究人员以前就指出,这种蛋白质的mRNA是由一种前体RNA产生的,前体RNA的大小正好是结构顺序和间隔顺序两者之和。Leder和NICHD的Shirley Tilghman,David Tiemeier以及瑞士苏黎世分子生物学研究所的Peter Curtis和Charles. Weissmann目前发现,整个基因同前体RNA杂交,不出现由非互补的DNA所形成的环;如果前体RNA缺少了间隔顺序就会形成DNA环。前体两端的碱基和信使RNA本身两端的碱基是相同的。这表明形成信使RNA时两端没有被切割下来。

其他基因的间隔顺序是否也转录到RNA中去仍有待研究。还可提出两种机制来说明间隔顺序的丢失,一种是合成信使RNA的各种酶可能跳过基因的间隔区段。另一种是信使RNA也许是分段合成后又连接起来。

尽管如此,Leder小组的发现还是支持了这种假说,即真核细胞先合成一系列较大的中间体,以后再切短形成活性的mRNA。这项研究的惊人之处在于切除的是分子中间的部分,而不是两端。

由于β-球蛋白和其他基因的间隔顺序位于结构区域内,插入部分的切割和RNA片段的连接必须是十分精确地进行。丢失一个碱基,就可能完全打乱其余的信使。如果要了解真核细胞中基因表达的机制还必须考虑到另一些因子:要有进行切割和连接的酶,要有使这些酶能够识别切割区和连接端的信号。正如Leder指出的那样,真核基因的表达,看来比研究人员根据对细菌的了解所预料的更为复杂。

如果情况是这样,那就牵连到重组DNA的研究。重组DNA研究的一个目的,就是要把细菌发展成为工厂,以便大量制造目前只能从人体得到少量的物质,如:激素和抗体。由于细菌看来不可能有真核基因表达所必需的更复杂的机制,所以除非能把真核基因变成类似于细菌的基因,并接受同样的控制,否则这个目的也许是不能达到的。对于那些仍然对重组DNA研究的潜在危险性感到忧虑重重的人来说,这倒是很可高兴的,因为真核基因表达将产生某种危险的病原体的机会可能也就减少了。

[译自Science1978年199卷4328期。任大明 赵寿元 ]