你研究过你的家谱图吗?或许是为了了解祖先在古时的生活状态,或者仅仅是为了满足好奇心。一股寻根溯源、探寻祖先的热潮正在兴起,查找家谱已经成为使用互联网的一个主要动机。其中,有些人调查研究了好几代家族史,另一些人则追溯他们的祖先至许多个世纪前,但没有人能像科学家那样,试图去寻找一切生命的祖先。

地球上的一切生物,从人类到细菌,从圆叶风铃草到蓝鲸──都被认为是单个实体的后代,这种实体是一种在40~30亿年前的原生物中到处飘浮的原始细胞,我们称它为“最后的共同祖先”(last universal common ancestor),或简称LUCA。当时它是什么摸样,以及是怎样生活的?由于没有留下任何化石残存,也没有关于它的任何其他自然界的线索,长期以来,人们认为关于LUCA的问题无法用科学来解答。

不过有关LUCA的问题终将重新趋热。研究人员目前正在比较各种生命的基因,力图把这个一切生命的祖先的图像描绘出来。他们的研究结果往往成为论争的主题,也对原始生命的某些最基本的假设提出了挑战。例如,我们通常以为生物进化是自然选择的结果,但有证据表明,情况可能并非如此。另一件令人意外的事是,DNA——生命的密码可能是由两种独立的场合进化来的。瑞典斯德哥尔摩大学的安东尼 · 普尔(Anthony Poole)说,“这是异常令人兴奋的事,它将大大改变LUCA的形象。”

达尔文在19世纪中叶就首先开始关注我们遥远的祖先,并提出了自然选择的进化理论。他认为,类似物种的祖先是共同的,因而有共同的家谱图,但达尔文不能判定是否所有生物都属于一个家谱还是若干个家谱。

只是到了20世纪50~60年代,研究人员在探明了细胞的最基本的作用机理后,才揭示了联系各种生命形态的类似性。譬如,几乎一切生物体都应用脱氧核糖核酸(DNA)长链把创造和维持生命所需的无数蛋白质编码,同时还应用短尺度的称作核糖核酸(RNA)的类似分子以复现每次储存在DNA一个基因中的信息,从而制造出蛋白质来。一切生命形态无一例外地都是利用称做核糖体的大而复杂的分子机器,以RNA片断模板作为将氨基酸单元组装的蛋白质。

或许一个共同祖先的最有力的证据乃是我们的基因的共同语言。尽管似乎还不能从生物化学的角度说明:为什么某种DNA或RNA的“字母”会编码某些氨基酸,但把同样的密码用于整个生命的家谱图则极少例外?

尽管LUCA是我们的一个最早的祖先,但并非就是第一个活的实体。LUCA的DNA、RNA和核糖体几乎都包在有膜的细胞内。它们太复杂了,不可能自发地从原始生物中产生。第一个活体应该只是一个能自我复制的分子,据认为产生于约43亿年前。它应是慢慢地进化为各种不同的原始细胞。但只有一种细胞——LUCA——最终非常幸运地有了后代。

那么LUCA是什么摸样呢?我们对它最早的了解来自伊利诺伊大学厄巴纳香槟分校的分子生物学家卡尔 · 伍斯(Carl R. Woese)的研究工作。上世纪60年代末,他发明了一种技术,可通过比较在核糖体中发现的小的RNA片断的排序来估量物种间的相关性。假设基因变异随时间而自然增加,那么2种物种的排序就愈不同,物种间变异的时间就愈久远。

以前,生命形态最基本的分类为真核生物和原核生物两类:一切动物、植物、真菌和诸如酵母等单细胞微生物都是真核生物。它们由较大的细胞组成,含有许多复杂的内部结构,诸如产生能量的线粒体和贮藏由蛋白包裹的DNA的核。原核生物主要是细菌,由较小而简单的细胞组成,缺乏上述内部物质,仅拥有由称作肽聚糖的特殊含糖蛋白质组成的细胞壁,这是真核生物里所不具有的。

伍斯发现,在原核生物中实际还存在着第3种生物:一种奇异的微生物——太古细菌。尽管它在许多方面类似于一般的细菌,但它没有明确的肽聚糖,却具有若干真核生物的特性,诸如拥有蛋白包裹着的DNA等。自此以后,研究人员采用一种新的生物分类学方法,把生命体分为:太古细菌、细菌以及真核生物。

尽管在生物分类学上取得了重大的进步,伍斯的早期研究还是留下一个关键问题没有回答:这3个生命领域是以怎样的次序进化的?换句话说,LUCA是细菌、太古细菌还是真核生物?在上世纪80年代末,通过进一步比较核糖体RNA后,普遍认为细菌是进化最古老的领域(尽管对其他基因的分析得出了不一致的结果)。

对此,巴黎塞德大学的帕特里克 · 福特雷(Patric Forterre)提出了不同的观点。他认为,细菌比真核生物细胞更原始,这是因为它们更简单。但这种基因分析方法有一个缺陷:没有考虑到不同种群之间积聚变异的速度是不一样的,因此进化较快的细菌显得比真实情况更古老。

福特雷接着指出,尽管真核生物更复杂,但它们体内也具有看似原始的成分。例如,真核生物的染色体由DNA的股线组成,后者需要称作端粒的复杂精巧的分子,以防止在复制时其端部遭到破坏。而细菌的染色体则组成一个环,所以它们不需要端粒。

真核生物还含有非编码内含子和显然无用的DNA,其相应的序列在由剪接体(复杂的编辑机器)制造蛋白质时,必须从中间物RNA分子中除去。细菌没有内含子,所以它们不需要剪接体。细菌与真核生物比起来,制造蛋白更灵活有效。它们能在数秒钟内开始合成蛋白;而真核生物需时半个小时。福特雷认为,由于这些原因,细菌可能是比较新近进化的,而LUCA实际上是真核生物——跟我们人是同一种类。

此外,揭示LUCA身份的不同方法来自上世纪90年代完成的第一个基因组排序工程。这种方法使研究者得以列举出所有生命形态共同的基因,看它们是否可能是由LUCA遗传下来的。但令人惊异的是,整个生物家谱所共有的基因数很少。例如最近所作的比较,观察了100个物种,发现仅有60种基因是共有的──这对维持诸如LUCA等以细胞为基础的生命形态来说实在是太少了,不管这种生命形态是多么原始。这说明,由于生物在适应新的环境并抛弃冗余遗传物质时的基因丧失,不少进化的记录已从物种基因组中清除掉了。

另一个问题是什么叫横向基因传递。与从祖先到后代的纵向基因传递不同,细菌等单细胞生物能在同一代的个体之间交换基因。在早期进化中,横向传递似乎起着主要作用。其结果是生物物种具有成为不同进化史的基因的“镶嵌物”。

嗜热还是不嗜热

我们能获得关于LUCA当初生活环境的线索吗?根据基因比较得出的某些谱系,可认为最早的生命形态是生活在80℃以上温度环境中的嗜高温生物。这就提示LUCA或许也是这样一种生活在深海热水出口附近的生物,这里丰富的矿物质能给当时缺氧的地球提供能源。

但这个理论的弱点在于,处在极热的条件下的生命需要特殊的酶来保护RNA和DNA免遭破坏。似乎更有可能是,在进化产生酶以容许他们逐渐靠近热区域以前,更简单的生命形态最初是在较适中的温度条件下产生的。近来的研究进一步否定了该理论。2000年的研究工作表明,能增强DNA对热破坏的抵抗力,仅在嗜高温生物中发现的反向促旋酶,而且到三个区域分开后才形成。同时,在细菌中发现的另一些保护性基因,似乎已从太古细菌横向传递中获得了。

对LUCA嗜热理论的更直接的挑战,来自当时在法国巴黎皮埃尔&玛丽 · 居里大学的进化生物学家塞勒 · 布洛丘(Celine Brochier)和赫维 · 菲利普(Herve Philippe)近来的研究工作。他们认为,以前对核糖体RNA的研究,很可能将已丧失了历史信息的快速进化形成的基因物质包括在内,因而存在着缺陷。他们将研究的焦点放在演化得更慢的部分核蛋糖体RNA上。2002年他们发表了一个谱系图,表明了最古老的生物体是被称做浮霉状菌属(Planctomycetal)的不寻常的菌类(它们仅能在中等温度下存活)。这种微生物的细胞壁中缺少肽聚糖,其染色体包在一层膜内,这是细菌中最接近细胞核的东西。

但是大家的意见并不一致。意大利那不勒斯国际遗传学和生物物理研究院的分子生物学家M · 迪吉乌里奥(M. Di Giulio)认为,布洛丘和菲利普没有充分利用由核糖体RNA得到的材料以使他们的分析更有针对性。迪吉乌里奥利用更多的遗传物质重复了法国研究组的工作,取得了不同的结果。在他画出的浮霉状菌属的世系图中,有更接近基础而极为嗜热的两个种群——Aquifical和Thermotogal被证明更为古老。但无法确定谁的方法更准确,争论目前陷入僵局。

甚至LUCA基因的性质也成为问题。长期以来认为,最早的能自我复制的生物体不可能没有DNA和蛋白质系统,因为它们过分的相互依存,不可能自发产生。DNA能把催化复制DNA的化学反应的蛋白质编码(两者不可缺一),因此第一个基因可能是由RNA构成。由于其不同的化学性质,能催化某些反应而不用蛋白质。“RNA的世界”最终为更高级的DNA/蛋白质体系所替代,RNA则起到附属作用。最初认为,LUCA只能在DNA/蛋白质阶段到达以后才存在,因为所有生命形式似乎都以同样的方式制造和利用DNA。例如,生物体用以制造DNA基本单元的核苷酸还原酶就含有一个在三个领域中都相同的分子核。

最近对基因组的比较已经揭示:在这三个领域里面与DNA有关的分子机构存在一系列的差别。例如,细菌用以复制DNA的某些酶与太古细菌和真核生物所用的酶无关。普尔等人认为,最可能的解释是,LUCA存在于发生RNA基因转变为DNA基因以前,“看上去的确像是DNA演化了两次。”

如果这还算不上异端邪说的话,对原始细菌区域作过鉴别工作的卡尔 · 沃耶斯(Carl Woese)最近已经对是否有LUCA存在产生了怀疑。他认为,最后的共同祖先不是单个生物体,而是进行横向基因交换的原始细胞的有变化的群落。

最早的膜封细胞应该是极其简单的。沃耶斯认为,它包含少数能独立起作用的基本组分,如果它们的基因是个别地由其他细胞获取的话,横向基因传递应该是支持进化的主要动力,而不是纵向继承。“曾经有一度认为,基因传递是进化的主要动力,”沃耶斯说。

随着细胞愈来愈复杂,随机获得的个别组分就不能那么容易组分了。在这个被沃耶斯称为达尔文界限的关节点上,基因组开始依靠继承,带有明显同一性的谱系开始在共同原始物中出现。沃耶斯认为,生命的谱系看上去所以会因你选用于分析的基因而不同,本理论可对次作出最好的解释。

但是另外一些科学家并没有放弃LUCA,他们正试图研制更先进的分析手段来弄清楚这方面的矛盾。美国马里兰州贝塞斯达国家生物技术信息中心的进化生物学家尤金 · 库宁(Eugene Koonin)最近重新开始编制一个LUCA基因清单。他的研究小组已开发出一个计算机模型,用来确定基因丧失和横向基因传递所起的相关作用。迄今为止,他们已经鉴别了大约600个侯选基因。

库宁等人希望,能发现运行一个原始细胞所需的最少的基因,从而能够在实验室里装配这个最小的基因组。“很容易想象一个细胞进化的‘侏罗纪公园’,我们在那里进行各种重建祖先形态的研究工作,”库宁在最近的一篇文章中这样写道。

显然LUCA的研究正方兴未艾。