基因组的研究结果显示,人和黑猩猩的DNA顺.序,约95%是一样的。这就进一步证实了多年来就已知的某些事情:决定一个人的因素是很多的。除了基因以外,还有基因与基因,以及基因与环境之间的相互作用。十分复杂的化学系统,造就了人和猴子的区别,同时也决定了人的个性。活细胞内的大分子,尤其是蛋白质,以无数种形式存在。但是,这么多不同形式的分子变种,有多少是RNA拼接和转译后饰变的结果呢?又有多少是源于遗传的和具有进化上的意义的呢?

大肠杆菌(E. Coli)用来探测温度的受体很可说明问题。大肠杆菌就是用这种同样的蛋白质——趋化性受体Tar——来探测天冬氨酸的。而且,环境中天冬氨酸的浓度,决定着对温度反应的灵敏度。在缺乏天.冬氨酸的介质基内,Tar是热的探测器,可使大肠杆菌游向较远的热源。但在周围的介质中含有溶解的天冬氨酸时,Tar便成了冷的探测器,可供细菌游离热源。这种行为变化的分子基础,在于细胞质区内Tar蛋白质的甲基化作用。当受体适应天冬氨酸时,它会变得高度甲基化,这显然会改变受体对温度升高时的构型反应。但是,甲基化引起的Tar对温度反应的变化是否仅仅是偶然的?或者,在大肠杆菌所处的自然环境中——不论是消化道或汉堡包或阴沟——滴加进天冬氨酸,是否有益于抗温呢?换句话说,这种效应,会是进化期间所选择的吗?

除Tar之外,E. Coli还有三种接受甲基的受体类型,在它们之间,相互调节着多达50种不同的化学物质以及PH和温度的吸引和排斥反应。受体不仅是多功能的,而且它们聚集在细胞表面上,影响着彼此的反应。因此从天冬氨酸和温度的变化中所观察到的这种现象,也适用于其他如丝氨酸和天冬氨酸,或核糖和PH的组合对。细菌对多种环境刺激的优先反应的程度有多大,遗传因素的比重又有多少呢?

以上问题很难回答,因为大肠杆菌趋化性受体簇太复杂了。每个受体甲基化作用的位点多达8处,并又可至少采取两种可能的构型。在每——受体簇中,几千种受体有四个不同的类型,每三个形成一组,彼此相互作用。因此,不同受体三联体(每个三联体对多种环境的影响,产生不同的反应)的数量极其庞大。

转而看“真实”细胞内的情况,不妨想一想鱿鱼巨大神经轴的钾通道。由于RNA剪辑的结果,这些钾通道的形状各不相同,在通道内特定的腺苷残基被转化为肌苷(次黄苷),继而转化成鸟苷。在每一个.特定的钾通道基因内,RNA剪辑在多达13个不同位置上产生氨基酸置换。改变了的氨基酸,对通道产生多种功能性饰变,从而改变了它的电压敏感度、导电率乃至表达水平。每个替换位点的效率各异,因此任何一个蛋白质分子,可以有多达8192种可能的不同的替换组合。因为通道是由4个亚单位构成的,因此将有4.5 x 1015个不同的四聚体通道。

这并非个例。许多哺乳动物的肌原体蛋白质,由于不同的RNA拼接,也存在多种形态。影响肌肉对钙敏感性的肌钙蛋白TroponinT就有80多种不同形态,其多少依肌肉的类型以及生长和运动等生理过程而异。由于RNA拼接发生在核内,而肌肉的肌原纤维又是多核的,所以任何一种肌原纤维的肌钙蛋白补体都是特异的。更加有趣的例子是染色质中的组蛋白,其氨基末端尾部在多个位点上受到了乙酰化、磷酸化和甲基化的作用而被修饰。负责催化这些组蛋白尾部修饰作用的酶类,对于特定的氨基酸的位置高度专一;它们自身又受信号路线和其他修饰组蛋白局部浓度的综合影响。这些修饰的范围如此广泛,以致有人认为它们构成了一种“组蛋白密码”,从而增大了包含在DNA顺序自身中的信息。

蛋白质的遗传变异机制真是五花八门,丰富多彩,这在高等生物中尤其如此。在人类,所有结构基因的一半可能是另样拼接的;可能有二分之一的蛋白质是因磷酸化作用而发生饰变的。大脑似乎具有特别丰富的分子多样性,可能反映了解剖上和生理上的无比复杂性。例如人类只有三个为神经细胞表面蛋白neurexins编码的基因。但是通过不同的启动基因和不同的拼接,这三个基因以不同的组合可产生数千种异构体,在不同的神经细胞表面上表达。把所有的分子变异综合起来看,生物体中的每一个细胞的化学性质都是特异的,甚至在估计含有1011个神经细胞的人类神系统中也是如此。

蛋白质结构的大多数变异,可能都是由酶及其底物之间相遇的机会引起的。许多其他变异可能是由温度、机械应力和离子及小分子的瞬时局部浓度等环境的影响所造成的。导致这些结构变异的,必定还有纯粹的遗传因素。每一个基因,通过自身或和另外基因的协作,都有能力创造复杂形态的蛋白质产物。但这种特定遗传变异的程度是全然未知的。一种蛋白质有多少种变异形态是由自然选择产生的?蛋白质结构的哪种饰变,已进化到使有机体在许多不同的环境条件下都能适应生存?

在免疫系统中,蛋白质结构的变异都是功能性的。哺乳动物制造成百万的淋巴细胞,每一个淋巴细胞都能成为随机产生的不同类型的抗体分子。克隆选择促进了能识别特异抗原的那些少数淋巴细胞的增殖;其余的淋巴细胞则只能死亡。形成抗体多样性的机制,包括基因片段的组合连接,基因片段连接时的随机变异、抗体轻链和重链的组合连接,以及抗体基因中的体细胞超突变。所有这些机制综合起来,可使一个人制造多达1012个的不同抗体分子。这种策略惊人的成功,会使人们提出这样的问题,在非免疫过程中是否也存在类似的策略呢?也许细胞中存在的蛋白质选择机制,可以牺牲其他蛋白质为代价,来增加某些蛋白质的异构体了。

从进化的观点看,蛋白质的结构因能影响生物的生存而显得格外重要。但是,许多蛋白质变异,似乎只有使细胞功能发生轻微的变化。一种化学变化可能只有当细胞遇到一种诱吸剂时才会稍微增强它游向一定目标的趋向。另一种化学变化也许只能略为增加一点某一发育阶段的基因转录。研究人员应用基因技术使某些特定基因失效后,感到困惑的是,即使除去了细胞内的主要成分,也只对发育产生很小的影响。例如,肌酸激酶是参与能量代谢的最重要的酶之一,可缺乏-种肌酸激酶异构体的小鼠,能和其野生型的亲戚一样生长,也可生育,并有正常的寿命。生物具有补偿和适应遗传变化的巨大潜能。个别细胞能够缓冲蛋白质结构的微小变化,只有在受到压力时,这种变化才会明显起来。我们怎样才能评价蛋白质微小变化的意义呢。

50年前,在分子生物学的初期,西摩、本泽(seymour、Benzer),把噬菌体T2的基因的分析到了一个单核苷酸不可还原的限度。现在,也许我们需要类似的计划,来解决分子过度丰富的问题。选择一种蛋白质成分,最好是大复合体的一部分,对之进行穷根究底的分析。精确地找到这种蛋白质可能采取的形态,并利用遗传或其他方法,把每一种蛋白质分别置入一个生物体内。然后,利用一套高效率和高分辨力的分析方法,对该生物进行彻底剖析,检测表型行为的任何一种可能的细微差别。这样的方法,需要大量一致的个体,并能筛选出不同条件下生存率的微小变化。这是只有微生物学家才能考虑的事情。

[Science,2003年2月21日]