韦森巴赫(Weissenbach)及其同事,在本期《自然》杂志上介绍了“人类基因组的第二代连锁图”。此文的发表时间,是在另一个完整的基因连锁图在《科学》上公开后不足一月。这说明人类基因组工程的发展,是势如破竹,锐不可当的。

遗传学中研究的表型,在人类遗传学上往往和疾病有关,基因图常和表型基因相连。所以,人类基因图有着重要的医学价值。最初的遗传图,是由几位颇有贡献的科学家,利用并不完善的手段绘制的。这些遗传学家的观点,当时被多数人视为是怪僻的。但是,目前的情况业已发生巨大的变化。由科学管理人员和工厂的经理们所参与的图的构建工作,是大有学问。两项报告对某些方法的成功提供了佐证。

这些图为何值得庆贺呢?因为以前不可能绘制与模式有机体完全不同的人类基因组图。需要利用分子生物学的技术,扩大对基因组内除被已知遗传病证实了的和诸如血型及HLA型的其他可识别表型特征以外的已知变异性进行研究。

绘制基因组图,必需对基因对或其他基因组标界之间的距离进行估测,从对连续世代中出现的可识别表型进行的比较中,获取有关信息。当这些基因处于不同染色体上时,它们单独分离成胚细胞。但是,处于同一染色体上的基因情况就不同了、如果它们紧靠在一起,其行为就好似它们的联接。进一步分离,连锁图可得到因发生在减数分裂中的重组过程的破坏,所以,基因之间的距离,是将被重组分离环连基因(或其他基因组标界)的几率函数。量度单位是分摩(CM),大约相当于1%的重组率(在人类,平均为DNA的108个碱基对)。

以上原理被认识足有50多年了,但直到如今,尚未能利用它们构建详细的人类基因组图。一个基因标记,必定以两种或两种以上的多形态形式出现,反映潜在基因的不同的等位基因。在构建图时所利用的典型基因标记,既有蛋白质,也有基因的间接产物。然而,蛋白质通常所有的多态性低。在实验动物身上,可通过被俘动物群内的特异交配而克服这一问题。显然在人类遗传学上,不宜照搬此法。被确定的解决办法,是利用DNA顺序的变异。

顺序变异的最简单形式,出现在基因组内的几百个碱基对上,并可用southern吸印进行检测。在用核酸内切限制酶分裂,并经电泳分开大小以后,可把固定化的基因组DNA杂交进克隆的探针中。所测片断的大小,取决于分裂位点的跨度。缺失、插入和突变,造成分裂位点的丧失或获得,导致大小的移位。这些分子表型,用缩写字母RFLP(限制片段长度多态性)表示,虽然RFLP作为标记是重要的,但存在着几面的不足。与多数RFLPs有关的变异水平低,而且,常常受到等位基因数的限制;另外,Southern吸印是费时的,且不宜自动化操作。

可以通过刻痕发现在衔接排列中,以小随体或随体形式存在的重复变异数的办法解决多态性水平低的问题。(小随体也叫VNTRs或可变衔接重复数)重复数往往是高度可变的,并与几个等位基因相关。变异的一个量度,是个体生物杂合性的一个机会(即,一个基因有两个不同的等位基因),对于一个有两个等位基因的基因来说,最高杂合性是50%;具有几个等位基因的基因,能有较高的值。杂合性超过70%,一般是衔接重复。小随体是由10个以上碱基对核心顺序排列组成。遗憾的是,它们的分布,偏向染色体的末端。微随体是由一,二,三和四核苷酸的重复组成,其分布更加随机,是很常见的,并可被PCR刻痕(聚合酶链反应)。高水平的杂合性和易于自动化的PCR,使它们成为构建遗传图的理想标记。

在PFLPs的装备下,几个小组开始了构建基因组图。但(以E · 罗布森的话)“私人的图就像私人军队诱发的战斗。”为促进世界和平,琼。Dausset,利用他的诺贝尔奖金和一大宗遗产,创建了CEPH(centred etude du polymorphisme humain)。在这一中心里工作的人们,收集了有关一组家族成员的信息,并从中制备了对定位图群体有用的DNA。对于所有定位图的绘制,产生了附加的效果。这种全球性协作的最终结果,报道在《科学》上面。全国卫生研究院和CEPH协作小组,现已构建了一个由1416个座位组成的图。这些座位的分布面超过基因组的90%。这一巨大成就,包含了不止上百名科学家的心血和智慧。但是,这并非基因组定位图的定论。所利用的多数标记是RFLPs;只有205个是关系超过70%杂合性的微随体。

得到政府同意和支持,并通过电视媒介的作用,法国创办了Genethon,—座人类遗传学工厂。在这一组织当中,韦森巴赫、莱思罗普(Lathrop)和其同事,基于792(C-A)个重复微随体标记,描述了一种图,差不多有600个标记具有高度的信息价值。由一个约20人组成的小组,利用由亨利、福特(Henry. Ford)首创的组织方法,分离了标记并构建了图,对于构图用的微随体标记,通过筛选一个人类DNA小片段的克隆文库进行鉴别。对(C-A)n重复的克隆阳性进行了顺序测定,并选择了PCR引物对,侧分衔接重复。利用体细胞杂文,标明标记在个别染色体上的位置,然后对连锁分析进行了检验,基于8个CEPH家族的一个小组。估测最后的图,覆盖面将超过人类基因组的90%。相邻标记之间的平均距离约5CM。NIH和CEPH协作,以及Genethon小组,业已利用CEPH家族,将直接把两个图整合成一块。

人类基因组的一个高密度成熟分裂图的创建,对于人类基因组工程无疑是一大喜讯。因为是小鼠中基于微随体图的最近世代,和人类染色体的大的酵母菌人工染色体Contigs的结构。这些进步,在实践中将有助于定位导致不常见遗传病的基因,使产前诊断和最终的基因克隆成为可能。对于识别诸如癌症、行为紊乱、心脏病和糖尿病这类常见病的复杂的遗传成分,也必要高分辨率的图。解决这些问题,将有益于所有人。

在大众和科学文献中通报人类基因组图,这并非首次。可能有人会以愤世嫉俗的口气提问:“这是最终结果吗?”可以肯定回答“不是的。”工厂在不断运行,并需要不断创造新产品。到明年,将公开里程碑式的结果,介绍遗传图的整合,关系到基因组的细胞遗传学和物理图谱,我预计,到1993年底,韦森巴赫和其同事,将创造出平均标志不足1 CM间距的图,这将很好地超出预期结果。在酵母菌人工染色体内基因组的一个分摩(contig)和一个整合的遗传图,将为测定基因组的顺序,提供一个适当的基础。这将在10年后完成。

生物科学在研究的,是建立在目前技术基础上的定向科学。在工厂中可以很好地进行,并能创造出可观的经济价值。但是,也不应掩饰由好奇心驱使的科学行为所导致的不可预见的效果。

[Nature,1992年10月29日]