概要:研究人员经过努力已甄别出导致囊性纤维化的主要基因。这项成果将有助于提高对该种致命疾病的诊断及治疗水平。

来自多伦多(Toronto)和安亚伯(Ann Arbor)的研究者们报告说,他们已经确定了囊性纤维化基因(CF基因)的位置。囊性纤维化是在白色人种中最普遍的遗传疾病,在美国,每2,000儿童中便有一名患有此病,估计患者共有30,000多人,大多数患者将在13岁前便死去,因此有关CF基因缺陷位置被确定的论文尚未发表,消息便不胫而走了。这项研究成果意味着人们能够提高对该病的诊断水平,包括胎儿期检查,为可能生下带病婴儿的人设计出更有效的检测方法,同时,人们也可能由此提高治疗手段,发明新的药物,乃至对缺陷基因进行“手术”。

克隆基因小组之一的负责人苏莱普齐(Lap-Chee Tsui)介绍说:“现在,我们能够扎扎实实地研究这基本缺陷是什么,而且能直接针对缺陷治疗,而不是仅仅着手于表面的症状了。”然而,还无人能估计出实现针对性疗法究竟要花多少时间。

回顾这项研究的历程,可以讲,竞争是十分激烈的。最后的成功,取决于Tsui和约翰 · 瑞丹(John Riordan)(多伦多儿童医院)以及弗朗西斯 · 科林斯(Francis Collins)(密执安大学霍华德休斯医学研究所)的通力合作。

Tsui和Collins的合作开始于1987年。在此之前,他们各自独立地工作。寻找CF基因的困难程度好比击碎一个坚果那样,因为他们并不知道该基因决定什么蛋白质。可以想象,研究者要在大约100,000个基因中寻找目标是何等艰难。尽管科学家们曾经成功地在未知其对应蛋白质的情况下克隆了一批基因(Duchenne肌肉营养性退化基因的确定就是一例),但那只是因为导致此病的基因是长段重排,因而只需要知道此基因的大致位置,就能最终精确定位。但遗憾的是,CF基因并不具有此种特性。

在1985年,即Tsui和Collins等开始合作的前两年,多伦多方面的研究小组已经确定了CF基因处在染色体 - 7,威廉姆逊(Williamson)和来自盐湖城犹他大学霍华德休斯医学研究所的瑞 · 怀特(Ray White)进一步缩小了范围。他俩鉴定出两个“标志”:met致癌基因和DNA顺序标定的J3.11,这两个“标志”标出了缺陷基因所在的位置。这样,“标志”就能成为瞄准靶基因的起始点,但met和J3.11有1600千碱基(Kilobases)之隔,在允许的时间内运用标准的染色体“行走”技术(chromosome“Walking”techniques)来逐个仔细检查似乎太难了。而一般“走过”一个染色体是通过鉴定DNA的重复的克隆碎片直至达到预定目标。

Tsui常考虑运用更有力的饱和定位法去发现比met和J3.11更靠近CF基因的标志顺序。为此,必须在有囊性纤维化病史的家族成员中找到与CF基因一同遗传的DNA序列。一个特别的标志随目标基因被遗传的频率可以用来估计这标志与目标基因的距离远近。

“甄别了250个标志之后”Tsui介绍说,“我们发现了其中两个恰巧就处于met和J3.11之间”。遗传学研究表明:两个都比met或J3.11离CF基因近。Tsui和Collins就是当研究处于这个阶段时开始合作的。

Collins发展了一种“染色体跳跃技术”,可以跃过长的DNA片断。与“行走”技术相比,“跳跃”技术非但速度快,而且能跃过无法克隆的DNA序列。

如果Taii甄别出的两个新标志在CF基因两侧,那是再理想不过的。然而事实并非如此。新标志彼此紧靠,在met和另一个于1987年春由Williamson小组甄别而定的基因之间。

同时,伦敦方面的研究者们以为他们业已寻到了基因所在位置,并在《自然》(Nature)杂志上大加宣传。但那年的秋天,更进一步的研究却为他们大泼冷水:他们并未找到,然而,不幸中之万幸,那个被错认的基因即IBP基因,确是离CF基因最近的标志。

尽管Tsui和Collins及同事们起初遇上了一些挫折,但他们仍下定决心深入研究:他们向两个方向同时进军。Collins解释说:“我们得朝着两个方向研究直至遇上个路标指示我们到底走哪条道。”IRP基因是他们遇上的头 · 一个路标,表明他们的这条路走准了。

研究者们“行走”、“跳跃”通过了28万对碱基,最终遇上了CF基因的起始点。一路之上,他们将正在仔细检查的BNA序列与来自另外生物体的有关DNA序列相对比。如果两者的排列有结构上的联系,就表明这种排列顺序在演化之中是保守的,从而说明这一结构有某些基本的功能。他们发现了三个保守的PNA排列顺序,又很快排除了其中两个与CF基因有联系的可能性。这剩下的那个即或为成功的关键了,但也并不顺利。对有囊性纤维化病史的家族进行遗传学研究表明、潜在的基因片断处在正确的位置。但当研究人员仔仔细细地去寻找它被活跃表达的迹象时,总不能如愿。看来,那段DNA序列不是任何活泼基因的一部分。

解决这一难题,靠的便是Tsui的多伦多同事Riordan的贡献了。Riordan小组建立了一个由汗腺细胞的RNA转录而来的DNA“文库”。每一个DNA转录本对应一个活泼基因,其中之一被证明是含有了与Tsui,Collins等发现的保守顺序相对应的片断,可是相对应的范围很小,两段DNA仅有113个碱基对相同。因而我们完全可以理解起初要证明那段保守顺序是活泼基因一部分时所遇上的麻烦了。进一步的分析表明:那113个碱基对似乎来自CF基因的起始端,这就使得他们能去克隆整个基因。这并非一件易事。“为了完成克隆工作”,Tsui说,“我们夜以继日地工作,我们仅能得到片断,最终还得将片断连接在一起。”

克隆成的基因很大,是拥有250千对碱基的DNA。与其它高等生物的基因一样,它具有24千对决定蛋白质的外显子,被非决定蛋白的内含子所分割。顺序分析表明,该基因决定的蛋白有1480个氨基酸,该蛋白具有膜蛋白的所有特征,可能与离子通道有关,这些蛋白顺序也与其它一些运输物质通过膜的载运蛋白的顺序相似。

囊性纤维化患者的主要病因在于粘液的过度粘稠(尤其在肺中更为突出),反复感染损坏了肺组织,最终导致患者的死亡。尽管研究人员还未能查明究竟是哪个蛋白缺陷引起了过稠粘液,但最近的证据已显示,问题在于肺细胞不能向粘液中分泌Cl-和H2O。

CF基因决定的蛋白质的结构表明它与氯离子的膜通道有关。Tsui、Riordan和Collins及同事们发现:患者的决定有关蛋白质的基因被改变了,这项改变足以导致囊性纤维化。大约70%的基因改变是由于决定508号位的苯丙氨酸的密码子缺失,而在正常染色体上,从未发现过此类变化。所以,Tsui认为他们找到了目标,而下一步即是要寻找导致基因变化的另外30%的缺陷。

苯丙氨酸的缺失使人们可以理解患者是如何陷于病痛之中的。苯丙氨酸与调节蛋白质活力的某一地区是有关的。该地区存在一个明显的与ATP的结合处,由ATP为细胞活动提供能量。苯丙氨酸的缺失使ATP无法与有关蛋白质结合,使它失去能量或使它对激酶的激活作用失去反应。

先前,临床医生仅仅能试图控制住患者的感染和其它一些症状。如今,由于CF基因及其蛋白质的有关情况已被了解,就有望设计出更有效的针对性疗法,其中包括能恢复氯离子运输的药剂的发明。“这可能要花上较长的时间,”Tsui说,“但至少我们已经寻到了一个起点。”最终,还有可能运用基因疗法来改正缺陷。Beall说,把正常基因导入肺细胞对患者是有益的。尽管还存在其它症状,但这些均可被控制住,因为有关基因缺陷才是致命的。

眼下最大的收获是可以提高查明人们是否携带有缺陷基因的手段。囊性纤维化患者必定带有缺陷基因。父母携带缺陷基因,则生下的孩子有25%的可能患病。在CF基因被发现前,缺陷基因携带者大都是由于家族中有此病例才被发现。因而遗传学家先前不得不寻找与CF基因一同被遗传的“标志”,这就需要对家族遗传有较深的了解。

当另外的30%的缺陷被甄别出之后,就可以直接查明每个人是否有缺陷基因。经过1 ~ 2年的认真研究,可望达到此目的。

寻找CF基因的工作确是非常费力的。Tsui、Collins和同事在这项工作中的方法在甄别导致其它遗传疾病的基因方面也是有用的。Kunkel说:”这项工作是艰巨的,但终究成功了。新的成功还会到来。”

[Science,Vol. 245,1989年9月1日]