人类基因组第一部分今日问世
由世界各国科学家联合参与?旨在破译人体细胞全部遗传密码的“人类基因组计划”取得第一次堪称里程碑的重大突破。今天,英国剑桥桑格中心的伊恩 · 邓纳姆(lan Dunham)及其同事在《自然》杂志上发表了22号染色体的基因序列。22号染色体是人类23对染色体(位于细胞核内分离的DNA分子)中次小的一对。
22号染色体的DNA序列测定是包括美国?英国和日本在内的世界各国研究人员大规模联合攻关的结果。尽管它还含有一些小空白(由于技术原因尚未测序的DNA段落),但仍不失为一项令人惊叹的成就。
预计明年初起码可以完成草图的整个人类基因组序列将含有人体各基因及由其所指导合成的蛋白质的全部信息。目前看来,它有可能在生物学和医学方面发挥重要的促进作用并将有助于研究人员彻底揭开人类生老病死之谜。
解读“生命百科全书”
22号染色体的基因序列为一串很长的字母,每个A、G、C和T在DNA中分别代表用于编码信息的四种化学组成成分的一种。DNA双螺旋结构由两股所谓含碱基核苷酸链连接而成,并双双连在一起形成碱基对云梯。这样的碱基对在22号染色体中约有3340万个,而整个人类基因组中则大约有30亿个。
这种几乎漫无止境的字母表能告诉我们什么呢?处于染色体某部位的基因就是指示肌体如何制造特定蛋白质(生命的构件)的密码指令,也就是嵌在DNA链中的含有指示细胞何时何地开始制造以及制造多少蛋白质的DNA段落。但是要从无人知其功能的DNA长链中找出这些隐藏的极其重要的密码,无疑是谚语中所说的“大海捞针”。
英国剑桥附近的桑格中心负责整个测序工作的三分之一。该中心的伊恩 · 邓纳姆认为能够首次看到一对完整人类染色体的基因序列给了他们洞察人类基因组是如何构成的新能力。他说:“这对染色体的结构看来比我们原先所想的要复杂得多。”
纽约洛克菲勒大学的遗传学家特里 · 加斯特兰德(Terry Gaasterland)认为,基因组测序只是“冰山一角",研究人员必须使用各种技巧来认定DNA的哪些部分确实是基因;更不用说要搞清楚那些基因有何作用——而这是没有任何简单的办法可解决的。加斯特兰德说:“研究得越深人,就越感到我们知识的不足。”
那么如何才能在DNA序列中确定基因的位置呢?一种办法是把这种序列与已知基因序列进行比较,找出其相似之处;另一种办法是用计算机来寻找有可能编码蛋白质的段落,但这只是预测,尚需在随后的实验中逐一进行验证。加斯特兰德认为,目前的基因预测技术虽不是很可靠,但对于缩小搜索范围还是有用的。不管怎样,邓纳姆认为,他们课题组所确定的545个基因占了22号染色体所有基因的大部分。
整个人类基因组序列草图可于明年初完成。在帝国科技与医学院从事人类遗传学研究的彼特 · 利特尔(Peter Litle)说,该序列草图将有助于研究人员第一次绘制出一张人体内所有基因也是所有蛋白质的完整图表。到那时,实质性工作才正式开始,“而彻底弄清这些蛋白质的功能,将涉及到比基因组序列本身还要多得难以想象的工作。”
加斯特兰德和利特尔都认为,人类基因组序列最重要的用途之一是作为一种探测不同个体DNA序列之间特定性差异的框架。在任何两个不相关的人中,每1000个碱基对可能就有999个都相同——只有一个可能有差异。这类叫做单核苷酸多态性即SNPS的差异在不同个体间至少有300万,正是这些差异确定了人与人之间的不同点。眼下在全球主要制药公司有10家参与的一项相关科研课题中正在将这些差异编制成表,目的是在2~3年时间内出版一份供免费查阅的最常见SNPS名录。
利特尔认为,大多数常见遗传病可能是由SNPS的特定结合引起的。例如,约有10%的人群罹患的糖尿病,可能有5种基因与其相关。人若是只遗传得其中4种基因的不良SNPS,那还不会有什么问题;若是速传得全部5种基因的不良SNPS,则有成为糖尿病患者的高度危险。
加斯特兰德说,整个人类基因组序列“将成为一种支架,把基因组中所有的SNPS部分都绝对可靠地钉挂在上面。”研究人员一旦知道某种特殊疾病与何种SNPS相关,就能提醒人们是否有得糖尿病?心脏病?中风或其它疾病的危险。
22号染色体上有许多会令医生和医学研究人员感兴趣的基因。其中有一种基因被认为与精神分裂症相关;还有些基因涉及到包括造成面部畸形并诱发心脏病的DiGeorge综合征和称之为脊髓小脑性共济失调的运动机能失常在内的一些罕见疾病。
人类基因组序列还有许多其它潜在的用途。试图建立物种进化系谱的研究人员已在利用遗传学数据库来了解不同生物体有何密切相关性。现在他们将拥有更强大的研究这一课题的工具。染色体的构造将提供人类DNA是如何进化的线索。例如,22号染色体含有许多重复的DNA部分——它们就是在人类历史上某一时刻被复制的。这类详细情况有助于我们揭开人类进化的秘密。
22号染色体基因序列中有那么一两种现象确实. 令人惊奇,例如,伊恩 · 邓纳姆课题组发现的一个基因在人体基因组中的情况与在酵母菌基因组中的情况几乎完全相同——尽管两物种间存在着巨大的差异。邓纳姆说,该基因像大多数其它基因一样,没有经历过进化。这表明它对所有细胞一定是至关重要的,其基因序列哪怕是发生极微小的变化也会引起灾难性的后果。
22号染色体序列只是开了一个头,即“全书的第一章,我们还得等待其它章节才能发现整个故事。不过,利特尔指出,显而易见,由于这项成果所产生的深远影响,人类基因组计划将开创“一种惊人的生物学研究新方法"。
人类基因组测序已列入议事日程
为了完成千年一遇的艰难尝试——人类基因组测序,目前有两个研究小组正在进行竞赛。一个是美国马里兰州洛克维尔的一家私营企业塞洛拉基因科学公司,他们在1999年9月着手这项工作,当月就完成了果蝇基因组的测序。另一个就是获得22号染色体序列的“人类基因组计划(HGP)”课题组,这是一个由来自世界各地包括英国?美国和8本的主要选手参加的?由政府资助的联合研究小组。
将其全部研究成果在因特网上公布(每24小时公布一次)的HGP课题组采用一种逐一克隆的方法对基因组序列进行预测,一次500个碱基。这种方法使用200多台测序仪来分析微小的人体DNA片断,这些DNA片断是由经遗传工程处理携带了所谓细菌人造染色体(BACS)的细菌成批生产出来的。HGP课题组需建立一个约含3万BACS的“文件库”,然后对与DNA重叠的碎片进行搜索,把它们整理成一张地图。
持有基本自动化测序技术许可证的生物技术企业巨头Perkin-Elmer公司在康涅狄格州有一家应用生命科学研究所,塞洛拉公司就是由该研究所和基因组研究学会(TIGR)联合创办的一家富有冒险精神的企业。该公司使用了一种不同的方法来获取信息,然后出售。塞洛拉公司所谓的整个基因组霰弹射击测序法是该公司负责人?一位具传奇色彩的由科学家转变为企业家的克雷格. 温特(Craig Venter)所创立的。他利用这项技术在流感病毒和流感嗜血杆菌等其它生物中进行过基因测序,最近对果蝇基因组测序也用了这一技术。
自称为基因科学“狂人”的温特声称,霰弹射击测序法比逐一克隆法要少花90%的费用,这项技术虽然快捷但很苦很累。它把整个基因组砸成碎片,同时将其输入一种世界上最大的超级计算机进行解读(因为人类基因组比细菌基因组要大1000倍,所以确实需要高功能的计算机来解读)。这种方法后来主要依赖来自HGP的数据把基因序列碎片重新装配成连贯的结构。
虽说霰弹射击测序法比逐一克隆法要快得多,但对于重复DNA序列也不是那么好处理。与较小生物体的基因不同的是,人类基因被许多重复DNA序列所包裹。尽管这些重复序列通常都不是处在人们最感兴趣的染色体区域,但它们会在序列片段的整理过程中让人难以确定。正是由于这一原因,温特的公司对HGP的信息总要进行反复核实。最近几周开始出现了一些确实有点惊人的传闻,说这两个科研小组在进行较为正式的合作。
研究工作开展得更为井井有条的HGP课题组反而因其进度缓慢受到批评,其实它的工作稍微领先一步。不过,正如桑格中心的伊恩 · 邓纳姆所指出,22号染色体序列是迄今为止最大的基因邻近的序列,它首次表明,“逐一克隆法在长距离DNA链的测序方面无疑是行之有效的。”
[Nature,1999年12月2日]