4月15日,举世瞩目的人类基因组计划圆满地划上了句号。中国国务院总理温家宝与美国、英国、日本、法国和德国等国政府首脑共同发表联合声明,向这一科学成就表示祝贺,并对这项计划所有参与人员的创造性和奉献精神致以敬意。为使读者对历时13年的这一国际大科学项目及其未来的发展有一概要的了解,本刊专访了中国人类基因组计划的领军人物之一、中科院副院长陈竺院士。
记者:不久前,有关人类基因组计划取得阶段性重大成果的消息再次成为轰动的新闻,很想听到您对此的分析和见解。另外作为国家“863”计划生物技术领域的首席科学家,您是怎么评价人类基因组计划已经取得的进展?
陈竺:经过全球科学界的共同努力,2003年4月中旬由美、英、日、德、法、中6个国家政府首脑正式宣布,人类基因组序列图测定完成,至此从1990年起步的人类基因组计划的核心部分——基因组测序画上了一个圆满的句号,也可以说是一本人类遗传信息的天书已被写就。
我们知道人类基因组序列测定是在作图基础上展开的,1990年到1998年的8年时间是人类基因组第一阶段(作图)包括遗传图和物理图。这两张图的制作使得人类基因组这样一个巨大的DNA生物大分子分解成较小的可以操作的部分。98年后进入第二阶段,即测序阶段。测序大体上也经历了两个阶段,从98年到2000年6月是工作框架图(草图)阶段,其覆盖基因组的区域达到90%,在测定的序列里,DNA碱基对测序精度的错误率低于1%以下,也就是准确率要达到99%以上。测序的第二阶段即所谓的完成图。完成图的标准要求覆盖基因组绝大部分区域,测序区域的错误率要低于万分之一,即准确率要达到99.99%。现在宣布的就是完成图。
当然发表论文前还要对已有的工作进行整理,不仅是测序,还要对基因组序列包含的基因以及各种功能序列作诠释,这还需要一个过程,估计要到今年下半年才能发表。2000年6月宣布完成的框架图,发表论文是在2001年6月。框架图和完成图之间并没有严格的界限。实际上人类基因组23对染色体(按染色体的种类一共是24条),无论是框架图还是精确图,都是在染色体水平上分头进行的,国际上有分工,中国负责的是3号染色体上靠短臂的一段。2000年6月绘出框架图时,实际上已有2条染色体做到完成图了,所以这是一个渐进的过程。框架图正式发表是2001年2月,这时的图已经比2000年6月又进了一步,所以又有人分成三个阶段,当中阶段称为精细图。我也认同这一说法。
现在知道人类基因组约有3.5万个基因,接下来尽管还有大量工作要做,但无论如何这一成果是了不起的,至少是人类第一次在DNA精细解剖水平上认识了自身。当然我们知道,人类基因组有些区域称为异染色质区,很难克隆,很难进行序列分析,如染色体中与有丝分裂有关的称为着丝粒的区域、端粒的区域,以及一些端着丝点的染色体。这些区域基因很少,而重复序列很多,它们肯定也有重要功能,可能是在染色体的结构、复制等方面有重要功能,但其编码的基因很少。实际上现在讲的完成图并未包括这部分,所以严格意义上讲,人类基因组的测序是对常染色体区域进行测序,当然现在的技术水平也只能达到这一步。尽管有这样一些问题,但不影响这一工作的意义。
记者:比较巧合的是,今年四月份还有一个重要的科学纪念日,就是庆祝DNA双螺旋结构发现50周年,您认为这两大重要科学事件之间有什么相似之处?
陈竺:从某种意义而言,人类基因组计划是科学家的兴趣和社会责任感相结合,科学家自下而上的科学思想和决策者自上而下的组织方式结合的产物;而被称为20世纪生命科学最大、最重要的科学贡献的DNA双螺旋结构的发现基本上是科学家好奇心驱使的项目。因为当时并未考虑到其应用前景,只是要想知道遗传物质DNA的构型是什么样的。沃森本人对这件事发生兴趣时只是一个23岁的年轻博士后,克里克比他大一点,都是从事基础研究的科学家。
如果说双螺旋完全是出于科学家好奇心驱动发现的话,那么人类基因组就是既有科学家的好奇心(试图揭示人类遗传信息的整体奥秘,获得整体上的突破性认识),但更有科学家的责任。1986年,杜尔贝科发表于《Science》杂志的文章标题就是“肿瘤研究的转折点——测定人类基因组序列”,可见这一计划的先驱者们是从解决健康问题、攻克肿瘤这样的顽症的角度认识基因组计划的意义。可见人类基因组计划既是对双螺旋精神的继承,又是对这一精神的发扬。而且是在人类进入了一个和平发展时代,对人的价值、对人的健康达到前所未有的重视程度时提出这样的计划。所以我觉得,这个计划不仅在人类科学史上,而且在人类发展史上也将留下浓墨重彩的一笔。
记者:接下来要谈到中国了,还是请您介绍一下中国参与人类基因组计划的情况及其意义。
陈竺:中国在97~98年就提出两个1%计划,即测人类基因组序列的1%和识别人类基因的1%。我非常荣幸地与强伯勤先生等同行一起提出了这个想法。1999年杨焕明教授从国际上领回了任务,然后“863”计划,包括中科院、北京市、上海市政府及国家自然科学基金委都对此给予很大关注和支持,国家自然科学基金委从94年就启动了一些相关项目。这也体现了科学家的意愿和决策层的意志相结合。同时在工作中有三个中心,北京两个、上海一个,其中既有生命学家的贡献,也有物理学、信息等方面科学家的大量参与。通过中国科学家的参与,这种大科学的精神和运作形态开始在中国启动起来,也使我国在基因组科学中占有重要的一席之地。
当然中国的基因组科学研究是一个整体,测序是其中一部分,实际上中国的人类基因组计划可以追溯到1993年,当时“863”有些项目已经开始支持局部的一些基础性项目。国家基金委在93~94年正式启动了中华民族基因组多样性研究。随着我们在一些领域成果不断涌现,实力不断增强,到了97年,我们就提出了更高的目标,希望能在人类基因组竞争的核心部分——测序和基因识别方面做贡献。这几年我们在整个人类基因组研究的各个方面都有了重大突破,不仅在测序,而且在疾病相关基因的研究方面有了一系列的突破,同时在功能基因组的研究方面都涌现出了一大批成果。
总之,我觉得人类基因组测序计划是整个人类基因组研究在早期阶段最重要的研究,因为如果没有测序就谈不上后期对功能的研究。同时它对其他方面起到了带动作用。然而这一过程并不是孤立的,而一开始就与功能的研究、与这一计划的起始目标——解决人类疾病是结合在一起的。正是从这个意义上,我们可以说过去的12年,一方面是作图测序的12年,另一方面也是人类疾病基因不断发现的12年。
记者:随着人类基因组计划的进展,人们经常可以听到的一个说法是:人类生命这部天书已被破译,不知您是否认同这种说法?未来人类基因组研究的走向如何?
陈竺:所谓破译在不同层次上有不同的理解,你把它读出来了,这也是一定意义上的破译。但读出不等于读懂,要读懂那就是更高层次上的破译了,所以现在我们首先要读懂它。实际上我们现在能读懂的还只是其中很小一部分,基因组里编码的3.5万个基因一半以上我们还不知其功能是什么,就是已知功能的那部分,我们也只是知道其中很小部分的功能。另外个别基因的功能不等于其在功能网络中的作用。我们现在知道每个基因实际上都有多重功能,可能我们现在对一些基因赋予的功能只是其在人类生长发育的一定阶段,或是某个空间位置(某一器官或某一组织细胞)的功能。所以我的总体感觉是,我们现在是站在一本巨大、虽然读出但还未读懂的天书面前,也可以说是站在一座很高的山峰面前,要去钻研,要去攀登。
接下来要进入的是功能基因组研究。一是要知道这些基因是干什么的,其相互关系,即蛋白产物的相互作用、基因表达的调控等。因为生命实际上是信息流,DNA是信息的储存单位,生命信息的执行单位是蛋白质。我们知道从DNA※RNA※蛋白质,实际上是基因组信息在表达,先是在转录水平上的表达,即DNA※RNA,使用的是核酸的语言;然后是RNA※蛋白质,叫翻译(从核酸语言到氨基酸语言)。基因组信息流通到生命信息的执行单位蛋白质上后,它在不同层次是怎样调节的?这种调节是怎样和生命过程的时间、空间相配合、协调的?这些都是非常复杂、有待进一步研究的课题。进一步要真正了解表达出的蛋白质的功能,了解其空间构型及其相互作用等。这也是现在蛋白质科学的一个高峰。同时,在细胞核内,DNA是与组蛋白协同工作的。组蛋白也有一套密码,有独立的遗传能力,对其内在规律的了解还只是冰山的一个尖……
就与人类疾病的关系而言,功能基因组研究是最重要的。疾病基因组学(也叫医学基因组学)就是研究人类疾病的发病机制。人类疾病涉及的这些基因一旦被发现后,实际上是对其功能研究的最好注释。当我们发现由于某一基因的缺陷造成了心脏病的话,我们就知道原来它与心脏的功能是有关系的,而且是整体水平上最重要的关系。
现在在疾病相关的研究中有一件事非常重要,那就是单核苷酸的变异(SNP),人类基因组的这种单核苷酸变异是很常见的,几百个碱基就有一个。这种SNP的综合效应可能造成了个体间的差异,包括个人的基本特征(身高、肤色等),及对疾病的易感性、对药物的反应等。当然要把每个个体的SNP都测出来是不可能的,现在发现SNP之间也是有相互关联的,每隔一定距离把其中具有代表性的SNP取出来,做成的这种图谱就称为单倍型图谱。这对于将来研究人类的疾病,尤其是多基因疾病非常有用。我们知道,单基因疾病通过定位克隆这条路已经走通了,但多基因疾病是更为复杂的系统,实际上是相当多的基因组结构功能发生微小的变化,其协同作用的结果造成对某些疾病的易感。因为多基因疾病发病率高、危险性大,所以是医学基因组中的重中之重。中国也参加了国际单倍型图谱协作组。
记者:许多人更关心的是人类基因组计划将在多大程度上为人类的医疗健康带来福音?
陈竺:我觉得人类基因组计划对未来人类健康的最大意义莫过于给21世纪医学带来了新的模式。首先是给循证医学带来的变化。不是一般的描述症状,而是在本质上、在分子水平上、在遗传信息上找到对疾病易感性的依据。如对于非典型肺炎(SARS),你得先有诊断依据。现在由于人类基因组能识别基因,使得我们的证据不仅仅是对疾病表现的描述,而且能深入到分子水平。
第二个是个体化医学。SNP图谱能识别个体的差异,这就为将来个体化的疾病预防治疗提供了依据,这既是21世纪医学发展的方向,也为未来的生物制药产业奠定了基础。我还是那句话,实际上每个人都可能携带对疾病易感的基因,你看人的一生都可能有各种疾病缠扰,而且现在知道不仅是对慢性病、富贵病,基因组差异很重要,就是对一些传染病、艾滋病也是这样,少数人群即使感染艾滋病病毒也可能长期不发病。同样接触过SARS的人,也不是每年人都患病,而且即使患病每个人的轻重程度也很不一样。不同个体表现出的这种对疾病的差异,除了一般讲的年龄、体质上的原因外,可能还有基因水平上的个体差异。这些知识的掌握对有重点地做好疾病的预防,找到一些高危的人群来预防疾病是非常重要的,这对医学模式、对医药产业都很重要。也正因为这么重要,与每个人利益相关,所以我们要特别重视其带来的伦理问题(包括保险、就业、就学等),要有一种社会机制,援助那些弱者。其实每个人的生命的某个阶段都有可能受到疾病的困扰,都会碰到这样的问题。
我觉得中国这样的发展中国家将来的医学模式将更加注重预防为主,我希望基因组研究能促进我国整体医学,尤其是预防医学的发展。另外我觉得我国的基因组研究不能停留在一般的基础研究水平上,而要与产业竞争力、与健康安全的保障能力结合起来。这次是公共卫生突发事件,实际上是国家安全的一部分。以前讲国防、金融、信息安全,而这次我们看到所有这些都是要由人来掌握的,所以健康安全可能是国家安全最重要的组成部分之一。所以在应用部门怎样利用基因组知识来指导疾病的预防控制,建立可持续发展和灵活反应的机制极其重要。
记者:我们再回到基因组计划。您觉得这一计划给我们的启示是什么?
陈竺:我们现在正在纪念双螺旋50周年,这次纪念我觉得意义特别重大,一是半个世纪,二是我们又在庆祝人类基因组计划的完成,三是我们在展望人类更加美好的未来。但作为中国这样的一个发展中国家的生命科学家,我觉得前面的路还很长,任重而道远,不能有丝毫的松懈,要有强烈的社会责任感,所以我重复一句话:今天的科学家要非常注重把个人的好奇心与人类社会的需求、国家的战略需要很好地结合起来,我想这可能是从双螺旋到人类基因组完成给我们的最大的启示。