目前,美国把人类染色体组的绘制、排序工作列为国家课题。在这令人振奋的开端时便有一些国家加入,当然我们期望还有更多的国家加入,这与1961年肯尼迪总统决定把人送上月球一样,美国为自己树立了一个极为明确而重要的目标,确定30多亿个碱基对的人类DNA顺序将有浩瀚的工作量,最终所用资金虽然会比送人探查月球少些,但人类染色体组工程对于人类生命的意义似乎更为深远。作为这件工作目前有指导意义的书籍很难找到。当最终破译之后,编入DNA分子内的遗传信息将会给人类生存的化学基础提供最好的答案。那不仅会帮助我们弄清作为健康人类应有怎样的功能,而且也在分子水平上解释诸多疾病遗传因素所起的作用,例如癌症、Alzheimer病和精神分裂症,它们正威胁着数百万人的生命。

1953年当弗郎西斯 · 克里克和我发现DNA双螺旋结构后,想弄清全部的遗传信息似乎是做梦也不敢想的科学难题。即使很短的DNA分子也无法排出顺序、用所获的分离碎片的化学分析想得知人类DNA总数也几乎不可能,仅仅几年之后,1973年因为有了重组DNA突破性措施、常规地分离单个基因已成为可能。这种突破给阿伦、马克西莫和沃尔特 · 吉尔伯特以及弗雷格 · 桑格等人以极大鼓舞,于是他们发明出极为有效的排序技术。现在,确定DNA的300~500个碱基对顺序的单项实验已属平常。

用此方法确定的第一批完整的DNA顺序是些较小DNA病毒,如ΦX174嗜菌体和猿病毒40,每个均含约5000个碱基对。这些顺序于1977年搞清。而在5年后,T7和λ嗜菌体比前者多10倍的DNA顺序也确定下来。今天,各种植物叶绿素、泡疹病毒、E-B病毒多于10万个碱基对的DNA顺序也已确定。目前具有最大DNA顺序的巨细胞病毒(也是一种泡疹病毒)它约有400万个碱基对。

大部分单个基因的顺序均已搞清,所知碱基对的总数已超过37,000,000个。在此范围内了解得最为彻底的微生物是大力研究的大肠扦菌,它的染色体组4.8×106个碱基对有80万个已经搞清。在美国和日本有很多专门研究的实验室促进了大肠杆菌的排序工作,有理由相信今后10年内必将取得成功。目前,DNA排序一般造价是每碱基对3 - 5美元,一个大分子至多需2千5百万美元,在较长时期后,总金额是不难想象的。若排序效率提高,大肠杆菌的排序最终造价会少于上额之一半。可以想象,在还没有主要规划尤其没有以排完整染色体组为目的情况下,我们已能搞清几种完整细菌的顺序了。

然而,对人类染色体组却是完全不同的情形,那几乎是大肠杆菌的1000多倍,而且布满了24个不同的染色体(22个常染色体、X和Y)个体小组家庭手工业式的方法(不同位点上的每项工作)似乎不可能获得成功,如用此法将需要几代科学家的工作。我们用15年就会完成该项工作,这的确令科学家和公民都兴奋不已。该工程将由开拓者来完成而不是他们的继承者,为此,我们从一开始就应制定好策略和规划,审查其资金问题。既使如此,大部分人将采用必将会创造出的DNA排序简法,那会比现今任一方法更好,而且要比传统大学研究室更像工业生产线。

首先提议人类染色体组排序是在1985年5月的—次会议上。罗伯特 · 辛什默(后来成为圣克鲁斯的加里福尼亚大学校长)召集了一个希望此工程集中在圣克鲁斯的科学家小组。年后,雷那托 · 杜尔必科独自感到了挑战,他热切地表示对癌症的研究期望着DNA的排序知识。此时,能源部(DOE)特别是查尔斯 · 德里西(卫生和环境研究室主任)坚定地要接受这项工程。1986年3月圣菲(新墨西哥)会后,德里西及其同事在能源部提出某些国立实验室(即使不够多)应成为美国从事人类染色体组工作的中心。过了几个月,据说DOE立即着手制定一个大规模的人类染色体组规划,通过生物学会传播出去。由能源部倡导的此项工程的赞成和反对者首次于1986年在科尔德 · 斯普林 · 哈伯实验室,在一般听众面前展开了讨论。在“人类分子生物学座谈会”期间专门用了一个下午讨论了该问题。虽然几位年长的科学家,有沃尔特 · 吉尔伯特,保罗 · 伯格和我,讨论此工程的开始时间等等但很多年轻的科学家的意见却缺乏积极性,他们担心耗资巨万的工程必定会削弱原调查研究的经费从而减慢了国家高质量生物学和医学研究的进程。困难的是能源部从未有重组DNA基本研究的主要支持者,也很少有高年资精通遗传学问题的管理者。人类染色体组工程以在能源部内部进行管理的方式而受到关注,能源部的领导总是物理学家,因此生物学难占优势。我认为请国立卫往研究所(NIH)也参加该工程是个稳妥的方针,并且应由国会拨款作为基金以提供新的资金。

不久,这些争论就受到基础生物学会、国家科学院生命科学学会会员们的重视。在马塞诸塞州伍兹霍尔大会后(1986年8月),全国科学研究委员会(NRC)受命做出一项决定,准备下年度工作报告。由布鲁斯 · 艾伯特任主席的1.5个成员的委员会,集各种观点于一身,当然也包括强烈支持该工程的人(他写过一篇论文对生物学界大实验室的效率提出怀疑)。长达14个月的评议产生了一个不寻常的报告,这推动了美国该项工程的开始,并且希望有共同目标的其它国家与之合作。

全国科学研究委员会开始评议后不久,很明显,在会议室内该工程本身已无可非议了,而对获得更好的解答来说,争论的是分子遗传学和在排序之前所需的人类DNA遗传图。这种图是查找人类疾病基因的无与伦比的工具。所提出的这种绘图工作以及发展改进DNA排序技术将是该工程头五年的主导性工作。最初的很多反对意见是担心这项工程会脱离生物学研究的主流。那些初期的反对者所关心的集中在人DNA顺序上,而大多数顺序在缺乏用很易研究、很简单的典型生物(如大肠杆菌酵母菌、蛔虫、果蝇、鼠)的染色体组做对比的资料时是无法解释的。

在实行人类染色体组的主要工作中,委员会强调必须改进技术,那将使主要基因图绘制、排序、数据分析能力的效率提高5~10倍。只有在排序的实际造价大幅度下降后方能开始大规模的排序;委员会认为在可望不久的五年内能够实现。联邦资金(因委员会的促进)将很快提到每年2亿美元,这样该工程约15年便可完成,一般染色体排序和人类染色体组排序将同时联合进行。熟悉微生物如细菌、芽胞酵母菌的基因结构会使人类基因组编码区的氨基酸与很多优势的非编码成分的区别工作变得容易。

与国家科学研究委员会小组委员会评议相似,议会能源和贸易委员会授权给美国国会技术评审署准备了一份报告。国会感兴趣主要是:1. 评价染色体工程的科学和医学动机。2. 通过何种在何种级别达到相应的资金。3. 各联合和私人机构如何协调。4. 如何使国际间科学合作的效能和促进美国生物学技术的竞争地位的需求之间维持适当平衡,议会的证书与国家科学研究委员会的报告不同,没有进行专业性介绍;而其目的是为国会将来的行动提供选择。读议会的报告,除了不偏倚的最终目的之外,得到的清晰印象是人类染色体组规划的某些形式是有限的,而国会有那种在一开始就把握住正确方向的作用。

1988年预算申请,能源部要求一千五百万美元,而后收到一千二百万美元得以继续业已开始的染色体组工作。染色体组研究没有向NIH正式请求援助,但在1987年春议会拨款意见听取会期间,国立卫生研究院董事詹姆斯 · 温加登在回答问题时表达了该项远大规划需五千万美元的意见。后来五月初,大卫 · 巴尔铁摩和我走访了议会和代表基础生物医学研究委员的上院拨款委员会的关键成员,我成了法定发言人,我们强调需几亿美元增加研究艾滋病的资金并指出拨款3千万美元可使国立卫生研究所开始系列人类染色体组工作。夏天,当各委员会提出经费数额后,又调整了国立卫生研究所的预算,为国立医学研究总院增加了一千八百万美元用作染色体组研究。那时该院发布了允许用到染色体组研究的通告。

卫生和人事部(DHHS)的拨款(国立卫生研究院的分部)由里根总统签字立法(12月初),两个月后列入1988年财政年度,最后指定用于染色体组研究的1720万美元由温加登召集了联合染色体组特别咨询委员会18名成员,为国立卫生研究所申请优先权。该委员会于1988年2月在弗吉尼亚的赖斯顿开会,由大卫 · 巴尔铁摩任主席,该会广泛支持NRC报告的主要精神。在最后通告中强烈支持温加登的申请:在国立卫生研究院内建立人类染色体组研究室,由新的联合董事长担任领导。与研究室并存还有一个具有顾问特点的委员会(已由NRC委员会推荐出来)与研究室领导协同工作,以掌握方向。该规划的早期主要培训工作也是重点,需要造就掌握使用新技术的科学家、然后收集、最后是解释染色体组规划中出现的大量新信息。在赖斯顿会议期间,我极力主张联合会的领导应是有活力的科学家(而不是行政官员)。我强调必须有一个人负责,只有卓越的科学家才会使国会、公众、科学机构消除疑虑,而科学的论证对于给染色体组分派大量急需资金(不是抽调)是最重要的。

那年5月初,温加登请我到贝塞斯达要我为国立卫生研究院工作时,我就知道我会接受的_那时我也料到,我的科学生涯从双螺旋结构到人类染色体组的30亿个碱基对的途径只有这一次机会了。

不久,卫生和人事部部长奥蒂斯 · 鲍恩任命了一个人类染色体组规划顾问委员会,选出12名成员,诺顿 · 津德任主席。该委员会的组成具有广泛的专业性以及理论科学界很强的代表性,理论界在起初对人类染色体组工程持否定态度。有此顾问委员会对生物学界有很大启发。使国立卫生研究院不致产生狭隘的偏见。此外,因为有工业界三名成员,我们相信能保证生物学技术上的优先地位而不会被忽视。

我在国立卫生研究院召开的记者招待会和后来的记者会上,一直阐述因不断增加的人类基因和遗传信息变异引起遗传病的知识而提高的伦理和社会意义。一方面,这种知识无疑会使人们对很多威胁人类生存的恶性病有更深的理解。因此尽快、尽可能的获得这种遗传学知识就有很强的伦理学根据。另一方面有引起遗传病基因的人,除非发明出合适的治疗办法否则反而会带来不必要的痛苦。所以我们必须给公民以遗传学方面的教育,使他们在其中不得不做出选择。

我相信,我们会把这些问题列入经费计划之内并建议在开始,至少已定染色体组经费的3%将用于支持伦理的社会方面的工作。这样做我们应该理解,在本世纪初,在优生学名义下,片面的遗传学知识可怕的滥用。很多人确实担忧,遗传学原理会再度使下层社会的生活更为落后。我们应做出保证,只能以适宜的方式使社会学习、利用信息,如果必要,可在联邦和州的级别上立法,以防止由于职员、承保人,政府官员等个人遗传的隐性侵袭,防止遗传方面的歧视。如果现在我们不这样做,我们会目睹有害的虐待,这最终会产生对人类遗传性强烈的有害反应。我们必须考查一下纳粹如何利用德国遗传学的领导成员和精神病学团体为他们的种族灭绝政策辩护(先是对付精神病人后来对付犹太人和吉普赛人)。我们不必再举出科学掌握在坏人手中造成极大危害的例子了。

起初,人类染色体组研究署只有顾问和办公机构。在88~89财政年度,给国立卫生研究院染色体组资金的当局是NIGMS。温加登告诉我,当我首次来与他工作时、就想把该研究署改为“中心”(当局会同意的),一等我们有了资金就为独立的规划提出论证。1990年财政年度预算有为染色体组1亿美元的申请,这使温加登可以继续请求卫生和人事部的部长改制。该请求已由洛易斯 · 沙立文部长批准,于1989年10月我们已变成国立人类染色体组研究中心(NCHGR)。

最初,国立卫生研究院和能源部的规划应如何调整还有许多问题难以确定。1988年末双方签定了一个理解性备忘录,有关条款规定可以组成一个联合分会,成员来自各方的顾问团。分会开始最重要的工作是草拟国家染色体组计划,该计划是国会于1990年春令国立卫生研究院提出的。1991年方给予拨款。我们第一次计划会议于1989年8月在科尔德 · 斯普林 · 哈伯召开,不久,同年10月在圣迭戈又举行一次。会议上首次提出摆在我们面前的问题,不再是计划而是如何做好工作。报告提纲于1990年1月由双方顾问委员会提供,报告现已提交国会,并予以公布。

报告介绍了下五年期间的定量目标即:遗传连锁图、遗传图的结构以及DNA排序技术的发展、也介绍了有关资料学,伦理学培训、技术转让及国内外合作的战略目标,有关连锁图的绘制,报告要求人类连锁图发展到能分辨2~5厘摩(cM),即标记之间平均占2 cM和不大于5 cM的缺口。由于国家研究理事会已报告了1 cM的连锁图,是否该工程绘制连锁图一事已删掉,我不相信。

自始至终,在人类染色体组工程方面,连锁图具有双重作用,首先是作为鉴别和定位基因的工具,这种基因只能靠其表型效应识别,例如与某些疾病有联系的表型,为此目的,一般认为3~5 cM的连锁图便可获满意的解释。第二连锁图是协助装配遗传图的工具。两年前(国家研究理事会报道之时)具有DNA克隆重叠结构的遗传图的界限似乎是1000000 bp(1 Mb)。这样,1 cM的连锁图帮助排列1 Mb单位的遗传图是重要的。

然而最近绘制的遗传图的一些技术已能产生至少2 Mb的连续区域。所以一个2 cM的连锁图就足够了。可是两年前由国家研究理事会设计要达到高分辨力连锁图,看来不太必要。可以更有效地利用定位结构遗传图去完成详尽的连锁图。

方案的改变都是根据最近绘图技术的改进而改变的。同样,为了尽量低的造价、根据技术的进步,我们希望经常重新评价,以使该规划达到现代化。根据科学的进展,这不会是最后一次的再评价,而认为每次重新评价就是设计的失败的观点是错误的。

绘制遗传图的五年目标是用STS标志作图。它占有1000000 bp(100 Kb)的空间并且用染色体组工程的大部分来装配2 Mb的。现在有许多用于人遗传图方面的技术和战略。所谓反转录过程,是指用同一的随机重叠区装配的大范围遗传图产生嗜菌体或Cosmld克隆的过程,这项技术在产生大多微生物染色体组遗传图方面已相当成功,如大肠杆菌、酿酒酵母菌等。

然而,用此途径不可能产生完整的遗传图。许多组织如洛斯阿拉莫斯、科弗莫尔国立实验室以及伦敦帝国癌症研究基金会都在为建立人类染色体的真正图谱而探讨利用反转录战术;另一些组织如路易斯安那州华盛顿大学的梅纳德 · 奥本森和戴维 · 施莱辛格都在实验控制途径,用此法每一步染色体组或染色体都逐渐分成越来越小的片断,因而每一步均可确定这些片断的顺序。我希望两年之后,各种措施的实际优缺点以及一些特殊技术的应用都将出现,而有些技术,措施以其卓有成效而被科学学会采纳。

为了实现国家计划的相应目标除建立的科学措施,方法学外,在下个五年期间,必须组织一些研究人员视察详细的作图,下十年期间视察人体染色体的排序。据我估计,按造价 - 效应分析细菌和酵母菌的染色体大约10人的组较为合适。而对人类染色体(均比以上大10~15倍)需受过培训者50人的组。就排序而言,由这种组完成排序的工作量大约是一个λ - 噬菌体相当于每个工作日的DNA(50 Kb)。另外,随时间的推移,因不断增加的新DNA顺序开始与以前所获顺序对比,所以染色体组规划的信息情况会变得很为重要,虽然开始一个染色体组规划的基本能力似乎在于重组PNA的化学家,但是在规划完工时,效能更多地是依靠熟练地应用计算机。

不同的染色体由各个实验室分离的观念于当今的常识相差甚远,反对此法的争论确实有过,大部分染色体已有了遗传图,在另一些高质量的实验室里也有各种遗传图。仔细观察发现,许多基因图绘制者最初都对特殊疾病的定位基因感兴趣,一旦绘出这个基因,他们就要进行克隆化并研究之而不继续绘图,据我所知,想完成高分辨力专门的染色体全国的研究者不足10人。当今只是染色体21有繁杂的绘图工作(人的最小染色体,其它生物也有)该基因使人对Alzheimer氏病易感。我们可以看到一个真实的一套重叠的DNA片断无性生殖的竞争过程,该片断可用来确定顺序。至此,为近于人染色体的半数完成整套DNA片断的一系列努力已开始了。我们的实际问题是说服有能力的小组集中去搞一直无人支持的染色体,另外是为整个绘图、排序决定选出的建议。

解决了细菌的染色体组会使我们首先认识单细胞生长、增殖的全部蛋白质。我们知道了大肠杆菌的顺序我们就能确定所有这些蛋白氨基酸的顺序,比如控制其基因表达或使离子和信息分子过通道机能的蛋白质。从教科书中不能获得对大肠杆菌的直接全面的了解,可能需几百年后大肠杆菌不再向科学挑战。总有一天我们会完全弄清大肠杆菌是如何发挥其功能的,这是很科学的断言。

获得多细胞生物的DNA顺序如C. elegans(100 Mb)和D. melanogaster(150 Mb)那将是相当重要的科学里程碑。很多复杂的染色体为更复杂的受精卵发育为有功能的成体而具有指导意义,直到十年前,多细胞生物如何发育在分子水平上还是个黑匣子。后来许多分子组胚学家开始无性繁殖调节基因,用之控制一个发展阶段到另一个阶段。迄今,遗传学上具有优良特性的生物的一些发育的关键步骤已了解到分子水平之上。但是如果我们想理解并使所有问题条理化、(例如可有不同的神经系统)我们就必须从整个遗传指导系统开始工作。因此在C. elegans和Drosophila领域正在为获得各自的DNA信息开始制定计划。这个科学小组尽力从事C. elegans的研究,而其最后所获全部染色体组像一套无性繁殖的重叠DNA片断一样有用。

我希望这两种生物的最终顺序的成果由美国和欧洲的实验室分享,每项的最后耗资不会超过七千五百万美元。有充足的理由相信,美国与欧洲合作的努力会共同得到Arabidopsis thaliana(芥子型植物),其染色体组仅有100 Mb,该植物在植物分子生物学领域逐渐成为典型生物。对较小类型生物固有的科学兴趣能证明是激发专业高水平科学才能的主要之处,那将产生我们用以处理人类染色体的生产线式的排序能力。

至今,美国、英国、苏联、意大利、日本都宣布了明确的人类染色体组规划。法国、欧洲经济共同休、澳大利亚可能还有加拿大也要参加。联邦德国要组织力量很成问题,因为对德国人来说遗传学研究具有消极涵意。对于这些国家,为了同一个目标,如何保证共同工作而不陷入昂贵的资金竞赛,这个问题还没解决。虽然许多著名分子生物学家和人类遗传学家已组或了人类染色体组组织(HUGO)但是它还不是个能采取步骤实现该工程的独立组织。

我希望HUGO能够成功,因为他们很容易独立而公开交换很想得到的信息。只了解人染色体的半数或是没进行另一半,哪一个均难免失败。最好是建立新的顺序后,立即追加一个数据库,这是容易办到的。然而,达到这个目标需要很高的技能和想象力,因为有很多诸如人员、财经、兴趣等必须解决的问题。例如(仅指一个方面)实验室自然会产生大量的顺序,还要计算出基因在其中的定位以及追寻如何发挥功能或如何被表达的线索。期望大量顺序数据会由排序小组发表,这是天真的想法,除非他们有合适的时间搞清了它的意义。然而使这些顺序的重大价值尽快地用于实践是确保它们全部价值得以实现的唯一办法,也是处理公费资助产生信息的唯一可行办法。很明显,一个实验室如果为了交换相当的另一些顺序而公开自己的顺序那是容易的。若要大规模排序、作图成果使想利用这些数据的主要发达国家理解就应早期分享人类DNA数据库。如果我们知道一个或多个国家有经济能力参与该工程的努力,显然不想做工作却希望一旦公布有用的信息而获取利益,现在问我们要做些什么就为时太早。我真不想看到这种可能。因此国会和公众有可能把我们推向国家主义路上去。世界各国应该明白,人类染色体组属于世界人民而不是某一国。

[Science,1990年4月号]