今年4月25日,正值沃森和克里克1953年4月25日在《自然》杂志上发表论文描述DNA结构著名的“双螺旋”模型60周年之际,该模型不仅是现代科学史上里程碑式的发现,并且以其跨学科的重要性而引人注目:它解决的问题是重大的生物学问题,但是它所凭借着解决问题的工具却是来自物理学家和化学家的专业技能。这些物理学家之一的雷蒙德·戈斯林(Raymond Gosling)把沃森和克里克的双螺旋结构称为一种“尤里卡”式的发现,其简洁和优美是令人震惊的,不仅解释了X-射线衍射数据,还解释了生命本身复制的模式。罕见的是一项科学发现达到了如此形象的情形,横跨了流行文化和大众意识两个领域,它甚至成为了科学研究的象征。
 
  这项科学发现在许多方面具有深远意义,包括在基因组生物学领域的未来发现方面也有深远的意义。为了庆祝这项发现60周年的到来,《基因组生物学》杂志约请评委对1953年4月25日以来这个领域的关键进展进行了精选,要旨是选择一项最重要、最令人吃惊的、或者个人认为最有影响力的进展,并且简明扼要地总结一下理由。
 

 

神奇的“内含子”

  1977年,里奇·罗伯兹(Rich Roberts)和菲尔·夏普(Phil Sharp)各自独立地报道了基因可以被内含子打断。按照我的意见,这是自从1953年4月25日沃森和克里克报告了DNA分子结构以来基因组生物学界最大和最令人惊奇的发现。后来,罗伯兹和夏普为此发现而荣获了1993年的诺贝尔生理医学奖。内含子的存在完全是出人意料的,它直接导致了后来剪接小体的发现,后者是负责切除内含子的大分子复合体。选择性剪接可以以不同的方式连接外显子,已知发生于几乎所有的人类基因,在增加蛋白质多样性和调控生物学过程两方面都起到重要的作用。这些发现的影响是深远的,现在人们已经知道了,许多人类疾病可以由直接剪接导致的RNA序列突变引起,也可以由催化和调控内含子切除的蛋白质和RNA中的突变引起。
 
  ――布林顿·格雷夫利(Brenton Graveley,康涅狄格大学健康和遗传发育生物学教授)
 
  内含子表现出并不与“从DNA到mRNA到蛋白质”的遗传信息的简单、线性转移的中心法则相吻合。它们需要一种不同的思维方式。生命拥有巨大的内在潜能有待于实现,这样的想法对于我的思想和研究一直有巨大的影响。这导致了我们近期的发现:人类基因组包含一整套可转座元件,它们可以逐渐进化成为外显子,是由那些影响多种剪接因子的竞争结合的突变引起的。瓦利·吉尔伯特(Wally Gilbert)以他特有的优雅总结了内含子作为负担和赐福的双重本质:“内含子既是历史的冷冻残留物,又是未来进化的位点。”
 
  ――泽尼耶·乌尔(Jernej Ule,伦敦大学学院分子神经生物学教授)
 

史蒂文·汉尼科夫

 

  1977年,当我首次了解到腺病毒中断裂基因的惊人发现的时候,我正在完成我的研究生学业。其后不久,人们纷纷传言基因是片断化的,或者,瓦利·吉尔伯特所指的外显子和内含子比最初提出时要远远的普遍和多见,并且,事实上这是规则、而不是例外。令人震惊的是发现我们习以为常的一些事情,也就是流行的不间断蛋白质编码基因的大肠杆菌范式在真核基因组中并不属实。很难想像的另外一个例子,是断裂基因和转录后剪接这样基础概念的存在在这个发现之前没有受到怀疑。吉尔伯特开始了对“为什么”的争论,其他人则问“怎么样”,但是对我来说,问题是:关于真核基因组织结构还会有其他的惊奇吗?于是,这开启了我对后来称之为基因组学的兴趣,当我在自己的实验室中研究片断化的基因时,我惊奇地发现了在片断化基因中的片断化基因。
 
  ――史蒂文·汉尼科夫(Steven Henikoff,福瑞德、赫钦森癌症研究中心研究员)
 
  在我的推荐表中,按照“意义、惊奇度和(尤其)个人影响力”排列,真核基因组中剪接小体及其内含子的发现是非常排前的。“内含子”有巨大的影响力,在很大程度上要感谢瓦利·吉尔伯特,它刺激许多人更加深入地去思考基因组结构的进化和功能意义。特别是,它使我们不得不去主动接受杜布赞斯基(Dobzhansky)的箴言:“没有了进化的光芒,生物学将毫无意义。”这句话在分子水平和在机体水平上一样有效。基因组远远不止是构成生物体所需要的编码信息的仓库,如果我们采取一种过度功能主义者/适应主义者的观点来看待问题的话,我们就会误入歧途。基因组学家们和系统生物学家们尤其有这方面的风险,正如近期围绕ENCODE计划所产生的争论所展示的那样。
 
  ――福特·杜利托(Ford Doolittle,生化学家,美国科学院院士)
 

基因组变得触手可得

  当我于1970年开始读研究生的时候,遗传学的主流由大肠杆菌、λ噬菌体、酿酒酵母和黑腹果蝇这样的模式生物体占领着。认识的改变是从遗传学方法学的概念走向DNA结构的生物化学事实。人们有可能用一些触手可及的术语来观察和认识基因组结构是一种范式的转换。这一切带来了PCR、DNA测序及其他技术的伟大进步。现在大多数生物学家们都已习惯用一些具体的术语,而不会用抽象的遗传学概念来思考基因组,也很难想象没有了这些如何进行科学研究。所以,对我来说,上个世纪70年代中期的DNA技术发明之日,正是遗传学革故鼎新之时,也是我们开启一个新时代之际。
 
  ――乔治·温斯托克(George Weinstock,圣路易华盛顿大学副校长、生化教授)
 

微小RNA:一种新的调控范例

约翰·瑞因

 

  遗传学方法对于生物学来说是基础性的,正如数学之于物理学那样。最奇特、离经叛道而激动人心的遗传学研究的范例是维克多·安布罗斯及其同事们发表的论文“美丽隐杆线虫异时发生基因lin-4编码了一些针对lin-14有反义互补性的微小RNA”。
 
  可以说是遗传学力量的一个力证,安布罗斯等人以史诗一般的论文鉴定了lin-4基因的功能,这个基因曾经被霍维兹和萨尔斯顿研究过,使用一个正向的遗传学筛板来筛选新的美丽隐杆线虫细胞谱系突变本。安布罗斯实验室开始将基因座的范围缩小至一个3.2kbp的区域,然后进一步精确到一个693bp的区域,使之可以补足或恢复延迟发育的lin-4突变表型。
 
  在研究了不少于两万种荷载lin-4突变本的染色体后,只有一种不能与最初的lin-4突变本互补(来源是同时发生在61个核苷酸和22个核苷酸lin-4 RNA品种内的C到T的改变)。作者们现在有证据表明,在这种微小RNA内的一个突变可能真正概括了最初的lin-4突变本。
 
  根据这些观察的价值,作者们提出了一个模型,可能是唯一的模型:这种不正常的22个核苷酸或61个核苷酸RNA与lin-14基因的3’UTR杂交后,起到了一种负抑制剂的作用(对lin-14的抑制可能解释最初观察到的lin-4突变本的过早发育)。我们现在知道,作者们已经发现了一种全新的基因调控方式在自然中广泛传播,介导它们的就是安布罗斯和其他人最后命名的微小RNA。
 
  ――约翰·瑞因(John Rinn,哈佛大学干细胞及再生生物学系副教授)
 

微阵列引发“数据爆炸”

艾丽西娅·奥什莱克

 

  十年前,我对于DNA是没有什么真正的概念的。在我的有限知识中,基因就是从你父母那里传到你的东西,还没有把基因与DNA清楚地联系起来。如果没有微阵列的发现,我可能还没有机会从事生物信息学的训练。第一个表达性微阵列是由斯坦福大学的帕特·布朗(Pat Brown)小组于1995年发表的。到2003年,在使用了这种技术的许多不同版本之后,有数百种发现问世。微阵列的发明产生了数据爆炸,产生了对定量科学家们的需要,来开发分析方法学和解释数据的方法。我有幸跟随微阵列分析领域的两位拓荒者戈登·史密斯(Gordon Smyth)和特里·斯彼德(Terry Speed)进行生物信息学的相关工作。如果没有表达性微阵列的发明,我的生活会止步于这个世界上最有趣的工作多少光年之外呢。
 
  ――艾丽西娅·奥什莱克(Alicia Oshlack,墨尔本默多克儿童研究所生物信息研究组负责人)
 

测序技术:为“遗传信息”解码

  自从1953年4月25日以来,基因组生物学界的最有意义发展是大规模DNA测序技术的诞生,首先由弗雷德·桑格(Fred Sangre)于1977年完成,经过几十年的不断创新,已经诞生了第一、第二和目前的第三代自动化测序技术。决定了DNA的结构好比于确定一张白纸的结构,这张白纸没有任何文字或数字书写在上面。现在,有了高通量测序,我们就有能力来读出这些分子白纸上的遗传学信息。这种能力不仅解密了人类基因组,还解密了成千上万的物种基因组,揭示了它们的基因、调控序列和总体结构,从而产生了生物学和医学上的许多重大进展。基因组生物学的下一个前沿,将是应用这些技术和相关分子试验的能力,为DNA测序所赋予,于大群体的物种、个体和细胞,来比较、模拟和预测这些系统的行为。
 
  ――米歇尔·沙茨(Michael Schatz,冷泉港实验室数量生物学副教授)
 

“序列就是力量”:人类和小鼠基因组计划

  我认为自从1953年揭示了DNA双螺旋结构以来,基因组学的最重要进展是对第一套个人基因组,也就是克雷格·文特尔(Graig Venter)的个人基因组的测序。对一套个人基因组、而不是一套参考或匿名基因组进行测序,这样的事情将基因组与人类联系了起来,将这个领域从一种分子的抽象科学转换成为了一种非常个人和与人类相联系的事情。如果我们在2053年回过头来看1953年,我们将认识到个人基因组是真正将DNA带向大众的东西。
 
  ――马克·格斯坦(Mark Gerstein,耶鲁大学教授)
 
  我认为1953年以来基因组生物学界“正在发生”的最重要事情是人类和小鼠基因组计划。尽管基因组计划本身不是一种真正的发现,它们已经带来了无数的其他发现。比如关于β球蛋白显性控制区的特性,它也称为基因座控制区。这是β球蛋白基因上游大约50kb的区域,已知对球蛋白基因表达有丰富的效应。该元件位于基因组的暗区域,也就是没有序列存在的区域,在发现了其功能之后,人们关注的是这样长的元件是如何在这么远的距离上对基因表达产生如此的影响。今天看来,如果不是全部,至少大多数基因可能是由这些众多的、远距离外的元件所控制的。所以,尽管纪念碑一样的基因组计划与优美的沃森-克里克模型形成了鲜明的对照,它们在对现在和将来的影响方面的力量是同等的。序列可能不是知识,但它是力量。
 
  ――彼特·弗雷泽(Peter Fraser,伦敦亚伯拉罕研究所核动力学实验室主任)
 
  对我来说,2002年基因组学的一个重要时刻就是当我们可以对人类基因组和小鼠基因组进行测序。加州大学圣克鲁斯分校(UCSC)的吉姆·肯特(Jim Kent)为这两种哺乳动物基因的最重要特征提供了一种可视化指南。通过将数以千计的小鼠和人体直系同源物之间的序列保守性水平压扁成为一种元基因,他证明了,从9 000万年前的一个共同序列开始,突变是如何刻印在内含子序列中的,而选择则保护了外显子,尤其是针对于它们的边界。对我来说,吉姆的分析很重要的就在于非常清楚地显示了,我们的基因和基因组是如何在进化上保持动态的。
 
  ――克里斯·庞廷(Chris Ponting,牛津大学基因组学教授)
 

复述人类的故事:分析古代和历史DNA

德特勒夫·魏盖尔

 

  对我来说,基因组生物学领域最令人惊奇的发现非高通量测序的应用莫属。在上个世纪80年代早期当我还在读大学的时候,能够读出整个基因组在理论上已经是可以想象的了。但我觉得最难以想象的是研究那些几千或几万年前就死亡的生物的基因组的能力。我的马普学会同行施旺特·帕波(Svante Paabo)就和他学生们的工作已经给我们在近期古代的人类进化问题的认识上带来了革命。我相信人们在改变我们对近代史认识方面也有相似的潜力。我个人认为这类研究中,会在近期引起关注的是波斯(Bos)及其合作者们在《自然》杂志发表的对中世纪黑死病爆发的探索。
 
  ――德特勒夫·魏盖尔(Detlef Weigel,马普发育生物学研究所分子生物学部主任)
 

规则的例外:水平基因转移

柯蒂斯·胡腾霍尔

 

  我建议水平基因转移的发现是基因组学史上最引人注目的成就之一。首先,它早于DNA结构本身的发现,包含在了1928年弗雷德里克·格里菲斯(Frederick Griffith)的转化实验中。正如生物学中过于经常发生的那样,这同时引入了一种规则(DNA是垂直遗传学传递的材料)和一种例外(水平转移)。其次,这种明显而直接的概念逐渐地被证明包含了一种相关生物学机制的多样性,可能其高潮式的代表是约书亚·莱德伯格(Joshua Lederberg)1951年的噬菌体转导和1958年关于细菌重组的诺贝尔奖。而且,水平转移其程度和可塑性得到重视还是在于1983年授予芭芭拉·麦克林托克(Barbara McClintock)的诺贝尔奖。转移发生机制的范围发生有以下意义:实用意义是驱动了抗生素耐性的传播,深层意义在于使人们放弃了对重构一种统一的生命树的怀疑。另外,水平转移还在于其发现之后几乎一个世纪还是一个活跃的研究领域。目前它对古代进化或真核生物体的影响尚不清楚。同样地,它在微生物群落中的流行性、动力学、生态学和功能性结果一直在研究之中。我希望,在DNA结构发现100周年之际,能见到水平基因转移的生物学分支列表更长,这个领域的发现也将是持续不断的。
 
  ――柯蒂斯·胡腾霍尔(Curtis Huttenhower,哈佛公共卫生学院生物统计系教授)
 

资料来源 Genome Biology

责任编辑 则 鸣