随着人类基因组计划的进展,人类在历史上首次能在基因组水平上审视自己。这一事件对人类自身、对医学、对伦理的影响现在难以估量。《新科学家》杂志的这组文章让我们把目光移向基因组带来的革命——

  HGP与塞莱拉互争短长

  1998年,即人类基因组计划(HGP)开始后的6年,克雷格 · 文特尔宣布他的塞莱拉公司将用全基因组鸟枪法”于2001年完成基因组测序,从而使这项工作变成了一场竞赛。此言一出,有人就对政府的计划是否浪费纳税人的钱产生了疑问。现在塞莱拉公司宣称获胜了。该公司的麦耶最近说,整个基因组图谱完全成功。”

  但剑桥大学桑格研究中心的约翰 · 苏尔斯顿认为,“没有政府的工作就根本不会有基因组。政府计划对防止基因组“私有化是至关重要的。他也不承认塞莱拉赢得了竞赛的胜利。他说,现在,可以根据双方提供的报告,第一次判断一下两个版本哪个更为优越。他们在很大程度上是靠我们所做的工作才获得他们的基因序列的。一半以上的数据来自HGP

  即使如此,苏尔斯顿认为塞莱拉的版本也并不比HGP优越,他们的方法是不规范的。

  HGP是通过识别沿着每条染色体的路标,然后一个一个区段地进行测序的方法来绘制基因组图谱。文特尔宣称的鸟枪法,是将整个基因组随机地切成碎片,然后用计算机进行测序并组装,这样可以更加迅速有效。

  但苏尔斯顿认为塞莱拉公司用他们的方法取得的版本不及HGP不论是序列的连续性和长度的等级都较差”。为了最后获得这个版本,塞莱拉公司不得不求助于“分隔式鸟枪法。这要依靠政府计划图像提供的信息,实际上是变相的HGP方法。

  苏尔斯顿还说塞莱拉公司的最后版本有更多的空缺,不如将许多DNA片段原地排列的方法更为准确。

  文特尔则说他们“整套基因组测序技术奇妙地重建了一个基因组,而政府的基因图谱有35%是完全编排错了的。他们的数据确实缩小了某些空缺,并显示了某些片段在哪些地方太长。但这不会使整个基因发生什么改变。”然而,两大集团都还有大量工作要做。HGP的序列只完成了33%,完成它还得花两年时间。文特尔认为:我们的图不是草图。它虽然还有一些空缺,但它是一个十分精确的序列,所有的块段都排列准确。”苏尔斯顿则反驳说,空缺是大量的

  对于塞莱拉公司决定在《科学》杂志上发表他们的基因组材料并不让其他研究人员无限制地享用其序列,也有争议。苏尔斯顿认为:如果你发表有关基因序列的报告,你就是把它放入了公共数据库。这就是为什么HGP把它的报告另行发表在《自然》杂志上而不与塞莱拉联合发表的原因。

  文特尔否认享用受到限制。他说,人们可以享用我们的基因序列,只要付费就行。从219日上午10时起,它在因特网上向任何需要它的学者开放。一项限制是不能把我们的数据给商业竞争者出售。”

  但还有其他限制:研究人员只被允许一星期下载100万个碱基对。

  基因组医药:尚非易事

  美国国立卫生研究院基因组项目负责人· 柯林斯说,人类基因组图谱是一部历史书,一本购物手册,最重要的,它是一本医药教科书。但它是用我们还不太认识的文字写成的。”

  文特尔认为,现有的序列还只是我们认识基因组的第一步。以后我们显然还有很多路要走。我们必须清楚地意识到随着这大约3万个基因的表达而出现的复杂性。”

  当基因组序列图全部完成时,政府资助的人类基因组计划和塞莱拉公司对约30人的DNA进行了测序,将几百万个变异登记编目。目的是想发现造成或诱发各种疾病的变异。

  但多数有缺陷基因产生的效应都较小,它们的影响有赖于别的基因或环境。根据法国国家科学研究部有关专家的报告,疾病几乎都非由出错的基因造成。他们说,解读基因组信息的总的目的,不是要发现哪些基因`出错'并用基因疗法去治疗,而是要了解正常人的正常的基因是如何发挥作用的,以便我们设计用什么方法和在何处进行干预。”

  人类基因约有10%可成为潜在的药物靶子。人类只有3万个基因,因此药物靶子只有3000个,也就是说,全世界100家顶级医药公司中每家只分到30个。

  这就迫使这些公司要想出别的办法去开发新药。这个压力将驱使它们趋向于开发个性化医药,即根据个人不同的生活方式和遗传背景,度身配制的医药。

  但文特尔的看法有所不同。他相信较少的基因数目提示人类细胞使用基因信息的方法远比多数研究人员设想的要复杂。他认为,医药公司干预癌症和其他疾病的方法可能要多几个数量级。”

  现在有待遗传学家们解决的一个大问题是如何解开这个复杂的谜团。对诸如小鼠、和大家鼠等生物进行基因测序能从中得到许多答案。例如,一个叫做“国际小鼠突变研究联合组织的计划,目的就是诱发3万个左右小鼠基因中的每个基因,来观察其结果,然后将得到的知识转用于人类。

  对在不同的组织和器官中表达的基因片段给予特定的“印记,也使我们有可能对拼接基因的变体进行登记编目,从而揭示哪些变体在哪些器官中产生什么作用。

  ——A. CoghlanJ. Marchant

  人类还至尊无上吗?

  人类从来没有像今天这样尊严扫地。当我们为人类基因组测序的成功而欢欣庆贺的时候,基因组本身却告诉我们,人类原来并不是那样特别高贵。

  原来,我们拥有的基因只比细菌多5倍,比蠕虫多三分之一,约为果蝇的2倍。德国马克斯 · 普朗克进化人类学研究所的· 帕布说,用基因组的观点来看人类在自然界的地位,既会使我们变得谦逊,也是对人类至尊无上观念的沉重一击。”

  大量涌现的基因信息证明,我们的基因中约有40%是和线虫相似的,60%是和果蝇相似的,90%是和小鼠相似的。我们和最接近的近亲黑猩猩的差别,只是DNA1%,或100个碱基对中的1个。

  审视人类基因组还能改变我们对人种的看法。同一人种的两个人看上去相像,但他们在基因上可能比属于不同种族的两个人差别更大。斯坦福大学的· 卡凡里 · 斯福札说,同种人之间的差别是如此之大,以致认为存在人种差别甚至存在人种的想法是荒唐可笑的。”

  帕布指出,甚至还不如说,我们都是非洲人,因为在世界其他地方所发现的基因差别都不过是在非洲所发现的变异的一小部分。他说,基因组知识会增进人类的博爱之情。”

  ——J. Marchant

  人类基因:更少即更多

  重要的不是你有多少个基因,而是你怎样对待真正起作用的基因。这是最近人类基因组给我们的主要启示。

  由政府和私人机构共同花费巨大努力获得的基因全图,在《自然》和《科学》杂志上占了100页以上的篇幅。基因组研究首脑人物柯林斯说,这是人类第一次置身事外地审视我们自身的生物学景观。这是一块最高级的里程碑。”

  科学家们急于要从这个新领域中寻找的珍宝是我们的基因,即能复制成RNA模板以生产蛋白质的DNA区域。两份报告所揭示内容的最惊人之处,是我们的基因远比几乎任何人所猜想的要更加稀少珍贵。10年前,多数研究工作者预言我们的细胞中存在的基因约为10万个。但两个独立的研究集团应用不同的DNA序列筛选方法,只发现了2.7万至4万个人类基因。塞莱拉公司的文特尔说,基因数目少,内含却很大。果蝇的基因组只有约1.3万个基因,我们要比果蝇大得多,且高明得多,因此总认为我们应当有多得多的基因。”

  同样不光彩的一件事是已发现有223个基因是我们的祖先直接从细菌那儿获得的。今天,这些基因中有许多仍在生物学中扮演重要角色。

  然而,脊椎动物中约22%的基因是细菌或果蝇中所没有的。事实上,脊椎动物可以将相当数量的创造——例如与蛋白质设计有关的、为多种蛋白质所共有的新的结构要素看作自己的创新。我们人类的蛋白质也是这些要素的更加复杂的排列组合。

  但人类的复杂性的奥秘并不在于基因的数量,而在于我们如何使用这些基因。斯坦福大学的· 麦耶说,一辆优越的赛车和一辆破车可以有相等数量的零部件,二者的区别是零部件的质量和我们将它们装配起来的技术熟练程度。”

  例如,基因常常以片段呈现。通过拼接”RNA蛋白质模板的某些片段、或使用某一片段而不用另一片段就可使一个基因产生许多不同的蛋白质。同样的基因能用于制造肌肉中的一种蛋白质和脑中的另一种蛋白质。人类有多达60%的基因能产生这些拼接变体”。

  从官方与非官方的基因组研究得到的另一重要发现,是许多人类转录因子的独一无二,并要比果蝇和细菌高出一筹。转录因子和其他调节蛋白质决定哪些基因在发育的关键时期,如胚胎形成和器官成形时期开启。是它们以如此少的基因精心编排了如此复杂迷人的乐章。

  文特尔认为所有脊椎动物都有几乎相同的基因。他说,重要的是它们什么时候开启或关闭。我们与猫、狗具有一样多的基因,但开关调节却不同。

  我们不要因我们的基因没有预期的那么多、还集合了许多乱七八糟的东西而感到失望。事实证明,基因编码区只占不足1.5%的基因组,而跳跃基因或转位子的重复副本要占DNA的近一半。

  转位子似乎只是废物,但它们可能有助于我们的进化。大多数转位子现在已没有活性了,但它们初次出现时却能在基因组内从一处跳向另一处。这有助于染色体内DNA的重组,并创造新的基因。事实上,一种新发现的转位子MER85就含有一个在胎儿的大脑中开启的活跃的基因。

  我们的染色体也证明是十分易变的。基因的绿洲常常被广阔的无基因沙漠所包围。荷兰阿姆斯特丹大学的· 弗尔斯弟格及其同事报告称,高度活跃的基因常常集合在他称之为增大基因表达区或“脊梁的地方,那里基因转录的速度急剧上升,要比其他地方快200倍。他说,这像是制造RNA的工厂。

  基因组不均匀分布的另一个特性是重组——精子和卵子形成时期染色体对之间DNA片段的交换。威斯康星州马什菲尔德医学研究基金会的· 韦伯及其同事发现,存在着重组的死角,也存在着染色体片段的转换发生率比通常大100倍的热带丛林

  迄今为止,要从DNA序列来预测重组会在何处发生还不可能。但重组容易发生的场所男女相差很大,从此可提供另一种思路。

  最后一个费解的问题是我们怎么会对保存基因的场所如此漫不经心。大多数生物学家都坚信染色体的顶端即端粒是无基因区,因为端粒会在人的一生中逐渐缩短。然而加州大学的· 莫伊济斯却在端粒附近发现了500个候选的基因。把珍贵的基因置于端粒中无异在地震区内建设家园。他说,我实在提不出说明这个现象的恰当理由。”令人感兴趣的是,衰老的某些特征可能是由端粒缩短引起的基因变化造成的。

  总之,工作还只刚刚开始。麦耶说,重要的是要真正认识到我们中的某些人已经每天在应用基因序列来解决生物学中的问题了。人们还将这样做上几十年,如果不是几千年的话。

  ——P. CohenA. Coghlan

  呼唤计算机生物学

  组成人类基因组的24条染色体有30亿碱基对。这要比已经测序过的任何别的基因组大25倍,为迄今发表过的所有其他基因组的全部体积的8倍。

  此后随着基因组的被“注释”或分析,还会产生更多的数据。仅仅储存这些信息就需要相当大量的计算机记忆——而我们积累基因信息的速度每年还要增加4倍。

  但与我们解释所有这些数据所需要的资料相比,储存问题还算不了什么。到了汇编基因组、寻找基因及其变异,以及对整个基因组进行比较的时候,数据处理的需要还会大得多。文特尔说,计算机生物学将成为人们所需要的首要技术。”

  这意味着生物数学正在成为推动高效能计算机发展的动力。现在美国政府和塞莱拉公司已计划建造世界最大的超级计算机用于分析基因组。但此外人们还在发挥聪明才智,想办法将现有计算机的效能最大化。其中最关键的工具就是一种叫做LSF的软件,它能将计算任务分摊给由高速光缆连接起来的一群计算机,这样就无需建造超级计算机了。这是一种更加便宜可行的技术。

  剑桥大学的桑格研究中心正计划与邻近的“欧洲生物信息数学研究所”联网。世界各地的计算机群很快也将能通过高速网络(名叫Grid)处理基因组信息了。

  [New Scientist2001217]