为准确定位致癌基因和药物治疗的靶标,从而挽救更多癌症患者的生命创造条件,继“人类基因组”工程之后的又一壮举——

8

1986年,癌症研究的先驱雷纳托·杜尔贝科(RenatoDulbecco)在《科学》杂志上宣称:“如果我们希望更多地认识癌症,那么我们现在必需集中精力研究细胞的基因组。我们正处在一个转折点上。”这位诺贝尔奖获得者20多年前的这几句话,是日后成为了人类基因组工程的一次最早的公开倡议。前些年累积的研究成果已经让人明白,癌细胞的大量越轨行为大都来源于对细胞基因造成的损伤以及功能的改变。他写道:“我们有两种选择,要么尝试逐个地去发现对恶性肿瘤起重要作用的基因,要么对整个基因组进行测序。”

杜尔贝科和科学界的其他人士坚持认为人类基因组测序本身,虽然其成就具有里程碑意义但还只是全面认识癌症生物学的第一步。由于掌握了人类正常DNA中核苷酸碱基对的完整序列,科学家随后就需要根据碱基对的功能来对大量的人类基因进行分类——这样就可揭示它们在癌症中的作用。历经20年的努力,杜尔贝科的愿景已从梦想变成现实。人类基因组工程完成后不到3年,美国国立卫生研究院(NIH)就已正式投入力量以求创造一份癌症中基因组变化的综合目录——“癌基因组图谱”(The Cancer Genome Atlas.TCGA简称)。

迫切追求这下一个雄心勃勃的大生物学计划的主要原因是癌症令人生畏的致命性:每天1500多个美国人死于癌症——平均约每分钟送走1人。除非研究人员设法加速找到癌细胞内新的易感点并开发攻击那些靶标的新策略,随着美国人口的老化,癌症死亡率预计还会迅速攀升。

然而,开展这么大规模的研究谈何容易。这项工作要应对50种最常见的癌症所要完成的DNA测序的工作量,最终可相当于1万多个人类基因组工程。

一种基因异变疾病

细胞基因组发生变异是所有类型癌症的根本原因,这个观念已不新鲜。自1981年第一个致癌基因得到确认以来,科学家已逐渐认识到癌症主要是由特定基因的突变造成的。这种损害可以通过对有毒物质或放射线的接触,DNA修复过程中的失误或细胞分裂前DNA复制时出现错误而造成。也有少数情况如致癌突变是上代遗传的基因带来的。

无论起因如何,这些变异都阴断了生物学通道,从而导致细胞复制或细胞生长失控。有些突变使通常起保护作用以抗衡细胞异常行为的基因丧失能力,而另一些突变则会增加破坏基因的活力。大多数细胞在变成癌细胞前至少必需获得几种这类突变——这个过程可延续多年。

20多年来,多个独立研究小组已采用首创的分子生物学技术来探寻基因中的突异,已鉴定了约350个与癌症相关的基因。一个汇集这类变化的称为癌的体细胞突变目录(COSMIC)的信息库,是由英国剑桥维尔科姆·特拉斯特·桑格研究所所属的迈克尔·斯特拉顿(Michael Stratton)研究小组资助建立的。不过没有人认为该目录是完整的。

如今,我们已经拥有了大大提升研究规模和速度的手段,再用家庭手工业方式来探索癌的基因组还有意义吗?近年来不断有一些设想、工具和技术相继涌现,使癌症和分子生物学界的许多杰出人士相信,现在是进行系统的、群策群力的和全面的探索癌症基因组的时候了。

“人类基因组工程”创设了正常人体组织基因组的30亿个DNA碱基对的标准参照序列,从而为TCGA工程奠定了坚实的基础。现在需要另一个首创性工程来对正常细胞基因组的DNA序列以及其他物理特征,与癌变细胞进行比较,以确认造成显著的癌的特征的主要基因变化。人类基因组工程已彰显大规模生物学研究中国际协作在共享资源和加速科学发现方面的重要性,TCGA也在寻求类似的协作机制。

“人类基因组工程”还促进了基因组测序和分析技术的重大进展。例如1999年初,DNA测序费用每完成一个核苷酸碱基对需要10美元以上,如今每个核苷酸碱基对测序支出不到1美分,而且随着新测序方法的不断涌现,预计费用还会不降。因此,几年前不可想像的适用于大规模研究的方法,如今可被用于鉴定癌症所涉及的大量基因组因子。

观念论证

最近有多项研究成果证明了这个提法,即鉴定癌细胞中特定基因的变化确可为诊断、治疗和预防癌症提供更有效的方法。这些研究鼓舞人们去展望未来,同时也表明为何获得回报的途径是复杂的、耗时的和昂贵的。

2001年,当维尔科姆·特拉斯特·桑格研究所开始单独采用基因组学技术探索癌症时,其即期目标是在为涉及378个癌症样品的20个基因的测序中,进行最大限度地运用机器人和信息管理系统的试验。但一年后,研究小组却发现一个称为B-RAF的基因在大约70%的恶性黑素瘤病例中发生突变,研究人员迅速将目光投注到这种最致命的皮肤癌中的这个新的颇具潜力的治疗靶标上。他们测试了多种方法,包括用经典的化学药剂以至用小剂量的干扰性核糖核酸制剂,看看这些干预是否能够阻断或降低B-RAF基因的活性,或者抑制因B-RAF突变而过量产生的称为MEK的蛋白质。5年后,这些最有希望的治疗方法正在进入临床测试中。

其他研究小组已在集中研究与乳腺癌、结肠癌、白血病、淋巴癌以及与另外一些癌症相关的基因突变,以研发分子诊断和预后检测技术,以筛选出当前化疗药库中某种对特定患者可能最有作用的药剂。癌症基因组学也有助于直接促成某些新的治疗手段的开发和应用。

2005年12月13日,美国宣布启动癌症基因组计划,美国国立卫生研究院(NIH)院长埃利亚斯·泽古尼在新闻发布会上称该计划将“开启癌症研究的新纪元”

例如,治癌药剂Gleevec是专门抑制由称为BCR-ABL的2种基因突变的溶合体所产生的一种酶的,这种酶可诱发慢性骨髓白血病。现已证实,Gleevec对抗这种疾病极为有效,并且在治疗更为复杂的恶性肿瘤,如胃肠基质肿瘤和其他数种含有相同的酶的较罕见的癌症方面具有医疗价值。Herceptin是一种以称为HER2的细胞信号接收蛋白质为靶标的药剂,在遏制乳腺癌方面也很成功。

基于癌症患者特定的基因突变而选择治疗方案的策略,也正在治疗肺癌的药物Iressa和Tarceva以及治疗肺癌、结肠癌和其他癌症的药物Avastin的研究中进行试验。这些新的基于基因的诊断、预后和治疗的表现显然令人欣慰,但如果研究人员能更早地获得癌症中基因组变化的完整的图谱,这类介入治疗药物还可出现得更多。

约翰·霍普金斯大学主持的一项近期研究既显示了大规模的基因组学对发现致癌基因的巨大作用,也显示了全面的癌基因组图谱具有多么大的潜力。霍普金斯大学的研究小组对从11名直肠结肠癌患者和11名乳腺癌患者的肿瘤组织提取的约1.3万个基因进行了测序,并报道称在近200个不同的基因中发现了重要的突变。有趣的是,以前仅约有10来个基因和这2类癌症相关,而且当时大多数科学家期待再发现的基因不可能很多。

研究人员在对癌细胞基因组进行测序时遇到的重大挑战是难以把肿瘤样品中无意义的突变同与癌有关的突变区别开来。有些令人吃惊的是,早期测序研究还发现在不同类型的癌症中基因突变很少重叠,在从患同类癌症的病人取得的肿瘤样品中基因突变的样式也少见实质性的改变。这些发现有力地证明,许多不同的可能的突变组合可以把正常细胞变成癌细胞。因此即使同样的身体器官或组织患癌症,各人肿瘤的基因图像可能存在极大差别。

虽然研究人员可能要用许多年的时间才能完成造成正常细胞演变成为恶性肿瘤的所有基因组突变的全部目录,但有可能革新癌症治疗的方法,也许会在这个目录完成前出现。由于每一种新的癌症得到研究并加入到TCGA中来,研究人员将获得另一套新的基因组靶标和图像,可被用于开发更多的量体定制的治疗方法。

参与癌症基因组计划的大型基因测序中心

编辑庞大图谱

TCGA开始时是先行实施一项探索性工程以开展和测试最终绘出癌症所有基因组异常图谱所需的科学框架。2006年美国癌症研究所和美国人类基因组研究所选定了将参与这项先期工程的科研小组和有关设施以及他们行将开始检测的癌症类型。这两家研究所将在今后3年中投入1亿美元用于编篡3个类型肿瘤的基因组变异图谱,这3类肿瘤是:大脑神经胶质瘤、肺癌和卵巢癌。先期工程所选定的这3种恶性肿瘤总起来在美国每年有21万个以上的病例,仅2006年估计就造成19.1万人死亡。此外,在样品收集所需的科学严格性,以及在技术和伦理方面,这3种癌症也较符合要求。去年9月,又选定3个生物贮藏库,以提供这类样品以及所需的新的肿瘤样品和取自同一患者的正常组织以供对比。这些机构将向中央生物样品核心资源库输送材料,该库是TCGA先期工程4大组成机构之一。

其他三大组成机构是:癌基因组特征认证中心、基因组测序中心和信息资料协调中心,所有这些机构将进行合作和公开交换信息资料。

由癌基因组特征认证中心确认的有意义的基因和其他染色体区域将成为3个基因组测序中心的测序靶标。此外,疑对致癌有重要作用的基因家族成员,包括为控制细胞周期的酶(酪氨酸磷酸根转移酶和磷酸酶)编码的基因也要测序。估计在先期工程的1500个肿癌样品中,每个样品约有2000个基因将被测序。

测序机构和基因组特征认证机构中很多成员是人类基因组工程的参与者,可以预期他们将面临的工作要比正常细胞DNA的测序复杂得多。由于细胞一旦发生癌变,其自我调控和修复的机能将丧失,很易以更快速率突变,因此,一个肿瘤内个别细胞基因组的构成会急剧变化。综合研究小组将需要开发十分有效的方法来识别这种生物学上可能很重要的“信号”。再者,肿瘤内几乎总是藏着一些良性细胞,会使样品弱化。如果测序的肿瘤DNA过于庞杂,一些重要的突变可能会错失。

所有这些信息都将被全球科研机构迅速、自由地取得。为了更便于基础研究和临床研究人员,乃至医疗保健专业人员有效地利用上述信息,TCGA将把测序信息和基因组分析与可观察到的肿瘤特征和同一样品捐献者的临床分析结果联系起来。因此研发生物信息工具以收集、整合和分析大量的信息,同时保障患者信息的安全,是使远景变成现实的另一个必需清除的障碍。

未测绘的领域

展望未来,在科学上、技术上和政策上都充满挑战——其中有些是已知的,另一些是未知的。有待解决的不确定问题包括:新的测序技术能否如期提供,以使我们的努力在经济上可行吗?如何才能迅速地改善和扩充我们的工具箱,以便系统地探测后生遗传学的变化和其他涉及癌症的大规模基因组变化,尤其是与癌转移相关的变化?我们应如何利用计算生物学来创立对基础生物学家、临床研究人员以及在第一线的医疗保健人员有用的信息入口?如何以既促进基础研究又促进治疗方法发展的方式来平衡知识产权?美国国会何时会最终通过非歧视性的基因立法以便TCGA所获取的知识能对美国人的健康产生正面影响?诸如此类的问题不胜枚举。

这项工作的发展前景今天还不很明朗。从这个意义上看,我们现在所处的地位类似19世纪早期的探险家梅里韦瑟·刘易斯(Meriwether Lewis)和威廉·克拉克(William Clark)。虽然他们没有发现横贯美洲大陆的令人向往的水上通道,但他们绘制的详细地图却对他们新生的国家证明是有价值的。为了所有那些已经遭受或者即将遭受癌症折磨的人,我们寄希望于21世纪探索癌症生物学的远征能超越雷纳托·杜尔贝科的最大的梦想。