作者勒鲁瓦·胡德

治疗疾病的系统生物学方法是基于这样的理念:受疾病干涉的蛋白质和基因调控网络与它们的正常存在状态是不一样的。到目前为止,我们一直在寻找这样的可能性:它们的这种差异可以用对血液的多参数测量来反映。这一理念正在改变着当前对疾病的诊断和治疗方法,它们和各种新技术一起,将促成一种全新的预测性和预防性医疗(predictive and preventive medicine)的实现,并最终实现个性化医疗(personalizedmedicine)。

系统生物学所面对的生物学信息可以分成基因组的数字化信息和发生在基因组以外的环境信息。对这些不同类型信息的整合,增加了与生物体发育及其对所处环境的生理学应答相关联的启示。基因组的数字化信息最终可以为人们所认识,彰显着生物学在各学科中的独特性,那就是生物学家从一种可以认识的核心信息开始他们的探索,力求去测量(定量化)某种生物学系统的所有分子要素,以便对它们的相互反应进行评估,并将这种信息整合进图形网络模型中,提出一些预测性的假说去解释生物系统所出现的各种行为。

一般来说,基因组编码两种主要类型的信息:⑴表达出执行生命的各种功能的蛋白质的那些基因,⑵这些基因的顺式调控元件。各种蛋白质执行各种功能时,可以单独执行,也可以以复合体或者(蛋白质)网络的形式去执行。在执行功能中,有些蛋白质相互反应,有些蛋白质则与一些小分子物质相互连接而产生功能(诸如信号转导或代谢网络)。各种顺式调控元件和转录因子一起,调控着各个单独基因的表达水平。它们还可以共同构成基因调控网络的联系和构造,向信号转导通路整合不断变化的输入,产生出动态变化的输出,构成基因介导的生理和发育应答的蓄电池。在此基础上,形成了一种正在给医学带来革命性变化的学说:疾病有可能通过遗传学干涉或病理性的环境因素和感染物或化学致癌源,干涉了系统的正常网络结构。

系统生物学方法对疾病认识的启示

研究人员在酵母中建立了一种代谢过程(半乳糖利用)的模型,通过一系列精确地遗传敲除和环境干涉的检验,在酵母基因组中,对所有6000种基因的信使RNA(mRNA)的浓度进行监测,并采用现有文献数据的一种图形网络程序,将这些监测数据整合进蛋白质-蛋白质和蛋白质-DNA相互反应数据中。

该网络模型提供了一种新的视野,使人们认识了代谢过程的控制及其与其他细胞过程的相互作用,同时还引发出了认识人类疾病的系统生物学方法的几种理念。每种遗传敲除品系都有一种各自不同的干涉基因表达模式,其中,每种敲除都会有数以百计的mRNA(浓度)发生改变。大约有15%的受干涉mRNA有编码分泌蛋白的潜能。如果疾病组织中的基因表达也能揭示出带有病理的、遗传的或环境的改变的特征的模式的话,那很可能血液可以成为疾病分析的一扇诊断之窗。而且,研究还表明,将酵母暴露在一种环境干涉条件下,蛋白质和基因调控网络都发生了动态的改变。疾病进展的动态变化同样可以反映在受疾病干涉网络与时俱变的过程,从正常状态到各种发展阶段。

前列腺癌的系统生物学研究

癌症的发生,是来自控制主要细胞事件的网络在功能上发生多种自发的或遗传性突变引起的,从我们的研究中越来越清晰地认识到:前列腺癌的演化进展状况可以反映在疾病细胞内基因和蛋白质的动态变化着的表达模式。

要构建一个系统生物学网络模型的第一步是建立所研究的细胞类型的综合性mRNA表达数据库。我们运用一种称为多并行标签测序(MPSS)的技术,以每趟测序100万条序列的速度对一个互补DNA(cDNA)文库进行测序,并监测细胞内少到一个或几个拷贝的mRNA转录本。我们针对正常前列腺组织构建了一个包括2000多万条mRNA标签的数据库,这个数据库的信息来源还有一种称为LNCaP的雄激素敏感性前列腺癌细胞株,它又分成雄激素缺乏型、雄激素受刺激型、正常状态型和雄激素失敏变异型四种存在状态。通过比较雄激素敏感型(癌症早期)和雄激素失敏型(癌症晚期)这两种不同阶段,数以千计的mRNA表达被鉴别发生了变化,在554种表达的转录因子中,有112种在细胞株的早期阶段和晚期阶段之间是变化了的(使用cDNA阵列检测时,其中80%测不出变化),比较癌症细胞和正常组织时有相近数量的转录因子表达发生了改变。

通过比较前列腺数据库和一个由Lynx Therapeutics公司提供的来自29种正常组织的5800万个MPSS标签组成的信息数据库,识别出了300种前列腺特异性基因,其中大约有60种拥有信号肽,提示它们可以表达成分泌蛋白。经过血液分析,识别出10种针对这些蛋白质的抗体,其中5种来自前列腺癌早期、5种来自前列腺癌晚期。相反地,标准的前列腺癌血液标记物PSA识别不出早期癌症的转录因子,却能识别出许多晚期前列腺癌的转录因子,其中包括使用我们的标记物所遗漏的所有转录因子。因此,联合使用两种标记物要比单独使用一种效果更好,推而广之,组合使用多种标记物可以识别出大多数的早期和晚期前列腺癌。

显微镜下的巨噬细胞在吞噬细菌

已有多个研究小组报道,通过质谱仪检测发现,血清中有一些(未识别的)分子反映出癌症的各种不同阶段。埃伯索尔德(Aebersold)小组使用糖蛋白捕获法和质谱仪进行同位素标记与分析,成功地鉴别了这些生物标记物中的许多种。分子诊断学将与日俱增地扮演重要的作用,通过选择和跟踪治疗的各种应答,为疾病生物学提供直接的测量。

如果有了足够的测量值后,人们就能大概识别出特定癌症的每种各自不同的类型的各自不同的模式,识别出每种疾病类型进展中的各种阶段,从而根据关键治疗靶和药物改变疾病模式的测量值对疾病进行分类。目前最令人关注的问题是需要测量多少个参数才能分层和跟踪各种前列腺癌的进展情况,并进而对最为高发病率的20种或30种癌症乃至最终对最常见疾病进行分层和跟踪(研究)。最后,组织特异性标记物的改变可能有助于识别网络中的临界点。这些受干涉网络中最重要的关节点是:药物可以影响受干涉网络,要么将疾病网络转变回正常状态,要么对疾病细胞进行特异性杀灭。因此,多参数血液测量将不仅对诊断学是极其宝贵的,而且会使合适的药物靶的发现合理化。照此设想,分子诊断学将成为分子治疗学的一种极其宝贵的工具。

走向单细胞和单分子分析

在酵母中的一个代谢过程中构建预测性网络模型的系统生物学方法要求有多达10万个测量值。以前列腺癌为例子,大约有108个测量值才足以开始构建一个庞大的癌症标记物数据库,这些标记物可以与基因组的数字化密码逆相关。但是,要构建人类疾病的预测性模型,能解决生物学特征化的异质性的方法将是关键的,这些特征包括各种(个)细胞针对环境干涉的应答的差异,也包括正常组织中细胞类型和环境的多样性。

在前列腺中,有神经上皮细胞、各种基质细胞、内皮细胞和上皮细胞(有95%的癌症产生这些细胞),每种细胞都有一种连续的发育周期。如果对这些细胞群体不加分类地混合对待,是不可能产生可靠的网络信息的。不同的研究者采用不同的方法来获得相对同源的细胞群体,这些方法包括细胞分选、手工切割,或者激光捕获微切割(LCM)。但是,细胞分选和LCM本身会导致处理诱发的基因表达变化,而手工微切割则很少获得完全同源的细胞类型。而且,即使是一种类型的细胞也代表着某种发育机制或生理机制的不同阶段。生物学家们更乐于分析系统生物学的关键测量值所需的各种细胞,因而可以从各种细胞中产生网络假说。进行了聚合酶链反应(PCR)扩增后,研究人员对来自单个细胞的mRNA进行分析,但是对蛋白质目前还没有类似的扩增技术。因此,所需的技术有三种走向:(1)高度并行化。可以对多种测量值类型(基因的和蛋白质的)和操作方式(如细胞分选)进行整合;(2)微型化。可以分析单个细胞和单个分子;(3)自动化。在此,重点介绍一下由美国系统生物学研究需要所驱动产生的一些新技术:

微流体学(microfluidics)作为一种有用的生物技术存在已有一段时间了。但是,多层弹性体微流体学是一种更加强有力的新技术,它使得人们可以将许多泵、阀和通道整合进一种很容易制作的微芯片中。这意味着诸如细胞分选、DNA提纯和单细胞基因表达谱等多种操作可以并行进行。这种技术通过大规模多参数分析,在生物学材料和系统生物学之间搭起了应用与被应用之桥,其用途包括单细胞(例如来自针刺活组织检查术)和非常小规模细胞群体的分子切割、乃至针对细胞和血液的多参数疾病诊断。

纳米机械和纳米电子器件作为一种新兴的技术,正迅速成为基因、mRNA和蛋白质的高敏感性、无需(同位素等)标记的实时监测手段。到目前为止,这些纳米技术中得到实证的尚处于单器件或者少量器件水平,但文献所报道的检测灵敏度和动力学范围已是蔚为可观了。构建纳米制造方法和将纳米技术与弹性体微流体学进行整合的领域正在取得进展。在今后20年内,很可能将出现微型化和自动化的微流体/纳米技术平台,它会将诸如细胞分选和血清提纯之类的操作整合起来,达到可以从单个细胞或极少量液体中取得5到10个生物标记物的测量值。那时,诸如对蛋白质-蛋白质、蛋白质-DNA和蛋白质-药物相互反应等相关的分子力进行定量化的新测量类型将成为可能。其他新兴的纳米技术还包括进行单个DNA分子的快速序列分析工具,以及基于纳米粒子的在体癌症成像探针。

瞄准染色体组的研究,ISB旨在寻找疾病预防的有效方法

今后几年内,这些技术将被用来产生分析人类疾病的初步的网络学说。这些学说必须最终在生物体内得到验证。这种验证通常是通过分子成像技术进行的,目前已有的方法包括:生物冷光(标记术)和荧光(标记术)、正电子发射X线断层照相术(PET)和磁共振成像术(MRI)。技术上的挑战在于:将网络分析中标示出的巨大数量的元件简化成分子成像生物标记物的少量靶标之一,并针对这些靶标进行网络的关键性验证。例如,在前列腺癌细胞中选择性表达的一些特异性代谢酶就构成了这样一个靶标。我们搜集那些在早期前列腺癌细胞株和晚期前列腺癌细胞株中差异表达的基因,从中筛选出左旋乳酸盐脱氢酶A,一种催化从(S)-乳糖酶产生丙酮酸盐的酶,它只在晚期癌细胞中以一种高水平进行表达。根据这一反应设计的特异性PET示踪剂证明了该发现,该示踪剂还可用于前列腺癌转移的识别。研究人员还将分子成像技术与分子治疗学结合起来,应用标记过的药物候选物对病人进行直接的测量,包括对药物通过体内的药代动力学进行成像分析,将药物与它们的疾病靶标进行测定分析,并测量治疗手段对疾病的生物学机制的影响。

前 景

今天的医学是一种复能性的医学,主要集中于针对已存在的疾病、而且一般是针对它们进展的晚期来开发治疗手段。在今后10年到20年内,医学将向预测性和预防性模式发展。

在这种模式中,新技术将使每个人都可以对他们基因组的(健康或疾病)相关部分进行测序,而通过血液分析的多参数信息指导下的分子诊断学将成为评价健康和疾病状态的一种常规方法。在这段时间内,遗传变异与疾病相关性研究将得到长足的扩展,这些进展组合起来,将确定每个人的未来健康史成为可能。预防性医学可以使受疾病干涉的网络用来识别药物靶——首先用于(疾病的)治疗,以后还会用于疾病的预防。而药理学介入将集中于预防疾病介导的(分子等的)转变,以及逆转或终止那些已经发生的转变。这将要求对构成正常生物学机制和病理学机制的基础——系统生物学有根本性的认识(飞跃),还需开发达到这一目标所要求的新技术的襄助。

预测性和预防性医学将自然而然地走向一种个人化的医疗,将对健康卫生事业带来一场革命。在这场革命中,制药企业将在分子诊断学指导下建立更有效的药物发现途径,其中商机无限。研究的范式将发生改变:根据病人特定的疾病划分进一系列治疗(选择)之窗中,每个窗口中有更少的病人群体和更高的治疗效果。从事健康卫生领域的人员将发生工作内容的转变,从对付疾病走向的同时促进健康(预防疾病)。最后,公众必须受到教育,了解他们在这种与以前大不相同的医学模式中的角色,而实施这种医疗的医师们也必须得到相关的教育。为实现这种理想,将会遇到大量科学和工程上的挑战———这种理想比人类基因组计划更伟大,挑战也更艰巨。预测性、预防性和个性化医疗的实施将会对科学、产业、教育和社会产生巨大的影响,但这样的发展道路,我们还只是刚刚开始能够设想而已。

[本文作者勒鲁瓦·胡德(Leroy Hood)是分子生物技术和基因组学领域的世界著名科学家,也是人类基因组计划的倡导者之一,2000年胡德在西雅图筹建了美国系统生物研究所]

·相关链接·

美国系统生物学研究所(Institute for Systems Biology,ISB)是一个国际著名的非盈利性研究机构,致力于研究和应用(推广)系统生物学。研究所的目标是揭示人类生物学的众多奥秘,并制定各种策略来预测和预防人类重大疾病,例如癌症、糖尿病和艾滋病等。美国系统生物学研究所的口号是:革新科学、改善民生(Revolutionizing science. Enhancing life)。

预测性、预防性、个性化医疗

预测性:可能性的健康史;一年两次的血液分析,检查健康状况的变化。

预防性:设计预防措施。

个性化:各人独特的变异(本)指导下进行针对个人的治疗。

人类基因组计划给当代生物学和医学带来了两种根本改变了的科学范式:系统生物学(systems biology)和预测性、预防性、个性化医疗(predictive,preventive and personalized medicine)。人类基因组计划已经使人们可以检索和认识广泛的人类基因组变异性(多态性),正是这种变异性,使每个人得以与其他人区别开来(同卵双生的双胞胎除外)。通常,你我之间基因组中的DNA平均每1000个字母有一个是不同的。

这就意味着,我们每个人彼此之间的基因组中平均有大约600万种DNA变种。这些变种中的大多数对我们的外表或行为没有什么影响。但是,其中有一些变种使我们中的一些人长得高或长得矮、长得胖或长得瘦。另外一些更少的变种则使我们易于患上一些疾病如癌症、心血管疾病、神经疾病或代谢性疾病。今后,我们将能够利用少量的血液来分析这些疾病基因的相关DNA序列,并利用它们为每个人预测其可能的未来健康史。这就是预测性医疗。

在医疗领域,仅预测而不能治愈或预防一种疾病是不受欢迎的,在今后15到25年中,我们将利用系统生物学方法,在它们所处的生物系统环境中识别那些有缺陷的基因并规避它们所导致的(功能)缺陷。这就是预防性医疗。预防性医疗的手段将包括药物、胚胎干细胞疗法、工程化蛋白、遗传工程细胞、以及许多其他手段。

由于我们中的每个人与他人相比都有600万种DNA变异,每个人将会有晚期发作的疾病的各种不同的组合病症。相应地,医师们将必须个别地考虑我们每个人,并针对各自不同的易患性组合来进行治疗。这就是个性化医疗。

预测性、预防性、个性化医疗将可望延长人类的平均寿命长达10至30年。这种医学模式将要求对医师的培养和对一般公众关于医学的宣传教育发生深刻的改变。致力于推动人类走向预测性、预防性、个性化医疗是美国系统生物学研究所的一个主要目标。

什么是系统生物学?

美国系统生物学研究所(ISB)的任务旨在用一种系统的方法给生物学带来革命性的改变,以及——

·不同学科的交叉融合催生了许多系统生物学所必需的综合性工具(例如DNA测序仪、寡核苷酸、蛋白质组学领域的许多战略和工具,等等);

·因特网给我们提供了迅捷的全球通讯手段,以及存储和传输大量数据的能力;

·人类基因组计划改变了生物学家研究生物学的视域和实践。具体包括:

(1)以发现为特征的科学带来了整体信息分析的可能性。

(2)生物学是一种信息科学,它有三种主要的信息类型:DNA和基因的数字化和一维结构;蛋白质的三维结构,组成生命的分子机械;生物由各种系统组成,各种系统有丰富多样的行为。

(3)建立了关于生物学信息的高通量定量测量的各种工具(例如DNA阵列、蛋白质组学工具,等等)。

(4)计算机科学、数学和统计学被广泛应用来处理、存储、分析、整合、模建和传播生物学信息。

(5)就像罗塞塔石碑(Rosetta Stones)被用来为解读古埃及象形文字提供了线索一样,各种模式生物体(酵母菌、蠕虫、蝇和小鼠)被用作解读人类复杂的各种生物学系统的工具。这种可能性是建立于这样的理由上的:所有的生命都起源于一个共同的祖先,起源于一些生命最根本的过程组成的基本机制;新陈代谢、信息存储和表达等都是为所有生物体所共有的。

(6)我们将很快就能从一个基因组去解读生命的逻辑(原理)。我们将通过比较基因组学(comparative genomics)来比较分析这种生命的逻辑在各种生物体中是如何变化的。比较基因组学将成为解读人类生物学复杂性的钥匙之一。

系统生物学的概况

生物学系统的系统方法可以非常相似地比拟于要了解我们的医疗卫生系统所需要的那些要素。医疗卫生系统有各种不同的群体:病人、医生、护士、医院、保险公司、政府(劳动和社会)保障部门等。

要认识整个医疗卫生系统,必须弄清楚每个群体中不同的要素(例如病人个人、医生、护士等)之间的关系,这种关系在不同群体间不同,不同要素之间也不同。这种信息必须整合在一起,才能认识该系统是如何运作的。系统生物学也是这样的:要从总体上获得对生物学系统(及其模型)的认识,必须认识清楚生物学信息的类型(DNA、RNA、蛋白质、蛋白质间相互作用、生物分子、细胞、组织等)、认识各种系统中各自不同的要素(例如特定的基因或蛋白质)、以及它们之间的关系;在这些生物学信息中,不同类型的生物学信息彼此不同,同类型生物学信息中不同要素之间也不同。同样地,所有这些信息都必须得到整合。

因此,以下目标是极其重要的:具有整体能力(例如测量某个生物学系统中所有基因或蛋白质)的高通量设施;强大的计算基础设施;还需要发明新的整体性工具来收集不同类型的生物学信息;开发计算工具来整合和模建这些信息。所有这些都是美国系统生物学研究所的工作目标。

在美国系统生物学研究所,研究人员已经开始运用这种(系统的)方法在细菌、酵母、海胆和小鼠等生物体中成功地开始研究了几种不同的生物学系统。

完成系统生物学的目标需要做些什么?

这需要一个跨学科的学术团队,包括有生物学家、计算机科学家、化学家、数学家和物理学家,他们运用各自不同的学科语言来交流和彼此理解,将大大加快开发新的整体性技术(global technologies),并将这些技术与数据收集、存储和整合融合在一起,与计算生物学和数学的分析工具融合在一起。一个重要的挑战是如何使各学科的技术专家获得对生物学的深入认识,同时要求生物学家深入认识各门学科及其技术。另外,技术专家、计算机科学家和生物学家要使用一种共同的语言。这需要建立新的方法来阐述和教学生物学。这些技术必须得到与生物学和医学的整合。

必须为基因组学和蛋白质组学技术建立实际的高通量设施,并且使这些设施应用在技术开发的最前沿。为此,必须加强与学术界和产业界的合作,前者将催生生物学和医学引人入胜的新领域,后者则偏重于各种涌现的技术和经费的资助。

美国系统生物学研究所是个跨学科的研究机构,必须综合各学科的协同工作,才能实现系统生物学以假说驱动的、交替反复的、综合性的、周期性的发展。因此,必须将发现型科学和假说驱动型科学结合起来,达到对各种系统的综合性整体分析。在接近和实现系统生物学目标的进程中,像ISB这样的非盈利性研究机构是现有组织结构的理想代表。

[李升伟摘译自美国系统生物学研究所网站]