要在系统水平上理解生物学,就得考查细胞和有机体功能的构成及原动力,而不能只考查细胞或有机体各部分各自的特征。因此,诸如稳健性之类的系统特性就成了中心议题,而对这些特性的理解则将对医学的未来带来冲击。然而,系统生物学领域所取得的成就要能真正发挥其潜在的巨大作用则要求在实验装置、先进软件和分析方法等众多方面取得突破。

自诺贝尔特 · 维纳(Norbert Weiner)的时代起,系统水平上的理解就一直是生物科学领域里反复出现的一个主题。人们今天重又对它产生兴趣的主要原因是,分子生物学领域的进步,尤其是在基因组排序和大批量检测方面的进步,使我们能够采集到有关系统性能的全面数据并获得基本分子的有关信息,这在维纳的时代是不可能的。当时,分子生物学乃是一门新兴的学科。而现在,对于在分子水平的理解基础之上建立系统分析来说是一个绝好的机会,它必将源源不断地向人们提供新的知识。

系统水平上的理解,即系统生物学所提倡的方法,要求我们转变生物学中“寻求什么”的观念。尽管对基因和蛋白质的理解仍不失其重要性,但焦点集中在理解一个系统的构成和原动力上。因为一个系统不只是一个由基因和蛋白质组成的集合,它的种种特性无法仅仅通过描绘它们之间互相联系的图表而得以完全理解。虽然这样的一张图表代表着重要的第一步,但它类似于一个静态的“路标”,而我们真正想要寻求的是“交通线路图”、出现这些线路图的原因以及如何控制它们的方法。

鉴别一个有机体全部基因和蛋白质类似于列出一架飞机全部零件的清单。尽管这样的清单提供各个组成部分的目录,但就其本身而言,要理解所涉对象包含的复杂性是不够的。我们需要知道这些零件是如何被装配在一起从而构成一架完整的飞机。这类似于给受基因调节的网络及其生化相互作用描绘一幅详尽的图表。这些图表所提供的关于系统某一部分的改变如何影响其他部分的知识是有限的,但要理解一个特定系统发挥作用的方式,我们就必须首先考查各个组成部分在系统运转过程中是如何动态地相互作用的。我们必须寻找下列问题的答案,例如:每条信号线上的电压是多少?这些信号是如何编码的?我们怎样才能排除噪音和外部波动的干扰来稳定电压?线路是如何在系统出现故障时做出反应的?设计原则和可能的线路图形是什么,以及我们怎样才能对它们加以修改来改进系统的性能?

在系统水平上对生物系统的理解可以源自对下面四个关键特性的深刻理解:

系统构成 这些构成包括基因相互作用和生化路径的网络,也包括这些相互作用借以调节细胞内部结构和多细胞结构物理属性的各种机制。

系统原动力 一个系统在不同条件下随时间运转的方式可通过代谢分析、敏感性分析、相图等动力分析方法以及分歧分析加以理解,也可通过鉴别特定行为所包含的本质机制加以理解。分歧分析跟踪系统处于多维空间状态时随时间而发生的变化,其中每一个维度代表有关生化要素的特定浓度。

控制方法 系统控制细胞状态的机制可以把故障调整到最小限度并提供用于疾病医治的潜在治疗目标。

设计方法 修改并建立具有特定特性的生物系统的策略可以在一定的设计原则和模拟基础上制订出来,从而避免盲目的重复试验。

上述任何领域的进步都要求我们对计算科学、基因组理论和检测技术等方面的理解有所突破,并把这些发现与现有知识相结合。

系统生物学领域里由假设所策动的研究。一个研究循环始于对具有生物学意义的对立问题的选择以及创建一个代表此种现象的模型。模型既可以自动创建也可以人工创建。模型代表—系列可计算的需要实验检验和支持的假设和设想。对模型所做的计算“干性”实验——例如模拟——揭示包含于每一模型的假定和设想的计算适度。不适当的模型会以公认的实验事实暴露不一致性,因此需要淘汰和修改。通过该项测试的模型将成为一个可能做出若干预测的详尽系统分析的主体。能够在竞争的模型中辨别正确模型的一组预测被选为“湿性”实验。成功的实验是那些消除不适当模型的实验。虽然这是一个理想化的系统生物学研究过程,但人们希望,计算科学、分析方法、测量工艺和基因组理论方面的研究进展将逐渐改变生物学研究以使这一循环适合于更有系统性的由假设所策动的科学。

对由基因调节的逻辑网络和生化网络的鉴别是一个重大的挑战。建立网络模型的传统方法包括进行一系列实验来鉴别特定的相互作用以及进行广泛的文献查阅。几种旨在建立大规模综合性基因调节网络和生化网络数据库的尝试已在进行之中。虽然这样的数据库是有用的知识来源,但许多网络结构仍有待确定。对表达形式已做了大量的研究工作,其中聚类分析被用来鉴别那些与功能已知基因共同表达的基因。虽然聚类分析有助于对基因和生物现象之间“相关性”的理解,但它并不能揭示调节关系的因果性。一些只需微量数据就可自动发现调节关系的方法已经被提出来。目前,这些方法采用源自mRNA丰度的资料,因此可用于推断以转录调节为基础的因果关系的余地是有限的。转录后和转译后的调节机制必须在能够获得大批量数据时加以合并,但许多特性仍有待以足够的精确性或大批量地加以检测。虽然不可能把全部所要求的数据结合到自动发现系统中,但对转录调节的分析也许能提供非常有用的信息,因为它产生的多种可能假设可供我们推断网络的结构。通常,若自动发现分析产生多个假设,则说明信息量不足。此类分析可以与以平均信息量为基础的决策规则相结合,从而在理论上提出一个最大限度减少含糊网络假设的实验。虽然这样的运算法则有待达到实用的水平,但它们可能证明有用于确定解决含糊假设所需实验的最佳顺序。这一领域的进步将进一步强化生物学(见图)领域里由假设所策动的研究工作。

一旦理解了网络结构,我们就能够详细系统地研究网络的动态特性。事实上,在网络动态特性基础上对原动力和结构的分析是互相交叉的过程,因为动态分析可能产生对未知相互作用的有用预测。对于细胞系统的动态分析,我们需要建立一个模型。但首要的是应仔细考虑建模的目的:无论是为了获得对系统行为的深入理解还是为了预测复杂行为对复杂刺激的反应,我们都必须首先界定该模型的范围和萃取水平。

分析方法的选用有赖于融入模型的生物知识的有效性。只用网络结构就可以进行稳态分析,无须知道特殊反应的速度常数。例如,通量平衡分析(FBA)曾被用来在只知道代谢网络结构的基础上预测大肠杆菌在不同营养条件下代谢路径的转变,这已用实验方法得到了证实。只要对稳态速度常数有所了解,传统的稳定性分析和敏感性分析就能理解系统行为在刺激和速度常数被修改以反映动态行为时是如何改变的。在分歧分析中,动力模拟器与分析工具相联接,因此可以提供动态行为的详细图示。此类分析已经成为动态系统的常规,并已应用于许多对生物模拟的研究。

一旦大量调节线路的网络结构及其功能特性两者都为人们所理解,那么对各种线路的分析和比较研究就将加深对所用设计样式丰富性的理解,以及调节线路的设计样式是如何通过进化被修改或保留下来的。人们希望,强化的深入研究将揭示一个可能的线路进化家族,以及一张功能性调节线路“周期表”。

稳健性是生物系统的一个本质特性。要理解支持生物稳健性的机制和原则,就必须在系统水平上深刻理解生物学。由稳健的系统所表现出的现象特性有三:(i)适应性,它表示对付环境变化的能力;(ii)参数不敏感性,它说明一个系统特定动力参数的相对不敏感性;以及(iii)功能退化,它反映一个系统的功能在受损后所特有的缓慢退化,而不是灾难性地衰竭。在工程系统中,稳健性是通过利用(i)某种形式的系统控制,如负反馈和前馈控制;(ii)冗余性,即引进多个功能相等的组成部分用作后备;(iii)结构稳定性,其中建有促进稳定性的内部机制;以及(iv)模块性,其中子系统在物理上或功能上隔离,以便在一个模块衰竭时不会延及其他部分而导致系统范围的灾难。毫不奇怪,这些在工程系统中使用的方法也可以在生物系统中找到。细菌的趋化性就是一个拥有稳健性全部三个方面的负反馈例子。冗余性可以在基因水平上看到,它的作用是控制细胞周期和生理节奏;也可以在线路水平上也看到,它在大肠杆菌的选择性代谢路径中起作用。结构稳定性提供对负责果蝇体节形成的网络中参数变化的不敏感性。而模块性则在不同规模上得到充分利用,从细胞本身到既分离又相互影响的各级信号转导。

要进行系统水平上的分析,就需要一套全面的定量数据。实施中的计划——如细胞信号联盟(AfCS)——正进行大规模的检测,其最终目标是创建一个详尽的细胞模型。对建模的探索性研究应该在此类计划的最早阶段进行,以确定建立最终模型的检测瓶颈到底在哪里,并避免获得对建模毫无价值的数据,如覆盖面和精确度均不充分的检测数据。

检测的全面性要求考虑三个方面:(i)要素的全面性,即反映可立即检测的mRNA转录产物和蛋白质的数量;(ii)时线的全面性,它代表测量所进行的时间框架;以及(iii)项目的全面性,它指的是多个项目的同时检测,例如mRNA和蛋白质浓度、磷酸化作用、定位等等。基于模型的实验计划规定在什么地方精确性是决定性的,什么地方则不是,以便使资源获得最佳分配。

对生物调节的全面系统分析要求大批量的精确检测,这些目标也许超越目前实验常规的范围。实验装置、单分子测试、使分子相互作用看得见的毫微微激光、以及纳米技术等方面的技术革新都是系统生物学研究的关键方面。例如,微流体系统,也叫做微量-TAS(全分析系统),能对微量(如微微升,即10-12升)的样品更迅速更精确地进行检测。多个用于聚合酶链式反应和电泳的原型已被开发出来。这样的方法不但加速检测,而且促进自动化。

图为在免疫系统机理研究方面作出贡献而获得1996年度诺贝尔医学奖的莱洛伊 · 津克纳吉

软件基础设施是系统生物学研究的另一个关键组成部分。虽然已经为建立模拟软件以及为利用许多原先为一般工程目的而设计的分析和计算软件包作过尝试,但没有共同的基础或标准能使这些资源相融合。系统生物学标记语言(SBML)连同细胞标记语言(CellML),代表尝试制订一个用于以XML为基础的计算机可读模型定义的标准,该标准使模型能在软件工具之间进行交换。系统生物学工作平台(SBW)建立在SBML的基础之上,并提供一个用于系统生物学研究的模块化开放源软件框架。

系统生物学这个概念会给制药行业和医疗实践带来什么样的冲击呢?系统生物学研究最可行的应用是创建细胞调节的详尽模型,焦点集中于特定的各级信号转导和分子,以便系统地深刻理解以机制为基础的药物发现。这样的模型也许有助于鉴别补偿药物的效果并预测系统副作用的反馈机制。甚至可能用多重药物系统把机能失调的细胞引向所要求的状态,而产生的副作用又最小。如果没有细胞内生化相互作用和基因相互作用的模型,就无法合理地预测这样的系统反应。难以想象,美国食品和药物管理局会在某一天下令对治疗药剂进行建立在模拟基础上的筛选,如同要求对所有高层建筑方案进行结构动态分析以确认抗震性能那样。

虽然系统生物学尚不成熟,但它在科学和实用两方面的潜在利益却是十分巨大的。生物学正在发生从分子水平到系统水平的转变,而后者预示着彻底改变人们对复杂生物调节系统的认识,并为这方面知识的实际应用提供重大的新机会。

(参考文献略)

[Science,2002年3月1日]