即使在单个简单的细胞内,也在进行着难以令人置信的复杂活动;即使在最简单的生物模块中也充满着神奇——也就是说,两个变量间的线性方程确实适用于大量的案例——
英国皇家工程院和英国医学科学院2007年2月共同发布了题为《系统生物学:一个工程和医学的新视角》的研究报告。
系统生物学是一个科学和工程研究上的创新性发展,是对一个生物系统的各组成部分之间的相互联系进行定量分析的新兴的方法学。系统生物学运用系统工程的概念,并通过建立数学模型和试验的方法来研究复杂的生物系统,它通过工程科学中的系统分析以及控制和信号理论,在生物学和工程研究之间架起了桥梁,并将对生物医学、健康护理等很多领域产生着广泛的影响。
为使读者及时了解这方面的最新动态,我们特约上海交大医学院顾敏鸣教授等选译了该报告的总论部分,希望引起关注。
——编者
生物学复杂性的挑战
生物学系统在多种空间水平中展现着其复杂性。人类基因组仅有25000个基因,但能制造10万种蛋白质(许多基因具有多种功能)。即使仅仅考虑蛋白质之间成对的相互作用,也可能产生50亿种化合物。因此,在所有人类基因与其蛋白质产物之间可以想象的相互作用有如此巨大(约有2e166713),以致于地球上40亿年的生命进化过程可通过瞬间的相互作用而加以探测。然而,有些作用比其他的作用更为相似,这是因为进化是一个非常有效的进程:它并不尝试随机结合,而是根据先前存在的定式进行的。
组织和器官是生物学复杂性的下一层次。即使明显相似的器官,如肝脏在系统协作方式中的功能也完全有别于组成器官之细胞的单独行为(细胞本身对周围环境及其与邻近细胞之间的相互作用非常敏感)。如分离出来的肝细胞在营养液中可能存活,但很快会丧失其特有的功能。
更为复杂的是整个生物体,也就是说,它不只是器官和细胞部分的总和。虽然这不是本文关注的焦点,但更高层次的生物学其复杂性取决于生物群落的层次,在那里研究的主题就好像传染病的扩散、生态系统和经济学的多变一样。
生物学的复杂性分割了时间和空间。在以10-9秒为计量单位的分子层面,布朗运动的特性发挥着十分重要的作用,而在整个生物体的层面,系统可能会超过109秒,几乎是人的一生时间。图1所示,在试图理解生物系统时应该考虑空间和时间层面的范围;而系统生物学能帮助揭示生物学的复杂性,提供有关生物系统功能方面的知识。
工程学原理在生物学中的应用
系统理论
诺伯特·威纳(NorbertWiener)的“控制论”一书,建立了在人体内使用系统理论的研究基础;而信号处理则是另一个十分重要的工程学领域,它与系统理论一起应用于包括生理学在内的许多领域。在系统生物学里,系统理论和信号处理能用来认识身体是如何在不同的空间和时间里工作的。
系统理论在用于飞行器控制系统、信息和电讯网络设计的同时,也用于经济学。系统理论的关键要素是前馈环、反馈环和模块性的概念。前馈环指的是系统中为了引发某种行为产生的那部分信息流动。举个简单的例子,驾驶员转动汽车的方向盘以使车辆沿着弯路行驶。这里,驾驶员和操纵装置是汽车系统的一部分。与之对比,反馈环指的系统里监控路况的那部分,即信息反馈到中心点以便监控系统的运行。在这个例子里,反馈环是指驾驶员注视弯道返回给大脑视觉皮质的信息。然后,系统将比较汽车在弯道上的位置,如果有必要,就采取后续行动。
模块性
模块性指的是系统理论和工程设计中的一种能力,它视系统为一整套要素的集合体。上例中,前馈环的组成部分包括驾驶员的大脑和骨骼肌肉系统(第一个模块)、汽车的操纵系统(第二个模块)。在反馈环里,模块由驾驶员的眼睛和大脑组成。不管是工程学还是生物学,系统中常常包括由多个模块组成的多重前馈环和反馈环,这些环在不同的时间和空间层面运转。然而,这类系统常常由一套标准的模块组成,当组合到一起时,就产生了一种特定的功能。
模块性是进行工程系统分析的关键。对系统生物学家而言,一个基本的问题是,模块性是否是自然中的普遍原理,抑或仅是某类生物系统的特性。但基因复制及随之而来的由突变及自然选择产生的修饰则是有机体进化中的基本过程,这些证据有力地支持了模块性的步骤。实际上,生物体稳定地形成再利用系统,与其说这一系统已经存在,倒不如说需要时间进化出一个新的基因产物。
系统分析
系统分析不是简单的计算。在许多情况下,它应用物理学方法寻找“法则”或系统运行的一般原理,其中新陈代谢和等级控制分析就是很好的例证。当然它也是数学的,也就是说它质疑系统的逻辑性,包括制约其运营的因素。最后,它必须与进化的定量理论相一致。需要指出的是,与历史演变中偶然出现的进程相比较,尤其是人们对系统运行的逻辑性问题尚存在着很大分歧。
生物学系统
生物有机体比人类设计的任何机器都要复杂。然而在复杂系统的构成中,工程师使用的方法与器官和整个生物体通过分子和细胞自组装而成的方法非常类似。由于生物系统有着人工系统所没有的关键特性,此类方法在生物学的应用中就需要开发新颖的工程工具。通过自我选择形成的法则和机制,生物系统有着特别超常的自组织和聚集能力。通过组件的周转和更新,生物系统也有着强大的自我维护能力。也许最能使生物系统与其他系统区别的特性,是它们能通过改变基因表达或者更直接地通过信号传导和蛋白质的修饰来适应环境的变化(这种适应在较高等生物中达到了顶点)。
自然界中组成部分之间的互动机制常常是高度随机进行的;也就是说,它很容易受机会的影响,这在仅仅考虑少数组成部分时尤其重要。尽管如此,生物系统仍是健全的。
趋势与驱动程序
系统思想对生物学来说不是新鲜事,历史上它已被用在生理学及其他领域。如今,足够并适当的实验数据加上分子生物学、计算机科学和数学等多学科的整合,促进了系统生物学的发展。下面列举几个关键的驱动力量作一概述。
分子生物学
由人类基因组计划引发的分子生物学革命已经推动着技术进步,简化了对大量生物学参数的实时测量。
如通过使用抗体片段在单个试验中发现和测量数千个基因产物(mRNA)的芯片组(类似的芯片也用于蛋白质分子的检测)。更成熟的技术,如色谱测定法已取得相当大的进展,现在已能测量大规模高通量的分子。这些进展帮助提供了在不同空间和时间的生物学系统的量化信息,并获得更有预见性的模块。
生物信息学
先进的生物信息学在处理和解释过去50年中以分子生物学发展为标志所产生的大量数据时将发挥着重要作用。人们获得了约50千兆与人类基因组有关的数据,但使用这些数据将有赖于把它们转换为可操作性的信息,到目前为止仍是一个巨大的挑战。这方面的成功主要取决于从众多信息中整合成易于理解的形式,以解释复杂生物学系统的结构和功能的能力。
成像
生物学系统在四维空间中的时空构成对功能的发挥至关重要。成像方法的进展已经并将继续对生物学、医学和系统生物学产生重要影响。如成像技术朝着理解体外药物反应的方向发展,并且将系统方法直接应用于临床医学。这就要求整合数学、统计学和生物学知识,如在神经系统领域,生物学家和成像学家之间的紧密联系是基础,而系统生物学将在实验医学中发挥重要的作用。
当前,用收集到的数据来开发测试生物系统行为的模块非常困难。一项关键技术就是高分辨和动态功能成像技术的应用,如从单个细胞中能自动提取动态时间的系列数据。
计算机能力和通信技术
从1994年起,计算机功能持续不断地快速发展。如戈登·摩尔(Gordon Moore)在1965年预测的那样,一块硅片上的晶体管数目每18个月翻一番,并且还将持续下去。通过帮助研究人员建立和使用前所未有的复杂模块,日益增强的计算机威力将促进系统生物学的发展。
由于系统生物学数据的挖掘越来越细致,未来要求的更复杂的计算机完全有可能超越现有计算机的能力。在过去,使用标准的宽带连接从数据库中下载10000张图像需要18天,而现在有了快捷的网络(以每张80秒的速度下载),故下载整套图像比过去快了很多。因此,如分布式处理、联合数据库和网格计算是系统生物学发展所必需的。在分布式计算领域,英国电子技术已经取得了重要的进展(研究成果收录在全国性和地区性的电子技术中心)。这使英国的电子技术在国际上处于领先位置,也证明了拓展基础设施对促进未来系统生物学发展很重要。
建模
“模块”这个词的意思很大程度上取决于它的使用语境。在本文中,“建模”指的是对潜在产生的实验数据过程的预言性建模,而不是对数据本身建模。建模在工程学、数学和物理学方面得到了很好的发展,现在正开始在生命科学中发挥更广泛的作用。系统数学和计算建模是系统生物学的关键,可以对复杂的生物学结构和功能进行预测。
而模块是简化和抽象的再现,用来洞察系统的基本要素,帮助弥补生物学知识的空白。复杂的生物系统管理需要对所有的变量进行实时监控、模拟,以致产生接近于要研究的生物系统的行为。但它的输出范围也许很有限(通过模拟和实验间的重复环以检测和修正模块,图2),因此在系统生物学里,建模是对观察和实验的补充,以加深对所研究的系统内部动力学的认识。
生物学系统环绕在一个大的时空范围内,要求进行特定的量化分析。然而,实质性的不相容仍然存在于数学公式间,并且这是当前系统生物学家面对的关键性挑战之一。
工程设计
工程设计和技术的进步推动了系统生物学前进的步伐。对生物系统进行干预将有助于改善健康,无论是环境因素、药理学因素,还是临床因素都需要认真思考并努力达到利益的最大化和害处的最小化。而技术和工具的改进使系统能在精确的范围内达到限定的效果,可以对复杂的生物学系统进行有效地潜在干预,使更可靠的系统对生物医学进展的效果做出预测,以达到预先设定的临床效果,或至少对生物的不确定性有个量化范围。
建立系统的方法
由分子到细胞
用于分子生物学的系统方法能够在一定序列基因组下对单个细胞的功能进行预测,最终对整个细胞网络的行为进行预测。但在目前,即便对一组产生某种功能的蛋白质信号通道作用的预测仍具有挑战性。系统生物学的进展很大程度上依赖于复杂系统模块的发展;反之,它要求拥有足够准确的有关系统行为的实验数据(自上而下法)和构成分子结构和功能的实验数据(自下而上法)。事实上,将二者的结合也许是最实用的方法(称为“两头发散法”)。如果能这样的话,实验生物学和医学就能从复杂系统的模拟和预测性模块的进展中获益。也许会从当前关注的感官网络建模、细菌产生的研究扩展到多细胞生物体,包括动物和植物。
如今,系统生物学领域关注的是用模块来反映蛋白质之间的相互关系;然而,人们还不知道如何解释要素分子的结构以及其物理特性之间的联系(即便是简单的细胞网络也会展现出其高度复杂的行为)。在活体细胞环境中,空间异质性和简单的非线性动力学都是系统获取的参数。因此,越到高层次,越会挑战等级模块。可以论证,那些包含随机要素的模块也许能在分子水平以及更高水平之间搭建起一座桥梁(模块在描述进化过程中分子要素的行为方面已经取得了成功)。但是,如何设置参数,使它对分子层次和更高层次的有机体都有效,还是个未知数。
全器官建模
对一个复杂器官(如心脏)而言,彻底地由下到上的重建很困难。因此,在对较高层次的生理系统进行建模时,以简化的等式可以表示较低空间层次的活动。这样,在一个较大模块里的子系统就由“黑盒子”表示,它与反馈和前馈环相连,其间有输入和输出。最终,可以使我们详尽地理解这些黑盒子模块的功能。这类模块性可以采用一种由中间向两头发散的方法,从拥有大量有用数据的层次开始分析,然后再往上或往下向两个方向扩展,以研究下一个与之相连的子系统。
所有这三个方法都是必须的,然而有观点认为:至少在近期研究未来的医疗需求时,自上而下和两头发散的方法可能更有用,它能将整个模块的复杂性控制在一定范围内。如钠和钙的移动能通过一组简单的方程来表示。还有一点很重要,不完整的或粗略的模块也有重要的价值,没有必要等到确定了系统的所有细节才来使用模块。实际上,通过建模和先前描述的实验间的重复环,模块可与实验数据结合使用,以便对自身进行修正。
成功的故事
系统生物学在认识医学条件和治疗反应中发挥着越来越大的贡献。作为“生理学组计划”的一部分,一种用于评估尖端扭转性室性心动过速(一种由遗传因素影响的致命心律失常)风险的心脏模型已被开发出来——通过抑制离子通道功能,以延长心脏肌肉的恢复而加以测试。该模型已被美欧监管机构用于药物安全性的评估。
另一个开发成功的模块被用来作为评估COX抑制剂的反应。测试这类药物的血浆浓度、痛觉丧失或慢性炎症的反作用之间的相关性相对较小。因此,预测用于炎症、疼痛治疗的合适剂量有一定难度;但对炎症的内源性介质变化的建模有助于解释用药和治疗之间的关系。