伴随着科学技术的进步,疾病的实验室诊断逐渐从最初的组织形态学观察向细胞与分子诊断水平发展。与此同时,单一的生理、生化或免疫学指标用于疾病诊断、病情观察的局限性也显得日益突出,无法对疾病复杂的动态过程进行有效的评价。因此,如何以疾病的复杂多变为出发点构建生物标志物综合诊断模型已成为检验医学发展的当务之急。以下从代谢组学的角度阐述相关的数据分析手段,并对其在临床疾病诊断中的应用作一介绍,为进一步探索医学系统生物学的临床应用打下基础。

 

医学系统生物学

  系统生物学是将生物学、医学、数学、化学与生物统计学、生物信息学相结合的一门学科,其研究方法逐渐被应用于微生物学、植物学和医学领域;而医学系统生物学则被定义为一门将基因、蛋白、代谢、细胞、信号通路等因素进行整体系统分析的生物研究科学,其主旨在于以系统的思维方式、系统的策略考虑和处理问题。对于医学系统生物学而言,所涉及的人体标本主要是体液,必须经过深入的研究才能发现在整个人体系统中多种成分通路之间的相互联系,而对动物模型或单个细胞的研究而言,其标本来源具有多样性和易操作性,因此在分析的前期阶段即可获得多种信息路径之间的相关性。
 

代谢组学的分析工具

  核磁共振(NMR)和质谱(MS)技术的不断进步使得其在代谢组学方面的研究具有不可替代的作用。其中NMR引入了强磁场(目前达到900MHz)、冰冻探针和微量样本检测等新技术。与600MHz情况下使用标准探针相比,NMR强磁场(800MHz)下使用冰冻探针的信噪比可以提高15-20倍。因此,数据收集时间大大缩短,并且实现了13C NMR波普法等技术在代谢组学研究中的应用。此外,通过高分辨魔角旋转核磁共振技术(HR-MAS)检测的波普可以获得人体组织代谢物浓度的相关信息。
 
  最新一代的傅里叶变换-离子回旋共振质谱分析技术(FTICR-MS)具有很强的量子跃迁能力,可用于高分辨要求的代谢组学分析。FTICR-MS技术具有高通量的特点,可同时检测上千种代谢物,但是该技术不能有效地辨别异构体。另外,毛细管电泳质谱技术也可用于代谢组物图谱分析,该方法灵敏度高,可以检测低峰度代谢物,在枯草芽孢杆菌中可以检测到1692种代谢物。
 

代谢组学数据采集与分析

  数据采集
 
  代谢物可以通过与对照样品的比值进行相对定量,但这种定量方法不能进行不同样品间量的比较。通过添加标准参照物以及对代谢物进行同位素标记,可以获得绝对定量的代谢组数据集。此外,数据采集的重复性以及采用何种数据处理方法对代谢组分析结果的影响很大。不同样品的同一个变量应具有相同的特征与含义,因此NMR产生的峰漂移的差异会影响数据的分析。一个常用的方法是将光谱区域内的信号进行整合存储,或者对峰进行自动识别排列。如Stoyanova等利用PCA(principal-component analysis)消除了位置噪音,Forshed等应用基因算法确定错误排列的NMR光谱。
 
  数据分析
 
  一旦获得代谢组的定量数据集,可以采用已在转录组、蛋白质组分析中得到应用的多种数据分析策略进行代谢组数据分析,这些分析策略的基本原则是比较实验组与对照组之间代谢物水平差异,并利用统计方法评估这些差异的显著性。利用这些分析方法即可以研究某些代谢物在不同样品间的表达相关性,并利用这些相关性构建相互关系网络;也可以对整体代谢物进行分组研究。
 
  代谢组数据的分析离不开化学统计学的应用,基于预测方法的多变量分析是分析代谢组研究产出的复杂数据的一种有效方法,其中PCA是一种将原始特征压缩至最小可能性成分数的维数缩减方法,即用较少的综合性变量代替原来众多的相关性变量,使有关的研究简化。PCA已成为代谢组研究中最常规的分析方法,在这方面有许多应用实例。
 

代谢组学在疾病诊断中的应用

  新陈代谢是生物体的基本特性之一,通常处于动态平衡中。大多数疾病可引起体内代谢物水平发生变化,通过检测代谢物水平即可确诊某些疾病。“诊断代谢物组学”通过分析体液组成,运用计量学方法对疾病组和正常组进行分类,利用Supervised类型分析方法获取疾病诱导产生的特殊代谢产物“生物标志物”(biomarker),帮助了解病变过程中机体代谢的改变,辅助临床诊断和治疗。以往对于疾病的诊断主要是检测与疾病相关的一种或几种生物标志物,随着代谢组学相应的分析手段和数据处理技术的发展,代谢指纹分析已经成为快速、高通量的分析诊断方法。
 
  循环系统疾病诊断
 
  冠心病(CHD)的发病率逐年上升,虽然目前通用的数字减影血管造影法(DSA)确诊率高,但创伤大、花费高、副作用多、操作繁琐。Nicholso等研究证明,基于36个病人的小样本代谢组学研究所建立的代谢组学诊断模型,以冠脉造影作为金标准,应用NMR技术,结合主成分分析法(PCA)、软独立建模分类法(SIMCA)、偏最小二乘法判别分析(PLS-DA)等模式识别技术,建立了判别心血管疾病及其严重程度的新诊断方法,优于传统的血管造影术。灵敏度及特异性高达92%和93%,且能够显著区分不同病变程度患。
 
  消化系统疾病诊断
 
  Marchesi等提出,应用高分辨NMR分光检定的代谢组学方法诊断肠炎,具有快速和非侵袭性的特点。研究中发现患者粪便中丁酸盐、醋酸盐、甲胺和三甲胺含量较正常人有所降低,而氨基酸水平有所升高,揭示肠道菌群改变和吸收障碍,有助于肠炎的早期诊断和发病机制的进一步阐明。另外,Yang J等基于HPLC-MS/MS技术对肝脏疾病的诊断进行代谢标靶研究,以尿液中核苷酸类代谢终产物为分析对象,结合PCA软件分析了肝炎、肝硬化和肝癌病人尿液中顺二醇式结构的代谢产物谱,能够有效地将肝炎、肝硬化患者从肝癌患者中区分开,基本避免了临床诊断中的假阳性结果,使肝炎、肝硬化误诊为肝癌的概率下降到7.4%。
 
  泌尿系统疾病诊断
 
  Psihogios等对77例经肾组织活检确证为肾小球肾炎的患者进行研究,应用基于1H NMR的代谢组学技术评估小管间质的损害程度,通过对尿液样本中柠檬酸、马尿酸、甘氨酸和肌酐等代谢物的含量测定,可以准确区分小管间质轻、中、重等不同程度损害。该方法敏感性和特异性高达96%和99%。另有报道表明,利用代谢组学技术研究肾小管s3段损伤性化合物氯化汞和六氯对二甲苯,发现随着肾小管s3段损伤的加剧,尿中乳酸、羟丁酸盐、马尿酸盐、肌酐和酮戊二酸显著升高,提示这些成分可作为肾小管S3段损伤的生物标志物,有助于对肾脏疾病的早期诊断。
 
  肿瘤的诊断
 
  代谢组学技术从机体的动态代谢途径寻找肿瘤标志物,有助于肿瘤的早期诊断,使治愈肿瘤成为可能。许国旺等用毛细管电泳方法(CE),通过代谢靶标分析,以尿中l3-l5种核苷浓度为数据矢量,用PCA法处理数据,对分别患有l0多种癌症的68位癌症患者和54位健康者进行分类研究,识别率达72%。对用HPLC测定的206位正常人和296位肿瘤患者尿中l5种核苷排放水平进行研究,也得到类似结果。采用人工神经元网络软件对数据进行处理,肿瘤患者的识别率可达83%。该项目已通过中国科学院组织的鉴定,被鉴定为达国际领先水平。
 
  其他疾病的诊断
 
  随着代谢组学的深入研究,基于NMR的代谢组学技术正在探索应用于其他体液检测和疾病诊断中。1H NMR检测关节腔内的滑膜液,有助于骨关节炎、类风湿性关节炎及创伤性关节炎的鉴别诊断。1H NMR对精液的分析,可以帮助诊断输精管梗阻导致的精囊闭塞以及非梗阻性不育症。代谢组学技术还应用于艾滋病的研究中,Hewer等应用1H NMR检测患者血清的代谢谱,结合模式识别方法,发现血清的代谢谱能够将艾滋病阳性和阴性患者区分开来,有益于艾滋病患者的早期药物治疗。
 

本文作者邓安梅来自第二军医大学附属上海长征医院

(参考文献略)