莱维·加拉威回顾了自己的研究生涯,在遇到困难时,严谨性、可复现性和稳定性这三个要素指引他一直走在正确的方向上。

 

http://www.nature.com/polopoly_fs/7.43193.1490614603!/image/Comment1a.jpg_gen/derivatives/landscape_630/Comment1a.jpg

黑素瘤细胞有癌细胞的典型特征:滤泡和微绒

 

  1987年的夏天,我第一次对科学产生了浓厚的兴趣:我试图进行一个有机化学实验,却总是失败。我从实验室走回家,一直在仔细思考着。突然,在我19岁的大脑中冒出一个想法:所有人类生物学现象以及疾病归根结底是体内的一系列化学反应,这些反应或者正确进行,或者出错。在令人沉醉的晚风中,我明白了自己的志向:了解这些机理,从而加快新疗法的开发。
 
  大概每个科学家都记得那样的时刻。我感到痛心,因为目前学术界和工业界有一个看法日益盛行:许多生物医学科学成果是伪造的,甚至发表在顶级期刊上的文章也不例外。
 
  因此,许多科学家的过往研究受到意想不到的详细审查,我也是其中之一。首先是癌症生物学复现项目尝试重复我们团队的工作,癌症生物学项目是独立于高影响力论文的重复实验。在这种情况下,调查第一次重复的编辑解释说,两组实验中控制细胞方法的不同使得这种对比给不出什么信息,没有意义。复制者小心翼翼操作的实验仅能表明复现结果是多么困难。
 
  这个实验以及目前的议论让我开始思考,我们的科学家怎样才能对自己的研究充满信心?而大型科研企业是否会对自己解码自然的群体能力估计过高?如果一个科学家不能重复其他人的工作,这意味着什么?
 
  医生们常说:“如果你没有出现并发症,那你一定没有经过足够多的医疗流程。”以此类推,如果你很少纠结自己的结果是不是正确,我估计你也不是一个好的科学工作者。
 
  许多研究成果令人怀疑,要摆脱这种头疼的境况,研究时应该要注意三个R,这也是高质量科学研究的要素:严谨性(Rigour),可复现性(Reproducibility)和稳定性(Robustness)。它们提醒我们,最初我们为什么要成为科学家。

 

严谨性

  解释科学成果时,需要适度的谨慎,这是理所当然的。不过,事实证明这很难做到。有时,缺少严谨性是因为训练不够所致。至少,常常是源于要考虑的因素太多,变幻莫测。
 
  几年前,在哈佛大学医学院里,我的研究团队令人痛心的经历证明了这一点。我们当时正在利用RNA干扰(RNAi)技术下调基因表达,来筛选对于携带其他驱动突变(例如,对恶性特征来说的必要突变)的癌细胞至关重要的基因。我们找到了一个重要基因,称之为“MFG”。我们在独立的RNAi数据集中寻找同样的关联,而且我们的发现似乎是有效的。接下来,我们运用自认为很巧妙的实验来研究这一机制。
 
  这一发现看起来格外令人兴奋,因为MFG编码一个蛋白,可能因此开发出药物。换句话说,我们自信可以设计出该蛋白的抑制物,而且几乎没有讨厌的副作用。我们获得了研究经费来寻找小分子抑制剂并开展进一步研究。这是我从19岁开始就梦寐以求的!不用说,我们将相关的论文投稿给某个知名杂志。
 
  在等待审稿意见的日子里,团队里一个颇具才华的计算生物学家突然要求与我紧急会面。他在多种其他癌细胞系中检查了新的RNAi筛选数据,发现把MFG沉默之后,突变细胞与其他细胞的行为并没有差别。换句话说,我们激动人心的发现并没有在新的、更大的数据集里得到验证。我傻眼了。这怎么可能?我们已经做了验证分析,还收集了很多有关机制的数据。
 
  我的良师益友、癌症研究人员威廉·凯林(William Kaelin)常说:“你希望的结果就是最危险的结果。”这些结果如此打动人心,使研究人员忽略了其他看来不重要的解释。我们经过慎重的重新评估发现:尽管单个实验的结果似乎是有效的,但是总体来看却不是这样。混合因素包括潜在的偏差,这些偏差来自少量突变细胞系以及我们的后续实验中某些RNAi构建体的超大抑制作用。
 
  我迅速撤回了投稿。还联系了提供研究经费的机构说明情况,对方允许我们更换研究方向。有时在夜里,我辗转难眠,想着如果我们直到论文发表之后才发现MFG的缺陷,那么会发生什么呢?我会如此快地接受新的分析结果吗?我当然希望如此。
 
  过早相信令人兴奋的结果会导致一系列的错误:对某些结果太过于乐观,其实它们的效果很有限;没有包含关键控制;优先考虑产生积极结果的实验模型,反之就不予重视。严谨性的关键是在审查实验结果时保持怀疑精神。这总是有好处的。
 

可复现性

 
  在医学上,区分具有相似症状的不同病症称为“鉴别诊断”。以此类推,有三个问题可以指导对明显不可复现的诊断:一是开展重复性试验是否要具备专业技能?二是系统性的比较能否揭示不一致结果的基础?三是最初结果有可能是错的吗?

 

http://www.nature.com/polopoly_fs/7.43194.1490614411!/image/Comment2.jpg_gen/derivatives/landscape_630/Comment2.jpg

无秩序的细胞分裂是癌症发生的先决条件

 

  要解释第一个问题,思考下面的例子吧:很多证据都显示,泰格·伍兹(Tiger Woods,美国著名高尔夫球手,又称老虎伍兹)在巅峰状态时,能用他球包里最大的那支球杆把球击出260米开外,并且保持这一成绩。我也打高尔夫,我用自己的球杆打球能获得可靠的成绩(有时),而且我的身高和体重都接近伍兹。我非常可能用自己的手再现他的成绩。
 
  多年来,许多高尔夫球手(包括我)在高尔夫行业中投入了无数的资金,都渴望达到老虎伍兹的成绩。不过,我们之中只有很少一部分能达到目的(我不是其中之一)。这是不是证明,老虎伍兹的结果是“错误的”?或者是,他看上去很不错的结果并不能经受独立的检验?当然不是;这说明,只有高水平球手才能一直打出那样的球,而一般的高尔夫球手都不具备那样的实力。
 
  我相信,实验技能不会像赢得绿色夹克(译者注:高尔夫球大师赛冠军都会穿上绿色夹克)所需的技能一样难以捉摸。我只是想强调,当某个科学家的重复实验涉及新的试剂、系统和生物学背景时,我们不能假设他就一定具备重复实验所需的技能,哪怕他再优秀也不行。在重复一个特定的实验之前,缺少必要经验的实验室通常会派实习生去其他实验室学习,跟着定期进行特定实验的科学家一同工作。就算这两个实验室都是彼此研究领域里公认的专家,情况也是如此。
 
  如果已经学会必要的专门技能还是不能重复实验,那么问题多半是出在方法、细胞系性质和试剂的细微差异上,这只能在实验过后才能发现。两个著名的癌症研究人员需要用一年多的时间来调整技术,才能得到一样的结果;成功取决于必要的互访和调节准备细胞过程中的微小差异。
 
  如果还是不能重复实验,我们必须考虑,原来的结果是不是真的正确。我们必须做好准备,接受残酷的现实,做出必要的改正,继续向前。尽管心灵会受到伤害,但是伟大的科学家是乐于以谦逊和优雅的态度拥抱真相的。

 

稳定性

  有时,我们过于关注试剂或实验的细节,但是,真正重要的是切实有效地推论出生命现象的机理。从实验到科学的发现需要优秀科学研究工作的第三个R:稳定性。
 
  稳定性的建立,需要在长时间内积累多重证据。达到稳定性需要严谨性和可复现性,加上耐心和对整体情况的明智注意。
 
  如同严谨性和可复现性一样,我对于稳定性的印象是在一些测试实验中建立的。我领导了近10年的大型合作项目――癌症细胞系百科全书。结果却与癌症药物敏感性基因组学项目报告的结果不一致,这激起了激烈的讨论。这场讨论澄清了以下问题:测量应该如何进行,哪些数据对开发治疗方案是有益的?
 
  我们的团队发表过令人意想不到的成果,这正是稳定性的一个例子,该成果指明了某些恶性肿瘤的弱点。隐匿一种常见基因缺失的癌细胞会变得更依赖某种蛋白,这种蛋白的活性由特殊代谢物调节,代谢物的量在基因缺失呈现时会提高。其他两个大型科研团队同时也发表了类似结果,但使用了截然不同的研究方法。尽管单一的研究或者模型系统有局限性,但是总的来说,聚焦于同样观察的不同数据提供了稳定性。

 

光明的前景

  少年时代的灵机一动是我几十年研究生涯的起点,每每想到这里我还会会心一笑。我没有继续癌症基础研究,因为它的工作内容大多是去操作具体的实验,使其具有重复性(比如,使人恼火的化学反应)。我选择了现在的职业是因为我相信在那里一定有人类疾病的答案,科学把握着发现和应用它的钥匙。
 
  科学家通过理性认知和实验,不断地探索自然的工作原理。谁也不能否认我们积聚的巨量知识还在随时间推移而增加,并且其对社会的积极影响也仍在扩展。无疑,有些数据和模型是不堪一击的,与此同时,我们的理解还会被错误的前提打断或者误导。虽然科学之路崎岖难行,但是坚持三个R可以保证前路仍充满光明。

 

资料来源 Nature

责任编辑 彦 隐

――――――――

本文作者莱维·加拉威(Levi Garraway)是美国印地安纳州波利斯礼来公司全球肿瘤部高级副总裁。