《魔鬼经济学》(Freakonomics,亦译为《怪诞经济学》)一书出版已有六周年了,此书通过统计学和经济学领域内的一些概念和观点尝试探索现实世界中的一些问题。该书问世之初立即走红,成为一部非小说的畅销书。到2011年,全球销售量已超出400万本,并衍生出系列作品,包括续集《超级魔鬼经济学》(SuperFreakonomics);《纽约时报杂志》开设不定期专栏;一个热门博客以及一部以此为题材的纪录片等。
 

莱维特                  杜伯纳

 

  《魔鬼经济学》是芝加哥大学经济学教授史蒂文·D·莱维特(Steven D. Levitt)和著述颇丰的畅销书作家、新闻工作者史蒂芬·J·杜伯纳(Stephen J. Dubner)的联袂之作。前者擅长利用统计数据和资料阐述一些通常与经济学看似无关的问题,后者则对莱维特以及他的追随者的作品进一步加以完善。
 
  “魔鬼经济学”一词代表了一种轻松有趣或有违常规,以及严谨可量化表达的看世界的方式。该书问世之后,人们对通俗经济学或通俗统计学流派的兴趣大增,许多作者在其影响下,开始尝试采用这种轶事趣闻式的叙事风格。
 
  然而,作为统计学的任课教师意识到如何引起人们对这一学科兴趣的挑战,而不是重复一些一成不变的陈旧例子。但挑战的另一方面是不流于简单化,并在不误导读者的情况下以有趣的方式将一些观点呈现给人们。我们和其他人还注意到,《魔鬼经济学》以一种确定的口吻提出一些猜测甚至不正确的观点,这是令人不安的。但是,这对于那些希望普及统计学思想的人来说,对这些问题的思考将是很有助益的。
 

对个案逐个进行分析

  通过对《魔鬼经济学》叙事方式的分析,我们发现了一系列可以避免的错误,从分析方式的过于粗略,到对莱维特的朋友和同事作品的盲目信赖,不加详查等。读者必须加以辨别,哪些研究结论是有充分量化依据的,哪些是只有一些数据资料,哪些只是纯粹的猜测。
 

作者作品的形成过程难以确定。但《魔鬼经济学》系列作品的形成过程似乎过于线性化,导致无法对原稿进行足够的检查或审查。例如,在《超级魔鬼经济学》中,经济学家莱维特信任他认识或尊重的研究人员,杜伯纳信任莱维特,并一起合作写成此书。编辑也信任作者书中的论述,将此书提供给读者,而读者们也信任《魔鬼经济学》的品牌效应。尽管在这一过程中有许多机会可以进行反馈以发现非专业人员难以辨识的错误,或对一些有改进余地的地方提出建议

 

  男女比例失调问题  莫妮卡·D·古普塔(Monica Das Gupta)是世界银行的研究员,她与这一领域的其他一些人认为,亚洲一些国家男婴出生率偏高是因为人们对男孩的偏爱,这体现在选择性流产,甚至弃婴等现象上。芝加哥大学教授艾米莉·奥斯特(Emily Oster)对这种观点提出了挑战,在发表在《Slate》的一篇文章中,杜伯纳和莱维特对奥斯特的研究表示赞赏。在莱维特担任编辑时,奥斯特的研究论文发表在《政治经济学》杂志上,文中写道:对中国、印度、巴基斯坦、埃及、孟加拉国和其他国家乙肝发病率进行调查统计时,发现这些国家的男孩出生率之高超出正常水平。调查发现,乙肝发病率最高的地区也是男女比例失调最为严重的地区。
 
  奥斯特的论文在流行病学领域内引发了几年的辩论,最终她承认,之前这一领域内专家的观点是正确的。古普塔以图表显示,在中国台湾,一胎和二胎的男女比例最接近于自然增长率,为106:100,但第三胎的男女比例则明显偏离了自然增长率,为112:100,无论有无乙肝流行,这一模式都是成立的。
 
  莱维特在后续的博文中,对奥斯特勇于承认错误的行为表示赞赏,但却一直未提及古普塔的研究成果。我们在这里并不是说古普塔就是正确或是错误的,我们想要说的是,莱维特和杜伯纳在为他们的经济学和经济学家的成就感到欢欣鼓舞之时,暂时放弃了批判性思维的研究方式。
 
  驾车与步行的风险  在《超级魔鬼经济学》中,莱维特和杜伯纳利用粗略的统计数据,称醉酒驾车比醉酒步行更安全。这一论断和其他类似的论断,其问题在于,假设驾车者和步行者是同一类型的人,所不同的只是他们选择了不同的出行方式。这种“除此之外都等同”的思维方式是一种常见的统计学上的谬误。事实上,驾车者和步行者除了出行方式不同之外,可能还有其他许多不同之处。这些看似顺理成章的计算结果,在现实生活中,会因为某个变量的变化而导致实际是行不通的。
 
  明星人为,而非天生  2006年,莱维特和杜伯纳根据佛罗里达州立大学心理学家K·安德斯·爱瑞逊(K.Anders Ericsson)的研究,在《纽约时报杂志》上写了一篇标题为“明星人为,而非天生”的文章。爱瑞逊认为,精英是由许多人为因素造就的,而不是依赖于与生俱来的天赋才能。一项惊人的观察研究提出,欧洲精英足球运动员很可能都出生在一年的前三个月里。这一理论的依据是,青年足球联赛是以出生日期的12月31日为截止日而分为各年龄组,教练自然会在各年龄组里选择出生月份较大的孩子。由此导致了一个令人瞩目的结论:许多世界杯球员的生日都比较早。作者写道:假设你是一个狂热的足球迷妈妈或爸爸,你的孩子要是出生在一个错误的月份里,对你来说可能是个坏消息。但如果你的孩子在五月初某个周日受孕,他可能会在明年二月份出生,那么在2030年世界杯时,你的孩子驰骋绿茵场的机会会更大一些。
 
  也许读者并不会认真地去咀嚼这些话的意思,但是,如果我们按照这些话去做的话就会发现,尽管它隐含着统计学上的意义,但其生日效应的影响其实是非常小的。三年之后,作者在《超级魔鬼经济学》中重新探讨这一话题时也坦承了这一点,指出7月31日是美国棒球协会的截止出生日期,8月出生的男孩比7月出生的机会更多。但是,他们继续提出,男性本身就比8月出生更为重要;还有,拥有一个职业棒球联盟球员的父亲比其他男孩的机会要大得多。环境因素确实是一个比先天天赋更为重要的因素,如果这些因素是成就未来体育明星的关键性决定因素(如此多不确定因素的存在),那么所谓的“出生月份成就体育明星”的结论也就站不住脚了。
 
  预测恐怖分子  在《超级魔鬼经济学》中,莱维特和杜伯纳引用了一位化名为伊恩·霍斯利(Ian Horsley)的英国人的理论。霍斯利创建了一个算式,他认为,根据人们的金融活动可以“嗅出”恐怖分子嫌疑人的蛛丝马迹,并以简单的计算方式显示了该算式的“伟大的预测能力”。
 
  该算式先从一个拥有数百万计银行客户的数据库开始,霍斯利从中产生了大约30个高度可疑之人的名单。根据他相当保守的估计,在这30人中至少有5人几乎肯定参与了恐怖活动。从30人中确定5名嫌疑人的算法,仍然是不尽完美的,很有可能漏过了其他恐怖分子,也有可能错认了无辜之人。
 
  假设这一算法的准确率达99%,他们设想的恐怖分子嫌疑人如果真的存在,那么英国5000万成年人中,可能有50万人被误指为恐怖分子嫌疑人。因此,正如安全问题专家布鲁斯·施奈尔(Bruce Schneier)所指出的那样,以99%的准确率来预测恐怖分子是愚蠢的行为。
 
  在这段有趣的叙述过程中,读者可能没有注意到这一点,即抓捕恐怖分子的失败率:假设在逃恐怖分子有500人,而被这一“伟大”算法发现的只有5人。莱维特和杜伯纳承认,30个里找到5个“不尽完美”,但如果他们能够考虑到霍斯利“不尽完美”算法所产生的严重后果,他们可能就不会宣扬这一理论了。
 
  气候变化问题的讨论  诠释他人的研究比解释自己的工作更具挑战性,特别是涉及到你本人专业领域之外的话题。在《超级魔鬼经济学》中,气候变化的章节就是一个很好的例子,莱维特和杜伯纳在书中对“地球工程”的观点进行了评论。“地球工程”是微软前首席技术官内森·梅尔沃德(Nathan Myhrvold)首创提出的气候整治概念。遗憾的是,在自己驾轻就熟的研究领域之外,莱维特并不比我们更有资格对梅尔沃德的建议妄加评置。
 
  芝加哥大学气候科学家雷蒙德·皮尔胡伯特(Raymond Pierrehumbert)对莱维特和杜伯纳关于气候问题的论述提出了质疑,而莱维特则反驳皮尔胡伯特对这一章节的“故意误读”。在涉及自己的观点或研究成果时,人们往往很容易采取一种先发制人的态势来悍卫自己的成果。但如果将不同的观点看作是一种有益的参考,而不是一种威胁,将有助于消除批评意见给我们带来的不快。如果你想涉及你专业知识之外的题材,那么你将付出的代价就是引出第二种,第三种或第四种不同观点或批评意见。
 

存在问题与解决建议

统计分析普及化的理想过程包括许多非线性的步骤,图中所示就是例子之一。普及宣传者对研究人员进行采访,对相关数据的加工整理和对证据的反复论证思考,或单独进行或与信赖的编辑一起修改并成文,最后将它传递给公众。这是一个动态的过程,是普及者不断发现和揭示新问题的过程

 

  何以一位经验丰富的记者和广受尊敬的经济学家会在许多问题上出错呢?以下建议性的答案也许能给一些准通俗统计学作家提供一些参考。
 
  不要为人际关系所左右  我们认为许多的错误源自合作的方式,依赖于非正式的社会网络关系有可能带来许多潜在的故障点。《魔鬼经济学》中的大部分内容,最早刊登在《纽约时报杂志》的专栏上,而他们的合作关系似乎更简单:杜伯纳信任莱维特,《纽约时报杂志》信任杜伯纳,而读者信任《纽约时报杂志》。在《超级魔鬼经济学》和作者的博客中,也可以看出莱维特信任梅尔沃德或奥斯特等人,杜伯纳信任莱维特,读者信任的是《魔鬼经济学》这一著名品牌。科学写作更为理想的过程,如图所示,可能会显得很杂乱,但它有望提供更好的结果。
 
  不要低估自己  也许莱维特的谦虚令人钦佩,他一再将自己的成功归于幸运和努力,而不是天赋。但正是这些将他引入了歧途:莱维特觉得自己周围有许多更杰出更出类拔萃的经济学家,觉得自己难以挑战他们。请记住:如果你发现自己犹豫不决,觉得自己准备提出的一些问题似乎很“愚蠢”,那么不妨大胆一些,但不要超出经过验证证据的范围之外。
 
  维持制衡关系  牢固的合作关系需要双方的互相制衡。就之前所叙述的几个例子来说,在涉及一些专业技术问题时很可能会产生一些分歧,虽然我们无法肯定这一点。最有争议的地方往往最有可能导致谬误,若是听之任之,不予争辩,将会导致一系列以讹传讹的结果。聘请专业的编辑人员,对一些技术问题详加评估,是避免出现令人尴尬或错误的又一种方式。
 
  从容不迫的态度  成功是要付出代价的。在博客或网站发表文章会受到内容连续性的约束,书籍出版发行则受到截止期限的约束,这些都有可能对一些信息资料的准确度产生不利影响。《魔鬼经济学》最重要的部分都围绕着莱维特自己的同行评审研究,相比之下,魔鬼经济学博客主要以莱维特一些朋友的文章为主,而《超级魔鬼经济学》很大程度是以一些奇闻轶事、新奇技术的报道以及莱维特的朋友和同事的工作成果为主。正像严谨的科学研究需要时间,严谨的著述也需要时间,如果能够记住这一点,即使在面对最后期限的情况下,也有助于抵御在未对资料信息进行查证的情况下作出简单化结论的诱惑。
 
  明确自己的定位  莱维特曾获得马萨诸塞州技术研究所博士学位,拥有芝加哥大学经济学教授称号,担任过《政治经济学》主流杂志的编辑,是美国律师基金会的研究员,以及担任公司决策机构的顾问工作。也许,他所任职的这类机构并不都是他的本行,但经济学是他的主流,包括他的统计方法也是传统的。而《魔鬼经济学》一书的阅读乐趣之一,是莱维特擅长在一些不为人注意的隐蔽角落寻找有趣的话题,如作弊的相扑选手等。通常这类问题未被广泛研究,甚至未曾引起人们的注意。在这种情况下,人们往往急于想达成某种共识,但在探索新的领域时,重要的是要明确哪些是引自别处的观点,哪些是自己的观点。
 
  言论自由中的责任  当统计学家对某个技术问题提出批评意见时,他或她所称的发现其实并非是错误的,而是认为它没有得到有力的证明。当然,研究人员――包括莱维特所认可的经济学家――都可能会犯错误。在追求理解世界这一更大目标的过程中,偶尔的出错也许无可厚非,但这种将科学视为似是而非的轶闻,或者在一些数据支持下所作的推理而不进行详查验证,正是莱维特同行审查论文的典型特点。
 
  通俗统计学书籍如今呈现更加多样化的趋势,莱维特和杜伯纳的畅销书系列给这类书籍引进了许多新的元素。一些作者玩弄概念,或另辟蹊径自成一家往往会给人们带来乐趣。但在传媒传播过程中,对朋友和同事不加置疑地予以信任,以及对一些问题有悖常理的论述,已经对一些工作造成了损害。他们,或者其他任何希望向大众普及经济学和统计学的人,都需要考虑如何避免在任何给定的例子中以偏概全,这就需要莱维特对他的朋友或同事的研究取不盲目采信的态度,杜伯纳对莱维特也是一样。
 
  “通俗易读”并不意味着“轻易写就”,即使是“轻易写就”的东西也并不总意味着“通俗易读”。读者对于《魔鬼经济学》中提出的结论不能盲目采信,我们鼓励人们以不轻信的态度和求索的心态重新审视这些现代经典,希望通俗体裁的统计学作品在继续传播统计推理重要性的同时,继续让人们体验到统计学的乐趣,并更清楚地认识到科学研究领域内固有的不确定性和复杂性。
 

资料来源 American Scientists

责任编辑 则 鸣

______________________

本文作者安德鲁·格尔曼(Andrew Gelman),哥伦比亚大学统计学教授,冯启示(Kaiser Fung),纽约大学统计学教授。