政策制定者对于建议提供者作判断和预测基于的根据一直不重视
许多政府渴望获得基于根据的政策和实践。常规的做法是:听取权威专家的个人建议,或听取由不同专家组成的专家组的建议。例如,世界范围的检疫机构经常依靠专家判断来估计害虫和疾病的侵入、生根和蔓延的可能。
然而,专家意见的准确性和可靠性因有众多认知弱点而打折扣。专家的判断往往受到专家的价值观、情绪(无论专家是否从决策中受益)和背景情况(专家从中获得观点)等因素的影响。专家通常未意识到这些主观影响。专家常享有高度的可信性,但是,他们大大高估了自己的客观性和同行可靠性。
幸运的是,有越来越多的文献描述了有关提高专家判断准确性及判断水平的诸多方法。不幸的是,这些方法很少用于公共政策。所有这些方法是为了:减少心理和动机的偏见、使评价和相关不确定性的获得结构化、兼听各种独立的意见。绝不能依赖于权威专家的建议或缺乏组织的群体共识。
忽略这些方法(即非专业使用专家)将降低信息的准确性,导致更频繁和严重的政策失误。
专家偏见最小化
对于一系列重要问题,专家对事实的判断在政策和决策中起着作用。(我们意识到,政治背景可以确定相关和令人信服的根据的内容,但这些根据很少直接导致政策和行动,因为决策者必须平衡一系列政治、社会、经济、现实和科学的议题。)
决策者往往把专家的根据等同于数据,所以,决策者对待专家的判断应当和数据同样的严格。专家必须是经过检验的,其偏见必须最小化,他们的准确度必须提高,他们的判断必须在具备了独立证据时才有效(见“八种改进专家建议的方法”)。也就是说,专家应该对他们的建议负责。
例如,自信和经常接近正确答案的专家比不自信和背离正确答案的专家提供更多的信息。权威专家作判断时未必强于新手。见多识广的专家的观点可以看得重一些,而某些专家的观点则可以忽略。这些方法可以说明:有些专家建议是稳健的,有些建议是矛盾、自私或误导。这会为决策提供更相关和可靠的根据。荷兰代尔夫特科技大学风险分析研究者Roger Cooke(罗杰·库克)和他的同事已经用这种方法有效改进了有关运输及核电安全政策的预测。
专家自己必须清楚:他们的决定与科学不确定性、科学假定和科学解释等相关。当邀请他们当顾问时,他们应当要求能够运用最先进的技术来获得他们的建议。否则,就可能浪费时间、资源和机会等。
重要的是,各方都必须清楚他们期望从对方得到什么:事实评估、事件结果预测和最佳行动路线建议。在管理得当的情况下,专家可以在事实评估和事件结果预测方面提供帮助。提供建议意味着专家与决策者有相同价值观和目标。
有些方法已显示出可以提高专家在事实评估和事件结果预测方面的绩效。在使用专家来权衡最佳行动路线过程中,研究者本人和政策制定者,应该确定所有可能的变化、选择和威胁,此过程称为水平扫描。政策制定者必须列出所有可能的解决方案,使用不同的专家和大量的参考文献,以减少忽视有价值的解决办法之风险(称为方案扫描)。
决策者的审议应该得到如下诸因素的支撑:证据的系统搜集、证据相关性的评价、知识鸿沟的识别,这些都可能改变决定。整理好信息以便随时使用,而不是当某项政策需要的时候再去整理信息。
专家参与决策的规则
可以使用若干专家参与的规则,其目的是提高专家判断的质量和可靠性。
确保问题完全明确和没有歧义,这样,基于语言的不确定不会模糊专家的判断。例如,像“本地区有多少患病动物?”这样一个看似简单的问题,不同的人可能做出不同的解释。此问题并没有指明是否仅仅包括那些已知患病的动物,或是还包括那些已经死亡、已经痊愈和疑似患病的的动物。
结构型问题格式与个人评估的过度自信相逆。例如,拉特巴大学安德鲁·斯皮尔斯·布里齐(Andrew Speirs-Bridge)指出:清晰说明四个方面的问题可以产生的更好度量的判断。这四个方面是:问题的上限和下限、最好的猜测和信心程度,考虑到不同的情景和理论。必须确保专家回答每个问题。
缺乏组织的群体互动属于“群体思维”;这样的群体倾向于原始甚至武断的评估;举足轻重的个人往往驾御结果;或者是,某些个人由于其外表、举止或专业背景出众,他们的可信度被夸大。而有组织的互动可以避免上述扭曲评估的情况。需要审查假设、调和误解和引进新信息。确保决策者不依赖于专家的选择,而是使用适当的决策工具;其中之一是结构型决策。作此决策的专家填充一张决策表,决策表上有各种政策选择的预期结果的评估,而不是由专家决定最佳选项。
例如,英国布里斯托大学地球科学家威利·阿斯皮诺尔(Willy Aspinall)对火山爆发的风险分析,用的是结构型互动,由此评估质量大大提高;因为他保证以这样的方式让若干专家回答非常具体的问题,从而避免或减轻了有损于群体互动的心理障碍。
同样,澳大利亚墨尔本大学保护生态学家玛丽莎·麦克布赖德(Marissa McBride)主持的一项研究曾得到各组专家的远程参与,该项研究使用了结构型问题和群体互动来评价濒危澳洲鸟类保护现状。研究者采用电话会议方式来概括互动的内容和目的,研究的目的是重新评估国际自然保护联盟红色名录对濒危物种的评估。然后,他们用e-mail说明初始判断和阐明问题,引入进一步的数据和解释。最终,他们分发一份空白表格,收取第二轮个人的匿名判断。
以上所述的策略在许多情况下可以改善决策,大大提高专家判断的可靠性,相对减少个人偏见和价值观的影响,时间和资源成本也不大。
资料来源 Nature
责任编辑 岳 峰
改进专家建议的八种方法
使用专家组 专家组评估往往胜过个人评估。
谨慎选择专家组成员 专家评价一旦超出了专家个人的专业或经验,其水平急剧下降。
不要被明星吸引 年龄、出版物数量、技术资格、经验、学会会员以及貌似公正等因素均不能说明专家评估未知数据或者预测事件之能力。从核安全系统的研究到地缘政治学研究再到生态研究,我们的这一发现均适用。
避免同质化 不同专家组倾向于产生更准确的判断。
不屈服于某一方 不太自大和汇集不同信息的人趋向于做出更好的判断。
重视各种意见 用测试问题来调整专家的表现。这样可以在包括地震和核安全系统在内的许多领域提高风险评估水平。
培训专家 培训可以提高专家在事件概率、数量或模型参数等方面的判断能力。
给予反馈 国际象棋棋手、天气预报员、体育人士、冒风险者、重症内科医师和解教科书上问题的物理学家等,一般能作出精确的判断,这可能是因为从可见和个人的错误中得到快速反馈的结果。专家们应该得到同样的对待――获得直接和明确的反馈。