研究人员指出,衡量论文与数据的开放共享所带来的社会经济影响是一个难题。

4.2

开放科学运动——旨在推动论文、数据和软件等科研成果免费获取与重复使用——是否真能带来其支持者所宣称的益处,比如加速科学发现、提升公众科学素养?一项针对这一复杂且具有争议性的议题开展的多维度研究给出了“有条件”的肯定回答。

例如,开放获取文章在其他学术论文和专利申请中被引用的频次更高。参与科研项目的普通民众,即所谓“公民科学家”,受益于开放科学模式,也对其协助探讨的主题有了更深入的了解。

这些结论均出自“开放科学影响路径”(PathOS)项目方发布的研究成果。但负责开展这项分析的欧洲跨学科团队强调,他们几乎没有找到确凿证据证明开放科学直接对科研产生了持久且广泛的影响,或带来许多经济与社会效益。

开放科学领域的学者高度赞扬了该团队的研究成果。欧洲科研资助机构联盟“科学欧洲”(Science Europe)的秘书长莉迪亚 · 博雷利-达米安(Lidia Borrell-Damián)表示:“像这样对开放科学进行全方位剖析的研究并不多见。这是一项非常诚实的分析……但(证据方面)确实存在不足。”

PathOS项目协调者、希腊雅典娜研究中心的经济学家伊奥安娜 · 格里帕里(Ioanna Grypari)表示,对于未能找到更多证据证明开放内容带来了可衡量的效益,研究团队感到很意外。但他们得出结论:要撇开内容质量等其他因素的影响,梳理清楚学术文章或数据的免费开放是否会对后续的重复使用和影响力产生可测量的影响,是很有挑战性的。而且,目前缺乏对照试验,用户访问公共存储库时一般也不会表明身份信息或使用方式。不过,格里帕里强调:“到项目结束时,我们得以明确我们尚未知晓的具体问题所在,并知道了如何在此基础上进一步推进,以便未来能逐步攻克这些未知领域。

二十多年来,开放科学的支持者一直在宣扬其益处,论文作者们已向出版商支付了数十亿美元,用以推动论文的开放获取。如今,新发表的科学论文有半数可以立即免费阅读,而2000年这一比例还不到1/4。此外,还有一些专项资金被用于建立覆盖诸多领域(从蛋白质序列到海底沉积物)的公共数据库。但政策制定者,尤其是欧洲的,越来越多地提出了疑问:开放科学运动是否产生了实效?

开放科学领域的学者表示,PathOS项目通过创造性地将宏观定量分析、文献综述与精细的定性方法(包括焦点小组访谈和6个多样化的案例研究)相结合,为探索该问题开辟了新路径。例如,一个小组通过分析显示访问者域名的服务器日志,探究了法国学术论文公共存储库HAL的用户构成,发现来自计算机、公共管理和出版等多个行业的用户访问总量,几乎与教育机构用户的访问量持平。

科廷大学的独立研究者卡梅伦 · 尼隆(Cameron Neylon)表示:“PathOS这种将微观与宏观、局部与整体联系起来的系统性分析方法让我感到相当兴奋。”他并未参与该项目。

2021年,联合国教科文组织(UNESCO)呼吁全球共同努力以评估开放科学的影响。PathOS项目成员、奥地利格拉茨研究机构“知识中心”(Know-Center)的信息科学家托尼 · 罗斯-赫劳尔(Tony Ross-Hellauer)在UNESCO的一次会议上指出,相关研究通常周期太短,且过于关注对引用次数和开放获取文章数量的统计。“我们不能再执着于那些容易量化的指标,而应关注真正重要的东西。”

为了填补证据方面的空白,PathOS团队自2022年起开展的一些案例研究开始用新的方法来分析引用情况,以评估免费资源对后续研究、经济和社会的影响。例如,其中一项研究分析了2020至2021年间发表的超过11.5万篇关于新冠的研究论文,这些论文均分享了新的开放数据集或软件代码。在排除了多种因素的干扰后,PathOS团队发现,那些有证据表明其数据集或软件代码后续被他人使用的论文,平均而言在专利申请中被引用的频次也更高,且论文作者建立的产业合作更为广泛。

但是,这些数据集或软件代码被重复使用的论文,并未因此在临床指南或临床试验报告中获得更多引用。PathOS团队推测,之所以出现这种情况,或许是因为临床医生对使用可能影响患者安全的研究内容持谨慎态度。不过,在这批数据集或软件代码被重复使用的论文中,有些在疫情早期发表且质量较高的,往往在临床试验报告中被引用得也相对较多。研究团队据此得出了一个结论:开放数据或代码更多发挥着扩大高质量研究影响的作用,而非产生影响力的独立驱动因素。

PathOS团队总结道:强制推行开放科学可能产生负面影响——费用方面越来越多的抱怨就是明证。这些费用是作者或其资助方为了使期刊论文能够免费阅读而需支付的。但团队也发现,数据的开放获取可能会带来经济回报。一项案例研究分析了通用蛋白质资源库(UniProt)的使用情况。这是一个带有注释信息的蛋白质序列数据库,其用户节省了原本需要从其他来源挖掘信息的时间,而节省的这部分时间超过了他们投入在访问、更新和注释UniProt数据上的时间。PathOS团队估计,用户节省的时间总价值相当于其投入时间价值的7倍,每位用户每年的净收益在3513至5475欧元之间。

格里帕里表示,这项研究以及其他PathOS案例研究都表明,数据集在易用性方面差异巨大,因此有必要加强对数据集的治理。目前来看,许多数据集缺乏必要的软件代码和其他信息,致使用户无法有效利用这些数据。

普林斯顿大学研究开放科学的图书管理员阿米特 · 多希(Ameet Doshi)希望看到更多像PathOS这样的研究,以了解是谁在使用公共数据或论文存储库以及他们是如何使用的。他表示:“获取科学家等群体的直接反馈非常重要,因为信息的用途如此多面,且高度依赖具体情境。”例如,在2022年的一项研究中,他和同事分析了下载美国国家科学院、工程院和医学院(NASEM)报告的用户留下的100多万条评论,发现超过一半的报告被用于非研究目的,包括帮助退伍军人申请伤残福利,协助医院牧师提升工作质量,等等。

为了帮助资助方与科研机构更一致地评估开放科学的影响并判断相关投入是否“物有所值”,PathOS编制了一本手册,确定了31项评估指标。项目负责人表示,有几项指标仍有待完善,例如那些将开放科学实践与经济增长以及社会整体效益相关联的指标。

多希指出,随着部分公众获取此类免费资源的需求日益增长,评估开放科学的利弊正变得越来越重要。他强调:“(让可靠的研究成果)更广泛地可及,有助于对抗信息环境中那些更具污染性的部分,如信息茧房和社交媒体的负面影响。PathOS项目就是一个极好的开端,希望未来能有更多研究关注开放科学的影响评估和使用情境。”

资料来源 Science