“利益相关者合作联盟”的乔尔·卡切尔-格尔圣菲尔德(Joel Cutcher-Gershenfeld)及同事们写道,对50多个协作项目的分析揭示了开放科学得以实现的秘密。
在美国国家科学基金会(NSF)2013年关于地球科学中实物样本再利用的研讨会上,一位青年研究者提及有一位资深科学家曾这样对他说:“我将用冰冷的死亡之手握着自己的硬盘驱动器走入坟墓。”数据库、元数据、模型、软件和其他资源的共享,可以加快科学发现的速度、提高可重复性、扩大经济发展规模。但这需要人们的改变。
科技企业的诸多方面都破坏了共享,使得克服个人的不情愿难上加难。目前,大多数部门、资助者及期刊均认为,数据从收集到出版都是私人专有的。即使科学家个人和机构领导人想要有所改变,也不得不面对来自各方的压力:坚持传统模式的评论者、同事和竞争对手。
就像科学哲学家托马斯?库恩在50多年前记录的那样,科学界一向抗拒对正统的挑战。数据及其他资源的开放共享就是一个典型的例子。保守主义占据统治地位,原因则正如社会学家罗伯特·米歇尔(Robert Michel)在20世纪10年代提出的“寡头铁律”所预测的那样,为了实现某一特定目标而设立的机构通常优先考虑的是持续存在而非其既定目标。我们都经历过“路径依赖”,惯例一旦确立就很难改变。例如,尽管有广泛的支持,但很少有学术部门对终身职位授予流程进行调整以适应跨学科工作。
在过去4年里,我们研究了参与数据共享的10多个科技联盟,分析了44种类似的举措。这些举措实施状况良好,联盟则发挥着催化剂的作用,可以实现成员无法独自完成的事情。然而,科学家们很少有机会了解到设计和管理这种联盟的有效策略。我们从自己的研究工作中总结出促成开放科学的5种方式。
促成开放科学的5种方式
从中间层扩建 2013年,美国科技政策办公室指出,利用联邦基金产生的论文和数据应当广泛开放,以“加速科技创新与突破,促进创业及经济增长。”但这种自上而下的举措并未使情况有所改变。
专业协会、资助者、出版商和学术部门可以在中间层运作,在高层指令与自下而上的行动中发挥调节作用。糟糕的是,传统机构的改变通常速度缓慢,无法创建基本制度使得有远见的举措与日常实践联系起来。
在跨越多种学科、追求独立研究项目方面,各研究机构与团队之间缺乏合作可能是致命的问题。例如,10多年前,为了协调40家研究机构对10万名儿童自出生起进行的追踪研究,美国国立卫生研究院曾发布了“国家儿童研究计划”。这项花费了12亿美金的研究项目于2014年被取消。
一个相对较温和的做法则获得了更大的成效。2014年,美国国家科学基金会(NSF)召开了一次为期3天的会议,大约30家收集、共享及维护有关地球科学的科技数据的机构参加会议。会议日程提出成立数据机构委员会(CDF),但是当协调者问道是否大家均已做好准备起草一份章程时,2/3的与会者给出了否定的答案。NSF资助的机构想要有所突破,而其他部门(如美国能源部、美国国家航空航天局(NASA))资助的机构则大多数想要维护自己的资金或运作,这正是“寡头铁律”的最好证明。
与会者们一致同意由NSF数据机构起草一份“稻草人”章程。该章程考虑了反对者的利益,因而获得了一致通过。于2014年晚些时候成立的CDF推出了一些举措,让信誉良好的作者之间可以共享并重复使用其数据,同时推进通用标准,这是个体机构无法做到的。
联盟可以超越个体机构或团队,引发根本性转变。我们研究的成功的所有联盟,均有助于研究者在超越学科界限和机构阻碍基础上进行互动。联盟在承认各成员独立性的同时,促进了成员之间的相互合作。
构建共享愿景 几乎所有关于团体机构如何改变的模型都强调构建共享愿景的必要性。而这并非科学家团队通常会承担的任务。科学中等级层次的缺乏意味着:强制、自上而下的愿景是难以成功,甚至不可能形成。
如何构建统一的共享愿景,“地球立方计划”(EarthCube)提供了模板。该计划于2011年推出,旨在促进地球与空间科学的共享。目标是研发网络信息基础设施,可供大约20万名地球科学家使用。最初,200多名思想领袖参与了路线图的实践工作,期间凸现的问题是缺乏包罗万象的网络信息基础设施。于是该计划进一步推广至1 500多名潜在用户,在27个特定学科专业研讨会上提出了“客户之声”。科学家意识到,很多原来以为仅仅是自己学科领域方面的忧虑,实际上具有普遍性。
网络信息基础设施专家同各学科领域代表合作一道着手策划实施。2015年,EarthCube开始从推广与规划转向创建工具及资源。随着工作的展开,更多推广与参与方面的需求开始凸现。维护共享愿景的工作永远不会结束。去年,NSF的一位负责人向记者透露,科技在迅速发展,而共享数据的社会化方面则需要一定时间来实现。
调和不断变化的多种利益 利益相关者可以是研究团队、学术部门、专业学会、资助者、出版商或其他实体。通常这些利益相关者之间既有竞争也有共同利益。成功的联盟能够协调利益相关者承认和促进共同利益,欣赏各自的不同特点。这需要各方达成共识、消除分歧。
大量的专业领域可能使数据共享更复杂:每个学科领域都有自己的技术特征、数据结构、分类系统等等。例如,作为NSF EarthCube的一个组成部分,我们自2013年开始对地球科学家进行调查分析。1 500位受访者确认了自己的主要与次要研究领域,以及自己的专业知识结构。他们列出了700多个独特的专业知识领域,如玄武岩地球化学、地球微生物学等等。
与研究河流碳循环的科学家相比,利用声呐来绘制海底地图的科学家会使用不同的工具,讲述不同的专业语言。但跨学科领域的数据共享具有重要价值。例如,一位使用河水泛滥时传感器数据的湖泊学家,可以同规划该河流卫星图像的数据科学家进行合作,并从中受益。EarthCube支持数据工具,因而能够以系统方式去关注所需,以处理不同的术语、技术需求、方法、规范等等。
确切了解各种利益相关者在某一项目中希望达到的目标很重要。2014年,美国超级计算中心的领导与大学的学者、政府机构、出版商等共同创立了“国家数据服务”(NDS),以促进数据共享所需的中介软件(连接系统和应用程序的软件)及软件服务的发展。
他们用6个月的时间构建了一个共享的愿景,但后来发现对于不同的利益相关者来说,该愿景具有不同的含义。例如,科学家想要能够提高其工作效率的工具和方法;而软件开发者感兴趣的则是有机会创建普遍的工具和方法。为服务于日益多样化的客户群体,网络信息基础设施的提供者需要共同的工具,而非定制的解决方案。作为一个整体的联盟,若要不断发展,每个相关利益群体都需要意识到其他群体加入该联盟的不同原因。成功的联盟都能够意识到利益相关者和利益均是动态的。针对实物样本的独特数字标识符的发展正说明了这一点。在数字操作方面更为娴熟的青年科学家是数字标识符的早期使用者;而一些上了年纪的科学家们则倾向于使用毡制粗头笔来标记样本,从而限制了数字共享。随着时间的推移,这一状况将会改变。数据共享计划必须要弥合这些差异,并且要能够适应参与者、需求和技术的不断发展。
为了提高效率,联盟应该定期对利益相关者及其各自利益重新进行分析。为此,我们中的一些人通过NSF的项目成立了一家新的公司――WayMark分析公司,对计划可能产生的影响以及执行后的实际效果进行评估。
扩大影响 联盟可以促成更广泛的合作。例如,数据机构委员会(CDF)与科技出版商之间的合作。虽然很多出版商坚持要求提交的资料文献包含数据,但很少有出版商将数据管理、分享或存储视为自己业务的一部分。因此,出版商通常会接受难以使用的数据包,例如元数据不足的PDF平面文件。在CDF未成立前,提供数据的个体必须要与每位出版商单独签署协议。
CDF与主要出版商合作创立了“地球与空间科学数据共享联盟”(COPDESS),由此扩大了影响。如今,同论文一起提交的数据日益与最佳数据设施(数据的管理及再使用)相匹配,这样既减少了工作又改善了管理,也使其他用户可以访问。
同样,“生物标记联盟”也为利益相关者的合作创建了新的方式。它为各个群体界定了一个竞争前的空间:药品制造商、生物技术公司、监管机构、公共研究机构、学术界、患者利益主张团体和贸易机构。这意味着基本规则的设计与确定。相互竞争的公司需要确保自己不能触犯反垄断法。美国食品药品监督管理局需要在不影响其监管权威的条件下,参与药物研发工具的相关讨论。
“生物标记联盟”迄今已完成了10多个项目,形成可靠的生物学资料数据解析,推进了药物研发及有效治疗。
共同发展联盟使科学与基础设施通过数据共享而实现共同发展。由美国国家科学基金会(NSF)出资成立于2008年的“植物界协作联盟”(iPlant),组建了一个平台,将植物科学家与高性能计算中心联系起来。但起初的状况令人颇感失望:参与人数少之又少。
随着植物科学的不断发展,基因组数据日益需要高性能计算,该平台的使用率急剧增加。事实上,植物学数据以外的其他资源也被证明是有用的。因此,iPlant于2015年开始将关注范围扩大,为生命科学的大型数据库与复杂分析提供基础设施。这是根据科学的发展变化而做出的根本性转变,从而使该联盟的影响不断扩大。
一起行动
成功的联盟可以避免重复工作、发现不足,适应各种各样的变化。“国家数据服务”(NDS)在美国创立两年之后,欧洲和澳大利亚成立了“研究数据联盟”(RDA)。两个联盟共同推进数据共享。起初,RDA担心NDS会做重复的工作。经过6个月的沟通,日益明显的是NDS致力于推进技术,而RDA则致力于体系的构建与完善(共同体产生使用案例,确定所需标准)。
两个联盟的工作有所重叠,但二者在更多方面存在不同和互为补充。在早期,二者的合作受到“寡头铁律”和“路径依赖”的威胁。庆幸的是,两个联盟及时起草了一份谅解备忘录,协调利益、明确互补性。协作可以使每个机构和其利益相关者受益。
科学的协作性在日益增强,但科学的基础(社会及技术层面)则相对落后。开放科学的实现不能仅依靠政策声明、自愿行动或学术部门自身的努力。由多个利益相关者参与的联盟通过遵循上述原则,在促成开放科学方面发挥着至关重要的作用。
资料来源 Nature
责任编辑 岳 峰