自我纠错是科学的基本原则。其中最重要的形式之一便是同行评审,即研究成果在发表前交由匿名专家仔细审查。此机制是对学术文献准确性的保障。当然,这样的纠错也总出差错。
目前有许多来自民间和官方的力量都致力于识别问题论文、完善评审流程,并通过撤稿或停刊等方式净化科研记录。但这些工作都有局限性,且需耗费大量资源。
人工智能,或将为学术评审事业注入强大动力,成为帮助科学自我纠错的专家里手——那么,当AI全面、深度参与论文评审的那天到来,你我对于科学的信念将会更清澈,还是产生更多摇摆呢?
同行评审越发力不从心
近几十年来,数字时代与学科多元化发展共同助推学术论文和期刊数量爆发式增长,传统的同行评审作为科学可靠性的主要保障已越发力不从心。与此同时,多方力量都在为科研诚信做出贡献。
媒体平台《撤稿观察》(Retraction Watch)专注于追踪被撤回的论文及其他学术不端行为。以“数据可拉达”(Data Collada)为代表的学术侦探组织则专门揭露数据与图表造假。
调查记者们持续曝光企业势力对科研的干预。新兴的“元科学”(科学学)领域正尝试量化科研流程,揭示其中的偏见与缺陷。
并非所有劣质的科研都产生大影响,但有些确实危害深远。这些影响不仅限于学术界,往往还会渗透至公众认知与政策制定。
哈佛大学的科学史学家内奥米 · 奥雷斯克斯(Naomi Oreskes)与同事近期发表论文称,他们对一篇被广泛引用的草甘膦除草剂安全评估报告进行了审查,发现文章本身看似独立而全面,但孟山都公司诉讼案曝光的文件表明,其真实作者为由孟山都的员工,发表刊物有烟草业背景。
孟山都是一家来自美国的农业生物技术公司,于2018年被拜耳收购。由于其生产销售的草甘膦除草剂农达(Roundup)导致大量使用者罹患癌症,孟山都面临一系列诉讼。
然而即便真相曝光,该评估报告仍持续影响全球范围内的文献引用、政策文件乃至维基百科词条。
当此类问题被揭露后,公众会就此展开热议,但大家未必认为这是科学界做出了成功的自我纠错,反而可能将其视作“科学崩坏”的证据。如此负面的论调有损公众对科学的信任。
我们需要全新的论文纠错机制或工具,AI此时介入恰似雪中送炭。
人工智能已开始助力学术监督
关于自我纠错所需的技术工具,过去的主要应用一直是查重系统。但局面正在改变:ImageTwin和Proofig等机器学习服务能对数百万张图表进行扫描,检测是否存在重复、篡改或AI生成的迹象。
自然语言处理工具可标记出“别扭的措辞”(tortured phrases),即论文工厂特产的怪词怪语。而像“语义学者”(Semantic Scholar)这样的文献计量分析平台则能追踪论文被引用的语境是支持性还是反驳性的。
随着AI——尤其是越发擅长数学与推理的代理式新型AI模型——持续演进,未来它还将有能力识别更隐蔽的学术缺陷。
例如,“黑铲项目”(Black Spatula Project)正探索如何运用最新AI模型大规模查验已发表的数学证明,其核心在于自动识别易被人类评审忽略的代数矛盾。前文提及的奥雷斯克斯等人的工作同样高度依赖大语言模型处理海量文本。
若获得全文访问权限与充足算力,这些系统很快就能对学术文献展开全球性的审查。全面审查很可能会发现一些明目张胆的欺诈,以及大量充斥着匠气与常见错误的平庸之作。
我们尚不清楚学术欺诈的确切比例,但可以确定的是,有大量科研成果实际上无足轻重。科学家对此心知肚明,正如他们对那些鲜少甚至从无引用的出版物习以为常一样。
对大众来说,认识到学术的平庸可能与发现欺诈事件同样令人震惊——因为这与主流媒体关于科学发现的那种戏剧化、英雄主义叙事相悖。
颠覆与重塑,崩坏或革新
要维护好公众的信任,就必须以更透明、更务实的方式重新定义科学家角色。当今多数的科研工作都是渐进式的,往往与科学家职业生涯相绑定,扎根于教育传承、导师培养和公众参与。
要对自己和公众保持诚实,就必须摒弃那些驱使高校、科学出版商乃至科学家本人夸大研究成果的功利机制。真正具有开创性的工作本就凤毛麟角,但这并不意味着其他科研毫无价值。
相较于将科学发现描绘成个人英雄式的壮举,更平和、更诚实地认可科学家作为集体认知进步贡献者的形象,或许更有利于帮助学术界经受人工智能的审查考验。
一场跨学科的全面审查即将降临学术界。审查的发起者可能是政府监督机构、智库,也可能是企图削弱公众科学信心的企业。
科学家其实可以预见到诸多结果。若科学界做好了面对AI评审的准备,甚至主动去引领浪潮,这场关于学术成果的大调查或许还能激发体系的革新。但若迟疑不决,AI揭露的裂痕就可能被曲解为科学事业的崩坏。
科学的力量从来不在永不犯错,而是敢于纠错、乐于修正。
资料来源:
AI will soon be able to audit all published research – what will that mean for public trust in science?
END












