1_副本

李正风

清华大学社会学系教授,清华大学科技与社会研究中心主任

本期专稿《大语言模型时代的科学生产新范式》以arXiv、bioRxiv和SSRN三大预印本平台的大规模数据为基础,考察了大语言模型(LLM)对科学论文产出的影响,揭示了三个核心发现:LLM显著提升了研究者的论文产出率,非英语母语者尤甚;语言复杂度作为论文质量信号的效力正在失效甚至逆转;AI辅助搜索拓宽而非收窄了文献发现的路径。

值得注意的是,科学知识生产是一个复杂的系统工程,从问题发现、假设生成、实验设计、数据收集与分析,到同行评审、知识传播,AI的渗透远不止于论文写作环节。这一视角上的局限,恰恰为我们进一步思考AI对科学事业的全面影响提供了重要起点。科研生产力的提升可能源于生成式AI在多个研究任务中的应用,同时,从“AI科学家”到AI辅助的高维数据模式识别,研究方法本身正在被重构。要充分理解AI对科学生产新范式、新格局的重塑,需要充分认识到AI渗透科学知识生产网络的深度与广度。

尽管该文揭示的只是更大变革的一个切面,却引导我们注意到一个重要的事实:AI对科学生产新范式的塑造,伴随着对科学研究传统认知的不断挑战和反思。AI作为新型的认知技术,不断实现对人类认知过程的“技术性替代”。以往在科研过程中被高估的因素,如英语写作技巧、语言复杂度等,可能与科学研究的质量并无本质关联。以技术的手段突破这些技能或技巧上的约束、缓解其差异之后,科学生产的格局将发生重大变化,比如非英语母语学者的科研生产力得到更大程度的提升。与此同时,包括科学研究质量的评判标准也会面临新的挑战。随着LLM的改进和AI技术的不断发展,以及将AI整合到科研工作中的新方式,AI“技术性替代”对传统科学研究过程的挑战、反思和重塑可能会更加广泛和深刻。为此,当下和未来的科学事业必须与不断迭代的人工智能技术保持同步。

同时,这项研究也为科学社会学与科技政策研究提出了若干需要深入探讨的新议题。第一,科学知识生产的全球格局将如何演变?文章发现姓名具有亚洲特征的学者在采用LLM后获得了最显著的生产力提升,暗示AI正在重塑科学劳动的全球分工。但这种新格局是否可以持续?当语言门槛降低,其他形式的不平等(如数据获取、计算资源、机构网络)是否会变得更加突出?第二,学术不端行为的重新界定。LLM对人类认知行为的“技术性替代”的边界在哪里?文章的检测方法几乎可能会漏检那些对LLM生成文本进行深度编辑的使用行为。这一技术局限背后是更根本的规范问题:什么程度的AI使用是“辅助”,什么程度的“替代”是可接受和需要规范的?当AI可以独立完成大部分智识工作时,作者身份意味着什么?现有的科研诚信框架是否需要重建?第三,如何平衡科学研究的速度与质量。科研生产力大幅提升意味着文献增长将进一步加速。该文乐观地指出AI帮助研究人员克服了认知局限,使其能够更充分地探索不断扩展的科学文献领域。但这种扩展是否是有限度的?科学文献的快速增长是否带来科研质量的降低?科学系统如何在“快”与“好”之间找到平衡?这些都需要科学共同体、政策制定者和公众的共同关注与审慎应对。