语言人工智能以效率弥补它们缺少的人性。

13.1

计算机和信息科技曾经被褒奖为一场教育革命。它们带来的益处是不可否认的。它们能给学生提供远远超过一本教科书的海量资讯。它们能让教育资源变得更加灵活,可以针对个体的需求进行剪裁,它们能让学生、父母和教师之间的互动变得快捷方便。假若没有视频会议,各家学校在疫情居家期间该怎么办?

AI聊天机器人和大型语言模型——譬如开放人工智能公司(OpenAI)去年11月推出的ChatGPT——的出现创造出更多新机遇。它们能给予学生练习题、答案及反馈,评估作业,减轻教师的负担。比起谷歌搜索给出的不甚准确、时常令人糊涂的信息垃圾,它们的交互性质对于学生而言更具激励性,而且它们能应对特定的问题。

但是,大型语言模型也“应该会让英语教师忧心忡忡”,研究数字素养的英国谢菲尔德大学教授詹妮弗 · 劳斯尔(Jennifer Rowsell)告诉我。ChatGPT能为懒惰的学生写出一篇像模像样的作文。它不是从互联网上寻找一篇文章,再原样复制一遍,而是重新构造一遍——而且假如你希望,它会给你炮制出第二篇文章、第三篇文章,一直到你满意为止。一些教师承认,ChatGPT的产物常常好得足以得到很高的分数。在《纽约时报》的一篇报道中,一位大学教授证实,他已经逮到一名学生以这种方式炮制出一篇哲学作文,而且拿到班上最高的分数。中学人文学科教师丹尼尔 · 赫曼(Daniel Herman)在《大西洋月刊》中写道:“我的生活——以及数以千计的其他教师、教授、导师和行政管理人员的生活——即将发生翻天覆地的变化。”他认为ChatGPT会让当前的教育体系付出“沉痛的代价”。

学校早已在进行最后一搏。纽约市教育部门计划在纽约市公立学校中对ChatGPT 下禁令,然而那阻止不了学生在家中使用ChatGPT。一位公立学校的社会研究教师丹 · 卢尔(Dan Lewer)在国际版抖音(TikTok)上提出,教师该要求从家中提交作业的学生同时提供一个短视频,学生在短视频中重新叙述他们的论文和证据。卢尔说,这应该就能确保“学生真正学习了材料,而不只是在线上找一些东西,当作业交掉”。

开放人工智能公司的研究人员在执行一些方案,试图给ChatGPT的输出结果加上“水印”。譬如说,让它挑选的词汇藏着隐含的统计特征。苦恼的教师以这种方式来检查一整个班级的作文的难易程度如何?这就不太清楚了——而且这个方法也许会遭到暗中破坏,比如把ChatGPT的输出结果放到其他语言学习软件中“翻译”一遍。在这场作弊学生与教师比拼的数字时代军备竞赛中,我不会奢望教师能始终领先一步。一些人早已做出结论,如今课外写作作业完蛋了。

但ChatGPT提出的挑战不单单关乎抓作弊者。现在,比起许多没有一点儿真正思考或理解的学生,人工智能能产出更优秀的文章。这个事实应该推动一些反思。我们打算教授的最首要的东西是什么。赫曼说,在他看来,青少年需要发展基本写作技能不再是显而易见的事——在此情况下,教师面对的问题变成“这是否仍然值得做”。

ChatGPT能生成超过尚可水平的文章,不是因为它十分聪明,而是因为达到目标的路径十分明确,这么说并不是要贬低它令人印象深刻的算法工程。那是一件好事吗?劳斯尔说,许多教育专家长期以来都感觉需要改变英语的教授方式,但她承认:“教师们发现,凭着我们知道了这么久的东西,要做出可观的改变十分困难。我们完全不知道该如何以别的方式教书。”

13.2

作弊者的好朋友?

给予ChatGPT一条作文提示,譬如玛丽·雪莱的《弗兰肯斯坦》如何影响女性主义科幻叙事,然后它会至少给学生提供一个作业的起点。继续给予提示,然后你就能完成作文

语言AI也许迫使事情走到不得不解决的最后关头。 “科学已经向前飞跃,我们的素养教育却不知道如何解决问题。”劳斯尔说,“但我们已经认识到,我们不会对抗AI——我们要理解AI,与它协作。经典的写作和ChatGPT没有不能合作的理由。也许这会催化我们在教育领域不得不实施的改变。”假如是这样,应该首先考虑一下语言的用途是什么。

从AI诞生的最早期起,就已经出现能使用自然语言来交互的算法。麻省理工学院的计算机科学家约瑟夫 · 维森鲍姆(Joseph Weizenbaum)讲述了1960年代时,他的一名同事如何与一个叫作Eliza的这类程序发生一段怒火四射的远程交流,并以为自己实际在与情绪反常的维森鲍姆本人对话。

Eliza这样粗糙的语言程序能愚弄一个使用者,这揭示了我们生来就多么容易误以为不具备心智的死物拥有心智。直到近期,关于语言使用的算法依然倾向于交付一些平平无奇的文章,除了充满无前提的推论和文法错误的笨拙用语,就没剩下什么东西。但是技术的进步——计算能力的指数增长,2010年代中期“深度学习”方法的出现,一直扩张的线上数据可供挖掘——已经产生拥有几乎毫无瑕疵的句法的系统,能提供让人毛骨悚然的智能幻影。ChatGPT已经被夸赞为一股改变游戏规则的力量。它能完成各种各样的有趣把戏,譬如糅合资料来源和文体类型:用英王钦定本《圣经》的文风来写一篇鱼肉馅饼食谱,或者写一首关于阿尔伯特 · 爱因斯坦和尼尔斯 · 玻尔对量子力学的争论的五行打油诗。

这些大型语言模型技术有着明显的危险之处。我们几乎没有和一个能如此强大地模拟思维却又不拥有思维的信息源打交道的经验。算法冷淡的命令式语气能被用于几乎任何用途,或者被予以滥用,自动生成表面上有说服力的冗长屁话(更确切地说,是用表面上“客观”和更得体的格式把人类早已生成的内容重新包装)。

算法也终究还是很“懒惰”的。当我给ChatGPT布置一个作文任务,要它从女性主义视角来概括《弗兰肯斯坦》的情节,ChatGPT似乎没有查阅这个主题下的庞大学术成果,而是转而提供一系列生硬和老套的、几乎与小说无关的比喻:它“能被视为对当时父权制社会的一个注脚”和“女性常常依据她们的容貌而受到评判和品评的方式”。它大概会对《傲慢与偏见》说出同一番话。

给予大型语言模型更好的提示的话,也许能避免一些这类缺陷——不过要给予一个真正尖锐、有信息量的回应,使用者也许需要对主题有深入了解,那样的话,写作文无论如何都不会造成挑战。但是追根究底,这些缺点反映出一个事实,即算法根本没有追踪用女性主义研究《弗兰肯斯坦》的文献,单纯只是在寻找与提示文字相关概率最高的文字和短语。像所有深度学习人工智能一样,它挖掘可获取的数据库(也就是从线上资源“凑集”的文本),获取关联和模式。假如你让它写一首十四行情诗,你多半会见到更多像“永远”“心”和“拥抱”之类的词汇,而不是“螺丝起子”(除非你要求它写一首关于螺丝起子的十四行诗,是的,我承认我这么做过,结果不怎么好)。算法不知道“爱情”和 “拥抱”是语义相关的。ChatGPT令人印象深刻的地方在于,它不只能将这些词汇联想的句法弄得平顺,还能创造出文章脉络。我认为,“你是让我始终被紧紧拥抱的螺丝钉”这样的诗句不太可能出现在人类创作的十四行诗中(有很充分的理由)——但是我依然感觉印象深刻,因为你能看出它的用意所在。(ChatGPT也能写俏皮话,不过它写出那样的诗句的责任在于我。)

对于事实性的提示,从这种概率性大杂烩中浮现的文本一般都表达一致的实情。这保证排除了任何特别具争议的观点,因为按照定义,只要它们不是一致的共识,它们就会有争议性。问一个大型语言模型,是谁杀害了约翰 · 肯尼迪(John Kennedy),答案会是李 · 哈维 · 奥斯瓦尔德(Lee Harvy Oswald)。但ChatGPT时而也会创造出随机的虚假陈述。在它给出的我的生平介绍中,它把我的年纪减掉两岁(我对此没意见),还给我虚构了一段早期从事制药业的经历(很古怪)。

假如ChatGPT生成一篇可信的作文,那是因为我们在给予学生们布置一个相等的作业:给出一些大家普遍赞同的事实,外表呈现一定的连贯性。学生的作文写作早已倾向于公式化,达到几乎像算法一般的程度,可以概括为“观点-证据-解释-联结”或“观点-证据-分析-上下文背景”。学生不仅被告知该把什么内容放置在哪儿,而且假如他们偏离模板的话,他们会有被扣分的风险。当前的教育体制奖励一种循着可预知的路线论辩的能力。艺术专业学生被派到画廊临摹著名画作,在没有“必须是原创”的负担和不切实际的要求情况下,学习技法,那么做在一定程度上合乎逻辑。

但这是我们想要的一切吗?劳斯尔说,教师或教育学家甚至很难面对这个问题,因为教育体系成员们的工作通常继续依照“这是我们一直以来的做法”这句话。譬如说,对于英文草书教学的深入研究揭示,没有让教学超越传统的明显理由。但是,也许现在是问出这个棘手问题的正确时刻。

我推想,我作为一名非正式教育工作者——1980年代时,我在一所监狱里教电脑课程,而且我一度在家里给小孩上课——我的本能是科学家的本能:从解释一件事如何运作开始,从它的部件开始。“在你弄懂它之前,你无法很好地用上它!”我脑内的声音说道。但是,当我向服刑人员学生们列举他们不熟悉的电脑元件时,一名学生最后插嘴道:“我甚至不知道如何开机!”

我理解,有些时候,学校的学生们对于语言学习的感觉一定有点像我的囚犯学生们对于电脑的感觉,他们被告知不熟悉的部件名称(名词、嵌入式子句、前置状语、CPU、RAM、比特和字节),同时想着“但我不想知道如何使用它”,但ChatGPT似乎让所有的基础都变得多余,正如一般的电脑使用者无需对写代码或移位寄存器有半点儿了解。英文写作呢?有个手机应用就能完成。中学人文学科教师赫曼担心,学生们也许倾向于依赖语言AI来满足写作需求,正如许多人现在会认为,在有实时流畅翻译AI的年代,学习外语纯属浪费时间。

我如今领悟到,我当年教服刑人员电脑的内部工作机制,是因为我喜欢这些知识。我猜测就算他们中有人也喜欢那些知识,也是寥寥无几的——但他们正确地看出,使用电脑的能力将会在他们的人生中变得很重要。我想要我的子女也喜欢语言的运作方式,喜欢语言所能做成的事。但可以这么说,他们首先需要知道如何“开机”。语言的开关不是名词和动词的区别,也不是从属子句的放置,而是更为基本的交流过程。

当我们学习好好使用语言时,我们不只是接受遵从某个模型的训练。那些句子或文章建构的模板并不遵从某种要求词汇、短语和论证符合特定排列的文学定律。不管它们可能有多么粗糙和公式化,最终它们之所以存在的原因是它们能惠及读者。换言之,阅读是一个有着自身动态特征的认知过程,写作者能够促进或阻碍这个认知过程。有时候,只要把一个词移动位置,让它符合阅读者的认知过程,就能把一个令人困惑的句子改造成明白易懂的句子。这个过程一点也不神秘。好的交流是一项能够学会的技能,就像标点法一样。(标点法本身的存在也是为了协助良好的沟通交流。)

这需要的就是共情:写作者的一项踏出他们的头脑,进入阅读者头脑的能力。对于事实文本,追求的写作目标通常是表达清楚。对于小说,优先考虑的也许是其他方面:甚至是阻止阅读者一下子就读懂,这不是武断专横或故意作对的做法,而是为了在含义于阅读者的头脑里具体化时,给予他一点儿惊讶和欣喜的悸动。音乐用旋律和节奏做了相同的事,这也是音乐使我们感动和兴奋的一部分原因。莎士比亚因为他的倒装句而闻名:他将正常的语序重排,从而吸引读者,或许是为了强调,或许纯粹是为了字谜带来的刺激。在更大的尺度上,小说主要是一门有控制地披露、在恰当的时刻揭晓信息(不能早也不能晚)的艺术。

究其本质,语言是心智与心智之间的联结。一个由语言学家丹尼尔 · 多尔(Daniel Dor)提出的语言起源学说主张,语言不是因为简单的交流而产生的,而是因为“想象的指示”才产生。语言使得我们能向前进,超越苍白的、类似动物发音的命令与警告句式,把一个心智的内容投射给另一个心智。

这对语言AI蕴含了什么?正是因为大型语言模型的算法没有交流目标——它压根不明白什么是交流,也不懂拥有听众的意味——它才没有向我展示语言能做成什么事,语言被发明出来完成什么事。它会熨平莎士比亚古怪的语言学花招。它会在捕捉修辞工具时宣告失败,而一位优秀的历史学家用上那些修辞工具,能让她的研究令人记忆深刻又具说服力。很难预见一个语言模型如何才能真正地变革,因为那与它被设计履行的任务恰好相反。该任务就是模仿、模拟以及——按照一名统计学家的提法——回归均值,任务的产物往往就是令人思想麻木的单调文章。

语言的使用与单调乏味恰好相反,年轻人尤其如此。年轻人在语言交谈和线上对话中表现的形式创新数不胜数,甚至是相当欢乐的。进步主义教育者渴望利用线上世界的多模态,但一直在努力琢磨明白如何利用。至关重要的是,Z世代(指1990年代中后期至2010年代前期出生的人)理解媒体,与传播打惯交道,依赖于共享观念、标准和参考点的假定。假如在教育中为语言使用的这一面留出空间,那么它也许会不受AI殖民的影响。

无可否认的是,大型语言模型提出许多伦理和法律难题。互联网和许多其他形式的深度学习AI(譬如深度伪造和面部识别)也提出过种种难题。我们设法对付这些问题,学会与之共存。一些人相信,将对于基于AI的文章写作的恐慌搁置一边,大型语言模型最终会变成另一种工具,或许适合放在Excel电子表格的单调功利主义和数码摄影的创造可能性之间的某个位置。

毕竟,书面语言本身往往是一个工具,一个达成目标的手段。这不意味着我们需要学习仅仅粗糙地使用它。但它意味着,ChatGPT之类的AI如今能提供的东西不仅对于某些用途早已足够,可能甚至会价值无限。读写技能不足的人们早已在使用ChatGPT来改进他们的求职信或电子邮件。一些科学家甚至在使用它在投稿之前润色论文。可以说,这些AI能将语言民主化,正如音乐软件已经将音乐制作民主化一样。对于那些英语技能有限,却需要专业化写作的人士,这项技术能帮他们填补差距。

而且正如电子计算器解放学生的时间,释放那些曾经被独占的心智空间(那时不得不学习对数来解决复杂乘法运算),大型语言模型或许也能解放学生,让学生不必掌握拼写、句法和标点符号的细微差别,那么他们就能重点关注建构有力论证或在句子中发展韵律和多样性的任务。

与此同时,大型语言模型缺少想象力、风格和鉴别力,这使得它们对小说作家构不成威胁。“AI真正难以模仿的,是写作的美学维度。”劳斯尔说。但正是这点,能让它们成为一个重要的新工具。

譬如,我猜想,让学生润色改善ChatGPT输出的乏味文章,这会让学生明白是什么让一则故事或一篇文章变得生动。或许就像一些音乐家在使用生成音乐的AI作为一个丰富的原材料来源,大型语言模型也提供思想的内核,写作者能予以筛选,在此基础上继续雕琢。

AI举起一面映照我们自身的镜子,以它的短处揭示出那些无法被自动化和算法化的东西:换言之,就是什么构成人性的内核。

资料来源 Nautilus

————————

本文作者菲利普·鲍尔(Philip Ball)是英国著名科学作家,他的《预知社会:群体行为的内在法则》《好奇心》《图案密码》《明亮的泥土:颜色发明史》《如何制造一个人》《量子力学,怪也不怪》《我们为什么听音乐》《水:中国文化的地理密码》等著作都有中译。