AI代理人正在筹划聚会,并且互相邀请前往16位虚拟城镇中约会。
“这是一个真实的故事,设计师选中25个电子游戏角色,让他们住在一个小镇上并记录他们的生活……而目的则是了解当计算机不再彬彬有礼……甚至开始变得真实时会发生什么。”
谷歌公司和斯坦福大学的研究人员最近创造了一种全新形式的真“人”秀——用AI代理人代替人类。
研究人员利用OpenAI炙手可热的聊天机器人ChatGPT和一些自定义代码生成了25个具有背景故事、个性、记忆和处事态度的AI角色,然后将他们放入一个16位电子游戏小镇——并且让他们继续自己的生活。那么,当计算机开始变得真实时,究竟会发生什么呢?
研究人员在提交给arXiv的预印本论文中概述了这个项目:“这些AI生成的代理人也是一大早醒来,做早餐,然后去工作,艺术家画画,作家们写作。他们在工作中产生了自己的想法,接着便开始注意到对方并发起对话。他们在计划第二天要做什么的时候会记住并反思刚刚过去的这一天。”
从电视节目的角度上看,这档真“人”秀算不上有多么吸引人,但它的本质毕竟是一个“自言自语”的庞大机器学习算法,从这个角度上说,这档实际并没有任何真人出演的节目已经逼真到令人吃惊的程度了。
25个电子游戏角色所在的这个AI小镇史摩维尔,正是人工智能领域令人着迷的最新发展成果。虽然基本版ChatGPT每次只做一个交互动作——用户写入提示,ChatGPT给出答复——但诸多衍生项目正在努力将ChatGPT同其他程序结合起来,以自动完成一连串任务,其中可能包括列出待办事项清单并逐一检查清单上的项目,利用搜索引擎搜索信息并汇总结果,编写和调试代码,甚至还包括批评和纠正ChatGPT自己的输出。
正是这类级联互动让AI小镇史摩维尔可以顺利运作。研究人员设计了一系列配套算法,它们组合在一起成了这些简易AI代理人的动力机制。有了这些算法,他们才可以存储记忆,才能根据这些记忆进行反思、计划并采取进一步行动。
这一切的第一步是创造一个角色。为了做到这一点,研究人员以详细的提示形式写下一条基础记忆,描述这个角色的性格、处事态度和当下处境。这里有一个从那篇预印本论文中摘录下来的简单例子:“约翰 · 林是柳树市场里一间药房的老板,他喜欢帮助别人。他一直在寻找一种能帮助顾客更方便找到所需药物的方法。约翰 · 林和他的妻子梅 · 林住在一起,后者是一名大学教授,他俩的儿子艾迪 · 林还在上学,正学习音乐理论。”
然而,这样的人物塑造还不够。每个角色还需要一段记忆。为此,研究团队创建了一个名为“记忆流”的数据库,用日常语言记录AI代理人的经历。
访问记忆流数据库时,AI代理人就会拥有与近期经历相关的重要记忆。其中,最“重要”的事件以独立记忆的形式记录下来,研究人员称之为“反思”。最后,AI代理人使用一套不断细化的文本提示来创建计划。这套文本提示将一天分解成越来越小的时间增量,于是,每个高级计划也随之分解成越来越小的子步骤。另外,所有这些计划也都会添加到记忆流数据库中,以便AI代理人随后回溯、检索。
当AI代理人开始一天的工作时——本质上就是将文本提示翻译成游戏中其他角色的行动和对话——他会利用与此前经历、反思和计划相关的记忆流同其他角色互动、对话,从而创造新的日常经历。与此同时,这些新的经历也会反馈到记忆流中。从原理上说,这个过程相当简单,但在ChatGPT的接口与OpenAI的大型语言模型结合后,输出的结果复杂得令人咋舌,甚至可以用“涌现”这个词来描述了。
在测试中,研究团队用文本提示让游戏角色伊莎贝拉策划情人节派对,让另一个角色玛丽亚爱上第三个角色克劳斯。伊莎贝拉还邀请朋友、顾客来参加派对,特地装点咖啡馆,并招募朋友玛丽亚来帮忙。玛丽亚也向克劳斯提到了这个派对并邀请后者同她一起前去。最后,总共有5名AI代理人参加了派对,其他角色虽然收到了邀请,但要么因为不知名的故障而没有现身,要么角色本人做出了不参加的决定。
除了最初的设定——派对计划和角色之间的感情关系——AI角色的其他经历都是自发出现的。论文作者写道:“传递消息、装点门面、互相邀约、前往派对,还有派对上的交流等社会行为,都是由这个AI角色体系自身发起的。”
值得一提的是,上述角色社会行为中的大部分都不难实现,只需要将ChatGPT拆分为各种功能组件和性格组件并使它们协同发挥就可以了。
这类开放式互动最显而易见的应用场景就是电子游戏,特别是在与高保真虚拟角色形象结合在一起后。非玩家角色与玩家之间不再是脚本化的互动,同前者对话会让你肯定地认为他有自己的性格。
另外,研究人员还警告说,在进入这样的互动后,人们可能会倾向于认为这些虚拟角色就是现实人物——实际上,这个趋势已经出现了——为此,设计师必须在互动中采取保护措施,时刻提醒用户这些角色并不是现实人物。其他风险则与一般的生成式AI相同,例如错误信息的传播和对虚拟角色的过度依赖。
就目前来说,这种互动方法可能还不够实用,尚无法在主流电子游戏中发挥作用,但它确实表明,这样的场面很可能马上就会出现。
从整个AI代理人领域来说,趋势也是如此。虽然这类AI互动宣传得如火如荼,但目前真正落地的仍旧屈指可数。不过,将多种算法结合起来、综合运用——再加上插件并接入互联网——的确有可能会创造出能力更强的代理助手,他们可以在文本提示下执行多步骤任务。从长远来看,这种自动化AI应该非常有用,但也会带来算法无法通用的风险,进而导致大规模意外。
现在,最明显的趋势是,生成式AI与开发人员、研究人员你追我赶、互相促进,使得这一领域涌现出各种意想不到的新方向和新功能——这个良性循环,目前还没有显示出任何放缓的迹象。
资料来源 Singularity Hub
——————
本文作者杰森·多里尔(Jason Dorrier)是在线网站奇点中心主编。在转投科技报导领域之前,他从事财经方面的研究和写作。多里尔对一切事物都怀有好奇心,尤其喜欢学习和分享人工智能、计算机、机器人、生物技术、神经科学和空间探索等领域的重要观点和关键进展