近些年,深度学习(DL)和语言模型(LM)的发展可谓日新月异。
从谷歌的BERT与OpenAI的GPT开创大语言模型(LLM)新局面,到聊天(自然语言处理)高手ChatGPT带给大众切实的AI震撼,再到眼下DeepSeek的R1模型搅动行业风云。
人工智能的上限会在哪里?我们与AI的互动会否进入更深层级?未来机器的智能将演化出何种形态?
未来诚然不可预知,但人类总在基于现有知识去推理、前瞻、预测未来,恰如AI模型基于旧有推理新事。
2025年的AI领域可能涌现怎样的浪潮和趋势——美国未来学家艾米 · 韦伯(Amy Webb)对此颇有观察与想法。我们不妨跟随她的视角,来展望2025年人工智能的新动向。
虽然未来还不好预知,但对AI来说,给蛋白质造就一段未来还是容易的。根据《科学》杂志在1月份的新报道,蛋白质语言大模型ESM3已能处理用蛋白质的序列、结构和功能相关数据构建起的“生物学语言”体系,学习蛋白质演变规律,模拟数亿年的演化,生成/设计全新的蛋白质。
相较于专攻结构预测的?AlphaFold等工具,ESM3是多模态、生成式的AI,是能创造“蛋白质文本”的语言处理者。
研发团队表示,交给ESM3的训练素材包括31.5亿个蛋白质序列、2.36亿个结构数据以及5.39亿条功能注释,设计任务则是基于少量结构信息推理得到全新的绿色荧光蛋白(GFP),结果表明,ESM3生成了一种与已知最接近的GFP序列相似度仅58%的esmGFP——若自然演化,其诞生需要超过5亿年时间。
许多观察人士认为:2024年会成为人工智能发展的分水岭,而在2025年,这个领域会继续凯歌高奏;企业可能开始把AI视作一种能提升竞争力的实用工具,不再只是新兴技术。
艾米·韦伯是美国咨询机构未来今日研究所(Future Today Institute)创始人兼CEO
在艾米 · 韦伯看来,2025年有望见证更多科幻般的AI技术成为现实,以及人工智能结合生物科技与先进传感器的浪潮,推动“生成式生物学”(generative biology)发展,将大语言模型(LLM)推向“大型动作模型”(LAM),给人类带来“活性智能”(living intelligence)。
如前文所述,ESM3模型基于已知蛋白质的海量信息创造了新蛋白,将5亿年演化浓缩于一问一答之间。这只是生成式生物学的一个典型案例。2024年11月,《科学》还报道过能创作遗传密码的AI。
那就是基因组基础模型Evo,基于StripedHyena架构,接受过270万个进化程度各异的原核生物和噬菌体基因组的训练,深刻理解并掌握DNA、RNA和蛋白质语言,能够预测微小DNA变化如何影响生物体的适应性,生成真实基因组长度的新序列,设计新的生物系统。Evo是第一个在全基因组规模上、以单核苷酸分辨率预测和生成DNA序列的模型。
韦伯在自己的前瞻性报告中援引上述案例,并畅想了生成式生物学的无限前景。“我们可以生成新的生物学,这意味着治疗疾病的新方法、应对气候变化的新方法、解决全球粮食短缺问题的新方法……”
此外,韦伯也很期待AI带给材料领域变革。
谷歌DeepMind曾于2023年底推出材料发现工具GNoME。这款AI历经材料数据集的训练,擅长发现新材料,已经帮助研究团队发现了220万种理论上稳定的新晶体材料,这相当于近800年的知识积累。“其中38万种已经投入实验室开发,有望为未来技术提供动力。”韦伯说道。
如果说AI+生物学的组合已经初露峥嵘,那么AI+传感器的潜力以及LLM→LAM的革命就仍在概念阶段。韦伯相信,未来的LAM可以借助传感器等设备采集关于人类运动、情绪、欲望和需求的各种信息,可以分析人类及其周围环境,从你问我答一清二楚的对话者转变为“心有灵犀”的代理者。
举个例子,用户告诉AI“买件男士夹克”,传统LLM可能围绕品牌、款式、购买方式等等罗列一大堆文本,LAM则能周道地帮用户完成网购。这就是行动力!有望颠覆商业格局的那种!
当然,这也意味着AI模型要从围墙花园式的封闭状态向不受限、开放式、代理式转变。目前的模型运作受限但相当安全,当其被赋予极大自主性后,风险也会变得极大,例如出现无道德约束的或种族主义的LAM。
在2018年电影《升级》(Upgrade)中,因事故而瘫痪的男主角给自己植入了人工智能芯片,成功获得运动能力,后在复仇之旅中逐步交给AI代理权限,最终被AI完全支配。
收集更多有关人类行为的信息,要求这个领域顺应新一轮互联趋势,引领一个可连接设备交错纵横的世界。
韦伯表示,可连接设备的浪潮未必会让我们生活得更轻松愉快,它的关键在于数据。
人类生活可产出大量数据供AI利用,尤其当我们使用AI优先(AI-first)硬件的时候。可连接设备获取信息的方式完全不同于从网络文本中抓取内容。在韦伯看来,像苹果Vision Pro这样的“面部计算机”就是“为读懂你的意图而设计的”。LAM没理由不用这些设备获取的数据来提供用户以超个性化体验。
“我们以后将被不计其数的传感器包围,它们会一直关注着我们,一直环绕着我们,可以同时收集多个数据流。物联网、物联之家、智能汽车、智能办公室、智能居所……无处不在的传感器……互连设备的网络都可以通信和交换数据,推动人工智能发展。”
不过新机遇也意味着新挑战。
“可连接设备为AI提供所需数据,但随着系统和平台的扩展升级,它们的能耗也与日俱增。半导体芯片已面临供应短缺等挑战。除了困扰制造的资源短缺,芯片本身也有局限性。摩尔定律开始失效,我们已逼近极限。芯片要越造越小,而成本越来越高。”
前文介绍的生成式生物学,有可能解决半导体难题吗?
韦伯认为,生物学处理信息的方式是硅所不能及的。如果我们试图制造能像人类一样思考和行动的机器,实际上就要让它们长得更像人类。“或许,未来十年会出现某个时刻,人工智能与所谓的‘类器官智能’(Organoid Intelligence,OI)联合。生物科技将使我们超越基于硅的计算系统。AI可以更快速、更高效、更强大。”
虽然听起来比较科幻,但类器官智能确已存在,科学家正使用脑细胞等生物材料进行信息处理——从教生物计算机玩乒乓球,到训练它从众多声音里检测出特定声音。
听完韦伯的种种预测,很多人可能产生疑虑:如果一个开放式、代理式的人工智能模型落入坏人之手,会否引发影响全球的深度伪造问题?关于可连接设备,如果某些用户的反馈过于个性化,而这些特殊信息又被输入社会信用体系,并导致多数人因此受到困扰,该怎么办?关于类器官智能,用于创建生物计算机的干细胞来源是否合乎伦理?
“技术不分好与坏。但如果不干预技术发展,我们有可能见到最灾难的后果。”韦伯说道。
-未来今日研究所(FTI)是一家专门从事战略预见的咨询公司;战略预见是一种严谨且系统的方法,用于明确在未来何处展开行动、如何取胜,以及在面对始料未及的干扰时如何确保组织的韧性-
-2024 年,FTI发布的一份报告,提出了“活性智能”的概念框架,该报告将其描述为“人工智能、生物技术和先进传感器”三种技术的融合,并用于能够感知、学习、适应和进化的系统-
资料来源:
AI, Connected-Devices And Biotech: Inside Amy Webb’s 2024 Emerging Tech Trends Report Panel At SXSW 2024 – AList
Futurist forecasts convergence of key technologies into “living intelligence”
Innovation experts predict top tech trends for 2025
ESM3: Simulating 500 million years of evolution with a language model
Simulating 500 million years of evolution with a language model
Sequence modeling and design from molecular to genome scale with Evo
END