2024年诺贝尔科学奖项颁给了微小RNA的发现者、人工智能模型的先驱以及那些将人工智能用于蛋白质结构预测的人。显然,人工智能在2024年诺贝尔奖中大获全胜。
诺贝尔科学奖一直在用自己的方式表彰人类智慧。2024年,人工智能(AI)的变革潜力首次得到诺贝尔奖的认可。10月8日,瑞典皇家科学院将物理学奖授予普林斯顿大学的约翰 · 霍普菲尔德(John Hopfield)和多伦多大学的杰弗里 · 辛顿(Geoffrey Hinton),以表彰俩人在计算机科学领域取得的突破。他们的成果对当今许多最强大AI模型的开发至关重要。
10月9日,一款神奇AI模型的开发者也接到斯德哥尔摩的来电。他们就是谷歌人工智能公司DeepMind的核心人物,德米斯 · 哈萨比斯(Demis Hassabis)和约翰 · 江珀(John Jumper),因创造能精准预测蛋白质三维结构的AlphaFold而获得化学奖。
长期以来,蛋白质结构预测是生物化学领域的重大挑战。当然,这两位只分得一半荣誉,另一半授予华盛顿大学的生物化学家大卫 · 贝克(David Baker),以表彰他利用计算机辅助设计新蛋白质的工作。
人工智能并不是这次结果揭晓的唯一共同点。在一些严谨的人士看来,2024年诺奖委员会对物理奖和化学奖的颁发是“越界”的,因为人工智能研究属于计算机科学,而蛋白质研究则应归属于生物学。
破界
这种灵活“跨界”并非史无前例。例如,1973年,3位常与蜜蜂、鹅和棘鱼打交道的动物行为学先锋被“强行”授予诺贝尔生理学或医学奖。不过辛顿和霍普菲尔德所做出的诺奖成就有更深远的影响。
2024年诺贝尔科学奖获得者:杰弗里·辛顿(左一)、约翰·霍普菲尔德(左二)、德米斯·哈萨比斯(左三)、大卫·贝克(左四)、约翰·江珀(右三)、加里·鲁夫昆(右二)、维克多·安布罗斯(右一)
两位大师都在1980年代初完成了他们的关键工作,但当时计算机硬件无法充分利用它。霍普菲尔德设计了一种后来被称为霍普菲尔德神经网络的人工神经网络,其构建模式类似物理学中的自旋玻璃模型——这让瑞典皇家科学院有理由称这属于“物理学”。辛顿的贡献是使用所谓的反向传播算法来训练神经网络。
人工神经网络是计算机程序,大致基于人们认为的真实生物神经细胞或神经元网络的工作方式。具体而言,此类网络中“节点”(相当于神经元)之间连接的强度(称为权重)具有可塑性。这种可塑性赋予网络根据过往表现以不同方式处理信息的能力,换言之,就是学习能力。霍普菲尔德网络中每个节点都连接到除自身之外的所有节点,这种网络特别擅长“从稀疏或嘈杂的数据中提取模式”。
辛顿通过他设计的算法,让神经网络在三维空间中工作,增强神经网络的学习能力。霍普菲尔德网络及其同类网络本质上是二维的。尽管它们实际上仅作为软件中的模拟而存在,但它们可以被视为节点的物理层。但是,将这些层堆叠在一起,信号在层之间来回移动(即反向传播和前向传播)时通过调整权重来训练它们,您将拥有一个更加复杂的学习系统。
此外,辛顿博士还利用物理学的一个分支,即统计力学,对霍普菲尔德的网络做出改进,创建了玻尔兹曼机。玻尔兹曼机可用于创建以无人监督的方式学习的系统,无须明确教授即可发现数据中的模式。[统计力学是热力学第二定律的基础,由与阿尔弗雷德 · 诺贝尔(Alfred Nobel)同时代的路德维希 · 玻尔兹曼(Ludwig Boltzmann)创立。]
因此,这两位研究人员的工作让机器学习真正发挥了作用。人工智能模型现在不仅能学习,还可以创造(或者,用怀疑论者的话说,以最复杂方式重组和照搬)。这些工具已经从执行高度特化的任务,例如识别组织样本中的癌细胞或精简大量粒子物理数据,转变至能应付从为本科生写论文到运行机器人的各种事务。
接受媒体采访时,辛顿博士似乎流露出对自己的成果既担心又自豪的态度。他和领域内许多人一样,担心超越人类的机器智能会怎样对待创造它自己的人。另一方面,他也沉思:通过协助脑力劳动,AI能否带来如工业革命之于体力劳动那样巨大的影响?
这样的沉思来得正是时候。不到24小时后颁发的诺贝尔化学奖似乎是对上述问题的回复。瑞典皇家科学院表彰了利用AI模型预测蛋白质结构的3位先锋。
折叠
蛋白质是生命的主要化学组成部分。它们的基本组成单位是氨基酸,这些小分子排列成长链,以相当复杂和特定的方式折叠。最终的折叠形态,也就是蛋白质三维结构,决定其生物功能。换言之,我们要了解蛋白质——进而理解生物学——就必须了解蛋白质结构。
贝克博士通过实践获得了这种理解。他在2003年的一篇具有里程碑意义的论文中介绍了自己设计的全新蛋白质。据称,借助计算机程序Rosetta,他发现了一种能以此前从未见于自然界的方式折叠的氨基酸序列。贝克在实验室重新创建该序列并制得蛋白质,接着用X射线晶体学技术确定其最终结构——与他设想的折叠形态非常接近。Rosetta(现在叫作Rosetta Common)很快成为全球蛋白质化学家使用的软件包。蛋白质计算设计已在各个方面发挥作用,例如疫苗开发和有毒化学物质检测。
另一方面,若要根据蛋白质的氨基酸序列预测其三维结构,那就是更艰巨的任务了。鉴于蛋白质可以折叠出近乎无限种形态——据估计,一个复杂蛋白质有10300种可能的空间结构——因此即使用计算机也只能获得有限结果。DeepMind的AlphaFold 1和2(均为人工神经网络)分别于2018年和2020年发布,是第一种接近无限可能的神经网络。AlphaFold 2目前拥有一个包含超过2亿种蛋白质结构预测的数据库,预测准确率高达约90%。
在此次诺贝尔奖结果揭晓前,2024年德米斯和江珀出现于各大科技奖项的候选人名单中,当然,许多人质疑,现在就向AlphaFold致敬是否为时过早。可无论如何,AlphaFold正改变科学。
DeepMind表示,大约200万科学家已经在研究中使用此工具。2024年5月发布的AlphaFold 3不再局限于蛋白质研究,还能预测大量其他生物分子的结构,诸如DNA,以及可能作为药物发挥作用的小分子;它也可以预测不同结构的不同分子怎样组合到一起,例如病毒的刺突蛋白如何与宿主体内的抗体和糖相互作用。
“见微知著”
2024年的诺贝尔生理学或医学奖与AI毫无关联,也没有受到所谓跨学科的争议。评审团队继续关注分子和细胞层面的“最微小”成果(而非生理学或器官方面的研究)的趋势,因为最令人兴奋的科学前沿正是在这些微观尺度上。
马萨诸塞大学医学院的维克多 · 安布罗斯(Victor Ambros)和麻省总医院的加里 · 鲁夫昆(Gary Ruvkun)因发现微小RNA(miRNA)及其在“转录后基因调控”中的作用而共同获奖。微小RNA是一类仅由20~24个核苷酸组成的小分子非编码RNA,在细胞的运作中发挥关键作用。
每个人体细胞的细胞核内都有一套完整指令用于创建人体,那就是基因组。生物学的一个重要问题是,同一套基因和指令怎样导致身体产生从肌肉细胞到肝细胞各种不同类型的细胞。答案是,并非细胞核内所有基因都会转化为蛋白质。不同类型的细胞遵循自己的发育途径,只选用与自己生长发育相关的遗传指令。而能在一定程度上控制它们的选择的,正是由安布罗斯和鲁夫昆发现的微小RNA分子。
微小RNA主要通过与细胞内另一种分子的靶标部分结合来发挥作用,它就是信使RNA(mRNA)——负责将信息从基因组的DNA传递到细胞内的蛋白质制造工厂?。通过干扰mRNA,miRNA可以改变或阻止蛋白质的产生。值得一提的是,2023年诺贝尔生理学或医学奖授予了mRNA疫苗领域的两位先驱。
微小RNA首次发现于1993年,现已知人类基因组中有超过1000种这样的小分子。它们的生物学影响不可谓不深远:微小RNA分子的调节异常可能导致癌症和癫痫;编码miRNA分子的基因突变会引发先天性听力丧失等疾病,并被认为与许多眼部疾病的病理有关,例如白内障、青光眼和黄斑变性;此外,miRNA分子似乎也是许多骨骼疾病的一大成因,如骨质疏松症、骨肉瘤和骨转移等。
1980年代末,安布罗斯和鲁夫昆在麻省理工学院的同一实验室工作,并利用生物学研究中的关键工具秀丽隐杆线虫(Caenorhabditis elegans)发现了miRNA分子。他们当时正研究秀丽隐杆线虫的两种突变株,这些株系的基因存在缺陷,而线虫的发育和工作方式又由基因决定。二人观察到,一种名为lin-4的基因会产生一种异常短小的RNA分子,该分子不编码任何蛋白质,而且似乎能抑制另一个基因的活性。
瑞典卡罗林斯卡医学院的诺贝尔委员会在揭晓获奖名单时指出,当科学家发表他们的研究成果时,他们遭遇了“来自科学界的几乎震耳欲聋的沉默”。人们起初认为秀丽隐杆线虫体内这种不寻常的基因调控机制是该生物所特有的一种特性,与人类或其他更复杂的生物无关。但这种观点后来发生了转变,因为大家发现,编码miRNA的基因遍布整个动物界。
丹麦制药巨头诺和诺德是尝试利用miRNA制造药物的公司之一。2024年,他们收购了德国生物制药企业Cardior,后者研发的miR-132反义抑制剂CDR132L能阻断特定miRNA,有望帮助患慢性心力衰竭和心脏肥大(心壁增厚和变硬)的病人。
追诺路万条
对于世界各地越来越多依靠人工智能进行研究的科学家来说,2024年诺贝尔奖传递了有趣的信号——或许他们有一天也能获得科学界最高奖项。江珀表示:“我希望我们未来将会迎来许多乘势AI的不可思议的科学突破。”
资料来源 The Economist