继物理学奖之后,今年的诺贝尔化学奖再度落入AI大神之手。来自华盛顿大学的大卫 · 贝克(David Baker)以及谷歌DeepMind团队两大核心德米斯 · 哈萨比斯(Demis Hassabis)和约翰 · 江珀(John Jumper)共享殊荣。他们创建出革命性的人工智能工具用以预测蛋白质三维结构,真正“破译了蛋白质的密码”。值得一提的是,1985年出生的江珀成了历史上首位斩获诺奖的80后。
2024年诺贝尔化学奖得主大卫·贝克、德米斯·哈萨比斯以及约翰·江珀
看到今年诺贝尔化学奖的结果,咋感觉我们普通人离拿诺奖又近了一点……为什么这么说?我们还是先来分析一下今年诺贝尔化学奖本身。
它主要是颁给蛋白质结构领域的。
蛋白质有多重要?它是生命的基本组件,比如各种组织的肌肉,同时在生物体内发挥着各种功能,比如催化生化反应、调节新陈代谢、运输物质、提供能量,等等。可以说,是个活的东西都离不开蛋白质的正常运转。
初中生物里一说到蛋白,就一定会强调“结构与功能”。想要实现蛋白的功能,离不开解构它的结构。那么怎么才能知道蛋白质的结构?
传统方法是用X射线晶体衍射法。步骤是这样的:先让蛋白质结晶,再用X射线照射蛋白质晶体,最后观察衍射产生的图像,就知道蛋白质的结构了。
精确是精确,但这个方法主要有两个问题:
1. 技术难度高、耗时长,据说当年一个博士生整个读博期间都不一定能测出一个蛋白质的结构;
2. 局限性大,因为很多蛋白质它压根不能结晶!
怎么办?蛋白质由基因编码生产,知道了目标蛋白质对应的基因序列,理论上就能知道蛋白质的结构,而基因测序那可比X射线晶体衍射法容易太多了!但这里还少了一环,蛋白质要经过折叠才会有三维结构,可是,蛋白质折叠的机制我们完全不懂。这又要怎么办?
既然“人类在预测蛋白质结构方面是垃圾”(新晋诺奖得主江珀的话),那科学家很自然地想到了用计算机做模拟来预测蛋白质结构。然而,早期计算机算法预测结果很不可靠,人家X射线晶体衍射法虽然费劲,但准确呐。所以,这条路就没走通。
于是,人工智能登场了。
在今年诺贝尔物理学奖得主辛顿通过人工神经网络大幅提升机器学习的能力之后,今年诺贝尔化学奖得主之一哈萨比斯开始用这些AI算法整点好玩的,先是开发了Alphago,把人类围棋高手杀了个片甲不留。然后又联合另一位得主江珀,接连开发了用于预测蛋白质结构的AI算法AlphaFold1、2、3,大幅提高了预测速度和准确度。有多准呢?2020年的时候,AlphaFold2的预测准确率都超过80%,直逼90%了。
现在,我们把这个过程反过来。
你想不想要怎么吃都不胖的超能力?那我就设计一个能大幅抑制营养吸收能力的蛋白质,确定它应该具有的结构,然后再通过AI程序反推编码它的基因。最后再用基因工程的方法按这个基因生产出原本不存在的“狂吃不胖”蛋白质,注入体内,是不是就可能实现这个超能力了!?推而广之,是不是什么超能力都能实现了?
当然了,理论是理论,现实操作起来还是有很多困难的,因为每一个分子都是人体系统组成的一部分,除了观察它本身的作用外,还要放置在整个机体去考虑,比如:这个原本不存在的蛋白质分子会不会因为排异反应被人体细胞自动吃掉?再比如这个蛋白质分子会不会功能太强,导致你被饿死?但无论怎么说,它至少提供了一种让我们拥有各种超能力的可能,这可能就是科学的魅力所在——它使我们的想象真的成为可能。
这个方案就叫蛋白质设计,也是这次分走一半诺贝尔化学奖奖金的贝克的主要贡献。早在1998年,他就开发出蛋白质设计算法Rosetta。在人工智能起飞之后,更是开发出序列获得率超50%的算法PROTEIN MPNN。(Rosetta序列获得率略高于30%,但考虑到98年的时候人工智能远没有现在这么厉害,Rosetta的开创意义更大)
蛋白质结构预测和蛋白质设计,对科学界来说,实在是太有用了,所以贝克、哈萨比斯、江珀3人得奖可以说是众望所归,大家的反应和昨天的物理学奖那完全是两个画风。这恰恰说明:公众丝毫不怀疑AI的重要性,也不觉得AI不能拿诺奖,只是觉得AI拿物理学奖不合适。这有没有可能是人类被AI统治之前的最后一次舆论挣扎?俗称:“死鸭子嘴硬。”
既然打不过,那就加入嘛。AI这么好用,连诺奖都正名了,没有不用的道理。要说AI这个新工具的出现,大大降低了我们普通人拿诺奖的门槛。看看这次化学奖的三位得主吧,贝克刚进大学学的是哲学;江珀自称在刚从事蛋白质计算机模拟工作之前甚至“不知道蛋白质是啥”;哈萨比斯呢,则是个高智商玩咖,国际象棋玩到了职业级(有世界排名那种),后来又醉心开发游戏,AI刚起飞的时候也没想着干嘛,先是拿来在自己19岁才接触的新游戏“围棋”上开金手指。而我们之前对科学家的刻板印象是什么样的呢?听得最多的,那就是几十年如一日在领域内默默耕耘啊。
所以啊,咱们现在好好学习AI,然后想想怎么用在自己熟悉的领域,搞不好就能整点划时代意义的新东西出来。
今年的诺贝尔奖就分享到这了。明年我们再见!
-《世界科学》2024年第8期专稿《人工智能是蛋白质科学的终结者吗?》一文叙述了AI预测蛋白质结构发展的来龙去脉,并揭示了该技术发展过程中——江珀、哈萨比斯、贝克等所发挥的关键作用,本期邀请了深圳湾实验室资深研究员周耀旗(详见周耀旗看“后AlphaFold 2时代”:进展不断,新革命还在远方)、清华大学科技与社会研究中心主任李正风教授对该技术进展进行点评-
“7个矮小男子和1个漂亮姑娘”在AI眼里会是怎样的故事?2024年诺贝尔物理学奖揭晓
END