今年的诺贝尔物理学奖出人意料地颁给了两位AI领域大佬,美国普林斯顿大学的约翰 · J.霍普菲尔德 (John J. Hopfield) 和加拿大多伦多大学的杰弗里 · E.辛顿(Geoffrey E. Hinton),旨在表彰他们在人工神经网络研究中所做的——为当今机器学习奠定了基础的——重大贡献。

微信图片_20241009145613

2024年诺贝尔物理学奖得主约翰·J.霍普菲尔德和杰弗里·E.辛顿

进入正题之前,先问大家两个问题:

1. 1365*8972等于几?(不能用计算器哈)

2.通过这个人物的表情,判断她此刻的主要情感。

微信图片_20241009145618

不用告诉我这两个问题的答案,只要比较一下这两个问题哪个难,哪个容易就好。相信呢,绝大多数观众都觉得第二个问题要容易得多。

但对于机器来说呢?

那就是第二个问题难得多了,毕竟,第一台通用计算机七八十年前就诞生了,算这个四位数乘法简直是小儿科。但人脸识别可是最近才兴起的玩意儿。

360截图20241009145604

第一台通用计算机七八十年前就诞生了……

为什么人脑和电脑差别那么大?因为人脑自带一个超级计算器——神经网络。于是,科学家就想了,要是能让机器尽可能地学习这个网络,那人工智能岂不是就要实现了?这就是人工神经网络。

最简单的人工神经网络是前馈神经网络,输入的信号从前面一层神经元传到后面一层,直到最后输出。这种网络是静态的、单向的,和人脑里的像吗?不太像,因为我们脑袋里的神经元互相之间都能传递信号,每时每刻都在交流,是动态的、双向的。

于是就有了反馈神经网络。反馈神经网络里的神经元既可以单向传播信号,又可以双向传播信号,甚至还能接收自己的反馈信号,每时每刻的状态都不相同,关键是具备记忆功能。

最有名而且最重要的反馈神经网络有两种:一是今年诺贝尔物理学奖得主之一的霍普菲尔德在1982年发明的霍普菲尔德神经网络;二就是另一位得主辛顿和同行在霍普菲尔德神经网络的基础上发明的玻尔兹曼机。

动态的东西最怕什么?当然是动着动着就崩溃了,这个问题的后果在计算机领域尤其严重。于是今天的主角之一霍普菲尔德出场了,他证明了霍普菲尔德神经网络不仅有用,而且具有稳定性,也就是这个系统总是朝着稳定点演化,而且到达稳定点之后就不再变化了。这个意义就太重大了,就相当于告诉同行们:大伙儿放心地用我这个网络做开发吧,甭管如何,绝对稳定,不会崩溃,安全性刚刚的。

霍普菲尔德网络虽然厉害,但还是有一个很要命的缺点,就是所谓的“伪吸引子”问题。前面提到,霍普菲尔德网络在演化到稳定点之后就不再演化了,但稳定点有两种,一种是局部稳定点,第二种是全局稳定点。第二种才是真正目标,称为“吸引子”;第一种只是像目标,但其实不是,所以叫“伪吸引子”。霍普菲尔德网络的问题是他一旦找到伪吸引子,也就停了,不会去找真的吸引子了。

咱们举一个不一定恰当的例子哈。要是给霍普菲尔德网络输入一段动画片《葫芦娃》的画面,里面有七兄弟和蛇精,它可能会告诉你这片子名叫《白雪公主与七个小矮人》,因为片子里出现了这样两个要素:七个身材矮小的男性和一个漂亮的女性。这就很符合霍普菲尔德网络记住的《白雪公主》的特征,达到了局部稳定点,它才懒得去管画面里的爷爷和蝎子精。

微信图片_20241009145621

最底下的小球是全局稳定点(吸引子),其他任何山谷都是局部稳定点(伪吸引子)

这可咋办呢?辛顿和同行就在霍普菲尔德网路的基础上发明了玻尔兹曼机。

什么是玻尔兹曼机?这里给一个简单的公式,不一定正确,欢迎各路大佬来锤:玻尔兹曼分布+退火算法+霍普菲尔德神经网络=玻尔兹曼机。

熟悉统计物理的观众一定知道玻尔兹曼分布,它给出了系统处于某个状态的概率,请注意是概率、不是确定的。把玻尔兹曼分布应用到霍普菲尔德网络上,这个网络就按照玻尔兹曼分布决定状态的变化,就有可能跳出局部稳定点了,整个网络也就变成了随机网络。

还是拿刚才的例子举例,当玻尔兹曼机看到那个葫芦娃的画面后,它还会去看看画面里有没有别的元素,当看到爷爷、穿山甲和蝎子精之后就能准确说出,这是《葫芦娃》。非但如此,如果我们把玻尔兹曼机放到规模更大的网络中,那它甚至还能有推荐功能——你给它看《葫芦娃》,它就会想:你是不是喜欢看这种七个矮个小男人与一个漂亮女人的故事,于是给你推送一部《白雪公主》!看看,是不是味儿对了!

有观众可能就要问了,这不是颁的诺贝尔物理学奖吗?咋听来听去都是神经网络、机器学习?没错,这就是今年诺贝尔物理学奖最大的争议:物理学奖变成了图灵奖!到底应该不应该呢?

我觉得吧,这个问题得分两个层面。首先,人工智能、机器学习、神经网络值不值得拿诺奖。当然值!人工智能搞不好就是下一波科技革命的发动机了,完全配得上这个标准嘛。换句话说,诺奖不给人工智能,那不是人工智能的损失,而是诺奖的损失。比如我们《世界科学》评个人类历史十大科学家,却不把牛顿、爱因斯坦放进去,那损失的是他俩,还是咱这个榜单的权威性?

那么,为什么是物理学奖?因为实在放不到其他奖项里去。要我说,诺贝尔奖委员会为了能把诺奖颁给人工智能,也真是煞费苦心。首先是老爷子霍普菲尔德,人家是根正苗红的物理学家,搞了大半辈子物理学,50岁才发那篇关于霍普菲尔德网络的论文。我估计评委是这么想的:人工智能是一定要拿奖的,也只有颁给物理学了;得奖工作本身最好和物理学沾边,获奖人如果本身是个物理学家,那就更好了。这就是为什么发布会上大书特书玻尔兹曼机了,首先当然是它重要,但还有一层心照不宣的意思是:玻尔兹曼这四个字那可是和物理学高度绑定的!要知道,辛顿作为AI领域教父可以吹的贡献太多了,除了玻尔兹曼机之外,还有反向传播算法,还有深度置信网,甚至还能谈谈他在谷歌等公司任职期间为整个AI行业培养的诸多人才。

另外,实事求是地说,霍普菲尔德网络和玻尔兹曼机不只是和物理学沾边,而且的确是用统计物理学思想开发的。尤其是霍普菲尔德网络,它和Ising铁磁相变模型极为相似。这也难怪,毕竟统计物理研究的就是大量粒子相互作用的系统,而神经网络恰恰就是大量神经元相互作用的网络,两者本来就很相似。所以啊,不是物理学不存在了,而是物理学无处不在了

诺贝尔物理学奖的分享就到这里,明天就是科学奖的最后一项化学奖了,咱可以激动地搓搓手期待起来了。

360截图20241009145650

2024年诺贝尔化学奖解读:是谁在手撕基因的“密码本”?

END