受到谷歌支持的DeepMind公司教会一个强化学习算法控制托卡马克核聚变反应堆内部炽烈的电浆。
托卡马克(tokamak)是一种甜甜圈形状的容器,设计用来容纳核聚变反应。托卡马克的内部呈现了一幕特别的混沌景象。在极高温下,氢原子互相撞击在一起,产生涡动翻腾的电浆(又称作等离子体),这些电浆的温度比太阳表面更加炙热。解锁核聚变潜力的关键就在于找到聪明的办法来控制和约束电浆。
过去数十年来,核聚变一直被认为是未来清洁能源的来源。目前,支撑核聚变的科学理论看起来颠扑不破,所以剩下的就是工程挑战。“我们需要能够将这个物质加热到极高温,让它结合得足够久,让我们从中取得能量。”洛桑联邦理工学院的瑞士电浆中心主管安布罗焦 · 法索利(Ambrogio Fasoli)说道。
这就是DeepMind公司插一脚的地方。这家人工智能公司的背后是谷歌母公司Alphabet,先前已经插手到电子游戏和蛋白质折叠领域,也一直在与瑞士电浆中心进行一个联合科研项目——开发用于控制核聚变反应的人工智能。
恒星也是由核聚变供能的。在恒星内部,单凭重力质量就足以将氢原子拉拢到一起,克服它们相反的电荷。在地球上,科学家改用强大的电磁线圈来约束核聚变反应,将电浆助推到想要的位置,让它成形,就像一名陶工摆弄转轮上的黏土。必须小心谨慎地控制线圈,防止电浆触碰到容器的表面,因为那样会损伤容器壁,拖慢核聚变反应。(缺少磁力的约束后,核聚变反应无法存在,所以几乎没有爆炸的风险。)
但每次科研人员想要改变电浆的构型,试验不同形状(可能产生更多能量或更洁净电浆)时,需用大量的工程学和设计工作。传统的系统由计算机控制,基于模型和细致的仿真,但根据法索利的说法,那些系统“繁琐复杂,不一定总是最优化的”。
DeepMind公司已经开发出一个能自主控制电浆的人工智能。《自然》上发表的一篇论文描述了来自两个团队的科研人员如何教会一个深度强化学习系统控制TCV内部的19个电磁线圈。TCV的全称是可变构型托卡马克,位于瑞士电浆中心,用它进行科研取得的成果会给未来更大型核聚变反应堆的设计提供情报。“人工智能以及专门的强化学习特别适合复杂的问题,尤其以控制托卡马克中的电浆为代表。”DeepMind公司的控制团队带头人马丁 · 里德米勒(Martin Riedmiller)说道。
神经网络(一类旨在模拟人类大脑架构的人工智能)最初在仿真中接受训练。它最开始观察19个线圈中的每个线圈的设置变化如何影响容器内电浆的形状。接着它被给予不同的电浆形状,尝试重新生成那样形状的电浆。其中包括D形截面的形状,接近国际热核聚变实验反应堆(ITER)内部将用到的电浆形状。ITER是大型实验用托卡马克核聚变反应堆,目前正在法国建造中。另有一种雪花外形的构型,有助于将核聚变反应的极高热度更加均匀地消散到容器四周。
DeepMind公司的人工智能可以自主琢磨出如何以正确的方式操纵电磁线圈,创造出这些形状的电浆。这些操作在仿真中行得通的话,当科学家在TCV内部实际进行相同的实验来验证仿真结果时,大概同样行得通。法索利说,这代表了“重要的一大步”,能影响未来托卡马克的设计,甚至加快实现可行核聚变反应堆。
“这是个非常正面的结果,”未参与这项研究的伦敦帝国学院核聚变专家亚丝明 · 安德鲁(Yasmin Andrew)说道, “一个很有意思的地方是,看下他们能否将技术迁移到更大型的托卡马克上。”
核聚变为DeepMind公司的科学家提供特别的挑战,因为整个过程既复杂又呈现连续性。和围棋那样基于回合的博弈不同,电浆的状态持续变化。雪上加霜的是,我们无法连续地测量电浆。人工智能研究者称之为“观测下系统”。
“有时候,擅长解决这些离散问题的算法处理连续性问题时十分费劲。”DeepMind公司的一位研究员若纳斯 · 比什利(Jonas Buchli)说道,“这对我们的算法来说,是真正的一大步,因为我们能表明,我们的算法能解决连续性问题。我们认为,这当然是个非常非常复杂的难题,和棋局中遇到的复杂性相比,它是一种完全不同的复杂性。”
这并非人类首次尝试用人工智能来控制核聚变。从2014年起,谷歌已经和以加州为大本营的核聚变公司TAE进行科技合作,试图将机器学习算法应用到另一类核聚变反应堆上,加快实验数据的分析。位于英国的欧洲联合环状反应堆(JET)核聚变项目的研究已经使用人工智能来尝试预测电浆的行为。这个构思甚至出现在虚构故事中。2004年上映的电影《蜘蛛侠2》中,反派八爪博士创造出由人工智能驱动、大脑控制的外骨骼来控制他的实验性核聚变反应堆。这个反应堆运作良好,直到人工智能接管了他的心智,开始杀戮人类。
简而言之,随着核聚变反应堆变得越来越大,与DeepMind公司的合作能被事实证明是极其关键的。尽管物理学家通过传统方法,很好地应付了控制小规模托卡马克内电浆的任务, 但随着科学家尝试让发电厂规模的托卡马克变得可行,挑战只会越来越大。目前的进展虽慢但很稳固。近期,JET项目取得了突破,立下核聚变研究项目取得的能量值的新纪录,而位于法国的ITER的建造工作正在进行中,等到它在2025年点火启动后,这项国际合作会变成全球最大规模的实验性核聚变反应堆。
加州大学圣迭戈分校(UCSD)能源研究中心副研究员德米特里 · 奥尔洛夫(Dmitri Orlov)说:“托卡马克越是复杂,性能越高,以更高的可靠性和准确性来控制更多量的需要也就越大。”人工智能控制下的托卡马克可以实现最优化,控制核聚变反应产生的热传递到容器壁,避免破坏“电浆不稳定性”。而反应堆本身就能得到重新设计,利用上强化学习算法提供的更严密的控制手段。
法索利说,与DeepMind公司的合作最终能允许研究者推进界限,加快通往核聚变能的漫长之旅。“人工智能使得我们能够探索一些用其他方式无法探究的东西,因为我们对于这种人工智能模拟的控制系统能够冒风险,而对于其他方式,我们不敢冒风险。”他说,“假如我们确信,我们拥有一种控制系统,它能带我们更靠近界限,但不会越过界限,那么我们实际上就能探索一些用其他方法无法进行探究的可能性。”
资料来源 Nature