气候科学正在人类与机器之间缔结更加完美的联盟。
厄尔尼诺现象:在传统人类学习的辅助下,深度学习也许不久就能预报目前难以预测的厄尔尼诺事件,就像图中显示的厄尔尼诺现象一样。2015年,四个热带气旋“基洛”“伊格纳西奥”“希梅纳”“TD14E”在太平洋肆虐
机器学习领域在过去20年间取得很大进展,人类能不能在国际象棋之类的比赛中击败计算机这个问题不再令人有所疑问;我们赢过计算机的概率几乎就像在仰卧推举比拼中对战叉车。但是,问一下目前的计算机国际象棋冠军,也就是谷歌的AlphaZero,向它请教象棋对弈的理论,譬如在西班牙开局中,是象还是马更具价值?你所能得到的反馈是闪动的光标发出的茫然注视。理论是人类的概念,算法并不需要什么理论。计算机只知道如何在任何给定的位置找到最佳的一步,因为它受到广泛的训练,也就是通过自我练习,学会棋子怎么走最好。
AlphaZero之类的成功故事背后隐藏着的计算方法已经被取名为“深度学习”,如此的称呼是因为这些计算方法利用深度神经网络之类的复杂结构,在输入与输出之间有多层计算节点。输入内容可以有丰富的构造,就像象棋棋盘上的棋子位置或者图片中的像素色值,而输出内容也许是做出决定所需要的某项评估,就像可能的某步棋的评估值,或者一张图片是吉娃娃犬照片而非蓝莓玛芬蛋糕照片的概率。训练深度神经网络通常牵涉调节所有可获取的刻度盘,也就是调节模型的参数,直至它对于一组训练数据表现良好,接着再测试它对于另一组样本以外的数据集的表现。对于这类系统,一种抱怨是说,一旦它们的训练完成,它们就成为黑盒;算法到底是如何处理所给予的信息的,为什么要那么处理?这常常是个于谜团。(当这仅仅牵涉一次象棋棋局时,事情并不要紧,但是当同样的技术用于判定民众的信誉度或者实施犯罪的可能性时,对问责的要求就提高了,这是可以理解的。)节点的层次越多,在学习环节中要调整的参数也就越多,这个“盒子”变得更不透明。
然而,除了在棋盘上立于不败之地,深度学习算法已经在金融、广告、医药领域取得成功。有点让人吃惊的是,下一块倒下的多米诺骨牌也许是天气预报。这是机器学习要承担的令人惊讶的挑战,部分原因是传统的人类学习(由计算机增强,但仅仅用于数值计算)早已经很好完成天气预报的任务。如上所述,当深度学习方法闯入有所建树的学科时,所发生的情况是有趣的案例研究。人类与机器之间的这次新竞赛能为科学的未来预示什么?
气象学与象棋不同,背后有许多成熟的理论。流体动力学的方程或者陆地与大气之间的能量转移这类基本物理关系为天气系统形成和演变的方式设定界限。基于气温、风速、湿度等的当前测量值,并且将测量误差引起的不确定性考虑在内,可以建立一套方程;当前最先进的天气预报实际上相当于那套方程的模拟解。神经网络无论有多么“深度”,都是从完全一无所知的位置起步,要一下子恶补所有理论知识,都会度过一段艰难时期。因此,机器学习和气候科学的前沿研究者最近开始使用不同的方法:结合我们对于气象学已经了解的知识与深度学习的能力,来揭开我们并不知晓的气象模式。
在2019年9月的《自然》杂志上,韩国全南国立大学海洋学系的咸佑根(Yoo-Geun Ham)、金贞焕(Jeong-Hwan Kim)与中国南京信息工程大学气候与应用前沿研究院的罗京佳共同宣布,他们成功地用一种全新的深度学习算法,最多可以提前18个月预测厄尔尼诺事件的发生。厄尔尼诺是指东太平洋地区海面温度的冷暖振荡中的升温阶段。它对全球天气中期预报造成长期难题。在厄尔尼诺出现的年份里,正常的天气模式被完全颠覆,世界部分地区会目睹更湿润的气候状况和更严重的风暴,而其他地区经历更久的干旱。最大的影响发生在南美洲的西海岸,那儿的大量降雨能引发灾难性的洪水,而海洋温度的改变威胁到该地区所依赖的渔业;而在南太平洋的另一边,干旱、强风的情况比往年严重三倍,气温高过历年平均气温,所有这些因素都加剧了爆发丛林大火的风险,就像目前正在澳大利亚新南威尔士州熊熊燃烧的野火一样。
厄尔尼诺现象的社会成本极其庞大;它已经关系到水短缺、饥荒、传染病传播和民众动乱。(1789年至1793年间欧洲农作物产量的下降甚至可能引发了法国大革命。)因此,更好预报厄尔尼诺、为它做好准备的潜在益处同样巨大。问题在于,厄尔尼诺事件仅仅在有些时候是有规律的。厄尔尼诺的记录可追溯到19世纪后期,那时厄尔尼诺被首次描述为全球性现象,两次事件之间通常间隔2~7年,但在此之外,并没有找到真正的模式。而且,每次厄尔尼诺的严重程度和类型各有不同,具体要看海洋温度的最大异常到底出现在哪里,而每个类型都产生一套独特的天气现象。取决于你生活在哪里,你也许不会注意到一场厄尔尼诺现象刚刚结束。2019年的厄尔尼诺在秋天结束,属于轻微的类型。
在咸佑根与他的共同作者之前,最出色的预报者能提前一年预测到厄尔尼诺事件,但有理由相信,尚有改进的空间。首先,海洋温度的变化不是那么迅速,波动不像个别天气系统那么混乱。海温异常也存在某种周期性;厄尔尼诺的升温阶段之后,一般紧随名叫拉尼娜的降温阶段,就像一波巨大的热浪在太平洋中来回行进。于是,虽然具体的缘由与时机仍然不清楚,但变暖的信号也许提前很久就存在了。
他们决定使用卷积神经网络,同样的网络架构用于图像识别之类的机器视觉问题。他们想看一下,它是否能在洋温数据中识别出能预测厄尔尼诺事件的特征。然而,为了训练模型,他们不能仅仅依赖于历史数据,因为可以分配的数据量并不足够。洋温的月度记录仅能追溯至1871年,而且有部分数据需要保留,用于确证模型在用于训练的样本数据以外的预测能力。神经网络技术最适合应用于大数据的问题,而厄尔尼诺数据的规模小得令人失望。
这是新颖的数据科学与老式的气候学相融合的领域。
他们最先没有用历史数据来训练神经网络,而是在一批“模拟”中进行训练。这些“模拟”由全球各地的研究团队制作,作为“耦合模式比较项目”( Coupled Model Intercomparison Project ,CMIP)的一部分收集而来。CMIP是一个大规模科研倡议,分享气候模型,比较万兆字节容量的预测,旨在了解不同的未来情况下会发生什么。一些模拟情景代表另一个过去,就像气候历史小说,而这些故事要足够详细,包括厄尔尼诺事件之类的特征。于是,这些“模拟”代表貌似真实的数据,由已知的气候模型来提供约束边界。它们也许与真实数据尚有距离,但它们的真实性足以充当真实数据的替身。咸佑根等人使用替代数据,能在相当于2 961年的观测结果的数据集上训练神经网络。然后,他们使用这些训练的结果作为从实际历史数据中学习的起点。他们将实际历史数据分为两部分,1871到1973年的数据用于训练,1984到2017年的数据用于样本以外的验证。
研究结果让人叹为观止。神经网络的表现胜过以前的最出色预报,做出预报的时间越早,两者的差距越大。即便相隔18个月,神经网络也能预见厄尔尼诺事件的出现,很好估计厄尔尼诺现象的程度,甚至能根据温度峰值出现在太平洋中部或东太平洋而将它们分类。它在预报北方春夏时节的厄尔尼诺现象时,表现尤其出色;而因为厄尔尼诺现象与南亚地区季风之间复杂的相互影响,以前的模型都会在此陷入“预测障碍”。
训练一个系统,让它在一个任务上表现良好(在这里,就是在一组模拟数据基础上预报厄尔尼诺现象),再将那些知识应用到另一个任务上,这项技术称为迁移学习。咸佑根在预报厄尔尼诺上获得的成功表明:这个方法结合了气候学与深度学习的优点。气候模型生成的模拟为神经网络提供充足的数据,让它从中学习,实质上是训练神经网络,让它像气候模型一样思考,但那些模型必然承受某种系统性差错。用真实的历史数据来微调神经网络,消除差错,让神经网络寻找到科学家也许未曾想到去寻找的特征,最终成果就是更为准确的预报。
作为最后一次合理性检查,以证明他们的模型实际上将气候理论的一些教训吸收了,建模者利用神经网络对1997年到1998年间的厄尔尼诺进行了事后分析,那是有记录以来最严重的一次厄尔尼诺现象。他们输入了1996年5月、6月和7月的洋温数据,看见特定区域的神经元亮了,这表明厄尔尼诺事件的有利情况正在形成。1996年,热带西太平洋海洋变暖开始形成趋势,如同上膛的枪,接着,印度洋西南区域的较冷情况将趋势推向东部,导致大约1年后出现极强的厄尔尼诺现象。在副热带大西洋出现比往年平均洋温更低的情况,这反而加重了事态。不像某种神秘的神谕黑盒,模型识别出这些意义深远的特征,而它们全都符合气候学家对于世界不同地区洋温与气候描述方式之间关系的认知。神经网络比任何人都更早看见厄尔尼诺的到来,假如预警系统布置到位的话,这或许足够让受影响区域的民众更好防备厄尔尼诺的破坏冲击。
追踪厄尔尼诺现象所展示的混合方法也许提供了新模式,即将成功的机器学习技术应用到如气候科学之类的重视理论的领域。这些新的突破显示出,科研的未来不是争夺地盘,而可能是合作,结合传统科学与数据科学的优势。在2019年的《自然》杂志的另一篇论文中,来自德国马克斯 • 普朗克生物化学研究所生物地球化学整合系的第一作者马库斯 • 赖希施泰因(Markus Reichstein)主张“语境线索”(即已知理论预测的数据的关系)的重要性。他将这视为增强地球科学中深度学习方法的途径。我们没有理由预期这种途径会止步于此。
与此同时,机器学习也许在恰当时候给予气候科学推动力,这多亏了我们发现所面临的接连不断的气候灾难。尤其是,尽管厄尔尼诺所影响的天气系统预计在未来会更极端,但气候变化是否会提高厄尔尼诺事件的频率或严重性呢?对此仍然没有形成科学共识。政府间气候变化专门委员会2013年的报告仅仅声称,它预计厄尔尼诺会持续出现,但对于它可能的变化方式没有多少把握。厄尔尼诺事件依赖于海洋冷暖水体、大气、信风等等之间的复杂反馈回路。扰乱这些循环的部分,可能会关闭整个回路,使厄尔尼诺的情况更频发,甚至可能永久存在,或者没有明显结果。
想明白如何为未来的极端天气定好计划,就像在棋子不断变化的棋局中寻找最佳策略。这会耗费一台超级电脑的所有学习能力以及一位象棋特级大师的所有经验。
资料来源 Nautilus
_____________________
本文作者奥布里·克莱顿(Aubrey Clayton)是一位居住在波士顿的数学家,他在哈佛继续教育学院教授逻辑学与概率哲学。