谷歌DeepMind发布了一款名为GenCast的人工智能模型,其在天气预报方面超越了现有的最佳系统。这项突破性成果已于今日发表在《自然》杂志上。
这已经是谷歌在短短几个月内推出的第二款人工智能天气模型。今年7月,谷歌发布了NeuralGCM的详细信息,该模型将人工智能与现有预报工具中使用的基于物理的方法相结合。该模型的性能与传统方法相当,但所需的计算能力更低。
GenCast则有所不同,它完全依赖于人工智能方法。它的工作原理类似于ChatGPT,但它不是预测句子中下一个最可能的词,而是预测下一个最可能的天气状况。在训练过程中,它从随机参数或权重开始,并将预测结果与真实天气数据进行比较。在训练过程中,GenCast的参数开始与实际天气相一致。
该模型使用40年的天气数据(1979年至2018年)进行训练,然后生成2019年的预报。在预测中,它在97%的时间里比当前最佳预报——集合预报(ENS)——更准确,并且在预测风况和极端天气(如热带气旋路径)方面表现更出色。更准确的风力预测能力提高了风能的可行性,因为它可以帮助运营商计算何时启动和关闭风力涡轮机。而对极端天气的更准确估计可以帮助人们为自然灾害做好准备。
谷歌DeepMind并不是唯一一家将人工智能应用于天气预报的科技巨头。英伟达在2022年发布了FourCastNet。2023年,华为开发了其Pangu-Weather模型,该模型使用39年的数据进行训练。它生成确定性预报——提供单个数字而不是范围,例如预测明天气温为30°F或降雨量为0.7英寸。
GenCast与Pangu-Weather的不同之处在于它生成概率预报——各种天气结果的可能性,而不是精确预测。例如,预报可能是“气温降至30°F的可能性为40%”或“明天降雨量为0.7英寸的可能性为60%”。这种类型的分析可以帮助官员了解不同天气事件发生的可能性并相应地制定计划。
这些结果并不意味着传统气象学作为一门学科的终结。该模型是根据过去的天气状况进行训练的,将其应用于遥远的未来可能会导致对不断变化和日益不稳定的气候的预测不准确。
GenCast仍然依赖于ERA5这样的数据集,ERA5是自1940年以来各种大气变量的每小时估计值,俄克拉荷马大学气象学院助理教授亚伦·希尔说,他没有参与这项研究。“ERA5的支柱是一个基于物理的模型,”他说。
此外,我们的大气中存在许多我们无法直接观察到的变量,因此气象学家使用物理方程来计算估计值。这些估计值与可获取的观测数据相结合,输入到GenCast这样的模型中,并且始终需要新的数据。“一个训练到2018年的模型在2024年的表现将比一个训练到2023年的模型在2024年的表现差,”DeepMind研究员、GenCast的创造者之一伊兰·普莱斯说。
未来,DeepMind计划直接使用风速或湿度读数等数据测试模型,以了解仅根据观测数据进行预测的可行性。
人工智能模型在预测方面仍然存在许多困难,例如估计对流层上层的状况。虽然该模型可能擅长预测热带气旋的路径,但它低估了气旋的强度,因为模型的训练数据中没有足够的强度数据。
目前的希望是让气象学家与GenCast协同工作。“实际上有气象专家在查看预报,做出判断,并在不信任特定预报时查看更多数据,”普莱斯说。
希尔表示同意。“当我们谈论人工智能预测系统时,人类能够将这些部分拼凑起来的能力被严重低估了,”他说。“人类预报员会查看更多信息,并且他们可以提炼这些信息以做出非常准确的预报。”