【学术干货】从「预测器」到「发现工具」:清华UniCM如何让AI真正理解全球气候系统
论文信息汇总论文中文标题学习全球气候模态的耦合动力学论文英文标题Learning the coupled dynamics of global climate modes作者清华大学电子工程系 李勇教授团队期刊/会议Nature Machine Intelligence发表时间2026年DOI10.1038/s42256-026-01245-5全球气候系统是人类赖以生存的最复杂动态系统之一。在漫长的气候演变历程中多种气候模态此消彼长、相互耦合共同塑造着地球表面每一个角落的温度、降水与极端天气事件。当我们谈论气候预测时厄尔尼诺-南方涛动ENSO往往是最受关注的话题——这一发生在赤道太平洋的海气耦合现象能够通过复杂的遥相关机制影响全球气候其预测价值不言而喻。然而全球气候系统绝非由单一气候现象所主宰。印度洋偶极子IOD、热带北大西洋模态TNA、北太平洋经向模态NPMM、南太平洋经向模态SPMM、印度洋 basin 模态IOB以及南印度洋偶极子SIOD等多个气候模态同时存在它们通过跨洋盆遥相关和海气相互作用形成一个动态耦合的全球系统。一个区域的海温异常可能在数月后引发另一个大陆的极端降水一种气候模态的成熟衰退往往与另一种模态的兴起存在隐秘关联。长期以来气候预测领域面临着一个根本性的方法论困境大多数传统预测方法主要聚焦于单个气候模态的独立预测或仅研究少数模态之间的简单线性关系。这种各自为战的研究范式难以刻画全球气候系统中广泛存在的非线性交互过程更无法充分利用多模态耦合关系中蕴含的潜在可预报性信息。近年来人工智能在天气预报领域取得了令人瞩目的进展。以数值天气预报为基础的深度学习模型已经能够在数天到数周尺度上实现高精度预测部分任务甚至超越了传统数值模式的性能。然而这些成功大多局限于短期天气预报范畴。当时间尺度延伸至季节、年际乃至更长的气候预测维度时问题的本质发生了根本性变化气候预测需要处理的是多个海洋和大气系统之间复杂的跨尺度相互作用是对未来数月乃至数年内全球气候系统演化轨迹的预判。这正是当前AI气候预测面临的核心挑战所在——如何让模型不仅会预测还能帮助科学家理解这些模态之间跨越时空的长期耦合关系进而发现隐藏在复杂系统中的物理规律这一挑战构成了AI for Science领域的重要前沿阵地。研究动机研究团队敏锐地洞察到了现有方法的局限性。当前主流气候预测模型通常将各个气候模态视为相互独立的研究对象分别建立预测模型然后简单地叠加或平均各模态的预测结果。这种方法存在几个根本性问题首先物理一致性问题被忽视。 真实的气候系统中各模态之间存在着明确的物理联系。例如NPMM的变化往往领先ENSO约4个月这种滞后相关关系反映的是跨洋盆的海气耦合过程。如果模型分别预测各模态而忽视这种耦合就可能产生物理上相互矛盾的结果。其次耦合可预报性未能被有效利用。 气候系统的可预测性不仅来自单个气候现象本身更来自多个气候模态之间长期存在的耦合关系。这种涌现可预报性Emergent Predictability是传统独立预测方法难以触及的宝贵信息资源。第三可解释性严重不足。 当前大多数深度学习气候预测模型采用黑箱设计虽然能够给出预测结果但难以解释模型为何做出这样的预测。这种不可解释性严重限制了模型在科学发现中的应用价值——科学家不仅需要预测结果更需要理解气候系统的运行机制。正是基于以上洞察清华大学电子工程系李勇教授团队提出了一个根本性的科学问题能否设计一个统一的建模框架将全球海洋-大气系统视为一个相互作用的整体同时学习多个气候模态的演化规律和它们之间的耦合动力学这个问题的重要性远超技术层面本身。如果能够实现真正的多模态统一建模不仅有望显著提升气候预测的准确性和时效性更能够为AI辅助科学发现开辟全新路径——让AI从单纯的预测器转变为能够揭示物理机制、提出科学假设的发现工具。核心创新UniCMUnified Climate Model统一气候模型的提出标志着气候预测领域的一次范式突破。其核心创新可以从以下几个维度深入理解从「单一模态」到「全局耦合」的方法论转变传统气候预测遵循分解-独立预测-结果叠加的技术路线各模态被切割成独立的预测对象。UniCM则首次提出从全球耦合系统的视角出发将整个气候系统建模为一个大尺度相互作用的复杂网络。这一转变的理论基础在于气候模态之间并非孤立存在而是在物理上通过海洋-大气耦合过程紧密联系。建模这种耦合关系能够释放出传统方法无法利用的预测信息。双分支架构设计UniCM采用精心设计的双分支架构分别负责不同层次的气候信息处理Globalformer模块专注于学习局地物理场的时空演化处理海表温度SST、风应力、温跃层深度、上层海洋温度等关键物理变量。这一分支负责捕捉气候系统的细粒度动态特征。Modeformer模块聚焦于气候模态之间的关系学习直接处理ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD等七类重要气候模态的时序演化学习它们之间的非线性交互和共同演化规律。双向耦合机制Mode-to-Patch Guidance最具创新性的设计是UniCM建立的双向耦合机制。一方面局地物理场的变化产生并塑造大尺度气候模态另一方面已经形成的气候模态又反过来影响局地物理场的未来演化。这种双向耦合机制实现了从局部到整体、再从整体反馈局部的闭环建模使模型能够更好地捕捉气候系统的涌现特性。可解释性与科学发现能力的融合UniCM不仅追求预测精度更强调模型的可解释性。通过分析模型内部的注意力机制研究团队发现模型能够自动聚焦于具有物理意义的关键区域和关键模态关系。这意味着UniCM不仅仅是一个预测工具更是一个能够帮助科学家发现潜在机制、提出新科学假设的智能助手。技术方案详解整体架构设计UniCM采用Transformer架构作为基础骨架针对气候预测任务进行了系统性优化。整体架构包含三个核心组件1. 输入编码层模型接收两类输入局地物理场数据和气候模态指数数据。物理场数据包括全球海表温度SST场、海洋上层温度剖面、风应力矢量场、温跃层深度等。这些数据首先经过卷积神经网络编码为patch序列每个patch对应地球表面的一个空间区域。气候模态数据则直接编码为模态特征向量包含ENSO、IOD、TNA、NPMM、SPMM、IOB、SIOD等七类模态的时序信息。2. Globalformer模块Globalformer负责处理patch化的物理场数据采用标准Transformer架构进行时空建模。其核心机制包括空间自注意力机制学习不同空间区域之间的远程依赖关系捕捉如厄尔尼诺期间赤道太平洋与印度洋之间的遥相关现象。时间自注意力机制建模气候变量在时间维度上的演化规律捕捉季节性和年际变率。物理约束层在注意力计算中引入物理先验知识如赤道波动理论、海气耦合约束等确保模型输出符合基本物理规律。3. Modeformer模块Modeformer是UniCM的核心创新模块专门设计用于学习气候模态之间的耦合关系模态间注意力机制计算不同气候模态之间的注意力权重识别关键耦合关系。例如模型可以自动学习到NPMM与ENSO之间的强耦合关系。滞后交互建模采用因果注意力机制建模模态之间的滞后相关支持跨时间尺度的信息传递。模态融合层将多模态信息整合为统一的气候状态表征同时保留各模态的特异性信息。4. 双向耦合层Mode-to-Patch Guidance这是UniCM最具特色的技术组件实现Globalformer与Modeformer之间的双向信息流动Bottom-up路径Globalformer提取的局地物理特征向上汇聚形成大尺度气候模态表征。这一过程模拟了局地海气相互作用汇聚形成全球气候模态的物理过程。Top-down路径Modeformer生成的气候模态状态向下广播指导Globalformer对关键区域和关键物理过程的关注。这一机制被称为mode-to-patch guidance体现了大尺度气候背景对局地天气气候的调制作用。通过双向耦合模型形成了一个闭环的全局-局部信息交互系统能够更准确地捕捉气候系统的复杂动态。训练策略UniCM采用多任务联合训练策略同时优化以下目标预测精度损失最小化预测气候场与观测场之间的均方误差。模态重建损失确保模型能够准确重建各气候模态的时间序列。耦合保持损失强制模型保持气候模态之间已知的物理耦合关系如NPMM领先ENSO约4个月的关系。这种多目标训练策略确保模型在追求高预测精度的同时保持对物理规律的遵循。预测推理在推理阶段UniCM支持多步滚动预测输入当前时刻的物理场和模态数据通过Globalformer和Modeformer进行状态更新通过mode-to-patch guidance机制实现全局-局部的信息交互输出下一时刻的预测结果将预测结果作为输入循环进行多步预测这种自回归预测机制使UniCM能够实现长达24个月的气候预测。实验结果分析ENSO预测能力达到国际领先水平ENSO预测是长期气候预测领域最具挑战性的任务也是检验模型能力的黄金标准。在1980—2023年的长期历史数据检验中UniCM展现出卓越的预测性能预测时效大幅延长UniCM在24个月预测窗口内持续优于多种代表性基线模型包括当前最先进的物理统计模型和深度学习模型。模型成功将ENSO的有效预测提前期延长至19个月而此前先进模型通常只能达到15至16个月左右。这一提升在气候预测领域具有里程碑意义。突破春季可预报性障碍春季可预报性障碍Spring Predictability Barrier是困扰气候预测界数十年的难题——由于春季大气状态转换导致预测信号减弱模型在跨越北半球春季时预测技巧往往急剧下降。UniCM通过学习多模态耦合关系有效克服了这一困难在跨越春季时仍能保持较高预测技巧将有效预测能力延长至约14个月。极端事件精准复现模型成功再现了多个历史极端ENSO事件包括1997—1998年超级厄尔尼诺事件以及2020—2023年连续三年的三重拉尼娜事件。这些事件在气候历史上具有重要地位其准确预测对于防灾减灾具有重大价值。UniCM不仅准确捕捉了这些事件的发生时间还成功复现了它们的发展过程和衰减轨迹。首次实现全球多气候模态统一预测UniCM的突破性不仅体现在ENSO预测上更在于其首次实现了真正意义上的全球多气候模态统一预测。在同一框架下模型能够同时预测七类重要气候模态气候模态有效预测提前期相对提升ENSO19个月20%IOD7个月22%IOB6个月18%SIOD5个月25%SPMM8个月15%NPMM9个月20%TNA6个月22%结果显示模型在多个非ENSO模态上的预测能力均显著优于现有代表性方法。特别值得注意的是部分较难预测的非ENSO模态平均预测技巧提升超过22%这表明UniCM的耦合建模策略对于各类气候模态都具有普遍有效性。耦合关系准确重建更重要的是UniCM能够准确重建不同气候模态之间真实存在的滞后相关关系。例如模型成功再现了NPMM领先ENSO约4个月的物理联系以及多个跨洋盆气候模态之间的耦合结构。这种能力证明模型学到的并非简单的统计相关性而是真实存在于全球气候系统中的物理耦合机制。从预测到科学发现的能力验证研究团队通过分析模型内部注意力机制发现了UniCM在科学发现方面的巨大潜力自动识别关键预测因子在重大ENSO事件发生之前模型的注意力机制会自动聚焦于具有物理意义的关键区域和关键模态关系。例如在1997年超级厄尔尼诺事件发生前模型识别出NPMM的重要先导作用这一发现与后续气候物理研究结果高度一致。发现关键枢纽模态在部分复杂气候事件的分析中模型发现TNA可能扮演关键枢纽角色通过跨洋盆遥相关影响多个气候模态的演化。这一发现为理解气候系统的内在关联提供了新视角。这些结果表明UniCM不仅是一个高精度的预测工具更是一个具有科学发现能力的智能助手有望成为气候科学研究的重要辅助工具。优势与不足主要优势1. 方法论范式创新UniCM突破了传统气候预测单一模态、分别预测的思路首次从全球耦合系统的视角统一建模多个海洋-大气气候模态之间的复杂动力学关系。这一范式创新为整个气候预测领域提供了新的研究思路和技术路线。2. 预测性能显著提升通过充分利用模态间耦合关系UniCM在ENSO等关键气候模态的预测上实现了显著突破有效预测提前期延长3-4个月这一进步在气候预测领域具有重要应用价值。3. 可解释性强相比传统深度学习黑箱模型UniCM通过注意力机制的可视化分析能够揭示模型关注的物理关键区域和模态关系为理解模型预测逻辑提供了窗口也为科学发现提供了可能。4. 应用前景广阔从农业生产到水资源管理从能源调度到防灾减灾UniCM更准确、更长时效的气候预测能力将在众多领域产生实际应用价值。其揭示的耦合机制也可能为气候干预研究提供理论支撑。潜在不足1. 数据依赖性作为数据驱动方法UniCM的性能高度依赖历史观测数据的质量和长度。对于观测稀疏的区域如南大洋、高原等模型预测能力可能受限。长时间序列高质量数据的获取仍是挑战。2. 极端事件样本稀缺极端气候事件如超级厄尔尼诺的历史样本极为有限这使得模型在极端事件预测上面临样本不足的困难。虽然模型在历史极端事件复现上表现良好但未来极端事件的预测能力仍需验证。3. 物理机制的可解释性边界虽然UniCM展现出一定的科学发现能力但模型学习到的耦合关系是否真正对应物理因果还是仅是统计相关仍需进一步的因果推断验证。如何将数据驱动的发现与传统物理理解有机结合仍是开放问题。4. 计算成本相比传统统计预测方法UniCM的训练和推理需要更高的计算资源支持这可能限制其在资源受限场景中的应用。未来研究方向技术层面深化因果推断与耦合建模的融合当前UniCM主要学习统计相关性未来可引入因果推断方法更精确地识别气候模态之间的因果关系从关联学习升级为因果发现。多尺度耦合建模现有模型主要关注季节-年际尺度未来可扩展到季节内振荡如MJO、年代际气候变化乃至更长尺度建立跨时间尺度的统一耦合框架。观测-模式混合建模将数据驱动方法与物理数值模式结合利用模式输出的物理一致性约束和观测数据的真实性实现优势互补。应用领域拓展气候影响预测深化将气候模态预测与具体气候影响如降水、温度、台风路径相结合提升气候影响预测的直接应用价值。气候变化情景预测在全球变暖背景下气候模态的统计特性可能发生变化。UniCM框架有望扩展到气候变化情景下的气候模态演化研究。跨学科应用探索UniCM所体现的局部过程-整体结构双向耦合建模思想可推广到其他复杂系统研究如生态系统、社会经济系统等。科学发现功能增强知识图谱构建基于UniCM学习到的耦合关系构建气候系统知识图谱系统化表示和推理气候模态间的复杂关系。假设自动生成开发基于UniCM的假设生成系统自动从模型行为中发现新的气候机制假说加速科学发现进程。人机协作研究范式探索科学家与AI模型协作研究的新范式AI负责模式识别和假设生成科学家负责物理验证和理论构建形成高效的闭环研究系统。编辑点评清华团队提出的UniCM模型在气候预测领域具有划时代意义。这项工作不仅实现了技术层面的性能突破——将ENSO有效预测提前期延长至19个月更为重要的是它开启了一种全新的气候研究范式不再将AI视为单纯的预测工具而是作为探索复杂系统规律的智能助手。从方法论角度看UniCM的双分支架构和双向耦合机制为处理复杂系统中的多尺度、多模态耦合问题提供了可借鉴的技术框架。这种全局-局部双向耦合的设计思想具有广泛的通用性有望推广到生态系统、流行病传播、社会经济系统等其他复杂系统研究中。从科学价值角度看UniCM展现出的可解释性和科学发现能力最为引人注目。模型能够自动识别物理关键区域、发现模态间的隐藏关系这意味着AI不仅能做事还能说话——解释它看到了什么、发现了什么。这种能力的释放将极大加速人类对气候系统的认知进程。当然作为一项新兴技术UniCM仍有提升空间。如何从统计关联提升到因果发现、如何处理气候变化背景下的非平稳性、如何在有限样本下提升极端事件预测能力这些都是值得深入探索的方向。最后需要指出的是气候预测是一个高度交叉的领域需要气象学、海洋学、计算机科学、数学等多学科的深度协作。期待更多研究者加入这一方向共同推动AI赋能气候科学的新发展。本文内容由洵锋学术编辑整理学术信息仅供参考详情请参阅原始论文。

相关新闻