IT时报 -V3 数字上海-
3数字上海
  • ·气象大模型,让极端天气不再无解

气象大模型,让极端天气不再无解

“风乌”“盘古气象”等推动天气预报更准、更快、更大范围

  

IT时报记者范昕茹图东方IC
  7月21日上午,今年第5号台风“杜苏芮”在西北太平洋洋面生成。随后,“杜苏芮”以每小时10—15公里的速度向西偏北转西北方向移动,于7月24日晚上加强为超强台风级。截至记者发稿,“杜苏芮”正逐渐接近我国沿海城市。
  在上海,也有一群人时刻关注着“杜苏芮”的走势。今年4月,上海人工智能实验室联合中国科学技术大学、上海交通大学、南京信息工程大学、中国科学院大气物理研究所及上海中心气象台发布全球中期天气预报大模型“风乌”,将有效预报时长延长到10.75天。如何更准确地预测天气、更精准地了解台风路径,为防灾减灾做出贡献……是“风乌”需要研究的课题。
  南京信息工程大学气候与应用前沿研究院院长罗京佳认为,气象大模型的出现,正推动着气象预测发生变化。未来,气象大模型将和传统数值预报一起,推动气象预测朝更准、更快、更大范围的方向前进。
首个突破10天的气象大模型
  随着ChatGPT的落地,全球进入大模型时代,这也带动了气象大模型潮流的出现。
  放眼国际,谷歌DeepMind发布了气象大模型GraphCast,而在国内,清华和华为相继发布气象大模型“鬼天气”和“盘古气象”,“风乌”也是伴随着这一波浪潮诞生的。
  和其他大模型不同,天气预报的精度和准度是气象大模型的生命线。而想要做到这一点,就要求气象大模型必须先懂气象。“气象要素之间,有普遍的联系性。”罗京佳解释说,比如上海发生大暴雨,强对流天气可能会影响到北京或者纽约的天气。
  怎样利用人工智能算法抓住气象要素间的联系,是提升全球气象预测准确性的关键。
  在AI模型的设计和训练过程中,“风乌”研究团队就利用了这一特性,将多个大气变量间的相互影响看作多任务学习问题,采用多模态神经网络和多任务自动均衡权重,解决多种大气变量表征和相互影响的问题。位势、湿度、纬向风速、经向风速、温度以及地表等大气变量这些多模态信息,被结构在了多模态网络中。
  通过不断地学习调整,“风乌”自动学习每个大气变量的重要性,使得多个大气变量之间能够更好地协同优化,不断提升大模型的精准度。
  如今,“风乌”在80%的评估指标上,都超越DeepMind发布的气象大模型GraphCast。在预报精度方面,相比GraphCast,“风乌”的10天预报误差降低10.87%,相比于传统的物理模型,误差降低了19.4%。
  过去数十年间,囿于气象观测的准确度、大气系统中物理过程的复杂性以及求解大气模型所需的巨大资源规模,全球中期天气预报的有效性每10年才提高1天。
  “风乌”却基于再分析数据,将有效预报时长提高到了10.75天。此前,全球范围内最好的物理模型HRES在此标准范围内,有效预报时长最大仅有8.5天。
  也因此,“风乌”成为全球首个突破10天的气象大模型。
预报极端天气不再是难题
  在传统的数值预报中,存在一个弱项,就是对强对流等突发天气束手无策。“我们主要是先观测,观测到了再追踪。”一位气象研究员解释说,比如在一个地方观测到雷电云团,气象员会对云团进行跟踪,并根据当时的风向等各种数据,推测出云团运行的方向和路径,从而对云团行进轨迹上的地区进行气象预报。但这也导致一个问题,就是预测时间很短,对传统气象预报而言,强对流等突发天气的预报提前时间通常在1个小时之内。
  现在,这一数字正被气象大模型所刷新。基于美国和中国的雷达观测,清华大学软件学院与国家气象中心、国家气象信息中心联合发布的气象大模型“鬼天气”能对2048公里×2048公里的区域内,生成合理的降水临近预报,将预报时间提前到3个小时。虽然看似只提前了2小时,但却能大大减少灾害的发生。
  台风同样如此。每年夏天是我国台风天气多发的时节,伴随着东南季风,太平洋海面上生成的热带气旋裹挟着水汽,一路增强为台风,并朝向西北抵达陆地。登陆后,台风开始衰减直至消散。对我国东南沿海区域而言,每一次台风都是一次考验。“大模型在台风上的应用已经很好了。”罗京佳说,“传统预报一般采用数字预报和人工预报结合的方式进行,比较考验预报员的经验,但大模型依靠数据,可以对台风路径有个相对准确的判断。”
  关于气象大模型“盘古气象”的论文显示,在对2018年台风“康妮”进行预测时,“盘古气象”所生成的跟踪结果,几乎与地面事实一致。
  作为全球中期气象预测大模型的“风乌”,台风预测也是它的强项之一。上海人工智能实验室青年科学家白磊透露,“风乌”对今年的“玛娃”台风进行了准确的轨迹预报。
  “虽然近年来极端天气频现,但整个大气层的底层规律还是相似的,其中一些共性规律可以被AI发现并学习。”不过,在白磊看来,目前仍然需要针对气象变化的情况对模型进行微调,运用更多的数据来提高算法有效性,有针对性地改进模型,进一步提高其对极端天气的预报能力。“比如,提升训练数据的分辨率,将天气预报从一个区精确到一个街道,向着更精准、更精确的方向努力。”他说。
天气预报应用拓宽
  相比传统方式,气象大模型最重要也是变化最大的一个特点是效率。
  由于传统数值预报需要进行复杂的数学物理方程计算,受限于计算的复杂程度,一台超级计算机往往需要几个小时才能出结果。气象大模型的出现,将气象预测从小时级一下子缩短到了秒级。
  公开信息显示,“盘古气象”的推理速度与FourCastNet相当,其在TeslaV100 GPU上预测24小时的天气只需要1.4秒,而“风乌”仅需30秒即可生成未来10天全球高精度预报结果。
  在巨大的算力支撑下,气象大模型的预测效率大大提升。在罗京佳看来,这将大大拓展天气预报的应用范围。“以往一些企业想要获得天气预报数据,往往要等好几个小时。”罗京佳说,现在,几秒钟就能出来,大大增加了预报的时效性。
  获取的便利性、更高的时效性,将有利于把天气预报运用到更多的场景中去。例如,应用于物流行业,帮助物流行业更好地规划快递配送;应用到渔牧业,帮助渔民牧民更好地执行渔牧计划,规避风险。
  据了解,未来“风乌”AI气象大模型将与传统的物理模型形成互补,为各行各业的生产生活提供更准确、更实用的天气预报信息,助力天气预报数字化,为农林牧渔、航空航海等各行业及公共安全保障提供有力的支持。
  上海人工智能实验室AI for Earth团队还将把人工智能方法应用到更广泛的气象、环境、天文、地质等地球科学问题研究中,助力“碳中和”、防灾减灾、能源安全等重大需求。