• CN 62-1175/P
  • ISSN 1006-7639
  • 双月刊
  • 中国科技核心期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中文科技期刊数据库收录期刊

干旱气象, 2024, 42(1): 117-128 DOI: 10.11755/j.issn.1006-7639(2024)-01-0117

技术报告

基于前馈神经网络的多模式集成降水预报研究

朱文刚,1,2, 盛春岩,1,2, 范苏丹1,2, 荣艳敏1,2, 曲美慧3

1.山东省气象防灾减灾重点实验室,山东 济南 250031

2.山东省气象科学研究所,山东 济南 250031

3.吉林省气象科学研究所,吉林 长春 130062

Research on multi-model integrated precipitation forecast based on feed forward neural network

ZHU Wengang,1,2, SHENG Chunyan,1,2, FAN Sudan1,2, RONG Yanmin1,2, QU Meihui3

1. Key Laboratory for Meteorological Disaster Prevention and Mitigation of Shandong Province,Jinan 250031,China

2. Shandong Institute of Meteorological Sciences,Jinan 250031,China

3. Jilin Institute of Meteorological Sciences,Changchun 130062,China

通讯作者: 盛春岩(1972—),女,山东栖霞人,博士,正高级工程师,主要从事数值预报和天气预报技术开发。E-mail:sdqxscy@126.com

责任编辑: 黄小燕;校对:邓祖琴

收稿日期: 2022-11-28   修回日期: 2023-09-8  

基金资助: 山东省自然科学基金面上项目(ZR2020MD055)
人工智能气象应用技术创新团队项目(SDCXTD2023-3)
山东省重点研发计划项目(2016GSF120017)
山东省气象局重点课题项目(2019sdqxz07)
山东省气象局重点课题项目(2023sdqxz08)
山东省气象科学研究所开放基金项目(SDQXKF2015Z01)
山东省气象科学研究所开放基金项目(SDQXKF2015M03)

Received: 2022-11-28   Revised: 2023-09-8  

作者简介 About authors

朱文刚(1985—),男,山东郯城人,硕士,高级工程师,主要从事数值天气预报和人工智能技术应用研究。E-mail:zhu122812@163.com

摘要

为提高山东定量降水预报准确率,采用深度前馈神经网络(Deep Forword Neural Networks, DFNN)和降水分级最优TS(Threat Score)权重集成方法对多模式集成降水预报进行研究。对2019年4—9月欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasting, ECMWF)全球数值预报系统、中国气象局上海数值预报模式系统(China Meteorological Administration Shanghai 9 km, CMA-SH9)和中国气象局中尺度天气数值预报系统(China Meteorological Administration Mesoscale, CMA-MESO)逐24 h累积降水量预报进行有监督训练,得到4组DFNN(ES、EM、SM、ESM)深度学习模型,并利用多模式降水分级最优TS权重集成方法建立Mul-OTS(Multi-mode Optimal Threat Score)集成模型。用2020年4—9月各模式逐24 h累积降水量进行降尺度格点预报,对5种集成方案对比检验、个例分析应用。结果表明:不同起报时间、不同预报时效,5组集成方案均降低了平均相对误差,ESM方案最好,Mul-OTS方案最差;4组DFNN方案均提高了晴雨准确率,ESM方案最好,Mul-OTS方案低于模式预报;4组DFNN方案均提高了各降水等级TS、ETS评分,对弱降水的提高幅度大于强降水,Mul-OTS方案对小量级降水等级订正是负技巧,对大量级降水等级的订正效果较好,但仍不如ESM方案;个例分析发现降水强度和落区预报ESM方案均优于其他集成方案。因此业务上采用最优的ESM方案建立了定量降水格点预报系统,为智能网格预报提供重要支撑。

关键词: 前馈神经网络; 最优TS权重; 多模式集成; 格点降水预报

Abstract

In order to improve the accuracy of quantitative precipitation forecasting in Shandong Province, the deep feedforward neural network (DFNN) and the optimal threat score (TS) weight ensemble method for precipitation grading were used to study the multi-model ensemble precipitation forecasting. Four groups of DFNN (ES, EM, SM, ESM) deep learning models were obtained by using the 24-hour cumulative precipitation forecast of Global Numerical Prediction System of the European Centre for Medium-Range Weather Forecasts, the Shanghai Numerical Prediction Model System of the China Meteorological Administration and the Mesoscale Numerical Weather Prediction System of the China Meteorological Administration from April to September 2019 for supervised training, and the Mul-OTS (Multi-mode Optimal Threat Score) integrated model was established by using the optimal TS weight integration method of multi-model precipitation classification. The down-scale grid prediction was made by using the accumulated precipitation of each model for 24 h from April to September 2020, and the comparison test and case analysis of five integrated schemes were carried out. The results show that the average relative error was reduced by the five integrated schemes with different starting time and lead times. The ESM scheme was the best, and the Mul-OTS scheme was the worst. All the four groups of DFNN schemes improved the accuracy of sunny and rainy prediction, the ESM scheme was the best, and the Mul-OTS scheme was lower than the model forecast. The four groups of DFNN schemes all improved the TS and ETS scores of each precipitation grade, and the improvement amplitude of weak precipitation was greater than that of strong precipitation. The Mul-OTS scheme was a negative technique for the correction of small precipitation levels, and the correction effect was better for the correction of large precipitation levels, but it was still inferior to the ESM scheme. A case study found that the ESM scheme for precipitation intensity and fall area forecast was superior to other integrated schemes. Therefore, the optimal ESM scheme was adopted to establish a quantitative precipitation grid forecasting system, which provides important support for intelligent grid forecasting.

Keywords: feedforward neural network; optimal threat score weight; multi-mode integration; grid precipitation forecast

PDF (7246KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

朱文刚, 盛春岩, 范苏丹, 荣艳敏, 曲美慧. 基于前馈神经网络的多模式集成降水预报研究[J]. 干旱气象, 2024, 42(1): 117-128 DOI:10.11755/j.issn.1006-7639(2024)-01-0117

ZHU Wengang, SHENG Chunyan, FAN Sudan, RONG Yanmin, QU Meihui. Research on multi-model integrated precipitation forecast based on feed forward neural network[J]. Arid Meteorology, 2024, 42(1): 117-128 DOI:10.11755/j.issn.1006-7639(2024)-01-0117

引言

随着同化观测资料种类和数据量的增多,以及同化技术和数值模式本身的发展和完善,数值天气预报准确率越来越高,但由于大气的混沌性,数值模式仍不可避免地存在随机误差(叶笃正等,2006;穆穆等,2011;杜钧和康志明,2014),且各种数值模式在分辨率、初始场、积分步长、物理参数化方案和动力框架等方面的不同导致模式预报误差也不尽相同。预报员面对多个模式的预报产品,仅凭借主观分析快速而准确地制作定量预报比较困难,尤其是模式降水预报具有离散性、非线性、非高斯特征,客观订正具有更大挑战。科学合理地进行多模式降水预报的本地化客观释用是提高降水预报水平的有效手段之一(任宏利和丑纪范,2007;毕宝贵等,2016)。

常用的定量降水客观订正方法,主要有针对单个模式进行系统性偏差订正的频率匹配法、最优评分订正法、百分位映射法等(Panofsky and Brier, 1968;Ebert, 2001;李俊等, 2014;智协飞和吕游, 2019;曹萍萍等,2023)。其中,频率匹配法通过统计实况与降水预报不同量级对应的频率,将有偏差的降水预报频率调整到对应量级的实况频率上(李莉等,2011;李俊等,2015;周迪等,2015);最优评分订正法基于训练期模式降水量预报调整后的TS(Threat Score)评分最优化进行建模,以确定预报日降水分级订正系数(吴启树等,2017);百分位映射法将模式预报转化为基于预报结果分布的百分位值,考虑模式与观测之间概率密度分布的偏差并对其进行订正(童尧等,2017)。而针对多模式集成方法有集合平均法、消除偏差集合平均法、加权集成法、多模式最优评分集成法等,研究表明综合采用多种方法一起订正要优于采用单一方法的订正效果:如,利用频率匹配法先进行单模式订正后,再分别利用3种集成方法进行多模式集成,在强降水的落区预报和降水中心的量级预报效果优于原始多模式集成与单模式结果(智协飞和赵忱,2020);利用逻辑回归方法、线性回归法先对4个模式降尺度订正,再将4个预报值进行消除偏差集合平均,结果多模式集成的预报效果优于单模式结果(王海霞和智协飞,2015);利用最优TS评分分别订正欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasting, ECMWF)全球数值预报模式、中国气象局上海数值预报模式(China Meteorological Administration Shanghai 9 km, CMA-SH9)降水预报后,再利用降水分级最优化权重法对订正后的两种产品集成,集成预报在几乎所有预报时效、所有降水量级的TS评分均高于单一订正后的降水预报(危国飞等,2020)。以上研究表明,单模式的偏差订正、多模式集成方法均不同程度地提高了数值模式降水预报准确率,且多模式集成预报要优于单一模式的订正预报。

随着机器学习和人工智能理论与技术的不断发展,越来越多的深层次神经网络被提出并得到应用。这些深层次网络可以有效地处理大规模、高维度的数据,并具备处理复杂非线性关系的能力,应用效果往往优于依靠统计特征或者主观经验积累的传统方法(王在文等,2012;顾建峰等,2020;孙健等,2021;袁凯等,2023;袁雅涵等,2023)。如,采用卷积神经网络训练的逐时降水分级订正模型,与频率匹配法对比,降低了分类降水预报的漏报率和晴雨、弱降水预报的空报率(陈锦鹏等,2021);利用ECMWF逐日24 h累积降水集合预报资料,分别建立了前馈神经网络(Neutral Network, NN)和带地理信息(Neutral Network-Geographic Information, NN-GI)模型进行概率预报,经NN和NN-GI模型订正后得到明显改进(智协飞等,2021);基于人工树突神经网络(Artificial Dendritic Neural Network, ADNN)算法,针对CWRF模式(Climate-Weather Research and Forecasting mode)回报的1996—2019年夏季降水量进行订正,提高了该模式降水预测精度(李涛等,2022)。

以上各类机器学习人工智能方法与气象大数据结合,在强对流监测、短时临近预报、短期预报领域得到了广泛应用,但利用深度学习方法开展多模式集成降水预报研究较少。因此,本文采用深度前馈神经网络(Deep Forword Neural Networks, DFNN)和多模式降水分级最优TS权重集成方法,设计了4组DFNN方案和1组Mul-OTS(Multi-mode Optimal Threat Score)集成方案,对多模式集成降水预报进行客观订正研究,以期提高山东定量降水预报准确率。

1 资料和方法

1.1 资料

1.1.1 实况资料

降水实况使用2019、2020年4—9月山东省123个国家级地面气象观测站(简称“国家站”)和298个区域级地面气象观测站(简称“区域站”)逐日24 h累积降水量。其中,2019年4—9月24 h累积降水量作为标签,用于DFNN降水预报模型训练和验证,以及对模式进行TS评分建立Mul-OTS集成模型;2020年4—9月24 h累积降水量用来对集成预报进行检验分析。文中所有时间均为北京时。图1为山东省123个国家站不同降水等级样本数,2019年晴样本数是小雨样本数的5倍左右,是中雨样本数的21倍左右,是暴雨以上等级样本数的64倍左右,不同降水等级训练样本极度不平衡。2020年小雨到暴雨样本数较2019年偏多,晴和大暴雨以上样本数则略少于2019年。

图1

图1   2019、2020年4—9月山东省123个国家站不同降水等级样本数

Fig.1   The number of precipitation samples of different grades at 123 national stations in Shandong Province from April to September in 2019 and 2020


文中附图涉及地图是基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2017)3320号的标准地图制作,底图无修改。

1.1.2 数值预报资料

数值预报降水资料包括中国气象局中尺度天气数值预报系统(China Meteorological Administration Mesoscale,CMA-MESO)72 h内逐24 h累积降水量,产品水平分辨率为10 km;中国气象局上海数值预报模式系统(CMA-SH9)72 h内逐24 h累积降水量,产品水平分辨率为9 km;欧洲中期天气预报中心(ECMWF)全球数值预报系统细网格72 h内逐24 h累积降水量,产品水平分辨率为0.125°×0.125°。以上资料研究时段均为2019、2020年4—9月,采用反距离权重插值法(李金洁和王爱慧,2019)将3个模式的逐24 h累积降水量预报降尺度生成水平分辨率为0.05°×0.05°的格点数据,然后提取自动站临近格点值和实况观测的24 h累积降水量进行空间匹配。

1.2 Mul-OTS方法

多模式降水分级最优TS权重集成(Mul-OTS)基本思想是对不同降水等级设置不同权重系数,使降水的TS评分在各降水等级达到最优(危国飞等,2020)。优点是在各降水等级上分别进行多模式权重集成,不同降水等级集成时的权重系数采用各模式对应降水等级TS评分权重比例。具体公式如下:

yj=i=1Nwikxi, yj-1Pk,Pk+1 (k=0,...,5)
i=1Nwik=1
wik=TSiki=1NTSik

式中:yj(mm)为第j次迭代集成降水量预报;yj-1(mm)为第j-1次迭代集成降水量预报;N为模式集成个数;xi(mm)为第i个模式的降水量预报;Pk为第k个降水等级阈值,k取0~5时,对应Pk取0.0、0.1、10.0、25.0、50.0、100.0 mm;wik为第i个模式在不同k降水等级的权重系数,本文采用2019年4—9月3个模式24 h累积降水量的TS评分权重比例作为权重系数(图2)。由图2看出,中雨以上降水等级ECMWF的权重系数大于CMA-SH9和CMA-MESO。首次迭代y0采用3个模式的平均值,通过穷举法得到最优迭代次数j2,最终建立Mul-OTS集成模型。

图2

图2   2019年4—9月不同模式预报的不同降水等级24 h累积降水量TS评分(a)和权重系数(b)

Fig.2   Threat score (a) and weight coefficients (b) of 24 h accumulated precipitation of different grades predicted by different models from April to September 2019


1.3 深度学习方法

深度学习概念由Hinton等(2006)提出,属于统计学习范畴,本质是从数据出发,提取数据特征,发现数据中的联系,抽象出数据模型,最后回到数据分析与预测中。本文使用的深度学习方法为深度前馈神经网络DFNN结构(图3),主要分输入层、多个隐含层和输出层,相邻神经元的节点全部连接,各层之间没有反馈。

图3

图3   深度前馈神经网络结构示意图

Fig.3   Structure diagram of deep feedforward neural network


DFNN算法实现主要分两步,第一步通过“前向传播”将输入特征向量逐层映射提取数据特征,并利用前向传播的输出值和真值样本标签建立损失函数Loss;第二步利用误差“反向传播”算法最小化损失函数,使模型达到收敛状态,减少模型预测值的误差,不断调整优化权重W和偏置B得到DFNN模型。第一步前向传播公式如下(阿斯顿·张等,2019):

Y1=f(W1X1+B1)Y2=f(W2X2+B2)Yn=f(WnXn+Bn)

式中:W为权重矩阵;B为偏置向量,Xi=Yi-1(i=1,2 ,, n),即当前神经元的输出特征向量Yi-1作为下一神经元的输入特征向量Xif表示神经元的激活函数,使得神经网络可以任意逼近任何非线性函数,常用的激活函数有Sigmoid、Softmax、Tanh、Relu、Elu等。

第二步反向传播最小化损失函数,晴雨分类使用交叉熵函数(Cross Entropy Loss)。降水量回归使用均方误差(Mean Square Error,MSE)函数。损失函数公式(阿斯顿·张等,2019)如下:

$\text { Lops }=-\frac{1}{m} \sum_{i=1}^{m}\left[y^{(i)} \ln \hat{y}^{(i)}+\left(1-y^{(i)}\right) \ln \left(1-\hat{y}^{(i)}\right)\right]$
MSE=1mi=1myi-y^i2

式中:y(mm)表示站点观测降水量;y^(mm)表示训练模型预测降水量;m表示样本数。

1.4 检验方法

降水预报检验采用气象系统业务常用办法,主要有平均相对误差(Mean Relative Error, ME)、晴雨准确率(Precision, PC)、TS评分、漏报率(Missing ratio, PO)、空报率(False Alarm Ratio, FAR)、预报偏差Bias及ETS(Equitable Threat Score)评分等(Jolliffe and Stephenson, 2003;王雨和闫之辉, 2007(①国家气象中心, 2020. 智能预报技术方法竞赛检验方案.气预函〔2020〕34号.北京:中国气象局预报与网络司.),主要公式如下:

ME=1mi=1myi-y^iyi+y^i
Bias=NA+NBNA+NC
ETS=NA-rNA+NB+NC-r×100%r=NA+NBNA+NCNA+NB+NC+ND               

式中:y(i)表示第i样本观测值;y^(i)表示第i样本预测值;m表示总样本数;ME表示训练模型对观测的拟合程度,越接近0说明预报和实况的偏差越小;NA、NB、NC分别为对应降水等级预报正确站数、空报站数、漏报站数;ND为预报和观测降水量均小于该降水等级的站数;Bias越接近1说明预报的降水面积和实况面积越接近,和降水位置无关,Bias>1表示存在湿偏差,Bias<1表示存在干偏差;ETS评分越接近1越好,并且对空报和漏报有惩罚,空报的影响大于漏报,ETS0表示预报为负技巧,ETS>0表示预报为正技巧。

2 方案设计和模型训练

2.1 方案设计

各数值模式在分辨率、初始场、积分步长、物理参数化方案和动力框架等方面不同,各模式预报误差也不尽相同,如全球模式ECMWF对于大尺度系统性降水预报较好,但存在小雨空报较多,强降水偏弱等问题,而区域模式由于分辨率更高,同化本地资料更多,对对流性短时强降水预报更好,但空报较多。为考察多模式集成预报效果,本文通过对ECMWF、CMA-SH9和CMA-MESO数值模式进行不同组合,设计了4组DFNN方案(表1中方案1、2、3、4)和1组Mul-OTS集成方案(表1中方案5)进行对比研究。

表1   方案设计

Tab.1  Design scheme

方案模式简称
1ECMWF、CMA-SH9ES
2ECMWF、CMA-MESOEM
3CMA-SH9、CMA-MESOSM
4ECMWF、CMA-SH9、CMA-MESOESM
5ECMWF、CMA-SH9、CMA-MESOMul-OTS

新窗口打开| 下载CSV


2.2 模型训练

用2019年4—9月模式24 h累积降水量作为DFNN方法的训练集训练模型。由于不同降水等级样本数存在明显数据不平衡(图1),导致训练模型获得的数据特征更多来自弱降水,损失了强降水的数据特征。然而,暴雨以上等级的预报往往需要重点关注,因此本文训练降水预报模型分为两个步骤:第一步训练晴雨二分类模型。训练分类模型之前数据进行随机下采样使晴、雨样本数相等,模型包含5个隐含层,节点数分别为32、64、128、64、16,输出层激活函数使用Sigmoid,损失函数使用交叉熵损失;第二步只用有降水的样本训练降水回归模型。模型包含3个隐含层,节点数分别为32、64、16,回归模型输出层不设激活函数,损失函数使用MSE损失。训练分类和回归模型时数据标准化均使用Z-score,激活函数均使用ReLu,优化损失函数均采用Adam梯度下降算法,损失函数正则化均使用L2-norm,初始化权重方法均采用随机初始化方法,随机取[-0.5,0.5]。

训练晴雨分类模型和降水回归模型均采用10次交叉验证策略评估模型的预测性能和泛化能力(图4)。通过对比,3个模式(ECMWF、CMA-SH9、CMA-MESO)08:00、20:00起报的0~24 h累积降水量预报,CMA-SH9晴雨准确率均最高,对应4组DFNN晴雨分类模型(ES、EM、SM、ESM)10次交叉验证晴雨准确率的平均值ESM方案均最高,分别提高了3.07%、3.88%,ES和EM方案基本相当,SM方案最低;3个模式24~48 h累积降水量预报,08:00起报的CMA-MESO晴雨准确率最高,20:00起报的ECMWF晴雨准确率最高,对应4组DFNN晴雨分类模型10次交叉验证晴雨准确率的平均值ESM方案均最高,分别提高了2.67%、3.64%;3个模式08:00、20:00起报的48~72 h累积降水量预报,ECMWF晴雨准确率均最高,对应4组DFNN晴雨分类模型10次交叉验证晴雨准确率的平均值ESM方案均最高,分别提高了1.84%、1.34%。因此,4组DFNN方案训练的晴雨分类模型在不同起报时间、不同预报时效相比模式预报均不同程度提高了晴雨准确率,随着预报时效的延长,提高的程度减少;用3个模式训练的ESM晴雨分类模型准确率提高最多,全球模式和区域模式相结合训练的ES和EM晴雨分类模型准确率相当,只用两个区域模式训练的SM晴雨分类模型准确率提高最少。

图4

图4   DFNN方法10次交叉验证及模式预报的山东省2019年4—9月不同预报时效晴雨准确率

(a)08:00起报,(b)20:00起报

Fig.4   The accuracy of sunny and rainy of 10 times cross validation using DFNN method and the model prediction with different lead times in Shandong Province from April to September 2019

(a) starting at 08:00, (b) starting at 20:00


训练降水回归模型时仅使用了实况有降水样本进行训练,因此表2的检验结果去掉了2019年4—9月实况为晴的样本数。通过对比,不同起报时间、不同预报时效的3个模式逐24 h累积降水量预报,ECMWF平均相对误差(ME)均最低,说明实况在有降水发生时,ECMWF的降水预报效果最好。和模式预报相比,4组DFNN降水回归模型10次交叉验证的平均相对误差(ME)均小于模式预报,其中ESM方案最低。因此,4组DFNN方案训练的降水回归模型均改进了降水预报的效果,且4组DFNN方案当中,用3个模式训练的ESM降水回归模型平均相对误差(ME)最低,优于其他3组DFNN训练(ES、EM、SM)降水回归模型。

表2   DFNN方法10次交叉验证及模式预报的山东省不同起报时间、不同预报时效的2019年4—9月平均相对误差

Tab.2  The mean relative error of 10 times cross validation using DFNN method and model prediction with different start times and different lead times in Shandong Province from April to September 2019

预报时效ECMWFCMA-SH9CMA-MESOESEMSMESM
08:00
起报
20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报
0~24 h0.510.520.590.590.570.570.470.470.470.460.480.490.460.45
24~48 h0.580.570.600.600.650.660.490.480.500.520.520.510.490.48
48~72 h0.630.620.650.650.690.700.520.520.530.540.550.540.510.52

新窗口打开| 下载CSV


3 降尺度格点预报

深度学习模型往往容易过拟合,为进一步评估DFNN降水模型的预报能力,使用2020年4—9月模式预报的逐24 h累积降水量作为测试集进行检验,并和Mul-OTS集成方法进行对比。由于3个数值模式水平分辨率不同,采用反距离加权插值方法将3个模式的逐24 h累积降水量预报降尺度生成水平分辨率为0.05°×0.05°格点数据,作为DFNN方法多模式集成预报的输入进行格点预报。具体步骤:将插值后的多模式格点数据首先输入到晴雨分类模型进行晴雨分类预报,无雨的格点预报为晴,有雨的格点预报再输入到降水回归模型输出定量降水格点预报,最终融合晴雨分类模型和降水回归模型的预报生成全场格点预报。检验时选取距123个国家站临近格点和观测匹配。

3.1 平均相对误差

表3看出,不同起报时间、不同预报时效,3个模式中,CMA-MESO平均相对误差ME均最小。具体地,CMA-MESO模式08:00、20:00起报的0~24 h累积降水量平均相对误差分别为0.34、0.37,对应ESM方案分别为0.25、0.24,分别降低了0.09、0.13,对应Mul-OTS方案分别为0.32、0.34,分别降低了0.02、0.03;CMA-MESO模式08:00、20:00起报的24~48 h累积降水量平均相对误差分别为0.41、0.40,对应ESM方案分别为0.29、0.30,分别降低了0.12、0.10,对应Mul-OTS方案分别为0.40、0.37,分别降低了0.01、0.03;CMA-MESO模式08:00、20:00起报的48~72 h累积降水量平均相对误差分别为0.44、0.42,对应ESM方案分别为0.35、0.32,分别降低了0.09、0.10,对应Mul-OTS方案分别为0.42、0.40,分别降低了0.02、0.02。总体上,5组集成方案的平均相对误差均小于3种模式,且ESM方案最好,Mul-OTS方案不如ES、EM、SM方案。

表3   不同模式和不同方案预报的山东省不同起报时间、不同预报时效的2020年4—9月逐24 h累积降水量平均相对误差

Tab.3  The mean relative error of 24-hour cumulative precipitation predicted with different starting time and different lead times by different models and different schemes in Shandong Province from April to September 2020

预报时效ECMWFCMA-SH9CMA-MESOESEMSMESMMul-OTS
08:00
起报
20:00
起报
08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报08:00起报20:00起报
0~24 h0.460.430.360.430.340.370.270.260.260.250.260.260.250.240.320.34
24~48 h0.480.450.460.450.410.400.320.300.310.280.340.300.290.300.400.37
48~72 h0.500.480.500.500.440.420.360.340.330.320.380.340.350.320.420.40

新窗口打开| 下载CSV


3.2 降水分级评分

图5为不同模式和不同方案预报山东省不同预报时效的2020年4—9月逐24 h累积降水量晴雨准确率。可以看出,3个模式中,CMA-SH9模式08:00起报的0~24 h累积降水量晴雨准确率最高为84.58%,对应ESM方案为86.92%,提高了2.34%,Mul-OTS方案为79.94%,降低了4.64%;CMA-MESO模式20:00起报的0~24 h累积降水量晴雨准确率最高为82.21%,对应ESM方案为86.80%,提高了4.59%,Mul-OTS方案为78.78%,降低了3.43%;CMA-MESO模式08:00、20:00起报的24~48 h累积降水量晴雨准确率均最高,分别为77.80%、79.32%,对应ESM方案分别为81.93%、83.71%,分别提高了4.13%、4.39%,对应Mul-OTS方案分别为74.57%、76.31%,分别降低了3.23%、3.01%;CMA-MESO模式08:00、20:00起报的48~72 h累积降水量晴雨准确率也均最高,分别为74.80%、76.19%,对应ESM方案分别为78.68%、80.55%,分别提高了3.88%、4.36%,对应Mul-OTS方案分别为71.08%、71.64%,分别降低了3.72%、4.55%。总体上,不同起报时间、不同预报时效,4组DFNN方案相比模式预报均提高了晴雨准确率,且ESM方案最好,其次为EM方案,而Mul-OTS方案晴雨准确率低于模式本身预报。

图5

图5   不同模式和不同方案预报山东省不同预报时效的2020年4—9月逐24 h累积降水量晴雨准确率

(a)08:00起报,(b)20:00起报

Fig.5   The accuracy of sunny and rainy of 24-hour cumulative precipitation predicted by different models and different schemes with different lead times in Shandong Province from April to September 2020

(a) starting at 08:00, (b) starting at 20:00


由于08:00、20:00起报的预报结论比较一致,以08:00起报为例,图6图7分别为不同模式和不同方案预报2020年4—9月山东省0~24 h、24~48 h累积降水量的评分结果(一般性降水指小雨至大雨区间降水等级,≥50 mm指暴雨及以上降水等级)。由0~24 h累积降水量预报的评分结果(图6)看出,3个模式对比,全球模式(ECMWF)一般性降水和小雨漏报率较低、空报率较高,Bias评分大于1.5,具有明显的湿偏差,TS、ETS评分明显低于区域模式预报,大雨及以上降水等级漏报率较高,Bias评分小于1.0,具有干偏差;2个区域模式对比,中雨及以下降水等级TS、ETS评分CMA-SH9高于CMA-MESO,大雨及以上降水等级TS、ETS评分CMA-MESO高于CMA-SH9,CMA-SH9和CMA-MESO各降水等级漏报率相差不大,但CMA-SH9强降水空报率明显高于CMA-MESO,Bias评分大于1.3,具有明显的湿偏差。

图6

图6   不同模式和不同方案预报2020年4—9月山东省0~24 h累积降水量的TS评分(a)、漏报率(b)、空报率(c)、Bias评分(d)和ETS评分(e)

Fig.6   Threat score (a), miss rate (b), false alarm rate (c), bias score (d) and equitable threat score (e) of 0-24 h cumulative precipitation predicted by different models and different schemes in Shandong Province from April to September 2020


图7

图7   不同模式和不同方案预报2020年4—9月山东省24~48 h累积降水量的TS评分(a)、漏报率(b)、空报率(c)、Bias评分(d)和ETS评分(e)

Fig.7   Threat score (a), miss rate (b), false alarm rate (c), bias score (d) and equitable threat score (e) of 24-48 h cumulative precipitation predicted by different models and different schemes in Shandong Province from April to September 2020


5组集成方案对比,各降水等级TS、ETS评分趋势基本一致。一般性降水、小雨、中雨、暴雨和50 mm降水等级TS、ETS评分ESM方案均最高;大雨TS、ETS评分Mul-OTS方案最高,SM方案次之;大暴雨TS、ETS评分SM方案最高,ESM方案次之,ES方案最差,甚至不如CMA-MESO预报,但ES方案是ECMWF和CMA-SH9的集成结果,所以ES方案也是正效果。4组DFNN方案,中雨及以下等级的Bias评分比模式预报更趋近于1,大雨及以上等级的Bias评分小于1,低于模式预报,存在干偏差;Mul-OTS方案中雨以下等级具有明显的湿偏差,暴雨及以上等级是干偏差。4组DFNN方案相比模式空报率明显降低,漏报率略有改进,说明DFNN方案主要是通过降低空报率来提高各降水等级的TS、ETS评分,Mul-OTS方案漏报率明显降低,但空报率改进不大,小雨、一般性降水空报率反而变差。5组集成方案对大暴雨的改进虽然是正技巧,但提升不明显,因为大暴雨的训练样本较少,2019年4—9月08:00至次日08:00仅有86个样本(图1)。

24~48 h累积降水量的评分结果(图7)显示,SM方案暴雨、大暴雨和50 mm降水等级TS、ETS评分为负效果,Mul-OTS方案小雨、一般性降水的ETS评分也为负效果,其他各降水等级5组集成方案均提高了TS、ETS评分;虽然Mul-OTS方案中雨以下等级评分效果较差,但大雨、大暴雨等级的TS、ETS评分最高,优于DFNN方案,且暴雨及以上TS、ETS评分略低于ESM方案,和EM方案评分相当。

对于更长预报时效的48~72 h累积降水量评分结果(图略),4组DFNN方案对大雨及以下等级的TS、ETS评分仍然有明显提高,但暴雨等级的EM和SM方案,大暴雨等级的4组DFNN方案均为负效果;Mul-OTS方案对中雨以下、大暴雨等级的TS、ETS评分为负效果,对大雨的评分效果一般,但暴雨、50 mm降水等级TS、ETS评分和ESM方案评分相当。

3.3 个例分析

受高空槽和西南暖湿气流的共同影响,2021年8月22日下午至24日上午,山东南部自西向东出现了一次明显的强降水过程。对比实况观测(图8),从模式12~36 h累积降水量来看,3种模式及ES、SM、Mul-OTS方案对鲁西北晴雨空报范围都较大,SM、ESM方案虽然也有一定的空报,但比较接近实况;对鲁西南和山东半岛的强降水,ECMWF、CMA-SH9、ES和Mul-OTS预报降水强度偏强、范围偏大,CMA-MESO、EM和SM预报降水强度偏弱、降水落区偏差较大,而深度学习ESM方案较为准确地预报出强降水的落区和强度。总体上,这次降水过程,深度学习ESM方案最好。

图8

图8   2021年8月23日08:00至24日08:00 24 h累积降水量的观测值及不同模式和不同方案的预报值

(a)观测值、(b)ECMWF、(c)CMA-SH9、(d)CMA-MESO、(e)ES、(f)EM、(g)SM、(h)ESM、(i)Mul-OTS

Fig.8   The observed values and the predicted values of different models and different schemes of 24 h cumulative precipitation from 08:00 on 23 to 08:00 on 24 August 2021

(a) observation, (b) ECMWF, (c) CMA-SH9, (d) CMA-MESO, (e) ES, (f) EM, (g) SM, (h) ESM, (i) Mul-OTS


3.4 预报效果检验

为检验降水格点预报的整体预报性能,检验时增加了山东298个非训练区域站,共421个考核站检验结果。另外,由于数值模式的延时,业务上0~12 h时效的预报产品无法使用,用12~36 h、36~60 h累积降水量生成客观格点预报产品。经检验,晴雨预报准确率12~36 h和36~60 h累积降水量4种DFNN方案均高于模式预报[图9(a)(b)],ESM方案均最高,EM方案次之,而Mul-OTS方案最低,不如模式本身预报;12~36 h累积降水量预报ETS评分[图9(c)],除大暴雨ES方案,其他4组DFNN方案均不同程度提高了各降水等级的ETS评分,对弱降水的提高幅度大于强降水,ESM方案最好,而Mul-OTS方案对中雨以上量级ETS均取得较好的订正效果,和ESM方案相当,但在一般性降水、小雨的ETS仍低于模式;36~60 h累积降水量预报ETS评分[图9(d)],4组DFNN方案对大雨及以下等级的ETS评分仍然有明显提高,对较强降水也有一定改进,但暴雨等级的SM方案,大暴雨等级的ES和SM方案为负效果,Mul-OTS方案对中雨及以上量级ETS仍有一定效果,但明显不如ESM方案,甚至不如ES和EM方案。总之,加入非训练站点的检验结果表明采用有限站点建模降尺度生成格点预报有效。

图9

图9   不同模式和不同方案预报山东省2020年4—9月12~36 h(a、c)、36~60 h(b、d)累积降水量晴雨准确率(a、b)和ETS评分(c、d)

Fig.9   The accuracy of sunny and rainy (a, b) and equitable threat score (c, d) of cumulative precipitation in 12~36 h (a, c) and 36~60 h (b, d) from April to September 2020 in Shandong Province were predicted by different models and different schemes


4 结论和讨论

为提高定量降水预报准确率,本文采用深度前馈神经网络DFNN和降水分级最优TS权重集成方法对多模式降水预报进行集成研究。使用2019年4—9月ECMWF、CMA-SH9和CMA-MESO逐24 h累积降水量,通过数据下采样、Z-score标准化、10次交叉验证,进行有监督训练得到4组DFNN(ES、EM、SM、ESM)晴雨分类和降水回归深度学习模型,其中晴雨分类模型包含5个隐含层,降水回归模型包含3个隐含层。以及利用多模式降水等级TS评分作为权重建立了Mul-OTS集成模型。分别用2020年4—9月3个模式逐24 h累积降水量进行降尺度格点预报,对5种集成方案对比分析,主要结论如下:

(1)不同起报时间、不同预报时效,5组集成方案的平均相对误差均小于3个模式,ESM方案最好,其次为ES、EM、SM方案,Mul-OTS方案最差,仅略好于模式预报。

(2)不同起报时间、不同预报时效,4组DFNN方案相比模式预报均提高了晴雨准确率,ESM方案最好,其次为EM方案,而Mul-OTS方案晴雨准确率低于模式预报,这是因为Mul-OTS方案小雨的空报率较高。虽然2020年4—9月模式晴雨准确率和用于训练的2019年4—9月模式晴雨准确率预报特征(均值和标准差)不同,但4组DFNN方案晴雨准确率仍取得较好预报效果。

(3)0~24 h累积降水量评分,4组DFNN方案均明显提高了各降水等级TS、ETS评分,对弱降水的提高幅度大于强降水;24~48 h、48~72 h累积降水量评分,4组DFNN方案对大雨及以下等级的TS、ETS评分有明显提高,对暴雨以上降水等级评分,除了个别方案为负技巧外,其他方案优于模式预报;Mul-OTS方案对小量级降水等级为负技巧,主要对大量级降水等级的订正效果较好,但总体上不如ESM方案。

通过5种集成方案对比检验、预报个例分析和业务应用的结果来看,采用基于前馈神经网络的ESM方案明显优于其他集成方案。但由于各降水等级的训练数据样本不平衡,本文采用晴雨分类和降水回归分步训练再融合的方式对大暴雨等级的预报还有待提高。后续可以通过增加模式种类,如中国气象局北京快速更新循环数值预报系统(China Meteorological Administration Beijing, CMA-BJ),或者通过增加与降水量相关性较高的预报因子,如地形、垂直速度和对流有效位能(Convective Available Potential Energy,CAPE)指数等,或者通过积累更多历史数据增加强降水的训练样本等方式从大数据中提取更具有物理意义的特征。从技术方法方面尝试采用卷积或循环神经网络来增加降水的时空信息,按照各降水等级采用多分类训练方式,期待进一步提高各降水等级评分,尤其是改进大暴雨以上等级的预报水平。

参考文献

阿斯顿·张, 李沐, 扎卡里C.立顿, , 2019. 动手学深度学习[M]. 北京: 人民邮电出版社.

[本文引用: 2]

毕宝贵, 代刊, 王毅, , 2016.

定量降水预报技术进展

[J]. 应用气象学报, 27(5): 534-549.

[本文引用: 1]

曹萍萍, 肖递祥, 龙柯吉, , 2023.

基于分位数映射法的四川省ECMWF模式降水预报误差订正分析

[J]. 干旱气象, 41(4): 666-675.

DOI      [本文引用: 1]

为做好ECMWF(European Centre for Medium-Range Weather Forecasting)模式本地化释用,提高四川省降水预报准确率,对四川省2020—2021年7—9月模式各量级降水预报系统性偏差规律分析发现,该模式预报的雨日较实况偏多,尤其是攀西地区和川西高原;预报的大雨日数盆地西南部及攀西地区多于实况,而盆地南部少于实况。然后,基于分位数映射法对模式预报的24 h累积降水开展大量级降水订正试验与检验。基于分位数映射法订正后,暴雨及以上量级TS(Threat Score)提高7%~15%,且各量级降水TS均高于多模式集成客观预报产品2%~4%,大雨及以上、暴雨及以上量级命中率提高10%~20%,订正后雨带位置特别是暴雨落区与实况更接近。

陈锦鹏, 冯业荣, 蒙伟光, , 2021.

基于卷积神经网络的逐时降水预报订正方法研究

[J]. 气象, 47(1): 60-70.

[本文引用: 1]

杜钧, 康志明, 2014.

天气预报中不确定性问题的调查分析

[J]. 气象科技进展, 4(1): 58-67.

[本文引用: 1]

顾建峰, 周国兵, 刘伯骏, , 2020.

人工智能技术在重庆临近预报业务中的初步研究与应用

[J]. 气象, 46(10): 1 286-1 296.

[本文引用: 1]

李金洁, 王爱慧, 2019.

基于西南地区台站降雨资料空间插值方法的比较

[J]. 气候与环境研究, 24(1): 50-60.

[本文引用: 1]

李莉, 李应林, 田华, , 2011.

T213全球集合预报系统性误差订正研究

[J]. 气象, 37(1): 31-38.

[本文引用: 1]

李俊, 杜钧, 陈超君, 2014.

降水偏差订正的频率(或面积)匹配方法介绍和分析

[J]. 气象, 40(5): 580-588.

[本文引用: 1]

李俊, 杜钧, 陈超君, 2015.

“频率匹配法”在集合降水预报中的应用研究

[J]. 气象, 41(6): 674-684.

[本文引用: 1]

李涛, 陈杰, 汪方, , 2022.

一种基于神经网络的中国区域夏季降水预测订正算法

[J]. 干旱气象, 40(2): 308-316.

DOI      [本文引用: 1]

基于CWRF(climate extension of WRF)区域气候模式的动力降尺度预测技术对夏季降水预测存在一定偏差,难以实现准确预测。本文立足于中国区域夏季降水特点,分析与夏季降水相关的气象要素,采用树突(dendrite,DD)网络与人工神经网络(artificial neural networks,ANN)相结合的方法,针对CWRF模式回报的1996—2019年夏季降水量进行订正,检验其订正效果。结果表明:人工树突神经网络(artificial dendritic neural network,ADNN)算法模型订正的中国夏季降水量整体好于CWRF模式历史回报,距平相关系数和时间相关系数较订正前均提高约0.10,均方误差下降约26%,趋势异常综合检验评分提高6.55,表明ADNN机器学习方法能够对CWRF模式夏季降水预测实现一定程度的订正,从而提高该模式降水预测精度。

穆穆, 陈博宇, 周菲凡, , 2011.

气象预报的方法和不确定性

[J]. 气象, 37(1): 1-13.

[本文引用: 1]

任宏利, 丑纪范, 2007.

数值模式的预报策略和方法研究进展

[J]. 地球科学进展, 22(4): 376-385.

DOI      [本文引用: 1]

数值预报经历了半个多世纪的发展,已成为当前主要的客观预报工具。在模式和资料状况给定的情况下,预报效果的改善很大程度上依赖于所采用的预报策略和方法。为此,全面回顾了国内外基于数值模式的预报策略和方法研究进展,认为采取统计&mdash;动力相结合、从历史资料中提炼信息的预报策略是提高数值预报水平的可行之路。最后在总结前人工作基础上,着重介绍了动力相似预报策略和方法的相关研究,特别是实际预报中的试验情况。

孙健, 曹卓, 李恒, , 2021.

人工智能技术在数值天气预报中的应用

[J]. 应用气象学报, 32(1): 1-11.

[本文引用: 1]

童尧, 高学杰, 韩振宇, , 2017.

基于RegCM4模式的中国区域日尺度降水模拟误差订正

[J]. 大气科学, 41(6): 1 156-1 166.

[本文引用: 1]

吴启树, 韩美, 刘铭, , 2017.

基于评分最优化的模式降水预报订正算法对比

[J]. 应用气象学报, 28(3): 306-317.

[本文引用: 1]

危国飞, 刘会军, 吴启树, , 2020.

多模式降水分级最优化权重集成预报技术

[J]. 应用气象学报, 31(6): 668-680.

[本文引用: 2]

王海霞, 智协飞, 2015.

基于TIGGE多模式降水量预报的统计降尺度研究

[J]. 气象科学, 35(4): 430-437.

[本文引用: 1]

王在文, 郑祚芳, 陈敏, , 2012.

支持向量机非线性回归方法的气象要素预报

[J]. 应用气象学报, 23(5): 562-570.

[本文引用: 1]

王雨, 闫之辉, 2007.

降水检验方案变化对降水检验评估效果的影响分析

[J]. 气象, 33(12): 53-61.

[本文引用: 1]

叶笃正, 严中伟, 戴新刚, , 2006.

未来的天气气候预测体系

[J]. 气象, 32(4): 3-8.

[本文引用: 1]

袁凯, 庞晶, 李武阶, , 2023.

深度学习模型在2021年汛期武汉市雷达回波临近预报中的应用评估

[J]. 干旱气象, 41(1): 173-185.

DOI      [本文引用: 1]

近年来,人工智能技术在图像识别领域取得了突破性进展,为探寻人工智能模型在武汉地区雷达回波临近预报中的应用价值,本文利用湖北武汉市2015—2020年雷达回波和降水量观测资料,对PredRNN++、MIM、CrevNet和PhyDNet 4种深度学习模型进行雷达回波临近预报训练,并基于2021年汛期雷达回波资料进行雷达回波临近预报。在此基础上,通过降水强度和降水面积指数筛选降水过程,并以均方误差(Mean Square Error, MSE)、结构相似性指数(Structural Similarity Index Measurement, SSIM)、命中率(Probability of Detection, POD)、空报率(False Alarm Rate, FAR)和临界成功指数(Critical Success Index, CSI)为指标,检验评估上述4种深度学习模型和光流法对2021年汛期武汉地区雷达回波的临近预报性能。结果表明:(1)整体来看,MIM模型的MSE最小、POD最高,MIM和PredRNN++模型的SSIM并列最高;所有深度学习模型的FAR均低于光流法,且PhyDNet模型的FAR最低;除CrevNet模型外,其余3种深度学习模型的CSI均高于光流法,且MIM模型的CSI最高。(2)预报的前12 min,光流法的CSI最高,而在18~120 min MIM模型的CSI最高,显示了深度学习模型长预报时效的优势。(3)随着回波强度增加,深度学习模型和光流法的POD和CSI均迅速降低,而FAR光流法与各模型则表现出不同的变化规律。(4)随着区域性降水强度增加,深度学习模型的预报能力均先降低后明显增强,而光流法对降水强度变化的敏感性较弱,故在强降水背景下深度学习模型的CSI较光流法增幅最大;对于局地一般对流性降水过程,所有深度学习模型和光流法的预报能力均大幅降低。(5)暴雨个例分析结果表明,深度学习模型不仅具备一定回波强度变化的预报能力,而且对回波运动的预报能力也明显高于光流法,展示了深度学习模型良好的应用前景。

袁雅涵, 王烁, 王文青, , 2023.

基于深度学习的积层混合云对流泡降水粒子特征研究

[J]. 干旱气象, 41(6): 933-943.

[本文引用: 1]

周迪, 陈静, 陈朝平, , 2015.

暴雨集合预报-观测概率匹配订正法在四川盆地的应用研究

[J]. 暴雨灾害, 34(2): 97-104.

[本文引用: 1]

智协飞, 吕游, 2019.

基于频率匹配法的中国降水多模式预报订正研究

[J]. 大气科学学报, 42(6): 814-823.

[本文引用: 1]

智协飞, 赵忱, 2020.

基于集合成员订正的强降水多模式集成预报

[J]. 应用气象学报, 31(3): 303-314.

[本文引用: 1]

智协飞, 张珂珺, 田烨, , 2021.

基于神经网络和地理信息的华东及华南地区降水概率预报

[J]. 大气科学学报, 44(3): 381-393.

[本文引用: 1]

EBERT E E, 2001.

Ability of a poor man’s ensemble to predict the probability and distribution of precipitation

[J]. Monthly Weather Review, 129(10): 2 461-2 480.

[本文引用: 1]

HINTON G E, OSINDERO S, TEH Y W, 2006.

A fast learning algorithm for deep belief nets

[J]. Neural Computation, 18(7): 1 527-1 554.

[本文引用: 1]

JOLLIFFE I T, STEPHENSON D B, 2003. Forecast verification: A practitioner's guide in atmospheric science[M]. Chichester: John Wiley&Sons.

[本文引用: 1]

PANOFSKY H A, BRIER G H, 1968. Some applications of statistics to meteorology[M]. Philadelphia: The Pennsylvania State University Press:224-225.

[本文引用: 1]

/