• CN 62-1175/P
  • ISSN 1006-7639
  • 双月刊
  • 中国科技核心期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中文科技期刊数据库收录期刊

干旱气象, 2023, 41(2): 328-340 DOI: 10.11755/j.issn.1006-7639(2023)-02-0328

技术报告

GRAPES-REPS对我国南方2017年初夏持续性降水预报的检验评估

王叶红,, 赵玉春

福建省厦门市气象局,福建省厦门市海峡气象开放重点实验室,福建 厦门 361012

Verification and assessment of persistent rainfall forecasts of GRAPES-REPS in pre-summer of 2017 in southern China

WANG Yehong,, ZHAO Yuchun

Xiamen Meteorological Bureau of Fujian Province, Xiamen Key Laboratory of Straits Meteorology, Xiamen 361012, Fujian, China

责任编辑: 蔡迪花;校对:刘晓云

收稿日期: 2022-03-24   修回日期: 2022-08-12  

基金资助: 福建省自然科学基金项目(2021J01466)

Received: 2022-03-24   Revised: 2022-08-12  

作者简介 About authors

王叶红(1974—),女,河南许昌人,正高级工程师,主要从事资料同化和中尺度数值模拟研究。E-mail:278403168@qq.com

摘要

我国自主研发的GRAPES-REPS(Global/Regional Assimilation and Prediction System-Regional Ensemble Prediction System)于2014年投入业务运行,为加深对该系统降水集合预报能力的认识,便于更好应用降水概率预报,本文以2017年5月中旬至6月下旬我国南方地区3次持续性降水过程为例,采用统计检验和个例分析相结合,评估该系统在72 h内不同预报时效的各量级24 h降水预报性能。结果表明:(1)GRAPES-REPS集合平均预报对小雨、中雨有较明显优势,但随着降水量级增大优势逐渐下降,对暴雨预报已不具有优势。其中,小雨预报范围接近观测,中雨(暴雨)有空报(漏报)倾向,大雨在较长预报时效上有空报倾向。(2)采用MRF边界层参数化方案和KF-eta积云对流参数化方案组合方案的控制预报成员和2个扰动预报成员为集合最优成员,其TS评分普遍高于采用其他组合方案的集合成员。(3)整体上集合成员降水预报离散度不足,尤其0~24 h预报时效,Talagrand分布呈U型,对小(大)量级降水预报概率偏大(小);随着预报时效增加,集合成员预报离散度显著增大,Talagrand分布逐渐接近理想概率分布。(4)集合预报在不同时效对各量级降水概率预报均具有参考价值,大雨、暴雨的概率预报效果优于小雨、中雨。(5)集合预报整体上能够较好把握典型暴雨日降水空间分布形态,对中央气象台漏报的广东中南部暖区暴雨有一定的概率预报能力。

关键词: GRAPES-REPS; 集合预报与检验; 初夏降水; 我国南方

Abstract

The self-developed global/regional assimilation and prediction system-regional ensemble prediction system (GRAPES-REPS) was put into operation in 2014 in China. In order to deeply understand the precipitation ensemble forecast ability of this system and conveniently apply the precipitation probability forecast, in this paper, the 24 h accumulated precipitation with different magnitudes forecasted by GRAPES-REPS at different lead time within 72 hours is evaluated by using statistical analysis and case analysis taking three continuous precipitation processes in southern China from mid-May to late June 2017 for example. The results are as follows: (1) The ensemble mean forecast of GRAPES-REPS has obvious advantage for light rain and moderate rain. The advantage decreases gradually with the increase of precipitation magnitude and no advantage appears for rainstorm. The ensemble mean forecast is close to the observation for light rain, while it has a tendency of null (missing) forecast for moderate rain (rainstorm) or heavy rain at a longer lead time. (2) The optimal members include control forecast and two perturbation forecasts that use a combination of MRF boundary layer scheme and KF-eta cumulus convection scheme, which is different to the other members. (3) The spread of precipitation ensemble forecasts is insufficient overall, especially at 0-24 h forecast lead time with the U-shaped Talagrand distribution and the higher (lower) forecast probability for small- (large-) magnitude precipitation. The spread increases obviously with the increase of forecast lead time, and the Talagrand distribution is gradually close to the expected-probability distribution. (4) The ensemble forecasts do have a reference value for precipitation with different magnitudes at every forecast lead time, with the probability forecast of heavy rain and rainstorm being better than that of light rain and moderate rain. (5) The ensemble gives a better forecast for precipitation pattern with different magnitudes as a whole, especially it has an ability of probability forecast for the warm-sector rainstorms in the central and southern Guangdong Province, which is missing in the forecasts of National Meteorological Observatory.

Keywords: GRAPES-REPS; ensemble forecast and verification; pre-summer precipitation; southern China

PDF (23384KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王叶红, 赵玉春. GRAPES-REPS对我国南方2017年初夏持续性降水预报的检验评估[J]. 干旱气象, 2023, 41(2): 328-340 DOI:10.11755/j.issn.1006-7639(2023)-02-0328

WANG Yehong, ZHAO Yuchun. Verification and assessment of persistent rainfall forecasts of GRAPES-REPS in pre-summer of 2017 in southern China[J]. Arid Meteorology, 2023, 41(2): 328-340 DOI:10.11755/j.issn.1006-7639(2023)-02-0328

引言

降水具有非线性、不连续性特征,降水预报在天气预报中极具挑战性,高精度的降水预报是我国气象现代化高质量发展所面临的迫切需求,而数值预报已成为提升降水预报准确性的重要技术支撑。由于受数值模式初值(Wang et al., 2007)、物理过程参数化(吴秋霞等,2007;王叶红和赵玉春,2020)等不确定性因素和大气混沌特性影响,降水数值预报存在较大的不确定性(Candille and Talagrand, 2008;Wang et al., 2018)。集合预报是一种描述数值预报不确定性的随机动力概率预报方法(陈静等,2002;杜钧和陈静,2010),近20 a来得到快速发展与广泛应用,它通过积分由初值(模式)扰动形成的多个初值(模式)来估计预报误差的概率分布,从而提供不确定性预报信息(Huo et al., 2019;董甫等,2020)。一个好的集合预报系统通常能够给出事件发生的所有可能性及其概率,并定量给出预报的可信度(杜钧,2002),这一优势在可预报性较低的高影响天气预报中尤为重要,而区域中尺度集合预报已日益成为高影响天气预报的重要支撑(陈静等,2005)。

近年来,我国一些区域集合预报系统已陆续建立并实现业务化应用(李俊等,2010;邓国等,2010;Zhang et al., 2015;王婧卓等,2018)。中国气象局数值预报中心自主研发的GRAPES-REPS(Global/Regional Assimilation and Prediction System-Regional Ensemble Prediction System)于2014年业务化运行,通过网络(http://www.nmc.cn/publish/nwpc/grapes-regio-nal/probability/index.html)面向公众提供集合预报产品。预报检验是数值模式发展及应用的重要前提,也能够辨析不同模式间的客观差异。为认识GRAPES-REPS的预报性能及可能存在的预报偏差,我国陆续开展了一系列该系统预报产品的系统性检验评估。研究发现,GRAPES-REPS可以在台风登陆地点、时间、强度和降水预报等方面提供更多的不确定性信息(钟有亮等,2017),但对西南低涡移动路径及水汽要素场的概率预报技巧还有待提高(王静等,2017);与ECMWF(European Center of Medium-range Weather Forecasts)全球集合预报模式相比,GRAPES-REPS对中国汛期降水具有较强的预报能力(王婧卓等,2021)。我国长江以南大范围持续性强降水过程易引发严重的洪涝及次生灾害,该地区的强降水预报历来受到高度关注,目前单一确定性模式无法对强降水落区及强度作出精确预报,特别是局地暖区暴雨,而集合预报可提供更多的降水预报可能性和概率,但GRAPES-REPS对该地区的降水集合预报性能尚不清楚,极大制约了GRAPES-REPS的应用及性能改进。2017年5月中旬至6月下旬我国长江以南地区发生多次大范围持续性强降水过程,24 h最强降水发生在6月16日08:00(北京时),最大累积降水量位于广东陆丰,达326.2 mm。为了加深GRAPES-REPS对我国南方初夏大范围持续性强降水集合预报性能的认识、了解可能存在的预报偏差,本文采用风险评分(Threat Score,TS)、Brier评分、Talagrand分布、ROC(Relative Operating Characteristic)曲线等预报检验方法,针对上述时段南方地区发生的多次强降水过程,进行GRAPES-REPS降水集合预报检验评估,以期为实际业务预报应用和集合预报性能改进提供参考。

1 资料

2017年中国气象局数值预报中心业务运行的GRAPES-REPS区域集合预报系统,由1个控制预报(M00)和14个扰动预报(M01~M14)共15个集合成员组成(表1),预报范围为70°E—145°E、15°N—65°N,水平分辨率为0.15°×0.15°,水平格点数为502×330,垂直坐标为地形追随坐标,垂直方向分为50层;预报时效为72 h,模式每天在08:00(北京时,下同)和20:00起报;背景场和侧边界条件由T639全球集合预报系统提供,采用多尺度混合初值扰动方案(王婧卓等,2021),模式扰动采用多物理过程组合方法(张涵斌等,2014),通过MRF和YSU边界层参数化方案与BMJ、KF-eta、SAS和KF积云对流参数化方案的不同组合,构造不同集合成员的模式扰动方案。

表1   GRAPES-REPS集合预报成员多物理过程组合方案

Tab.1  The combination schemes of multiple physics process for GRAPES-REPS ensemble forecast members

集合
成员
边界层参数化方案积云对流参数化方案
M00MRFKain-Fritsch-eta
M01MRFKain-Fritsch
M02MRFBMJ
M03MRFKain-Fritsch-eta
M04MRFKain-Fritsch
M05MRFBMJ
M06MRFKain-Fritsch-eta
M07MRFKain-Fritsch
M08YSUSAS
M09YSUBMJ
M10YSUKain-Fritsch
M11YSUSAS
M12YSUBMJ
M13YSUKain-Fritsch
M14YSUSAS

新窗口打开| 下载CSV


所用数据为2017年5月12—15日、6月13—17日及25—28日每日两次起报共26个时次的0~72 h集合预报产品和全国基本站24 h(08:00—08:00)降水实况数据。利用反距离权重法将0~24 h、12~36 h、24~48 h、36~60 h和48~72 h时效的模式降水预报格点产品分别插值到基本站上,分别对我国南方地区(105°E—125°E,18°N—35°N)小雨以上(≥0.1 mm)、中雨以上(≥10.0 mm)、大雨以上(≥25.0 mm)、暴雨以上(≥50.0 mm)4个量级降水(后文分别简称为小雨、中雨、大雨和暴雨量级)进行集合预报检验。文中涉及的中国及其省(市、区)行政边界基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改。

2 检验方法

2.1 TS和偏差(Bias)评分

TS(Schaefer,1990)和Bias(Donaldson et al.,1975)评分是传统的二分类检验方法,常用于单一确定性模式降水预报检验。计算公式如下:

TSk=NAkNAk+NBk+NCk
Bk=NAk+NBkNAk+NCk

式中:TSkk量级降水预报的TS评分;Bkk量级降水预报的偏差;NAkk量级降水预报正确的站数;NBkk量级降水空报的站数;NCkk量级降水漏报的站数。TSk取值范围为0~1,当预报和观测降水完全重合时,TSk=1,即预报完全正确;TSk越接近于0,则预报效果越差。Bk>1(<1),表示预报降水站数多于(少于)观测降水站数,有空报(漏报)倾向;Bk=1时,预报与观测的降水站数相等,偏差评分最优。Bias评分计算的是相对频率,无法衡量预报与观测的吻合度。

2.2 Brier评分

Brier(1950)定义了一种均方概率误差,称之为Brier评分(Brier Score,BS)。它综合考虑了可靠性、分辨率和不确定性(Murphy,1973),广泛应用于定量降水概率预报评估,其公式定义如下:

BS=E(p-po)2

式中:BS为降水事件概率预报的Brier评分,其值在0~1之间,值越小越好,BS=0表示降水概率预报最佳,预报完全正确,而BS=1则表示降水概率预报最差,预报失效;p为降水事件发生的集合预报概率;po为实况,若降水事件发生,则po为1,否则为0。。

2.3 Brier技巧评分

Brier技巧评分(Brier Skill Score,BSS)是基于Brier评分的技巧评分。其公式(赵琳娜等,2015)定义如下:

BSS=1-BS/BSclim

式中: BSclim为气候概率预报的Brier评分。若BSS=0,则降水事件概率预报的Brier评分等于气候概率预报的Brier评分;若BSS>0,表示降水事件的概率预报有意义,反之,降水事件概率预报不如气候概率预报。因此,Brier技巧评分越大越好。

2.4 Talagrand分布和概率标准差

Talagrand分布(Talagrand et al.,1997)可用来统计观测与集合预报成员的概率分布差异,检验集合预报系统的离散度。对任一预报时刻的任一空间点,把n个集合成员的预报值从左到右按由小到大顺序排列形成n+1个区间;然后,对大量空间点统计实况出现在i区间内的频率,其中最左边(最右边)的单边区间表示实况比最小(最大)成员还要小(大),即超出集合预报范围(杜钧和周斌斌,2016)。

概率标准差也是度量离散度适宜性的一种方法,其公式(谭燕,2006)定义如下:

Q=1n+1i=1n+1(Pm-Pi)212

式中:Q为概率标准差;Pi是实况出现在i区间内的频率;Pm是每个集合预报成员所应有的平均频率。Q值越小越好,Q=0表明集合预报最完美,可信度高。因此,Q值越小,Taglagrand分布越接近理想状态,集合预报越完美;反之,Q值越大,表明集合预报成员离散度小,无法反映预报的不确定性。

2.5 相对作用特征曲线

ROC曲线分析(Mason,1979;Swets,1986)是对二分类要素序列进行检验,它通过计算预报的命中率(Hit Ratio,HR)和空报率(False Alarm Ratio,FAR)来描述系统的预报能力。计算公式如下:

HR=NAkNAk+NCk
FAR=NBkNBk+NDk

式中:NDkk量级降水预报正确否定的站数,即预报和观测均未出现k量级降水的站数。若以0%作为概率临界值,即预报对象总是发生,则HR=1、FAR=1;若以100%作为概率临界值,即预报对象总是不发生,则HR=0、FAR=0。经过(0,0)和(1,1)两点的直线(即对角线)是概率预报有无技巧的分界线。因此,一个完美的预报应当有100%命中率和0%的空报率,同时一个0技巧的预报系统的ROC曲线与对角线一致。当ROC曲线位于对角线上方时为有技巧预报,此时ROC曲线下方的面积AROC>0.5;当ROC曲线位于对角线下方时为无技巧预报,此时AROC<0.5;概率预报最佳时,HR=1、FAR=0、AROC=1。选取不同的概率作为预报对象发生的概率临界值,可得到不同的命中率和空报率,并分别作为纵、横坐标绘制曲线,即为ROC曲线。

3 降水集合预报统计检验

3.1 确定性预报检验

集合平均是所有集合成员预报的平均结果,它能够非线性过滤不同集合成员的随机预报信息而保留共同部分,是衡量集合预报系统性能的重要指标之一(杜钧,2002)。从不同时效的降水预报TS[图1(a)(c)(e)(g)(i)]可见,相对于集合成员,集合平均对小雨、中雨、大雨量级预报均有优势,但随着量级增大优势逐渐下降,而对暴雨量级已无优势,其集合平均TS评分均小于控制预报及部分扰动预报,这与陈圣劼等(2019)的“ECMWF对江苏暴雨的集合平均预报效果不及控制预报”结论类似。研究指出,对于具有明显单边的非正态分布降水量场,集合平均的光滑作用使得强降水区域缩小,从而导致对强降水预报劣于集合成员(杜钧和周斌斌,2016),可采用概率或频率匹配平均法(杜钧和李俊,2014)进行订正。因此,在实际业务中借鉴前人提出的一系列后处理技术(陈圣劼等,2019;李俊等,2014;李俊等,2015;陈博宇等,2015;闫慧和赵桂香,2020),重点针对暴雨量级的集合平均预报订正很有必要。

图1

图1   GRAPES-REPS成员预报的0~24 h(a、b)、12~36 h(c、d)、24~48 h(e、f)、36~60 h(g、h)和48~72 h(i、j)累积降水量及其集合平均的TS(a、c、e、g、i)和Bias(b、d、f、h、j)

Fig.1   Threat scores (a, c, e, g, i) and biases (b, d, f, h, j) of accumulated precipitation forecast at lead time of 0-24 h (a, b), 12-36 h (c, d), 24-48 h (e, f), 36-60 h (g, h) and 48-72 h (i, j) from GRAPES-REPS members and their ensemble mean


进一步考察Bias[图1(b)(d)(f)(h)(j)]发现,对于小雨量级,各预报时效集合平均的Bias均略大于1,而集合成员的Bias均小于1,表明集合平均的小雨范围略大于观测,而集合成员预报的小雨范围均比观测小;对于中雨量级,0~24 h时效集合平均和控制预报的Bias最接近1,但随着预报时效延长,Bias均大于1,空报偏多,且集合平均偏多程度高于控制预报;针对大雨量级,0~24 h时效除成员M00和M06预报的大雨范围略大于观测外,集合平均和绝大部分集合成员预报的大雨范围均小于观测,但随着预报时效延长,预报的大雨范围逐渐增大并大于观测。暴雨量级Bias的变化趋势与大雨量级类似。需要注意的是:在暴雨量级上,随着预报时效延长,控制预报的Bias从0~24 h的0.964逐渐增大至48~72 h的2.033,而集合平均的Bias则从0.180逐渐增大至0.952,表明在更长的预报时效内集合平均的暴雨范围与实况更为接近,而控制预报的暴雨范围明显偏大;随着预报时效临近,控制预报的暴雨范围与实况逐渐接近,而集合平均的暴雨范围明显偏小。另外,对于关注度更高的暴雨,各时效的集合平均TS评分均不及控制预报,并在0~24 h和12~36 h时效漏报更高,表明在0~24 h和12~36 h预报中,当集合成员中大多数预报对暴雨漏报过多时,集合平均将无法消除这种系统偏差。

为进一步认清不同集合成员的降水预报性能,试图寻找预报性能较优或较差的成员,以满足实际业务应用和集合预报性能改进,对比了各成员TS评分,发现成员M00、M03、M06预报的TS值普遍高于其他成员,成员M12、M04、M10、M09预报的TS值普遍低于其他成员。那么,M00、M03、M06最优成员组在多物理过程组合方案上是否有共性?M12、M04、M10、M09最差成员组在多物理过程组合方案上又有何特征?从表1看出,成员M03、M06均采用与M00相同的MRF边界层参数化方案和KF-eta积云对流参数化方案的组合方案,与其他扰动成员采用的组合方案不同;此外,成员M12和M09均采用YSU边界层参数化方案和BMJ积云对流参数化方案,成员M04和M10分别采用MRF、YSU边界层参数化方案和KF积云对流参数化方案。由此不难看出,对于我国南方初夏持续性强降水过程,在BMJ、KF-eta、SAS和KF四种积云对流参数化方案中KF-eta方案预报效果最佳,SAS方案次之,而BMJ和KF方案相对较差。

综上可见,在实际应用中,一方面用户可据此进行综合决策;另一方面可以采用提高最优成员组权重和降低最差成员组权重的方法进行非等权重集合平均。此外,也利于选取更加适用的物理过程组合方案进行模式扰动,提高集合预报性能。

3.2 离散度检验

一个理想的集合预报系统,当成员足够多时,大气的真实状态通常应包含于集合成员预报结果中,且在统计意义上观测实况落在每个集合预报成员附近的概率均等(Talagrand et al., 1997),这就需要集合成员预报结果间的离散度适宜。Talagrand分布或分级直方图是用来衡量集合成员预报值与观测值离散程度分布是否一致的评分指标,平直型分布表示集合预报系统具有完美的离散度,U(倒U)型分布表示集合成员的离散度偏低(偏高),L(反L)型分布则表示集合预报有系统性正(负)偏差(杜钧和周斌斌,2016)。

从不同预报时效24 h累积降水预报的Talagrand分布[图2(a)]可见,Talagrand分布呈U型,与理想概率期望值存在一定差距,即集合预报中实况落在Talagrand分布最左边和最右边的单边区间频率偏大,表明集合预报离散度偏小。特别是0~24 h预报,实况落在最左边和最右边区间频率高于其他时效,尤其落在最右边区间的频率高达20.53%,远高于其他时效,表明0~24 h集合预报的离散度更加偏小。可见,实况超出集合预报范围的频率明显偏大,即GRAPES-REPS表现出小(大)量级降水的预报概率偏大(小),这是目前集合预报系统普遍存在的问题。随着预报时效延长,实况落在Talagrand分布两边的频率明显减小,尤其是最右边区间频率减小更明显,Talagrand分布逐渐接近理想概率分布线,小(大)量级降水预报频率偏大(小)情况有所改善。综上可见,较短时效的降水预报频率分布反而较差,预报时效越长,降水预报频率与观测更为一致。从不同时效降水集合预报的概率标准差[图2(b)]上也得到同样的结论,即0~24 h降水预报的概率标准差明显大于其他时效,表明其他时效降水预报的离散度分布更接近理想状态,优于0~24 h。需要说明的是,由于Talagrand分布仅考虑区域内集合预报与观测频率的匹配,并未关注空报和漏报情况,故无法反映实际预报效果。

图2

图2   不同预报时效24 h累积降水量的Talagrand分布(a)及相对于理想概率的标准差(b)

Fig.2   Talagrand distribution of 24 h accumulated precipitation forecasts at different lead time (a) and its standard deviations relative to ideal probability


3.3 概率预报检验

3.3.1 Brier评分和Brier技巧评分

图3是不同时效、不同量级的24 h累积降水集合预报平均Brier评分和Brier 技巧评分。可以看出,各预报时效暴雨量级预报的平均BS值最小,而大雨、小雨和中雨量级的平均BS值依次增大[图3(a)],表明暴雨量级的概率预报效果好于其他量级。不同时效24 h累积降水集合预报的平均BSS技巧评分[图3(b)]也表现出相似特点,24~48 h、36~60 h和48~72 h暴雨量级预报的平均BSS值明显大于其他量级。此外,各时效不同量级降水预报的平均BSS值均为正,表明GRAPES-REPS对上述降水事件的概率预报均有意义。

图3

图3   不同时效各量级24 h累积降水量集合预报的平均BS(a)和BSS(b)

Fig.3   Mean Brier scores (a) and Brier skill scores (b) for 24 h accumulated precipitation ensemble forecasts with different magnitudes at different lead time


另外,除小雨量级外,其他量级降水预报的平均BS均随预报时效延长呈先降后升的变化趋势,且各量级的平均BS均在48~72 h最大[图3(a)],而小雨量级BS最小值出现在24~48 h,中雨、大雨和暴雨量级则出现在12~36 h,表明各量级降水概率预报效果均随预报时效减小有所提高,且24~48 h小雨量级和12~36 h中雨、大雨和暴雨量级的概率预报效果最佳。

3.3.2 ROC曲线

图4是不同时效各量级24 h累积降水量集合预报的ROC曲线分布,其中曲线上自右上角到左下角的点对应概率阈值依次为0.0、0.1、0.2、0.3、…、1.0时的命中率和空报率。整体上,在72 h内不同预报时效各量级降水集合预报的ROC曲线均位于对角线上方,表明集合预报为正预报技巧。对于小雨量级,0~24 h和12~36 h预报性能优于其他预报时效。中雨的12~36 h预报性能最好,当预报概率小于0.7时,0~24 h命中率高于24~48 h、36~60 h、48~72 h;当预报概率大于等于0.7时,0~24 h命中率接近于24~48 h,但低于36~60 h、高于48~72 h。大(暴)雨12~36 h(24~48 h)的ROC曲线靠近左上角,预报性能最好。

图4

图4   不同时效的小雨(a)、中雨(b)、大雨(c)、暴雨(d)量级24 h累积降水量集合预报的ROC曲线

Fig.4   The ROC curves of 24 h accumulated precipitation ensemble forecasts for light rain (a), moderate rain (b), heavy rain (c) and rainstorm (d) at different lead times


从ROC曲线面积(图5)可见,不同预报时效各量级降水集合预报的AROC均大于0.50,其值在0.67~0.84之间,表明集合预报对不同时效各量级降水均有一定的预报能力;随着降水量级增加,0~24 h预报的AROC依次减小,而12~36 h、24~48 h、36~60 h和48~72 h预报的AROC先增后减,均在中雨时达到最大。需要注意的是,与其他预报时效相比,0~24 h预报的AROC随降水量级增加变化幅度最大,且暴雨量级预报的AROC明显小于其他时效;48~72 h小雨预报的AROC较其他时效明显偏小,但随着降水量级增加,不同时效的差距逐渐缩小。上述分析再次表明,对于大雨和暴雨量级,更近时效的预报反而不及长时效。

图5

图5   不同时效各量级24 h累积降水量集合预报的ROC曲线面积

Fig.5   The ROC curve areas of 24 h accumulated precipitation ensemble forecasts with different magnitudes at different lead time


上述是对2017年5月中旬至6月下旬3次连续降雨过程26个集合预报样本进行的统计检验,为探究集合预报系统对不同连续时段降水过程预报性能是否具有一致性,分别对这3个连续时段的集合预报产品进行上述统计检验(图略),发现GRAPES-REPS对我国南方地区不同持续性降水过程的集合预报性能有较好的一致性,表明该系统的预报性能比较稳定。

与2014年投入业务应用之初相比,2017年业务运行版本在控制预报、初值和边界条件、初值扰动及物理过程扰动等方面都有所改进。与张涵斌等(2014)对2013年6月24日至7月13日我国南方降水过程集合预报检验结果相比,本文开展的2017年我国南方初夏持续性强降水过程集合预报检验,对于小雨、中雨、大雨、暴雨各量级降水,无论是控制预报、集合平均TS,还是Brier评分、ROC面积,降水预报性能都更优,表明2017年业务运行的版本整体性能较前期版本有明显改进。

4 典型降水事件预报检验

受1702号台风“苗柏”残留云系和南下冷空气共同影响,我国长江以南地区出现持续暴雨天气。2017年6月15日08:00至16日08:00,广西、广东和福建局地出现100.0 mm以上大暴雨,广东陆丰出现326.2 mm的特大暴雨(图6)。此次降水过程50.0 mm以上强降水主要位于桂西北、赣中至闽北、粤中南及闽西等地区。

图6

图6   2017年6月15日08:00至16日08:00累积降水量实况(单位:mm)

Fig.6   The observed accumulative precipitation from 08:00 15 to 08:00 16 June 2017 (Unit: mm)


图7可见,不同预报时效的24 h集合平均降水量都能够描述出2017年6月15日08:00至16日08:00雨区发生范围,但强度明显偏弱。总体而言,集合平均对广西降水落区预报较好,但强度偏弱。对江西中部至福建北部的降水预报,0~24 h预报的大雨范围偏大、位置偏北、强度偏弱;12~36 h预报的大雨范围与实况较一致,但位置偏北、强度偏弱;24~48 h预报的大雨落区与实况较一致,但范围偏大,同时预报出了暴雨量级的降水;36~60 h与12~36 h预报类似,但前者预报出了福建出现暴雨量级的降水;48~72 h与24~48 h预报相似,能够预报出暴雨量级降水,但位置偏北。对广东中部、南部及福建西部的降水预报,各时效的预报结果都较实况偏弱,且位置存在偏差。

图7

图7   不同时效集合平均预报的2017年6月15日08:00至16日08:00累积降水量(单位:mm)

(a) 0-24 h,(b) 12-36 h,(c) 24-48 h,(d) 36-60 h,(e) 48-72 h

Fig.7   The accumulated precipitation from 08:00 15 to 08:00 16 June 2017 forecasted by ensemble mean at different lead time (Unit: mm)

(a) 0~24 h,(b) 12~36 h,(c) 24~48 h,(d) 36~60 h,(e) 48~72 h


另外,考察了GRAPES-REPS不同成员对此次降水的预报性能,发现各成员在0~24 h预报的降水量在强度和落区上都存在较大差异(图略),广西强降水有3个成员预报的落区和强度与实况较为一致;江西—福建的降水整体预报偏弱,只有1个成员预报出暴雨量级降水,落区有2个成员预报较好;广东的强降水预报强度也偏弱,只有1个成员预报出100.0 mm以上降水。12~36 h降水预报(图略)显示,4个成员预报的广西强降水落区和强度与实况比较一致,其他成员预报强度相对偏弱;大部分成员预报出江西—福建的暴雨,但范围较实况偏小,落区有些成员预报与实况较一致,有些成员预报偏北;广东的强降水预报强度偏弱,降水中心多偏北。24~48 h降水预报(图8)显示,5个成员预报出广西大范围暴雨和大暴雨,其中4个成员预报的强降水中心位于广西北部,较实况偏北;大部分成员预报出江西—福建的暴雨,但范围较实况偏大,其中3个成员的落区预报与实况较一致,其他成员预报位置偏北;2个成员预报出广东暴雨和大暴雨,但预报位置均偏北。36~60 h降水预报结果(图略)与24~48 h的类似。48~72 h降水预报(图略)显示,5个成员预报出广西暴雨,其中4个成员预报的降水中心位置偏南;大部分成员预报出江西—福建的暴雨或局地大暴雨,但强度偏强、范围偏大,多数成员预报落区偏北;7个成员预报出广东局地暴雨,甚至大暴雨,但预报位置与实况偏差较大,这可能与低层形势场预报偏北有关(图略)。

图8

图8   24~48 h集合成员预报的2017年6月15日08:00至16日08:00累积降水量(单位:mm)

Fig.8   The accumulated precipitation from 08:00 15 to 08:00 16 June 2017 forecasted by ensemble members at lead time of 24-48 h (Unit: mm)


综上所述,在48~72 h长时效降水预报中,大多数集合成员预报的暴雨和大暴雨落区与实况相差较大,强度偏强;在36~60 h、24~48 h和12~36 h降水预报中,随着预报时效的临近,降水落区、强度预报与实况都较为接近的成员不断增加;在0~24 h降水预报中,集合成员预报降水整体明显偏弱。

为检验基于26个时次集合预报样本确定的最优和最差成员组在某一时次预报中的具体表现,考察了各集合成员在2017年6月15日08:00至16日08:00暴雨量级上的TS评分(图略),发现最优成员M00、M03、M06的不同时效TS值均位居前列,而最差成员组中仅M09在12~36 h和36~60 h的TS值较靠前外,M12、M04、M10不同时效及M09其余时效的TS值均位于后列。这进一步表明,对于我国南方初夏强降水过程,控制预报成员M00及与其采用相同边界层和积云对流方案的成员M03和M06具有更好的预报效果。

概率预报是描述某一天气事件发生的可能性,定义为预报出某一天气事件的成员数与总成员数之比,可以最大程度地了解实际大气可能发生情况及不确定程度。图9是2017年6月15日08:00至16日08:00不同预报时效中雨、大雨和暴雨的概率预报与实况降水分布。可以看出,不同时效的中雨概率预报效果较好,60%以上概率的中雨落区与实况比较一致,其中12~36 h和24~48h的概率分布与实况更为接近。对于大雨而言,实况在48~72 h概率预报中有所体现,但在大雨北界以北仍有概率为60%~80%的区域,且在广西东南部、广东南部和西北部以及江西南部也有部分地区概率超过60%,而实况中这些地区降水未达到大雨量级;随着预报时效临近,36~60 h、24~48 h、12~36 h和0~24 h预报效果改进明显,一方面大雨落区概率预报范围更加集中,且与实况更趋一致,另一方面大雨发生概率有不同程度提高。比如36~60 h江西中部—福建北部大雨预报概率达80%以上,广东中南部大雨预报概率为30%,局部达60%,而24~48 h和12~36 h预报在36~60 h基础上使广西西北部大雨概率提高到60%以上;相较前几个时效,尽管江西中部—福建北部0~24 h预报的大雨概率有所减小,但广西西北部和广东东部及与福建西部交界处的大雨概率分别提高到80%、60%以上,且广东中南部大雨概率达30%和60%以上的范围均有所增加。与大雨类似,暴雨在48~72 h概率预报上也有不同程度反映(闽西暴雨除外),暴雨最大概率在30%以上,但同样存在概率预报范围大于实况情况;随着预报时效临近,暴雨落区概率预报范围更加集中,与实况更趋一致,但0~24 h概率预报对江西中部—福建北部暴雨带的预报不佳。

图9

图9   2017年6月15日08:00至16日08:00不同时效的中雨(左列)、大雨(中列)、暴雨(右列)集合概率预报(彩色填充区,单位:%)与实况降水量(蓝色实线,单位:mm)分布

(从上至下依次为0~24 h、12~36 h、24~48 h、36~60 h和48~72 h预报时效)

Fig.9   The ensemble probability forecasts (color filled areas, Unit: %) for moderate rain (the left column), heavy rain (the middle column) and rainstorm (the right column) at different lead time and corresponding observed precipitation (blue solid lines, Unit: mm) from 08:00 15 to 08:00 16 June 2017

(The forecast lead time are 0-24 h, 12-36 h, 24-48 h, 36-60 h and 48-72 h from top to bottom in turn)


值得一提的是,广东中南部特大暴雨是此次降水过程量值最大的区域,且局地性强,局地24 h累积降水量达326.2 mm,属典型华南暖区暴雨。中央气象台6月15日06:00发布的15日08:00至16日08:00蓝色暴雨预警中,对福建大部、江西中南部、湖南南部、广西北部和西部以及台湾北部做出了大到暴雨、局地大暴雨的预警警报,但对广东中南部强降水漏报了。然而,GRAPES-REPS在48~72 h预报出该地区的暴雨概率为30%以上,之后预报的暴雨概率均在10%以上,这在强降水预报中是非常重要的信息,提示有强降水出现的可能性。由此可见,与确定性预报相比,概率预报具有更多优势。

图10是此次降水过程不同预报时效各量级降水的集合平均TS和Bias。可以看出,集合平均在小雨量级上各预报时效的TS比较一致,在中雨量级上12~36 h和36~60 h预报的TS略高于其他预报时效,在大雨量级上24~48 h预报的TS高于其他预报时效,在暴雨量级上36~60 h预报的TS高于其他预报时效[图10(a)]。从Bias[图10(b)]来看,小雨和中雨量级0~24 h集合平均预报的Bias接近于1,其他预报时效都大于1;大雨量级0~24 h和12~36 h预报的Bias小于1,其他预报时效都大于1;暴雨量级各预报时效的Bias都小于1,尤其是0~24 h和12~36 h预报的Bias接近0,表明集合平均预报的暴雨范围较观测偏小,且临近时刻比较远时刻偏小的更明显。

图10

图10   不同时效集合平均预报的2017年6月15日08:00至16日08:00各量级累积降水量TS(a)和Bias(b)

Fig.10   Threat scores (a) and biases (b) of 24 h accumulated precipitation with different magnitudes from 08:00 15 to 08:00 16 June 2017 forecasted by ensemble mean at different lead time


限于篇幅,本文仅对GRAPES-REPS进行降水集合预报检验,缺乏与ECMWF、NCEP(National Centers for Environmental Prediction)等其他集合预报系统的对比检验。根据王婧卓等(2018)研究可知,GRAPES-REPS集合平均的各量级降水Bias及小雨和暴雨ETS(Equitable Threat Score)明显优于ECMWF全球集合预报系统,其降水概率预报与ECMWF具有一定可比性,各有优势,且GRAPES-REPS集合成员能够很好地预报降水发生、发展、消亡过程,对中国汛期降水具有较强的预报能力。

5 结论

(1)GRAPES-REPS对小雨和中雨量级集合平均的TS高于集合成员,但空报较多;暴雨量级预报的TS则低于控制成员及部分扰动成员,且各预报时效(48~72 h除外)普遍漏报较多;对于大雨量级,集合平均TS高于扰动成员和部分时效(0~24 h、12~36 h和36~60 h)控制成员,其中0~24 h漏报较多,24~48 h、36~60 h和48~72 h空报较多。

(2)对于持续性强降水过程,控制预报成员(M00)和2个扰动预报成员(M03、M06)为集合最优成员,它们采用的均是MRF边界层参数化方案和KF-eta积云对流参数化方案的组合方案,其他成员则采用其他组合方案。

(3)集合成员降水预报的离散度整体不足,特别是0~24 h时效,Talagrand分布呈U型,落在最左、右边区间的预报频次偏大,表明对小(大)量级降水预报频次偏多(少),概率偏大(小)。随着预报时效增加,Talagrand分布落在两头区间的预报频次有所减小,逐渐接近理想概率分布,小(大)量级降水预报频次偏多(少)情况有所改善。

(4)Brier评分表明,各预报时效对大雨和暴雨量级的概率预报效果优于小雨和中雨量级;较长时效的各量级降水概率预报效果均随预报时效减小有所提高,其中24~48 h小雨量级和12~36 h中雨、大雨和暴雨量级的概率预报效果最佳。另外,不同时效各量级降水预报的Brier技巧评分均为正值,表明GRAPES-REPS对这些降水事件的概率预报均有意义。

(5)ROC曲线及其面积分析表明,各量级降水在不同预报时效的ROC曲线均位于对角线上方,且AROC均大于0.5,说明GRAPES-REPS在不同预报时效上对各量级降水均有一定的预报能力。其中,0~24 h、12~36 h的小雨量级概率预报技巧优于其他预报时效,12~36 h的中雨和大雨量级、24~48 h的暴雨量级概率预报技巧较高。

(6)2017年6月16日强降水个例分析可见,GRAPES-REPS整体上能够较好地把握不同量级降水的空间分布形态,对江西—福建的雨带预报较好,而对广西雨带预报强度偏弱、落区偏北,但对中央气象台漏报的广东中南部暖区暴雨有一定的概率预报能力,集合成员可为降水预报提供更多信息。

参考文献

陈博宇, 代刊, 郭云谦, 2015.

2013年汛期ECMWF集合统计量产品的降水预报检验与分析

[J]. 暴雨灾害, 34(1): 64-73.

[本文引用: 1]

陈静, 陈德辉, 颜宏, 2002.

集合数值预报发展与研究进展

[J]. 应用气象学报, 13(4): 497-507.

[本文引用: 1]

陈静, 薛纪善, 颜宏, 2005.

一种新型的中尺度暴雨集合预报初值扰动方法研究

[J]. 大气科学, 29(5): 717-726.

[本文引用: 1]

陈圣劼, 刘梅, 张涵斌, , 2019.

集合预报产品在江苏省暴雨预报中的应用评估

[J]. 气象, 45(7): 893-907.

[本文引用: 2]

邓国, 龚建东, 邓莲堂, , 2010.

国家级区域集合预报系统研发和性能检验

[J]. 应用气象学报, 21(5): 513-523.

[本文引用: 1]

董甫, 张玲, 张海鹏, , 2020.

基于WRF模式的强天气过程集合预报综述

[J]. 干旱气象, 38(5): 699-708.

[本文引用: 1]

杜钧, 2002.

集合预报的现状和前景

[J]. 应用气象学报, 13(1): 16-28.

[本文引用: 2]

杜钧, 陈静, 2010.

单一值预报向概率预报转变的基础:谈谈集合预报及其带来的变革

[J]. 气象, 36(11): 1-11.

[本文引用: 1]

杜钧, 李俊, 2014.

集合预报方法在暴雨研究和预报中的应用

[J]. 气象科技进展, 4(5): 6-20.

[本文引用: 1]

杜钧, 周斌斌, 2016.

雾的集合预报与集合预报的检验

[J]. 气象科技进展, 6(3):41-47.

[本文引用: 3]

李俊, 杜钧, 陈超君, 2014.

降水偏差订正的频率(或面积)匹配方法介绍和分析

[J]. 气象, 40(5): 580-588.

[本文引用: 1]

李俊, 杜钧, 陈超君, 2015.

“频率匹配法”在集合降水预报中的应用研究

[J]. 气象, 41(6): 674-684.

[本文引用: 1]

李俊, 王明欢, 公颖, , 2010.

AREM短期集合预报系统及其降水预报检验

[J]. 暴雨灾害, 29(1): 30-37.

[本文引用: 1]

谭燕, 2006. 中尺度强降水天气集合预报技术的研究[D]. 北京: 中国气象科学研究院.

[本文引用: 1]

王婧卓, 陈法敬, 陈静, , 2021.

GRAPES区域集合预报对2019年中国汛期降水预报评估

[J]. 大气科学, 45(3): 664-682.

[本文引用: 2]

王婧卓, 陈静, 庄照荣, , 2018.

GRAPES区域集合预报模式的初值扰动增长特征

[J]. 大气科学, 42(2): 367-382.

[本文引用: 2]

王静, 陈静, 钟有亮, , 2017.

GRAPES-REPS西南低涡预报检验评估

[J]. 气象, 43(4): 385-401.

[本文引用: 1]

王叶红, 赵玉春, 2020.

边界层参数化方案对“莫兰蒂”台风(1614)登陆阶段影响的数值模拟研究

[J]. 大气科学, 44(5): 935-959.

[本文引用: 1]

吴秋霞, 史历, 翁永辉, , 2007.

AREMS/973模式系统对2004年中国汛期降水实时预报检验

[J]. 大气科学, 31(2): 298-310.

[本文引用: 1]

闫慧, 赵桂香, 2020.

山西一次持续暴雨天气过程诊断与集合预报检验

[J]. 干旱气象, 38(1): 137-147.

[本文引用: 1]

张涵斌, 陈静, 智协飞, , 2014.

GRAPES区域集合预报系统应用研究

[J]. 气象, 40(9): 1 076-1 087.

[本文引用: 2]

赵琳娜, 刘琳, 刘莹, , 2015.

观测降水概率不确定性对集合预报概率Brier技巧评分结果的分析

[J]. 气象, 41(6): 685-694.

[本文引用: 1]

钟有亮, 陈静, 王静, , 2017.

GRAPES区域集合预报系统对登陆台风预报的检验评估

[J]. 热带气象学报, 33(6): 953-964.

[本文引用: 1]

BRIER G W, 1950.

Verification of forecasts expressed in terms of probability

[J]. Monthly Weather Review, 78(1): 1-3.

DOI      URL     [本文引用: 1]

CANDILLE G, TALAGRAND O, 2008.

Impact of observational error on the validation of ensemble prediction systems

[J]. Quarterly Journal of the Royal Meteorological Society, 134(633): 959-971.

DOI      URL     [本文引用: 1]

DONALDSON R J, DYER R M, KRAUS M J, 1975. An objective evaluator of techniques for predicting severe weather events[C]// Preprints: Ninth Conference on Severe Local Storms. Norman: American Meteorological Society:321-326.

[本文引用: 1]

HUO Z H, DUAN W S, ZHOU F F, 2019.

Ensemble forecasts of tropical cyclone track with orthogonal conditional nonlinear optimal perturbations

[J]. Advances in Atmospheric Sciences, 36(2): 231-247.

DOI      [本文引用: 1]

MASON I, 1979.

On reducing probability forecasts to yes/no forecasts

[J]. Monthly Weather Review, 107(2): 207-211.

DOI      URL     [本文引用: 1]

MURPHY A H, 1973.

A new vector partition of the probability score

[J]. Journal of Applied Meteorology, 12(4): 595-600.

DOI      URL     [本文引用: 1]

SCHAEFER J T, 1990.

The critical success index as an indicator of warning skill

[J]. Weather and Forecasting, 5(4): 570-575.

DOI      URL     [本文引用: 1]

SWETS J A, 1986.

Indices of discrimination or diagnostic accuracy: their ROCs and implied models

[J]. Psychological Bulletin, 99(1): 100-117.

PMID      [本文引用: 1]

TALAGRAND O, VAUTARD R, STRAUSS B, 1997. Evaluation of probabilistic prediction systems[C]// Proceedings: ECMWF Workshop on Predictability, Berkshire, United Kingdom: ECMWF: 1-25.

[本文引用: 2]

WANG J Z, CHEN J, DU J, et al, 2018.

Sensitivity of ensemble forecast verification to model Bias

[J]. Monthly Weather Review, 146(3): 781-796.

DOI      URL     [本文引用: 1]

This study demonstrates how model bias can adversely affect the quality assessment of an ensemble prediction system (EPS) by verification metrics. A regional EPS [Global and Regional Assimilation and Prediction Enhanced System-Regional Ensemble Prediction System (GRAPES-REPS)] was verified over a period of one month over China. Three variables (500-hPa and 2-m temperatures, and 250-hPa wind) are selected to represent “strong” and “weak” bias situations. Ensemble spread and probabilistic forecasts are compared before and after a bias correction. The results show that the conclusions drawn from ensemble verification about the EPS are dramatically different with or without model bias. This is true for both ensemble spread and probabilistic forecasts. The GRAPES-REPS is severely underdispersive before the bias correction but becomes calibrated afterward, although the improvement in the spread’s spatial structure is much less; the spread–skill relation is also improved. The probabilities become much sharper and almost perfectly reliable after the bias is removed. Therefore, it is necessary to remove forecast biases before an EPS can be accurately evaluated since an EPS deals only with random error but not systematic error. Only when an EPS has no or little forecast bias, can ensemble verification metrics reliably reveal the true quality of an EPS without removing forecast bias first. An implication is that EPS developers should not be expected to introduce methods to dramatically increase ensemble spread (either by perturbation method or statistical calibration) to achieve reliability. Instead, the preferred solution is to reduce model bias through prediction system developments and to focus on the quality of spread (not the quantity of spread). Forecast products should also be produced from the debiased but not the raw ensemble.

WANG Y H, ZHAO Y C, CUI C G, 2007.

Numerical research on effects upon precipitation forecast of Doppler-radar estimated precipitation and retrieved wind field under different model initial schemes

[J]. Acta Meteorologica Sinica, 21(1): 98-113.

[本文引用: 1]

ZHANG H B, CHEN J, ZHI X F, et al, 2015.

A comparison of ETKF and downscaling in a regional ensemble prediction system

[J]. Atmosphere, 6(3): 341-360.

DOI      URL     [本文引用: 1]

/