CLDAS气温实况融合产品在兰州和武威的检验评估及偏差订正
Verification and correction of 2 m temperature merging product of CLDAS in Lanzhou and Wuwei, Gansu Province
通讯作者: 刘新伟(1981—),男,正高级工程师,主要从事灾害性天气研究。E-mail:Ljhx6@163.com。
责任编辑: 邓祖琴;校对:王涓力
收稿日期: 2023-01-9 修回日期: 2023-09-20
基金资助: |
|
Received: 2023-01-9 Revised: 2023-09-20
作者简介 About authors
郭润霞(1993—),女,工程师,主要从事短期预报及客观预报方法研究。E-mail:guorunxia25@126.com。
为更好地理解格点融合实况数据与观测数据的差异和代表性,利用甘肃兰州和武威两地站点的观测数据对中国气象局陆面数据同化系统(CMA Land Data Assimilation System,CLDAS)地面2 m气温融合产品进行检验评估及偏差订正。结果表明:(1)逐小时气温和日最低气温融合产品的平均误差总体为负值,较实际气温偏低,且在2 500 m以下误差随海拔上升而减小;日最高气温融合产品平均误差在海拔1 500 m附近为负值,1 500 m以上误差变为正值且随海拔升高而增大;日最高和最低气温误差较逐小时气温误差偏大,但平均误差均在2 ℃以内。(2)通过近网格点检验,发现逐小时CLDAS气温产品白天与实况相近,夜间较实况偏低0.2 ℃;日平均气温CLDAS融合产品总体较实况偏低1 ℃,兰州城区产品偏差相对较小;30 ℃以上高温天数融合产品与实况分布基本一致,但在兰州城区,CLDAS融合产品的高温天数较观测天数偏少。(3)线性回归法和递减平均法对CLDAS气温融合产品都有一定的订正效果,递减平均法订正效果更优且在高海拔地区订正效果更明显。CLDAS气温实况融合产品在兰州和武威两地能较好地反映气温变化特征,但日最高、最低气温误差较逐小时气温大,且在复杂地形下误差相对较大。
关键词:
In order to make a further understand of the difference and representativeness between gridded merging real-time product and observed data, the paper evaluated and corrected the CLDAS 2 m temperature merging product based on the observational data of automatic stations in Lanzhou and Wuwei region. The results are as follows: (1) The hourly temperature and daily minimum temperature products are lower than observations, and these errors decrease with the altitude going up below 2 500 m. The mean error of the daily maximum temperature product is negative around the altitude of 1 500 m, and changes to positive values above 1 500 m, then the positive mean error increases with the increase of altitude. The errors of daily maximum and minimum temperature are larger than those of hourly temperature, but their mean errors are all within 2 ℃. (2) The near gridding validation further shows that the diurnal change of CLDAS hourly temperature is generally similar to observations in the daytime, while it is relatively 0.2 ℃ lower than observations at night. The daily average temperature of CLDAS merging product is generally lower about 1 ℃, and the negative deviation in Lanzhou urban area is relatively small. Spatial distribution of high temperature days above 30 ℃ of merging products is basically consistent with observations, but there are more actual high temperature days in Lanzhou urban area. (3) Both the linear regression and the decaying averaging method have a certain correction effect on CLDAS temperature merging products, and the latter has a better correction effect. The correction effect becomes better with the altitude increasing. To sum up, the CDLAS temperature merging products can better reflect the characteristics of actual temperature change in Lanzhou and Wuwei region, but its ability to reflect the daily maximum and minimum temperature is not as good as the hourly temperature, and the error is relatively large in complex terrain.
Keywords:
本文引用格式
郭润霞, 刘新伟, 王一丞, 刘娜, 周子涵.
GUO Runxia, LIU Xinwei, WANG Yicheng, LIU Na, ZHOU Zihan.
引言
利用数据融合与数据同化技术,结合多种观测和模拟资料,可有效获得高精度、高质量、时空连续的多源数据融合气象格点产品(师春香,2018;师春香等,2019)。目前,国际上已有多种陆面数据同化系统的融合格点产品,如美国全球陆面数据同化系统(Global Land Data Assimilation System,GLDAS)(Rodell et al.,2004)、欧洲陆面数据同化系统(European Land Data Assimilation System,ELDAS)(Albergel et al.,2013)、北美陆面数据同化系统(North American Land Data Assimilation System,NLDAS)(Xia et al.,2012)等。2018年由国家气象信息中心联合多家单位研发的亚洲区域中国气象局陆面数据同化系统(CMA Land Data Assimilation System,CLDAS)多源数据融合产品通过业务准入,已经在全国各省市和直辖市气象局及其他直属单位得到广泛应用。该产品包括气温、降水、湿度、风、总云量、能见度等多种气象要素。
总体来看,对CLDAS气温融合实况分析产品效果的检验评估正在稳步推进。然而,大多检验工作都基于非独立站点,基于独立站点的检验评估工作相对较少。研究表明,在相同检验条件下,独立站点检验显示的准确性均较非独立站点检验有不同程度降低,即基于独立站点的检验更加考验融合实况产品的准确性,也更能反映格点融合产品与观测之间的偏差(孙靖等,2021)。2021年兰州和武威两地建设了山洪源头便携式气象观测站,并于当年3月投入使用,这为甘肃地区开展CLDAS气温融合实况分析产品的应用提供了可能。本文利用兰州和武威两地站点实测气温数据,通过独立站点检验和近网格点检验等方法,对国家气象中心研发的CLDAS气温融合实况分析产品在兰州和武威地区的适用性进行评估,并在此基础上开展本地化偏差订正,以期进一步认识格点融合实况数据与观测数据的差异及其代表性,为该产品在甘肃地区的应用提供科学依据。
1 资料和方法
1.1 资料
图1
图1
兰州(a)和武威(b)地区新建站分布
Fig.1
Distribution of newly-built sites in Lanzhou (a) and Wuwei (b) region
图2
图2
兰州地区原有区域站点分布
(红色点为用于近网格点检验的站点,虚线为0.05°×0.05°网格)
Fig.2
Distribution of original regional weather stations in Lanzhou region
(The red dots represent the sites used for near grid verification,the dotted line represents 0.05°×0.05° grid)
文中附图涉及地图均基于国家测绘地理信息局标准地图服务网站下载的审图号为GS(2019)1824号的标准地图制作,底图无修改,文中所用时间为北京时。
1.2 检验方法
利用平均误差(Mean Errors,ME)、均方根误差(Root Mean Square Errors,RMSE)、平均绝对误差(Mean Absolute Errors,MAE)和准确率(Accuracy,ACC)等统计指标进行检验评估,计算公式如下:
式中,Oi为站点观测值;Gi为实况分析产品插值到检验站点得到的数值;N为参与检验的总站数;
1.3 订正方法
递减平均法订正公式如下:
式中:B(t)为滞后平均误差;b(t)为预报误差,b(t) = f(t)-a(t),f(t)为预报值,a(t)为实况分析值;B(t-1)为前一日平均误差;ω为权重系数。
气温预报订正步骤如下:(1)当t=1时实行冷启动,即B(t-1)=0;(2)计算过去35 d训练期的最优权重系数ω;(3)计算滞后平均误差B(t);(4)重复步骤(3),经过35 d训练期的迭代累加后,得到的误差已趋于稳定,并能在一定程度上表征系统误差;(5)用当前预报值减去最新的滞后平均误差B(t),得到订正后的预报值。
2 结果与分析
2.1 独立站点检验
利用兰州和武威两地33个独立站点对CLDAS气温融合实况分析产品进行检验。采用气象局发布的智能网格业务标准检验方法,以站点观测为真值,使用“邻近点替代”方案(韦青等,2020),即选择距离观测站点最近的格点融合实况值作为该点对应的融合实况值(有多个距离相等的格点,则优先选取东北方向格点)。
首先对2021年3月至2022年4月多源数据融合实况分析产品的逐小时气温、日最高和最低气温(08:00—08:00)进行逐时次和逐月检验分析。
从逐小时气温误差日变化[图3(a)]看出10:00—18:00平均误差为正,其他时次平均误差为负。各时次平均误差绝对值均在1 ℃以内,表明气温融合产品准确率较高,气温较高时段逐小时气温融合产品较实况偏高,偏高0.5 ℃以内,其他时段较实况偏低,偏低0.8 ℃以内。均方根误差和平均绝对误差变化趋势基本一致,日变化较平缓,均方根误差最大不超过1.7 ℃,平均绝对误差最大不超过1.3 ℃。总体而言,逐小时气温产品误差较小,且在早晨和傍晚时段误差最小(最小RMSE=1.4 ℃,MAE=0.9 ℃)。从逐小时气温误差月变化[图3(b)]可看出,平均误差各月均为负值,表明气温融合产品较实况偏低,偏低1.0 ℃以内;3—10月平均误差较小(平均偏低0.1 ℃左右),11月至次年2月平均误差较大(平均偏低0.6 ℃左右)。均方根误差和平均绝对误差变化趋势一致,春季误差相对较小(RMSE为1.3 ℃左右,MAE为1.0 ℃左右),其他季节误差较大,其中7月误差最大,RMSE为1.8 ℃,MAE为1.3 ℃。
图3
图3
2021年3月至2022年4月逐小时气温误差的日变化(a)和月变化(b)
Fig.3
Diurnal (a) and monthly (b) variations of hourly temperature errors from March 2021 to April 2022
图4
图4
2021年3月至2022年4月日最高(a)、最低气温(b)误差的逐月变化
Fig.4
Monthly variation of errors of daily maximum(a) and minimum(b) temperature from March 2021 to April 2022
独立气象观测站点2021年3月陆续投入使用。基于这些站点数据对日最高、最低气温产品的检验结果表明3月误差较大,4月误差有明显减小,而5月开始,甘肃中部降水逐渐增多,天气多变,转折性天气造成气温波动较大,因此日最高、最低气温融合产品的误差也有所增大。总体上,各月虽然误差有所变化,但误差总体均在2.0 ℃以内,由此表明,2 m气温融合产品在兰州和武威地区对实况的再现能力较好,能较为准确地反映气温的真实状态。
进一步分析2 m气温融合产品误差在空间上的差异(图5)。兰州独立观测站点集中在城区,地形一致,平均误差基本为负值,较实况偏低0.5 ℃左右[图5(a)]。武威独立观测站点较分散,ME在武威南部为正,平均偏高0.8 ℃,武威北部为负,平均偏低0.6 ℃,最大平均误差在±2 ℃以内[图5(d)]。参考蒋雨荷等(2022)对该产品在四川地区的误差分析,作者认为造成这一现象的原因是武威南部祁连山区地势较高,气温略低于周边区域,融合产品的插值结果出现高估;而兰州城区地处河谷地带,地势较低,气温观测值略高于四周,融合产品的插值结果小于观测值,同时城市热岛效应也可能造成平均误差为负,出现低估。逐小时气温均方根误差和平均绝对误差的空间分布[图5(b)、(c)]和日最高气温(图略)变化一致,武威南部误差较大,北部误差较小;而日最低气温的RMSE和MAE无明显空间变化(图略)。总体来看,武威地区误差均大于兰州地区,2 m气温融合产品在复杂地形下的应用效果有待进一步检验。
图5
图5
兰州(a、b、c)和武威(d、e、f)逐小时气温的平均误差(a、d)、均方根误差(b、e)及平均绝对误差(c、f)空间分布
Fig.5
Spatial distributions of ME (a, d), RMSE (b, e) and MAE (c, f) of hourly temperature in Lanzhou (a, b, c) and Wuwei (d, e, f) region
通过2 m气温融合产品各误差的空间分布可以看到,兰州站点集中在城区,误差变化不大;武威地区自北向南海拔和地形差异较大,误差分布与兰州不同。根据兰州和武威两地地形地貌差异,将研究站点分为3类:兰州城区为河谷盆地(海拔小于2 000 m,共15站),武威南部为祁连山地(海拔大于2 000 m,最高3 445 m,共7站);武威中北部为平原和荒漠(海拔小于2 000 m,最低海拔1 303 m,共11站),探究各要素误差与地形及海拔的关系(图6)。可以看出,武威南部误差明显大于兰州城区与武威中北部,表明海拔对2 m气温误差的影响明显;而兰州城区与武威中北部海拔相近但存在下垫面差异,武威中北部误差大于兰州城区。
图6
图6
不同地区日最高气温(a、b、c)与日最低气温(d、e、f)误差对比
Fig.6
Error comparison of daily maximum temperature(a,b,c) and daily minimum temperature(d,e,f) in different regions
图7
图7
逐小时气温误差(a)和日最高气温误差(b)与海拔的关系
Fig.7
Relationship between the errors of hourly temperature(a),daily maximum temperature(b) and altitude
2.2 近网格点检验
为进一步开展更精细化的检验评估,定义近网格点检验,直接对站点与格点数据进行点对点误差分析,以期更深入地认识格点融合实况数据与站点观测数据之间的差异及其代表性。因此,利用未融合进多源数据融合实况分析产品的兰州地区新建气象观测站点和原有已融合进多源数据融合实况分析产品的区域站点数据,找到站点与格点距离1.5 km以内的点作为检验对象(兰州区域内47站,其中独立站点8个、非独立站点39个),以2021年6—8月为检验时间段,对CLDAS气温融合产品进行更深入的检验评估。
首先,评估气温融合产品对实况的整体模拟能力。统计CLDAS气温融合格点产品与观测站点不同小时气温区间气温出现的频率,逐小时不同气温区间实况和CLDAS出现的频率高度一致,主要集中在15~25 ℃,二者的主要区别在于,当气温低于20 ℃时,CLDAS融合实况出现的频率略高,当气温高于20 ℃时,观测实况出现频率略高(图略)。此外,逐小时气温的日变化总体表现为白天(08:00—20:00)CLDAS与实况基本相近,夜间(20:00至次日08:00)CLDAS较实况略偏低(图略)。
进一步计算日最高、最低气温平均误差在2 ℃以内的准确率,从其空间分布可看出(图8),大部分格点准确率在80%以上,个别点准确率相对较低。日最高气温在永登西部和榆中东部的准确率相对较低,日最低气温在永登东部准确率较低。日最高气温的平均准确率为84.09%,日最低气温的平均准确率为88.64%,日最低气温的平均准确率高于日最高气温。
图8
图8
兰州地区日最高气温(a)和日最低气温(b)融合产品准确率的空间分布
Fig.8
Spatial distribution of the accuracy of daily maximum temperature (a) and daily minimum temperature (b) in Lanzhou region
从日平均气温的平均误差空间分布(图9)来看,CLDAS气温融合产品总体偏低,兰州城区的负偏差相对较小。日平均气温在30 ℃以上的日数,CLDAS气温融合产品的分布与实况基本一致(图10),但兰州城区实况中高温天数更多,这可能与城市热岛效应有关。城市下垫面多为水泥、混凝土等,与自然下垫面(绿地、水面等)相比,城市下垫面的反射率小、热容量小,在相同辐射条件下,吸收的太阳辐射多,温度变化幅度大(尚建设等,2018),因而城市下垫面的温度明显高于自然下垫面。夏季干旱少雨的天气状况有利于城市热岛效应的产生和增强,强热岛区域主要分布在人口密集的传统老城区、商业区、车站、工业园及城市新区(何泽能等,2022)。CLDAS气温融合产品未能考虑城市热岛这一因素,因此高温天数较实况偏少。
图9
图9
日平均气温平均误差空间分布
Fig.9
Spatial distribution of ME of the daily average temperature
图10
图10
观测数据(a)和CLDAS(b)日平均气温30 ℃以上日数空间分布
Fig.10
The spatial distribution of days with daily average temperature above 30 ℃ of observation(a) and CLDAS(b)
按照下垫面条件的不同,将研究区划分为永登山地、城区盆地和榆中山地,以研究不同下垫面对日平均气温偏差的影响。这些地区的日平均气温偏低,负偏差在1 ℃以内,城区盆地的误差相对较小,而榆中和永登均为山地,误差相近(图11)。由此可见,下垫面条件是影响日平均气温偏差的主要因素。
图11
图11
不同地区日平均气温偏差对比
Fig.11
Comparison of daily average temperature’s ME in different regions
2.3 偏差订正
基于前述检验结果,采用线性回归和递减平均两种订正算法对CLDAS逐小时气温产品进行偏差订正。这两种算法对CLDAS气温融合实况产品的具体订正效果如下。
从误差随时间变化的结果(图12)来看,线性回归算法有一定订正效果,订正后最大均方根误差从1.7 ℃减小至1.3 ℃以内,平均绝对误差减小至1.0 ℃以内,平均误差日变化的负偏差明显减小,但正偏差增加。10月至次年1月的偏差明显减小,夏季的负偏差增大。递减平均算法对CLDAS的订正效果更为明显,平均误差日变化大幅减小,并解决了线性回归订正算法中日变化放大了正偏差、季节变化放大了夏季负偏差的问题。订正前,ME变化范围为-1~0.6 ℃,订正后减小到-0.1~0.05 ℃。均方根误差由最大1.7 ℃减小至不到1.1 ℃。平均绝对误差减小至0.9 ℃以内。该算法对于中午至下午时段以及冬季的气温订正效果最明显。
图12
图12
逐小时气温产品订正前后误差随时间变化
Fig.12
The temporal change of errors of hourly temperature product before and after correction
此外,各误差变量的空间分布显示,两种订正算法都有一定的改善效果。递减平均法的订正效果尤为显著,订正后,ME减小至±0.5 ℃以内。在武威南部山区,RMSE和MAE明显减小,但在武威北部的平原荒漠地区,订正前后差异并不明显(图略)。为进一步定量描述订正效果,定义[(MAE订正后- MAE订正前)/MAE订正前)]为订正后的改善率,负值越大表示改善效果越好(姚帅等,2022)。从图13可以看出,改善率在武威地区由北向南逐渐提高,南部祁连山地区改善率在-30%~-40%,北部荒漠地区改善率在-20%左右。改善率与海拔基本呈正相关,即海拔越高,订正效果越好。此外,在兰州城区,西南部的改善率高于东北部,改善率最高超过-60%。递减平均法相对于线性回归算法具有更高的改善率,订正效果更为出色。前人研究也表明对于统计学中不精确的状态估计,递减平均法(卡尔曼滤波方法)利用权重平均得到的状态估计相对于其他估计方法(线性回归法)通常更接近真实值(Cui et al.,2012)。虽然两种订正算法都以减小系统误差为最终目标,但递减平均法在计算递减平均误差时既考虑了气候平均预报误差的特征,保证了估计误差整体的稳定性,又加入了临近时刻误差信息,融入了天气系统连续性特点,将二者以一个权重系数相结合,共同估计递减平均误差(马旭林等,2015),因此其订正效果会比只考虑了气候平均预报误差的一元线性回归法更好。
图13
图13
武威(a、b)和兰州(c、d)地区逐小时气温误差线性回归算法(a、c)和递减平均算法(b、d)订正改善率
Fig.13
Improvement rate after correcting with the linear regression(a,c) and the decaying averaging methods(b,d) in Wuwei(a,b) and Lanzhou(c,d) region
3 结论与讨论
本文主要评估了CLDAS气温融合产品在兰州和武威两地的应用效果,并尝试对其进行偏差订正。检验评估分为独立站点检验与近网格点检验两个部分,旨在更深入了解CLDAS气温融合产品的性能。主要结果如下:
(1)独立站点检验结果表明,尽管逐小时气温融合产品总体上略低于站点实况气温,但其准确率较高。均方根误差和平均绝对误差在日变化中表现为早晨和傍晚时段误差最小;季节变化中表现为春季误差相对较小,其他季节误差较大,但均在1.8 ℃以内。日最高、最低气温误差比逐小时气温误差大,但平均误差均在2 ℃以内,日最高气温较实况偏高,日最低气温较实况偏低。海拔2 500 m以下,逐小时气温误差和日最低气温误差随海拔升高而减小;日最高气温融合产品的平均误差在海拔1 500 m附近为负值,之后随着海拔升高转为正值且随海拔高度升高误差增大。
(2)近网格点检验结果表明,逐小时气温日变化总体表现为白天CLDAS产品与实况基本一致,夜间略偏低。日平均气温CLDAS融合产品总体偏低,兰州城区负偏差相对较小。高温天数分布与实况基本一致,但兰州城区实况中高温天数更多,可能与城市热岛效应有关。
(3)基于检验结果,采用线性回归和递减平均两种算法对CLDAS气温融合产品进行偏差订正。递减平均法在各方面均表现出更好的订正效果,能有效减小误差,特别是在高海拔地区。
本文通过独立站点检验和近网格点检验,尽可能全面地分析了CLDAS气温融合格点产品与实况观测数据的差异。总体而言,CLDAS气温实况融合产品在兰州和武威地区具有较好的适用性,但在一些复杂地形地区,误差较大,这些地区站点的代表性和空间匹配方法都有待进一步研究。
参考文献
近40 a重庆城市热岛特征及其与天气状况的关系
[J].利用1980—2019年重庆市中心城区4个气象站点的气温、降水等观测资料以及典型时段卫星资料,分析重庆市热岛效应的时空变化特征以及不同天气状况对热岛的影响。结果表明:20世纪90年代中期以来,重庆城市热岛效应增强趋势明显,21世纪10年代达最强,近年有减缓迹象。热岛的日、月及季节变化特征分布为:白天弱,夜间强;8月最强,6月最弱;盛夏最强,初春次之,仲春至初夏最弱。卫星遥感显示城市热岛呈东北、西南走向分布,强热岛主要位于人口密集的老城区、商业区、广场、车站、工业园以及城市新区等区域。21世纪10年代,城市热岛效应受雨天、阴天等负向驱动因素的影响以及多云天、晴天等正向驱动因素的影响,重庆市中心城区雨天、阴天、多云天、晴天时的平均热岛强度分别为0.19、0.52、0.69、0.76 ℃。
济南市夏季城市热岛效应特征分析
[J].利用2012—2014年济南市自动气象站气温数据,分析济南市夏季城市热岛效应时空分布特征。结果表明,济南市夏季城市热岛效应显著,热岛强度由市区向四周辐射,市中心沿经十路到泉城路东西向一带为热岛效应最强区域;济南市夏季城市热岛效应强度存在明显的日变化,热岛强度夜间大于白天,早晨和傍晚前后存在热岛强度陡然变化阶段。
中国地面气象要素格点融合业务产品检验
[J].对2018年5 km分辨率中国地面气象要素2 m温度、 10 m风速和24 h累积降水格点融合产品进行非独立和独立检验。非独立检验结果表明: (1)相比于站点观测, 2 m温度格点融合产品整体偏暖, 各月平均均方根误差在1 ℃左右, 35 ℃以上高温和-20 ℃以下低温天气时均方根误差分别在1 ℃和2 ℃以上。(2)10 m风速格点融合产品可准确地描述0~2级风速, 但对3级以上, 特别是6级以上大风风速描述能力偏弱, 主要表现为比实际偏小。(3)卫星-地面观测的二源融合和卫星-雷达-地面观测的三源融合降水格点产品在0~0.1 mm降水区间出现降水面积过大的现象; 随着降水量级的增加, 两种产品的均方根误差和平均偏差均随之增加, 主要表现为降水融合产品的量级比观测偏小。相对而言, 三源融合降水格点产品的准确性优于二源融合产品的。独立检验结果表明, 三种要素的检验指标随时间或阈值的变化趋势与非独立检验基本一致, 且更能表明格点融合产品与观测之间的偏差。主要是因为独立检验中使用到的观测均未参与格点融合产品的制作过程。综上所述, 中国地面气象要素格点融合产品对一般天气描述较好, 但在高低温、 大风或强降水等极端天气时误差较大。
递减平均法对陕西SCMOC精细化温度预报的订正效果
[J].利用递减平均法对2012—2013年陕西区域99站共731 d的SCMOC温度精细化指导预报进行误差订正,订正结果表明:该订正方法总体表现为正的订正效果,对08:00和20:00起报的定时温度、日最高温度以及08:00起报的日最低温度有明显的订正能力,在准确率偏低的预报时效内订正效果较好;对于48 h内逐3 h定时温度预报,在夜间的准确率高于白天,对应的“递减平均法”在白天的订正能力高于夜间;对于168 h内日最高(低)温度预报,随着预报时效的增加准确率降低,但是“递减平均法”的误差订正能力增强;“递减平均法”对48 h内逐3 h定时温度和24 h内日最低温度的订正能力在准确率偏低的月份偏强。
Monitoring multi-decadal satellite earth observation of soil moisture products through land surface reanalyses
[J].
Bias correction for global ensemble forecast
[J].
A dynamical performance-ranking method for predicting individual ensemble member performance and its application to ensemble averaging
[J].
The global land data assimilation system
[J].
Sensitivity of ensemble forecast verification to model bias
[J].
Continental-scale water and energy flux analysis and validation for the North American Land Data Assimilation System project phase 2 (NLDAS-2): 2. Validation of model-simulated streamflow
[J].
/
〈 |
|
〉 |
