贵州省两次气象干旱对比分析及基于机器学习的干旱预测模型建立
Analysis of two meteorological drought events in Guizhou Province and establishment of drought prediction model based on machine learning
通讯作者: 李忠燕(1986—),女,四川隆昌人,高级工程师,主要从事气候预测及诊断工作。E-mail:523257762@qq.com。
责任编辑: 邓祖琴;校对:王涓力
收稿日期: 2024-04-28 修回日期: 2024-09-11
基金资助: |
|
Received: 2024-04-28 Revised: 2024-09-11
作者简介 About authors
王玥彤(1992—),女,贵州贵阳人,工程师,主要从事短期气候预测及诊断工作。E-mail:810569401@qq.com。
对比分析贵州省主汛期(6—9月)不同干旱事件的特征,有助于提升贵州省短期气候预测技术。基于贵州省84个气象台站降水资料,分析贵州省1981—2023年2次严重干旱事件的时空演变特征,并利用再分析数据揭示事件成因,比较两者差异;同时结合国家气候中心130项气候指数和机器学习方法对贵州省干旱事件进行建模。结果表明,贵州省主汛期降水量呈明显年代际变化特征,2011、2022年在拉尼娜背景下降水最少;2011年贵州省大范围干旱的主要原因是西太平洋副热带高压(简称“西太副高”)偏东及低层南海地区气旋式环流异常,导致水汽条件差;2022年在热带印度洋偶极子负位相影响下,西太副高异常偏大、偏西、偏强,南亚高压偏强、偏东,气温异常偏高,中国南方地区低层为反气旋式环流异常,水汽条件差并伴随持续高温,导致贵州省干旱加剧。通过机器学习的26种算法建立贵州省干旱预测模型,其中Linear SVC模型的预测效果最好,检验评估表明,该模型对贵州省2011、2022年的干旱有较好的预测能力。
关键词:
Comparative analysis of different drought events occurring in Guizhou Province during the flood season (from June to September) is significant for improving the short-term climate prediction techniques. Based on the precipitation data from 84 meteorological stations in Guizhou Province, the spatial and temporal evolution characteristics of two severe drought events in Guizhou Province during the period of 1981—2023 were characterized statistically, and the causes of the two drought events were revealed using reanalyzed data, and the differences were compared. At the same time, combined with 130 climate indexes of the National Climate Center and machine learning method, the drought event in Guizhou Province was modeled. The results show that the precipitation in flood season in Guizhou Province presented significant inter-decadal variability, and the precipitation was least under the La Niña background in 2011 and 2022. Poor water vapor conditions in flood season in 2011 under the joint influence of the Western Pacific Subtropical High moving to the east and the cyclonic circulation anomalies over the lower South China Sea region led to a widespread drought in Guizhou Province. In 2022, affected by the negative phase of the Tropical Indian Ocean Dipole (TIOD), the Western Pacific Subtropical High was abnormally large, strong and westward, the South Asian High was strong and eastward, the temperature was abnormally high, and there was an anticyclonic circulation anomaly at the lower level over the southern China, and the water vapor conditions were poor and accompanied by continuous high temperature, which resulted in the persistence of the drought in Guizhou Province. Twenty-six algorithms of machine learning were used to build a drought prediction model for Guizhou Province, among which the Linear SVC model had the best prediction effect. The test and evaluation show that this model had a good prediction ability for 2011 and 2022 drought in Guizhou Province.
Keywords:
本文引用格式
王玥彤, 何东坡, 李忠燕, 王烁, 陈早阳.
WANG Yuetong, HE Dongpo, LI Zhongyan, WANG Shuo, CHEN Zaoyang.
0 引言
随着全球变暖的加剧,近年来极端气候事件频发。在中国北方干旱形势严峻的同时,南方干旱的发生频率和强度也明显上升,区域性和季节性的严重干旱事件呈增加趋势(李伟光等,2012;王素萍等,2014)。中国西南地区约30%的区域属于干旱区,干旱化趋势明显,尤其在秋季干旱化程度最强(蔡怡亨等,2023)。西南地区的区域性干旱事件在频次、范围和强度上均呈增加趋势(张强等,2009;李韵婕等,2014;李忆平等,2015),其中极端干旱的发生频率、持续时间和强度也在增加(杨金虎等,2015;张红丽等,2016)。研究表明,西太平洋和热带印度洋的热力异常通过海气相互作用影响东亚地区的大气环流,进而影响西太平洋副热带高压(简称“西太副高”)的位置和强度、水汽输送等,对西南地区不同季节的干旱产生明显影响(黄荣辉等,2012;池再香等,2012;尹晗和李耀辉,2013;胡学平等,2014;于浩慧等,2023)。
近年来,贵州干旱面积明显扩大(王莺等,2022)。2022年下半年长江流域大范围持续性干旱对农业生产和能源部门造成重大影响(张强,2022),同时期贵州省也经历了历史罕见的持续干旱,全省9个市(州)均遭受不同程度的旱灾。汛期干旱和洪涝是贵州省最严重的两种自然灾害,对旱涝的预测是汛期重要的短期气候预测服务内容,可为各级政府决策提供科学依据(王玥彤等,2020)。因此,研究对比贵州省2022年及相似干旱年份的成因和差异,对提高贵州省短期气候预测水平,保障人民生命财产安全具有重要意义。近年来,人工智能技术在气象领域的应用逐渐增加(Zhang et al.,2013;苗春生等,2017;黎玥君和郭品文,2017;Ham et al., 2019;陈晓平等, 2020;沈皓俊等,2020),将非线性方法引入干旱的物理统计模型,结合机器学习处理非线性问题的优势,为旱涝状况的预测提供了新方法。
1 数据与方法
1.1 数据
中国气象局气象大数据云平台提供的贵州省84个国家级气象站1981—2023年逐日、逐月降水量资料和气象干旱综合指数(MCI)资料及中国全球大气/陆面再分析产品CRA40(空间分辨率为0.25°×0.25°);国家气候中心整编的130项气候指数集,包括西太副高脊线与西伸脊点、Niño3.4及热带印度洋偶极子(Tropical Indian Ocean Dipole,TIOD)等指数;美国国家环境预报中心和国家大气研究中心(National Center for Environmental Prediction/National Center for Atmospheric Research,NCEP/NCAR)1981—2023年大气再分析资料,空间分辨率为2.5°×2.5°;美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)1981—2023年第5套逐月扩展重建海温(Sea surface Temperature,SST)资料,空间分辨率为1°×1°。文中所用气候态为1991—2020年平均。
1.2 方法
1.2.1 MCI
式中:MI30为近30 d相对湿润度指数;SPI90、SPI150分别为近90 d、150 d标准化降水指数;SPIW60为近60 d标准化权重降水指数;a、b、c、d为权重系数,西南地区分别取0.3、0.5、0.3、0.2;Ka为季节调节系数,根据不同季节各地主要农作物生长发育阶段对土壤水分的敏感度确定。
1.2.2 贵州省持续性干旱定义及计算
根据严小冬等(2019)的研究,将贵州省持续性干旱定义为月降水距平百分率小于-15%且持续3~4个月,或持续5个月及以上(其中有1个月降水距平百分率可以大于-15%且小于20%),并且累积降水距平百分率小于-120%且月平均降水距平百分率小于-30%。持续干旱事件的强度用累积降水距平百分率表示。为便于年代际变化分析,使用各年代持续性干旱事件的累积降水距平百分率之和量化各年代持续性干旱的强度。
1.2.3 机器学习方法
随机森林(Random Forest,RF)是机器学习中集成学习(Ensemble Learning)的典型方法之一(Breiman, 2001;Hastie et al., 2009)。RF通过在决策树集成的基础上引入随机属性选择来构建模型(张蕾等,2023;卢维肖等,2024)。在训练每棵基决策树时,RF从每个节点的属性集合中随机选择一个子集,然后从该子集中选取最优属性进行划分。由于这种随机性,RF能有效抑制模型过拟合,并在分类时评估属性的重要性。特征的重要性通过计算其对模型准确性的平均贡献来评估,这个贡献通常以不纯度(如基尼不纯度或信息增益)减少为标准。根据每个特征的重要性得分,可对特征排序,并选择最相关的特征用于模型训练或分析。
本文使用随机森林方法对130项影响干旱的气候指数进行权重排名,并展示权重排名前5的因子。但建模时,所有气候指数都会参与。基于RF计算的各项指数权重,利用python的lazypredict库中包含的26种机器学习算法(表1)建立贵州省干旱预测模型,并对各模型进行评估和对比。模型评估标准包括准确率、平衡准确率、受试者特征曲线下面积、F1分数及花费时间。其中,准确率(Accuracy)指分类器正确预测样本的比例,由分类器正确分类的样本数除以总样本数得到;平衡准确率(Balanced Accuracy)是在考虑每个类别样本数量的基础上计算的准确率,可反映各类别对模型性能的影响;受试者特征曲线下面积(Receiver Operating Characteristic Area Under Curve,ROC AUC)是衡量二元分类器性能的指标,取值范围为0~1,其中1表示完美分类,0.5表示随机分类;F1分数(F1 Score)是准确率和召回率的加权调和平均值,综合考虑分类器的准确性和稳定性;花费时间(Time Taken)指模型训练或测试所需时间,时间越短表示模型效率越高。
表1 26种机器学习算法
Tab.1
名称 | |||
---|---|---|---|
AdaBoost Classifier | Extra Trees Classifier | Linear SVC | Ridge Classifier |
Bagging Classifier | Gaussian NB | Logistic Regression | Ridge Classifier CV |
Bernoulli NB | KNeighbors Classifier | Nearest Centroid | SGD Classifier |
Calibrated Classifier CV | Label Propagation | Passive Aggressive Classifier | SVC |
Decision Tree Classifier | Label Spreading | Perceptron | XGB Classifier |
Dummy Classifier | LGBM Classifier | Quadratic Discriminant Analysis | |
Extra Tree Classifier | Linear Discriminant Analysis | Random Forest Classifier |
2 研究结果
2.1 主汛期降水及干旱演变特征对比
贵州省主汛期(6—9月)降水量距平百分率年际变化(图1)显示,降水量具有明显的年代际变化特征,20世纪90年代降水总体偏多,2000—2014年降水偏少,其中2011年降水量最少,仅为420.4 mm,偏少38.2%。2015—2023年降水量以偏多为主,尤其是2020年,主汛期降水量达942.1 mm,为历史最多;但2022年降水量异常偏少(453.1 mm,偏少33.4%),为历史同期第二低,仅次于2011年。2011年和2022年,贵州省均发生严重的持续性大范围干旱事件,造成较大的经济损失和社会影响。
图1
图1
贵州省1981—2023年主汛期降水量距平百分率年际变化
Fig.1
Inter-annual variation of precipitation anomaly percentage during the flood season from 1981 to 2023 in Guizhou Province
依据贵州省持续性干旱的定义,使用最新观测数据更新了1981—2023年的持续性干旱个例库(表2)。贵州省1981年以来共发生11次持续性干旱事件,其中20世纪80年代最为频繁,共4次;2020—2023年发生2次持续性干旱;2009年7月—2010年3月、2011年1—9月、2022年7月—2023年2月的3次干旱事件均持续9个月,其中2022年7月开始的干旱事件强度最强。结合降水距平百分率年际变化及干旱事件的强度和持续时间,选取2011年作为与2022年具有相似拉尼娜背景的干旱年份进行对比分析。
表2 1981—2023年贵州省全省范围持续性干旱事件个例
Tab.2
干旱时段 | 季节 | 持续时间/月 | 累计降水量距平百分率/% | 平均降水量距平百分率/% |
---|---|---|---|---|
1984年1—3月 | 冬春 | 3 | -125.3 | -41.8 |
1986年12月—1987年4月 | 冬春 | 5 | -201.3 | -40.3 |
1988年3—7月 | 春夏 | 4 | -159.7 | -31.9 |
1988年10月—1989年1月 | 秋冬 | 4 | -202.9 | -50.7 |
1995年10月—1996年2月 | 秋冬 | 5 | -164.1 | -32.8 |
1998年11月—1999年3月 | 秋冬春 | 5 | -168.9 | -33.7 |
2009年7月—2010年3月 | 夏秋冬春 | 9 | -397.5 | -44.2 |
2011年1—9月 | 冬春夏秋 | 9 | -371.9 | -41.3 |
2017年10—12月 | 秋冬 | 3 | -125.0 | -41.6 |
2020年11月—2021年1月 | 冬 | 3 | -127.2 | -42.4 |
2022年7月—2023年2月 | 夏秋冬 | 9 | -376.9 | -47.1 |
对比分析发现2011年与2022年2次干旱事件年降水量异常偏少区域在空间分布(图2)上有差异:2011年,贵州省大部地区降水量距平百分率偏少2~5成,南部和东北部局部地区偏少5成以上;2022年,贵州省大部地区降水量距平百分率同样偏少2~5成,但偏少5成以上区域主要位于贵州省东部。
图2
图2
贵州省2011(a)、2022(b)年主汛期降水量距平百分率空间分布(单位:%)
Fig.2
Spatial distribution of precipitation anomaly percentage during the flood season in Guizhou Province in 2011 (a) and 2022 (b) (Unit: %)
由逐月降水量距平百分率及MCI指数计算的全省逐日干旱站点数变化(图3)可看出,干旱发展的时间并不相同。2011年6月的雨水集中期后,7月上中旬出现强降水天气过程,干旱并不明显;7月中旬后,全省出现大范围晴热高温天气,气温升高且降水异常偏少6成以上,导致干旱迅速发展,至8—9月进一步发展,持续至9月底结束。2022年6月降水持续减少,7月下旬贵州省东北部边缘地区开始出现旱情,并逐渐向中部、西南部扩展;7月下旬后期发生了一次强降水过程,旱情暂时得到缓解;但8月上旬起,北部、东部地区再次出现旱情,并迅速蔓延至西部、南部;之后由于缺乏全省范围的有效降水,旱情未能大范围缓解,一直持续至9月底,并延续至2023年2月才完全解除。从表2可以看出,2011年干旱持续9个月,集中在冬、春、夏、秋四季,累计降水量距平百分率为-371.9%,平均降水量距平百分率为-41.3%;2022年干旱同样持续9个月,主要集中在夏、秋、冬季,累计降水量距平百分率为-376.9%,平均降水量距平百分率为-47.1%,2022年干旱强度为1981年以来拉尼娜背景下最强的一次。
图3
图3
贵州省2011、2022年主汛期逐月降水量距平百分率(a)及中旱及以上站点数逐日变化(b)
Fig.3
Monthly precipitation anomaly percentages (a) and daily changes in the number of stations with moderate drought and above (b) in Guizhou Province during the flood season in 2011 and 2022
2.2 大气环流与海温特征
2.2.1 高中低层大气环流特征
图4
图4
2011(a、c、e)、2022(b、d、f)年200 hPa(a、b)、500 hPa(c、d)位势高度场(等值线)及其距平(填色)(单位:gpm)及850 hPa(e、f)风场距平(单位:m·s-1)
(红色实线为气候态;A为反气旋式环流,C为气旋式环流;蓝色箭头为风场距平方向)
Fig.4
The geopotential height field (contours) and its anomaly (the color shaded) at 200 hPa (a, b) and 500 hPa (c, d) (Unit: gpm),and wind field anomaly (Unit: m·s-1) at 850 hPa (e, f) in 2011 (a, c, e) and 2022 (b, d, f)
(The red line indicates climatic state; the character A indicates anticyclonic circulation and C indicates cyclonic circulation; the blue arrows indicate the direction of wind anomaly)
上述环流配置导致贵州省持续少雨,促进全省范围气象干旱的发生与维持。
2.2.2 环流指数变化特征
图5
图5
2011、2022年主汛期西太副高脊线(a)和西伸脊点(b)逐月距平
Fig.5
Monthly anomaly of ridge line (a) and western extension ridge point (b) of the west Pacific subtropical high during the flood season in 2011 and 2022
2.2.3 海洋变化特征
图6
图6
2011(a、c)、2022(b、d)年全球海温距平(单位:℃)(a、b)及沃克环流异常(单位:m·s-1)(c、d)
Fig.6
The global sea surface temperature anomalies (Unit: ℃) (a, b) and Walker circulation anomalies (Unit: m·s-1) (c, d) in 2011 (a, c) and 2022 (b, d)
2011年夏季,赤道太平洋为冷海温距平,表现为拉尼娜事件,中国沿海海温偏低,印度洋表现为全区一致偏暖。同期,拉尼娜影响下的赤道沃克环流表现为低层东风异常,赤道中太平洋地区表现出对冷海温的响应,为下沉气流,上升支位于热带西太平洋暖池区域(120°E—160°E)。赤道印度洋偏暖导致上升运动,而海洋性大陆冷海温地区为下沉支。
2022年夏季,赤道东太平洋同样为冷海温距平,拉尼娜事件持续,但中国沿海海温偏高,赤道冷海温中心位于日界线附近,海洋性大陆区域为暖海温,热带印度洋区域表现为“西负东正”的偶极子负位相。同期沃克环流响应赤道区域的海温,上升支较窄并位于120°E附近,但上升运动强烈,下沉支位于赤道中太平洋冷海温区域,使得沃克环流在此处异常加强。
对比2个年份Niño3.4区海温和热带印度洋偶极子(TIOD)的时间演变特征(图7)可知,2011年Niño3.4区海温前期偏高,由2010年的厄尔尼诺事件逐渐衰减并转为拉尼娜事件;2022年则持续处于拉尼娜事件中。TIOD演变差异明显,2010年为负位相,2011年初转为正位相并持续;2021年TIOD稳定维持负位相,2022年春末负位相增强,夏季发展成为1981年以来最强负位相,2022年前期太平洋和印度洋海温异常对大气的强迫效应持久而明显。
图7
图7
2011、2022年Niño3.4区海温滚动季指数(a)及TIOD逐月指数(b)
Fig.7
The rolling seasonal index of Niño3.4 sea surface temperature (a) and monthly index of TIOD (b) in 2011 and 2022
2.2.4 干旱成因
2011年主汛期,赤道太平洋地区的大气环流对拉尼娜事件响应明显,赤道印度洋及太平洋东岸偏暖的海温外强迫增强中低纬度地区大气环流的下沉运动。Hadley环流的下沉支位于120°E—130°E偏北,西太副高偏东,贵州地区水汽和冷暖空气交换条件较差,导致大范围干旱持续。
2022年主汛期,在拉尼娜背景下,赤道中太平洋的冷海温距平异常偏强,热带印度洋海温“西负东正”的负位相异常加强。通过海气相互作用,西太副高偏强、偏大,南亚高压偏强东伸,东亚地区中高层大气形成深厚的高压系统,控制中国南方大部地区。850 hPa风场显示中国中东部地区受反气旋环流控制,且中高纬度环流经向性强,大范围水汽被输送至中国北方地区。贵州省受强大副高控制,缺乏充足的水汽,大范围高温少雨天气持续,最终导致干旱事件的发生。
2.3 贵州省干旱预测模型的建立与检验
2.3.1 干旱预测模型因子权重排名
上文已对贵州省84个国家级气象站的历史降水距平百分率进行了统计分析。进一步将全省空间平均持续性干旱个例库扩展为基于这84个气象站的全省持续性干旱过程个例库。将国家气候中心提供的130项逐月气候指数扩展为预测时段超前1月(-1)、超前2月(-2)和超前3月(-3)的数据集,形成总计390个预测因子。利用随机森林算法对此全新个例库和扩展后的气候指数预测因子进行建模,选取准确率最高的模型,并提取每月权重前5的预测因子(表3)。结果表明,预测月超前2月或3月的指数对干旱的影响权重更大。此外,西太副高脊线位置、850 hPa东太平洋信风、东亚槽位置指数多次出现在权重排名前5的位置,这些指数对干旱预测有重要参考价值。
表3 贵州省1—12月干旱预测模型权重排前5的预测因子
Tab.3
月份 | 影响因子排名 | ||||
---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | |
1月 | 欧亚纬向环流(-2) | 北大西洋—欧洲区极涡 强度(-1) | 北半球副高脊线位置(-3) | 北大西洋涛动(North Atlantic Oscillation,NAO)(-3) | 850 hPa东太平洋信风(-1) |
2月 | Niño Z区海表温度距平(Niño Z SSTA)(-1) | 热带南大西洋海温(Tropical Southern Atlantic SST,TSA SST )(-1) | 太平洋—北美遥相关(Pacific/North American Pattern,PNA)(-3) | 北大西洋海温三极子(North Atlantic Triple,NAT)(-2) | 西风漂流区海温(-3) |
3月 | Niño Z区 SSTA(-2) | 极地—欧亚遥相关型(-1) | 西风漂流区海温(-2) | 大西洋欧洲区极涡面积(-3) | 西风漂流区海温(-2) |
4月 | 850 hPa东太平洋 信风(-1) | 太平洋区极涡强度(-3) | 西风漂流区海温(-2) | AO(-1) | 黑潮区海温(-2) |
5月 | 北美区极涡强度(-2) | 大西洋欧洲区极涡面积(-2) | 北半球极涡中心经向 位置(-1) | 西太平洋暖池强度(-1) | 东亚槽位置(-1) |
6月 | TIOD(-2) | 印度洋全区一致海温模态(Indian Ocean Basin-Wide,IOBW)(-2) | 850 hPa东太平洋信风(-3) | 850 hPa东太平洋信风(-2) | NAT(-2) |
7月 | AO(-1) | 东亚槽位置(-1) | NAT(-3) | 北大西洋副高北界(-3) | 北太平洋遥相关(-1) |
8月 | AO(-2) | 东亚槽位置(-2) | 850 hPa西太平洋信风(-1) | 东亚槽强度(-2) | 亚洲经向环流(-2) |
9月 | 东亚槽位置(-3) | 东亚槽强度(-3) | 亚洲纬向环流(-2) | 欧亚纬向环流(-2) | 亚洲纬向环流(-3) |
10月 | 北美—北大西洋 副高北界(-1) | 西太平洋副高脊线(-2) | 东亚槽位置(-3) | 北大西洋—欧洲环流W型(-2) | 北半球极涡面积(-1) |
11月 | 北美—北大西洋副 高北界(-2) | 西太平洋副高脊线(-1) | 北大西洋—欧洲环流 W型(-3) | AO(-3) | 西太平洋副高脊线(-3) |
12月 | 北半球极涡中心 强度(-1) | 北大西洋副高北界(-1) | 北太平洋副高北界(-1) | 东大西洋—西俄罗斯遥 相关型(-2) | 东亚槽位置(-1) |
为进一步分析2011年与2022年干旱成因的不同,选取这2年均出现干旱的7、8、9月进行因子权重对比分析(表4)。权重排名前5的预测因子中,7月,北极涛动(The Arctic Oscillation,AO)(-1)和北大西洋副热带高压(简称为“北大西洋副高”)北界(-3)差异较大;8月,AO(-2)和850 hPa西太平洋信风(-1)差异较大;9月,亚洲纬向环流(-2)差异较大。这表明,2011年和2022年干旱成因的主要区别在于前期AO、北大西洋副高北界、850 hPa西太平洋信风及亚洲纬向环流指数的不同表现。
表4 贵州省2011、2022年7—9月建模预测因子权重对比
Tab.4
影响因子 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
排名1 | 数值 | 排名2 | 数值 | 排名3 | 数值 | 排名4 | 数值 | 排名5 | 数值 | ||
7月 | AO(-1) | 东亚槽位置(-1) | NAT(-3) | 北大西洋副高北界(-3) | 北太平洋遥相关(-1) | ||||||
2011年7月 | 3.478 | 166.5 | -0.43 | 17.549 | 0.086 | ||||||
2022年7月 | -0.124 | 166.0 | 0.97 | 11.020 | 0.136 | ||||||
8月 | AO(-2) | 东亚槽位置(-2) | 850hPa西太平洋信风(-1) | 东亚槽强度(-2) | 亚洲经向环流(-2) | ||||||
2011年8月 | 3.478 | 166.5 | 5.341 | 27 856.30 | 2.137 | ||||||
2022年8月 | -0.124 | 166.0 | 8.042 | 27 922.02 | 2.353 | ||||||
9月 | 东亚槽位置(-3) | 东亚槽强度(-3) | 亚洲纬向 环流(-2) | 欧亚纬向环流(-2) | 亚洲纬向环流(-3) | ||||||
2011年9月 | 166.5 | 27 856.3 | 7.698 | 6.871 | 7.404 | ||||||
2022年9月 | 166.0 | 27 922.02 | 5.526 | 7.175 | 7.688 |
综上,影响干旱的预测因子较多,且各月预测因子权重各异,单独分析各因子难以有效预测贵州省干旱状况。分析2011、2022年干旱成因发现,尽管2个年份均处于拉尼娜背景下,但北太平洋与热带印度洋海温的不同导致海气相互作用的差异,增加了贵州省干旱预测的复杂性。因此,本文采用机器学习方法建立贵州省干旱预测模型,为干旱预测提供新的参考方案。
2.3.2 贵州省干旱模型建立与检验
为防止过拟合,贵州省干旱预测模型使用全年数据集进行建模,而未单独按月划分数据集。模型基于1981—2023年贵州省气候指数数据集和全省各站降水量距平百分率数据建立,样本总数为518条,共178 710个数据点。从中随机选取70%的数据作为模型训练集,用于模型构建;10%作为验证集,用于模型调优;剩余20%作为测试集,用于模型应用检验(2011、2022年干旱样本仅用于测试)。前期气候指数扩展的390个预测因子作为模型输入变量,降水量距平百分率作为目标变量,利用多种机器学习算法对模型进行构建、调优和检验,最终选取测试集检验效果最好的模型作为贵州省干旱预测模型。
训练阶段,各算法训练集准确率均约90%,通过验证集调优后,准确率提升至约92%。为检验模型实际应用能力,使用测试集对不同算法模型进行检验,图8为基于26种机器学习算法的干旱预测模型检验评估结果,5个评估指标按数值从低到高排序。可见,16个算法的准确率超过0.8,前3依次为Extra Tree Classifier、Linear SVC、Logistic Regression;5个算法平衡准确率超过0.6,前3依次为Decision Tree Classifier、Perceptron、Linear SVC;6个算法ROC AUC超过0.6,前3依次为Decision Tree Classifier、Perceptron、Linear SVC;F1分数超过0.8的算法有5个,前3依次为Linear SVC、Decision Tree Classifier、Perceptron。
图8
图8
基于26种机器学习算法的干旱预测模型准确率(a)、平衡准确率(b)、 受试者特征曲线下面积(c)、F1分数(d)、花费时间(e)检验评估结果
Fig.8
Test evaluation results for drought prediction models based on 26 machine learning algorithms, including accuracy (a), balanced accuracy (b), ROC AUC (c), F1 score (d), and time taken (e)
综合各评价指标,Linear SVC算法在测试集(包括2011、2022年)表现最佳,其准确率(超过80%)、平衡准确率、受试者特征曲线下面积、F1分数均位列前3,且运行时间最短,模型效率较高,故选择Linear SVC算法模型作为最终的干旱预测模型。为进一步验证模型的应用效果,选取2011年8月和2022年8月进行检验和对比分析(图9),可见Linear SVC算法模型预测出贵州省2011年8月和2022年8月全省降水量距平百分率均为负值,有利于预测干旱的发生。尽管模型对干旱程度的预测较实况偏轻,但总体上可为预报员提供有价值的参考。
图9
图9
贵州省2011年(a、b)、2022年(c、d)8月降水量距平百分率预测(a、c)与实况(b、d)对比(单位:%)
Fig.9
Comparison of predicted (a, c) and observed (b, d) precipitation anomaly percentages in August in 2011 (a, b) and 2022 (c, d) in Guizhou Province (Units: %)
3 结论
基于降水量数据、MCI指数、再分析资料结合持续性干旱的定义,对贵州省2011年和2022年2次严重气象干旱的大气环流背景和海温背景进行对比分析,得到以下主要结论。
2011、2022年均处于拉尼娜背景下,但北太平洋海温和热带印度洋海温分布的差异导致海气相互作用机制不同。2011年赤道印度洋至海洋性大陆区海温呈“西正东负”分布,西太副高因而偏东,西太平洋—东亚沿海地区出现气旋式环流异常,削弱了向贵州的水汽输送,进而引发干旱。2022年,北太平洋大范围偏暖,赤道印度洋至海洋性大陆区海温呈“西负东正”分布,在海洋性大陆区偏暖海温引导下,西太副高异常偏西、偏强且面积偏大,贵州省受副高控制盛行下沉气流,导致长时间晴热少雨天气并维持干旱。综上,水汽条件匮乏是2011年干旱的主要原因,而2022年干旱则由于西太副高控制下的持续下沉气流所致。
本文采用130项气候和环流指数结合机器学习方法对贵州省干旱事件进行建模,综合评估26种机器学习算法的性能,确定Linear SVC算法模型为最终的干旱预测模型。检验结果表明,该模型对贵州省2011、2022年干旱事件具有较好的预测能力。然而,模型在干旱强度方面的预测能力有待提升,尤其是对重度干旱区域的预测。因此,下一步将尝试细分数据集,并结合深度学习方法进一步提高重度干旱的预测能力。
参考文献
1997—2021年四川省干旱时空变化特征分析
[J].构建适宜的气象干旱指标是开展干旱监测和干旱评价业务服务的基础。基于1997—2021年四川省155个国家气象站逐日平均气温和降水,以及各县(市、区)农作物播种面积资料,通过改进气象干旱综合指数(Meteorological Drought Composite Index, MCI)中的季节调节系数,形成改进的气象干旱综合指数(Modified Meteorological Drought Composite Index, MCIm);再结合历年干旱受灾面积、有效灌溉面积修订区域性干旱过程识别方法,并识别出四川省历年区域性干旱过程51次,然后再利用经验正交函数(Empirical Orthogonal Function,EOF)、旋转经验正交函数(Rotated Empirical Orthogonal Function)、Morlet小波分析法,分析区域性干旱过程时空分布特征。结果表明:1997—2021年四川省发生区域性干旱过程的持续日数呈现出“先变短再增长再变短”,平均影响范围呈现出“先减小再增大再减小”,平均强度和综合强度呈现出“先减弱再增强再减弱”的变化趋势。平均年干旱过程累积日数总体呈现盆地多于盆周山区、盆周山区多于川西高原和攀西地区的特征。年累积MCIm距平EOF分解空间型存在全区一致特征,同时也存在南北反位相特征。四川省可划分为6个区域性干旱气候区,2009—2015年各区年累积MCIm周期变化比2001—2008年更明显。改进后的区域性干旱过程识别方法识别出的干旱过程与干旱灾情更为吻合,更能准确反映四川省干旱发生的实际状况。
贵州旱涝变化特征及其与西太平洋副高和海温的联系
[J].利用国家气象信息中心整编的全国753站中贵州省16站逐日观测资料、NCEP/NCAR再分析资料以及NOAA的月平均海表温度资料,采用经验正交函数(EOF)展开、Morlet小波分析等方法对基于标准化降水指数(SPI)的贵州省旱涝时空分布特征进行研究,并分析贵州旱涝异常时的环流特征及与全球海表温度的关系。结果表明:(1)贵州SPI的各季节主模态空间分布均为全区一致型,春秋两季还表现出一定的干旱化趋势;春季和秋季的旱涝分布存在2 a、10 a左右的振荡周期,而夏季和冬季的振荡周期则以2 a、3 a及5 a左右为主;(2)春秋两季,当西太平洋副热带高压主体强度偏强(弱)、位置偏西(东)时,贵州地区降水偏少(多),易发生干旱(洪涝);而冬夏两季,当西太平洋副热带高压主体偏北(南)、位置偏东(西)时,贵州地区降水偏少(多),易发生干旱(洪涝);(3)贵州秋季SPI与前期、同期东印度洋—西太平洋区域的海温存在显著的负相关。
2009—2010年贵州秋、冬、春季干旱气象要素与环流特征分析
[J].利用2009年9月—2010年5月贵州88个气象站地面观测资料, 800个自动气象站温度、 降水资料以及NCEP再分析资料, 分析了持续干旱过程中的大尺度环流背景及气象要素分布特征, 同时运用气候干湿指数、 综合气象干旱指数对此次持续干旱程度进行了模拟。结果表明, 贵州此次持续干旱天气主要发生在西太平洋副热带高压呈带状分布, 强度偏强\, 位置偏西\, 南支系统偏弱及冷空气活动路径偏北偏东的环流条件下。在干旱期间, 贵州西部地区气温为正距平, 降水为负距平, 空气相对湿度为38%~73%, 气候干湿指数<0.6; 东部地区气温除2009年11月和2010年4~5月为负距平外, 其余月份均为正距平, 降水基本上为负距平, 空气相对湿度为60%~81%, 除2009年11月和2010年4~5月气候干湿指数>1.0外, 其余月份均
2009/2010年中国西南区域性大旱的特征分析
[J].针对目前各种干旱指数对干旱事件整体识别能力的局限性,采用一种新的客观识别方法“区域性极端事件客观识别方法(OITREE)”对2009~2010年中国西南地区的秋冬春连旱进行了特征识别。结果表明:(1)此次干旱事件的发生时段为2009年8月25日至2010年4月18日,历时237 d,为近50 a(1961~2010年)综合强度排名第五位的干旱事件,是一次极端干旱事件;(2)此次极端干旱过程最大影响面积为576.82万km2,影响范围涉及到云南全省、四川南部、贵州大部(主要是西部)以及重庆、广西西部,其中,云南、贵州和广西3省交界区干旱最严重,其次为云南的中部和中西部,且云南省不论受旱面积还是受旱强度都是最大的;(3)此次干旱过程有4个明显变化阶段:干旱增强、减弱、再增强、最后解除。第一阶段为2009年8月25日至10月下旬,干旱开始发展并持续增强,影响范围最大可达约370万km2,包括西南、华南、华东、华北及东北南部的小部分地区,持续达2个月,受影响的核心区域除了西南地区以外,还有华北和华南的部分区域;第二阶段为2009年11月初至12月中旬,干旱强度急剧下降,影响范围最小只有约50万km2,主要在西南地区,持续时间只有1个月;第三阶段,2009年12月中旬至2010年3月下旬,旱情再一次增强,干旱面积再次扩大,影响范围最大可达约200万km2,包括西南及西北地区东部,持续时间为3个月,是4个阶段中发展时间最长的,主要受影响的核心区域为西南地区;第四阶段,2010年3月下旬至4月中旬,干旱逐渐缓解,直到过程结束,旱情解除。OITREE方法能从不同层次和方面完整地描述干旱事件的时空变化特点,其判别结果与实际情况基本一致,是一种有效监测干旱的新方法。
基于标准化降水指数的1960—2011年中国不同时间尺度干旱特征
[J].利用1960—2011年中国566个气象站逐日降水资料,采用标准化降水指数对近52年中国的干旱特征进行了详细分析。结果表明:近52年来,中国存在一条由东北向西南延伸的干旱趋势带,东北、内蒙古中东部、华北、西北地区东部以及西南地区东部趋于干旱,而西北地区西部的北疆地区、青海中部以及西藏中北部等地呈显著变湿趋势;华北地区干旱化主要是夏季趋于干旱引起的,东北和西南地区的干旱化主要是夏、秋季趋于干旱引起的,西北地区东部和长江中下游地区主要是春、秋季趋于干旱。东北地区20世纪70年代和2000年后轻旱以上日数较多,60年代干旱日数最少;华北地区和西北地区东部90年代最多,60—80年代旱日较少;西南地区东部2000年后干旱日数最多,60—70年代较少;长江中下游地区60年代和21世纪后干旱日数偏多,80年代较少。60年代,易旱区主要位于西北地区中、西部以及长江中下游部分地区;70年代,西北西部和东北地区是干旱的高发区;80年代,易旱区位于华北、黄淮、内蒙古中西部以及西南东部等地;90年代,易旱区转移到中部,西北地区东南部、华北、黄淮、江淮以及江汉等地是干旱的高发区;进入21世纪后,东北、内蒙古东部、西北地区东部、西南东部以及长江中下游的部分地区干旱高发。
21世纪以来干旱研究的若干新进展与展望
[J].干旱是中国影响范围最广、造成经济损失最严重的自然灾害之一,直接威胁国家粮食安全和社会经济发展,对干旱问题的认识和研究有助于提升国家防旱减灾能力。自新中国成立以来,中国对于干旱气象的研究取得了丰硕的成果。本文以21世纪以来中国气象局干旱气候变化与减灾重点开放实验室为平台开展的与干旱气象相关的科研项目群取得的研究成果为基础,通过成果检索,对干旱监测技术、干旱时空分布规律、干旱致灾特征、干旱灾害风险及其对气候变暖的响应以及干旱灾害风险管理与防御技术等方面的新进展进行总结和归纳。同时,基于干旱气象研究的前沿发展趋势,提出中国未来干旱气象研究应在加强气候变化背景下干旱高发区综合性干旱观测试验基础上,从不同维度和尺度定量研究干旱形成机理,构建多源数据融合和多方法结合的综合干旱监测新方法,揭示干旱致灾机理,科学评估干旱灾害风险,提出具有可执行性的风险管理策略等重点科学问题上取得突破。这对于推动中国干旱气象研究具有积极意义。
我国西南干旱研究最新进展综述
[J].随着全球气候变化,重大干旱等极端气候事件有增加趋势。我国历来是受干旱危害最严重的国家之一,近年来干旱强度和受旱区域不断增加,而且开始由干旱半干旱区向湿润区发展。雨水充沛、气候湿润的西南地区,近年来发生持续数年的严重干旱事件,给当地社会经济造成重大损失,并引起了广泛关注。许多学者也对西南干旱进行了分析研究,他们通过分析西南地区降水和温度的时空分布特征,以及影响西南干旱的大气环流和天气系统,寻找造成西南干旱的发生规律、特征和形成机理; 还有学者运用干旱指数、卫星遥感等方法研究了西南干旱的监测技术。本文研阅了近10 a 来大量相关文献,对西南干旱的最新研究成果进行了总结和评述,力图为西南乃至其它区域干旱的研究提供借鉴,为干旱防灾减灾提供帮助。
科学解读“2022年长江流域重大干旱”
[J].今年从6月开始持续到目前的整个长江流域的干旱事件,不仅对农业和能源等各方面影响十分严重,而且干旱发展过程和影响特征还表现出许多与以往不同的独特性,对其进行科学分析十分必要。鉴于此,该文试图在科学与科普同时兼顾的基础上,分别从新常态与反常态两个视角,从干旱的表现特征、形成机制、影响特点及从中得到的启示与思考等方面,对当前还在肆虐的2022年长江流域严重干旱事件进行一些简单的科学解读,以促进社会公众对此次干旱事件的科学认识。
Deep learning for multi-year ENSO forecasts
[J].
The analysis of tropical cyclone tracks in the western north Pacific through data mining. part II: Tropical cyclone landfall
[J].
/
〈 |
|
〉 |
