• CN 62-1175/P
  • ISSN 1006-7639
  • 双月刊
  • 中国科技核心期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中文科技期刊数据库收录期刊

干旱气象, 2024, 42(5): 671-682 DOI: 10.11755/j.issn.1006-7639-2024-05-0671

“人工智能在干旱气象及相关领域的应用”专栏

贵州省两次气象干旱对比分析及基于机器学习的干旱预测模型建立

王玥彤,1, 何东坡2, 李忠燕,1, 王烁1, 陈早阳1

1.贵州省气候中心,贵州 贵阳 550002

2.贵州省气象台,贵州 贵阳 550002

Analysis of two meteorological drought events in Guizhou Province and establishment of drought prediction model based on machine learning

WANG Yuetong,1, HE Dongpo2, LI Zhongyan,1, WANG Shuo1, CHEN Zaoyang1

1. Guizhou Climate Center, Guiyang 550002, China

2. Guizhou Meteorological Observatory, Guiyang 550002, China

通讯作者: 李忠燕(1986—),女,四川隆昌人,高级工程师,主要从事气候预测及诊断工作。E-mail:523257762@qq.com

责任编辑: 邓祖琴;校对:王涓力

收稿日期: 2024-04-28   修回日期: 2024-09-11  

基金资助: 中国气象局复盘总结专项(FPZJ2023-118)
中国气象局复盘总结专项(FPZJ2024-119)
国家自然基金项目(42305051)

Received: 2024-04-28   Revised: 2024-09-11  

作者简介 About authors

王玥彤(1992—),女,贵州贵阳人,工程师,主要从事短期气候预测及诊断工作。E-mail:810569401@qq.com

摘要

对比分析贵州省主汛期(6—9月)不同干旱事件的特征,有助于提升贵州省短期气候预测技术。基于贵州省84个气象台站降水资料,分析贵州省1981—2023年2次严重干旱事件的时空演变特征,并利用再分析数据揭示事件成因,比较两者差异;同时结合国家气候中心130项气候指数和机器学习方法对贵州省干旱事件进行建模。结果表明,贵州省主汛期降水量呈明显年代际变化特征,2011、2022年在拉尼娜背景下降水最少;2011年贵州省大范围干旱的主要原因是西太平洋副热带高压(简称“西太副高”)偏东及低层南海地区气旋式环流异常,导致水汽条件差;2022年在热带印度洋偶极子负位相影响下,西太副高异常偏大、偏西、偏强,南亚高压偏强、偏东,气温异常偏高,中国南方地区低层为反气旋式环流异常,水汽条件差并伴随持续高温,导致贵州省干旱加剧。通过机器学习的26种算法建立贵州省干旱预测模型,其中Linear SVC模型的预测效果最好,检验评估表明,该模型对贵州省2011、2022年的干旱有较好的预测能力。

关键词: 贵州干旱; 大气环流; 拉尼娜事件; 机器学习

Abstract

Comparative analysis of different drought events occurring in Guizhou Province during the flood season (from June to September) is significant for improving the short-term climate prediction techniques. Based on the precipitation data from 84 meteorological stations in Guizhou Province, the spatial and temporal evolution characteristics of two severe drought events in Guizhou Province during the period of 1981—2023 were characterized statistically, and the causes of the two drought events were revealed using reanalyzed data, and the differences were compared. At the same time, combined with 130 climate indexes of the National Climate Center and machine learning method, the drought event in Guizhou Province was modeled. The results show that the precipitation in flood season in Guizhou Province presented significant inter-decadal variability, and the precipitation was least under the La Niña background in 2011 and 2022. Poor water vapor conditions in flood season in 2011 under the joint influence of the Western Pacific Subtropical High moving to the east and the cyclonic circulation anomalies over the lower South China Sea region led to a widespread drought in Guizhou Province. In 2022, affected by the negative phase of the Tropical Indian Ocean Dipole (TIOD), the Western Pacific Subtropical High was abnormally large, strong and westward, the South Asian High was strong and eastward, the temperature was abnormally high, and there was an anticyclonic circulation anomaly at the lower level over the southern China, and the water vapor conditions were poor and accompanied by continuous high temperature, which resulted in the persistence of the drought in Guizhou Province. Twenty-six algorithms of machine learning were used to build a drought prediction model for Guizhou Province, among which the Linear SVC model had the best prediction effect. The test and evaluation show that this model had a good prediction ability for 2011 and 2022 drought in Guizhou Province.

Keywords: drought in Guizhou Province; atmospheric circulation; La Niña event; machine learning

PDF (12426KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王玥彤, 何东坡, 李忠燕, 王烁, 陈早阳. 贵州省两次气象干旱对比分析及基于机器学习的干旱预测模型建立[J]. 干旱气象, 2024, 42(5): 671-682 DOI:10.11755/j.issn.1006-7639-2024-05-0671

WANG Yuetong, HE Dongpo, LI Zhongyan, WANG Shuo, CHEN Zaoyang. Analysis of two meteorological drought events in Guizhou Province and establishment of drought prediction model based on machine learning[J]. Arid Meteorology, 2024, 42(5): 671-682 DOI:10.11755/j.issn.1006-7639-2024-05-0671

0 引言

随着全球变暖的加剧,近年来极端气候事件频发。在中国北方干旱形势严峻的同时,南方干旱的发生频率和强度也明显上升,区域性和季节性的严重干旱事件呈增加趋势(李伟光等,2012;王素萍等,2014)。中国西南地区约30%的区域属于干旱区,干旱化趋势明显,尤其在秋季干旱化程度最强(蔡怡亨等,2023)。西南地区的区域性干旱事件在频次、范围和强度上均呈增加趋势(张强等,2009;李韵婕等,2014;李忆平等,2015),其中极端干旱的发生频率、持续时间和强度也在增加(杨金虎等,2015;张红丽等,2016)。研究表明,西太平洋和热带印度洋的热力异常通过海气相互作用影响东亚地区的大气环流,进而影响西太平洋副热带高压(简称“西太副高”)的位置和强度、水汽输送等,对西南地区不同季节的干旱产生明显影响(黄荣辉等,2012;池再香等,2012;尹晗和李耀辉,2013;胡学平等,2014;于浩慧等,2023)。

近年来,贵州干旱面积明显扩大(王莺等,2022)。2022年下半年长江流域大范围持续性干旱对农业生产和能源部门造成重大影响(张强,2022),同时期贵州省也经历了历史罕见的持续干旱,全省9个市(州)均遭受不同程度的旱灾。汛期干旱和洪涝是贵州省最严重的两种自然灾害,对旱涝的预测是汛期重要的短期气候预测服务内容,可为各级政府决策提供科学依据(王玥彤等,2020)。因此,研究对比贵州省2022年及相似干旱年份的成因和差异,对提高贵州省短期气候预测水平,保障人民生命财产安全具有重要意义。近年来,人工智能技术在气象领域的应用逐渐增加(Zhang et al.,2013;苗春生等,2017;黎玥君和郭品文,2017;Ham et al., 2019;陈晓平等, 2020;沈皓俊等,2020),将非线性方法引入干旱的物理统计模型,结合机器学习处理非线性问题的优势,为旱涝状况的预测提供了新方法。

本文将气象干旱综合指数(Meteorological Drought Composite Index,MCI)和降水量作为衡量气象干旱的重要指标(王劲松等,2007),采用严小冬等(2019)提出的贵州省持续性干旱统计方法,结合多种参考依据,选取典型干旱年(2011、2022),对比分析这些年份的干旱特征、大气环流及海温外强迫的异同点,科学解释干旱成因。充分发挥物理统计与机器学习的优势,融合机器学习方法建立贵州省干旱预测高精度模型,以期提高贵州省汛期干旱预测准确率,更好地服务于地方各级政府。

1 数据与方法

1.1 数据

中国气象局气象大数据云平台提供的贵州省84个国家级气象站1981—2023年逐日、逐月降水量资料和气象干旱综合指数(MCI)资料及中国全球大气/陆面再分析产品CRA40(空间分辨率为0.25°×0.25°);国家气候中心整编的130项气候指数集,包括西太副高脊线与西伸脊点、Niño3.4及热带印度洋偶极子(Tropical Indian Ocean Dipole,TIOD)等指数;美国国家环境预报中心和国家大气研究中心(National Center for Environmental Prediction/National Center for Atmospheric Research,NCEP/NCAR)1981—2023年大气再分析资料,空间分辨率为2.5°×2.5°;美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)1981—2023年第5套逐月扩展重建海温(Sea surface Temperature,SST)资料,空间分辨率为1°×1°。文中所用气候态为1991—2020年平均。

1.2 方法

1.2.1 MCI

气象干旱综合指数MCI计算方法(国家气候中心等,2017;许丹等,2023)如下:

MCI=Ka×(a×SPIW60+b×MI30+c×SPI90+d×SPI150)

式中:MI30为近30 d相对湿润度指数;SPI90、SPI150分别为近90 d、150 d标准化降水指数;SPIW60为近60 d标准化权重降水指数;abcd为权重系数,西南地区分别取0.3、0.5、0.3、0.2;Ka为季节调节系数,根据不同季节各地主要农作物生长发育阶段对土壤水分的敏感度确定。

1.2.2 贵州省持续性干旱定义及计算

根据严小冬等(2019)的研究,将贵州省持续性干旱定义为月降水距平百分率小于-15%且持续3~4个月,或持续5个月及以上(其中有1个月降水距平百分率可以大于-15%且小于20%),并且累积降水距平百分率小于-120%且月平均降水距平百分率小于-30%。持续干旱事件的强度用累积降水距平百分率表示。为便于年代际变化分析,使用各年代持续性干旱事件的累积降水距平百分率之和量化各年代持续性干旱的强度。

1.2.3 机器学习方法

随机森林(Random Forest,RF)是机器学习中集成学习(Ensemble Learning)的典型方法之一(Breiman, 2001;Hastie et al., 2009)。RF通过在决策树集成的基础上引入随机属性选择来构建模型(张蕾等,2023;卢维肖等,2024)。在训练每棵基决策树时,RF从每个节点的属性集合中随机选择一个子集,然后从该子集中选取最优属性进行划分。由于这种随机性,RF能有效抑制模型过拟合,并在分类时评估属性的重要性。特征的重要性通过计算其对模型准确性的平均贡献来评估,这个贡献通常以不纯度(如基尼不纯度或信息增益)减少为标准。根据每个特征的重要性得分,可对特征排序,并选择最相关的特征用于模型训练或分析。

本文使用随机森林方法对130项影响干旱的气候指数进行权重排名,并展示权重排名前5的因子。但建模时,所有气候指数都会参与。基于RF计算的各项指数权重,利用python的lazypredict库中包含的26种机器学习算法(表1)建立贵州省干旱预测模型,并对各模型进行评估和对比。模型评估标准包括准确率、平衡准确率、受试者特征曲线下面积、F1分数及花费时间。其中,准确率(Accuracy)指分类器正确预测样本的比例,由分类器正确分类的样本数除以总样本数得到;平衡准确率(Balanced Accuracy)是在考虑每个类别样本数量的基础上计算的准确率,可反映各类别对模型性能的影响;受试者特征曲线下面积(Receiver Operating Characteristic Area Under Curve,ROC AUC)是衡量二元分类器性能的指标,取值范围为0~1,其中1表示完美分类,0.5表示随机分类;F1分数(F1 Score)是准确率和召回率的加权调和平均值,综合考虑分类器的准确性和稳定性;花费时间(Time Taken)指模型训练或测试所需时间,时间越短表示模型效率越高。

表1   26种机器学习算法

Tab.1  The 26 machine learning algorithms

名称
AdaBoost ClassifierExtra Trees ClassifierLinear SVCRidge Classifier
Bagging ClassifierGaussian NBLogistic RegressionRidge Classifier CV
Bernoulli NBKNeighbors ClassifierNearest CentroidSGD Classifier
Calibrated Classifier CVLabel PropagationPassive Aggressive ClassifierSVC
Decision Tree ClassifierLabel SpreadingPerceptronXGB Classifier
Dummy ClassifierLGBM ClassifierQuadratic Discriminant Analysis
Extra Tree ClassifierLinear Discriminant AnalysisRandom Forest Classifier

新窗口打开| 下载CSV


2 研究结果

2.1 主汛期降水及干旱演变特征对比

贵州省主汛期(6—9月)降水量距平百分率年际变化(图1)显示,降水量具有明显的年代际变化特征,20世纪90年代降水总体偏多,2000—2014年降水偏少,其中2011年降水量最少,仅为420.4 mm,偏少38.2%。2015—2023年降水量以偏多为主,尤其是2020年,主汛期降水量达942.1 mm,为历史最多;但2022年降水量异常偏少(453.1 mm,偏少33.4%),为历史同期第二低,仅次于2011年。2011年和2022年,贵州省均发生严重的持续性大范围干旱事件,造成较大的经济损失和社会影响。

图1

图1   贵州省1981—2023年主汛期降水量距平百分率年际变化

Fig.1   Inter-annual variation of precipitation anomaly percentage during the flood season from 1981 to 2023 in Guizhou Province


依据贵州省持续性干旱的定义,使用最新观测数据更新了1981—2023年的持续性干旱个例库(表2)。贵州省1981年以来共发生11次持续性干旱事件,其中20世纪80年代最为频繁,共4次;2020—2023年发生2次持续性干旱;2009年7月—2010年3月、2011年1—9月、2022年7月—2023年2月的3次干旱事件均持续9个月,其中2022年7月开始的干旱事件强度最强。结合降水距平百分率年际变化及干旱事件的强度和持续时间,选取2011年作为与2022年具有相似拉尼娜背景的干旱年份进行对比分析。

表2   1981—2023年贵州省全省范围持续性干旱事件个例

Tab.2  Cases of persistent drought processes from 1981 to 2023 in Guizhou Province

干旱时段季节持续时间/月累计降水量距平百分率/%平均降水量距平百分率/%
1984年1—3月冬春3-125.3-41.8
1986年12月—1987年4月冬春5-201.3-40.3
1988年3—7月春夏4-159.7-31.9
1988年10月—1989年1月秋冬4-202.9-50.7
1995年10月—1996年2月秋冬5-164.1-32.8
1998年11月—1999年3月秋冬春5-168.9-33.7
2009年7月—2010年3月夏秋冬春9-397.5-44.2
2011年1—9月冬春夏秋9-371.9-41.3
2017年10—12月秋冬3-125.0-41.6
2020年11月—2021年1月3-127.2-42.4
2022年7月—2023年2月夏秋冬9-376.9-47.1

新窗口打开| 下载CSV


对比分析发现2011年与2022年2次干旱事件年降水量异常偏少区域在空间分布(图2)上有差异:2011年,贵州省大部地区降水量距平百分率偏少2~5成,南部和东北部局部地区偏少5成以上;2022年,贵州省大部地区降水量距平百分率同样偏少2~5成,但偏少5成以上区域主要位于贵州省东部。

图2

图2   贵州省2011(a)、2022(b)年主汛期降水量距平百分率空间分布(单位:%)

Fig.2   Spatial distribution of precipitation anomaly percentage during the flood season in Guizhou Province in 2011 (a) and 2022 (b) (Unit: %)


由逐月降水量距平百分率及MCI指数计算的全省逐日干旱站点数变化(图3)可看出,干旱发展的时间并不相同。2011年6月的雨水集中期后,7月上中旬出现强降水天气过程,干旱并不明显;7月中旬后,全省出现大范围晴热高温天气,气温升高且降水异常偏少6成以上,导致干旱迅速发展,至8—9月进一步发展,持续至9月底结束。2022年6月降水持续减少,7月下旬贵州省东北部边缘地区开始出现旱情,并逐渐向中部、西南部扩展;7月下旬后期发生了一次强降水过程,旱情暂时得到缓解;但8月上旬起,北部、东部地区再次出现旱情,并迅速蔓延至西部、南部;之后由于缺乏全省范围的有效降水,旱情未能大范围缓解,一直持续至9月底,并延续至2023年2月才完全解除。从表2可以看出,2011年干旱持续9个月,集中在冬、春、夏、秋四季,累计降水量距平百分率为-371.9%,平均降水量距平百分率为-41.3%;2022年干旱同样持续9个月,主要集中在夏、秋、冬季,累计降水量距平百分率为-376.9%,平均降水量距平百分率为-47.1%,2022年干旱强度为1981年以来拉尼娜背景下最强的一次。

图3

图3   贵州省2011、2022年主汛期逐月降水量距平百分率(a)及中旱及以上站点数逐日变化(b)

Fig.3   Monthly precipitation anomaly percentages (a) and daily changes in the number of stations with moderate drought and above (b) in Guizhou Province during the flood season in 2011 and 2022


2.2 大气环流与海温特征

2.2.1 高中低层大气环流特征

200 hPa,2011年欧亚中高纬地区呈“西高东低”距平分布,南亚高压略偏大、偏北,东伸不明显[图4(a)];2022年欧亚中高纬高度距平场分布呈“两脊一槽”分布,南亚高压异常偏大、偏强、偏北,异常东伸至中国东南沿海地区,覆盖范围更广[图4(b)]。

图4

图4   2011(a、c、e)、2022(b、d、f)年200 hPa(a、b)、500 hPa(c、d)位势高度场(等值线)及其距平(填色)(单位:gpm)及850 hPa(e、f)风场距平(单位:m·s-1

(红色实线为气候态;A为反气旋式环流,C为气旋式环流;蓝色箭头为风场距平方向)

Fig.4   The geopotential height field (contours) and its anomaly (the color shaded) at 200 hPa (a, b) and 500 hPa (c, d) (Unit: gpm),and wind field anomaly (Unit: m·s-1) at 850 hPa (e, f) in 2011 (a, c, e) and 2022 (b, d, f)

(The red line indicates climatic state; the character A indicates anticyclonic circulation and C indicates cyclonic circulation; the blue arrows indicate the direction of wind anomaly)


2011年主汛期500 hPa西太副高位置偏东、偏北,乌拉尔山及鄂霍次克海地区阻塞形势不明显,以纬向型环流为主[图4(c)]。2022年主汛期中高纬环流呈较强经向分布,形成“两脊一槽”结构,西太副高总体偏西、偏强,乌拉尔山和鄂霍次克海地区阻塞形势明显[图4(d)],2022年中高纬环流经向特征更明显。中低纬度地区显示出不同的高度场特征:2011年贵州地区为负距平,2022年则受明显正距平控制。

850 hPa风场距平[图4(e)(f)]显示,2011年中国南海地区为气旋式环流,贵州省上空东北风异常、水汽条件较差;2022年中国东南大部地区受反气旋环流控制,贵州受到强大西太副高影响,高温少雨天气持续。

上述环流配置导致贵州省持续少雨,促进全省范围气象干旱的发生与维持。

2.2.2 环流指数变化特征

西太副高西伸脊点和脊线的位置变化对贵州省主汛期降水的时空分布有重要影响(陈军等,2016;王芬等,2017)。对比分析2011年和2022年主汛期西太副高脊线位置距平和西伸脊点距平的时间变化特征(图5)可发现:2011年6—9月西太副高脊线异常偏北,西伸脊点偏东,副高季节内变化稳定,且7—9月偏北、偏东的特征更明显;2022年西太副高季节内变化特征明显,5—7月脊线偏南,8月转为偏北,9月异常偏北;西伸脊点5—6月略偏东,7月转为偏西,8—9月异常偏西。汛期西太副高脊线异常偏北造成贵州省降水偏少,从而导致气象干旱的发生发展。

图5

图5   2011、2022年主汛期西太副高脊线(a)和西伸脊点(b)逐月距平

Fig.5   Monthly anomaly of ridge line (a) and western extension ridge point (b) of the west Pacific subtropical high during the flood season in 2011 and 2022


2.2.3 海洋变化特征

拉尼娜事件与我国气候密切相关(何慧根等,2023),贵州省干旱事件与太平洋、印度洋及北大西洋海温异常分布有紧密联系。基于大气环流异常状况的分析,进一步比较2011年和2022年主汛期海温分布异同(图6),以探讨2个年份干旱成因的异同点。

图6

图6   2011(a、c)、2022(b、d)年全球海温距平(单位:℃)(a、b)及沃克环流异常(单位:m·s-1)(c、d)

Fig.6   The global sea surface temperature anomalies (Unit: ℃) (a, b) and Walker circulation anomalies (Unit: m·s-1) (c, d) in 2011 (a, c) and 2022 (b, d)


2011年夏季,赤道太平洋为冷海温距平,表现为拉尼娜事件,中国沿海海温偏低,印度洋表现为全区一致偏暖。同期,拉尼娜影响下的赤道沃克环流表现为低层东风异常,赤道中太平洋地区表现出对冷海温的响应,为下沉气流,上升支位于热带西太平洋暖池区域(120°E—160°E)。赤道印度洋偏暖导致上升运动,而海洋性大陆冷海温地区为下沉支。

2022年夏季,赤道东太平洋同样为冷海温距平,拉尼娜事件持续,但中国沿海海温偏高,赤道冷海温中心位于日界线附近,海洋性大陆区域为暖海温,热带印度洋区域表现为“西负东正”的偶极子负位相。同期沃克环流响应赤道区域的海温,上升支较窄并位于120°E附近,但上升运动强烈,下沉支位于赤道中太平洋冷海温区域,使得沃克环流在此处异常加强。

对比2个年份Niño3.4区海温和热带印度洋偶极子(TIOD)的时间演变特征(图7)可知,2011年Niño3.4区海温前期偏高,由2010年的厄尔尼诺事件逐渐衰减并转为拉尼娜事件;2022年则持续处于拉尼娜事件中。TIOD演变差异明显,2010年为负位相,2011年初转为正位相并持续;2021年TIOD稳定维持负位相,2022年春末负位相增强,夏季发展成为1981年以来最强负位相,2022年前期太平洋和印度洋海温异常对大气的强迫效应持久而明显。

图7

图7   2011、2022年Niño3.4区海温滚动季指数(a)及TIOD逐月指数(b)

Fig.7   The rolling seasonal index of Niño3.4 sea surface temperature (a) and monthly index of TIOD (b) in 2011 and 2022


2.2.4 干旱成因

2011年主汛期,赤道太平洋地区的大气环流对拉尼娜事件响应明显,赤道印度洋及太平洋东岸偏暖的海温外强迫增强中低纬度地区大气环流的下沉运动。Hadley环流的下沉支位于120°E—130°E偏北,西太副高偏东,贵州地区水汽和冷暖空气交换条件较差,导致大范围干旱持续。

2022年主汛期,在拉尼娜背景下,赤道中太平洋的冷海温距平异常偏强,热带印度洋海温“西负东正”的负位相异常加强。通过海气相互作用,西太副高偏强、偏大,南亚高压偏强东伸,东亚地区中高层大气形成深厚的高压系统,控制中国南方大部地区。850 hPa风场显示中国中东部地区受反气旋环流控制,且中高纬度环流经向性强,大范围水汽被输送至中国北方地区。贵州省受强大副高控制,缺乏充足的水汽,大范围高温少雨天气持续,最终导致干旱事件的发生。

2.3 贵州省干旱预测模型的建立与检验

2.3.1 干旱预测模型因子权重排名

上文已对贵州省84个国家级气象站的历史降水距平百分率进行了统计分析。进一步将全省空间平均持续性干旱个例库扩展为基于这84个气象站的全省持续性干旱过程个例库。将国家气候中心提供的130项逐月气候指数扩展为预测时段超前1月(-1)、超前2月(-2)和超前3月(-3)的数据集,形成总计390个预测因子。利用随机森林算法对此全新个例库和扩展后的气候指数预测因子进行建模,选取准确率最高的模型,并提取每月权重前5的预测因子(表3)。结果表明,预测月超前2月或3月的指数对干旱的影响权重更大。此外,西太副高脊线位置、850 hPa东太平洋信风、东亚槽位置指数多次出现在权重排名前5的位置,这些指数对干旱预测有重要参考价值。

表3   贵州省1—12月干旱预测模型权重排前5的预测因子

Tab.3  The top 5 weighted forecast factors of drought prediction model from January to December in Guizhou Province

月份影响因子排名
12345
1月欧亚纬向环流(-2)北大西洋—欧洲区极涡
强度(-1)
北半球副高脊线位置(-3)北大西洋涛动(North Atlantic Oscillation,NAO)(-3)850 hPa东太平洋信风(-1)
2月Niño Z区海表温度距平(Niño Z SSTA)(-1)热带南大西洋海温(Tropical Southern Atlantic SST,TSA SST )(-1)太平洋—北美遥相关(Pacific/North American Pattern,PNA)(-3)北大西洋海温三极子(North Atlantic Triple,NAT)(-2)西风漂流区海温(-3)
3月Niño Z区 SSTA(-2)极地—欧亚遥相关型(-1)西风漂流区海温(-2)大西洋欧洲区极涡面积(-3)西风漂流区海温(-2)
4月850 hPa东太平洋
信风(-1)
太平洋区极涡强度(-3)西风漂流区海温(-2)AO(-1)黑潮区海温(-2)
5月北美区极涡强度(-2)大西洋欧洲区极涡面积(-2)北半球极涡中心经向
位置(-1)
西太平洋暖池强度(-1)东亚槽位置(-1)
6月TIOD(-2)印度洋全区一致海温模态(Indian Ocean Basin-Wide,IOBW)(-2)850 hPa东太平洋信风(-3)850 hPa东太平洋信风(-2)NAT(-2)
7月AO(-1)东亚槽位置(-1)NAT(-3)北大西洋副高北界(-3)北太平洋遥相关(-1)
8月AO(-2)东亚槽位置(-2)850 hPa西太平洋信风(-1)东亚槽强度(-2)亚洲经向环流(-2)
9月东亚槽位置(-3)东亚槽强度(-3)亚洲纬向环流(-2)欧亚纬向环流(-2)亚洲纬向环流(-3)
10月北美—北大西洋
副高北界(-1)
西太平洋副高脊线(-2)东亚槽位置(-3)北大西洋—欧洲环流W型(-2)北半球极涡面积(-1)
11月北美—北大西洋副
高北界(-2)
西太平洋副高脊线(-1)北大西洋—欧洲环流
W型(-3)
AO(-3)西太平洋副高脊线(-3)
12月北半球极涡中心
强度(-1)
北大西洋副高北界(-1)北太平洋副高北界(-1)东大西洋—西俄罗斯遥
相关型(-2)
东亚槽位置(-1)

新窗口打开| 下载CSV


为进一步分析2011年与2022年干旱成因的不同,选取这2年均出现干旱的7、8、9月进行因子权重对比分析(表4)。权重排名前5的预测因子中,7月,北极涛动(The Arctic Oscillation,AO)(-1)和北大西洋副热带高压(简称为“北大西洋副高”)北界(-3)差异较大;8月,AO(-2)和850 hPa西太平洋信风(-1)差异较大;9月,亚洲纬向环流(-2)差异较大。这表明,2011年和2022年干旱成因的主要区别在于前期AO、北大西洋副高北界、850 hPa西太平洋信风及亚洲纬向环流指数的不同表现。

表4   贵州省2011、2022年7—9月建模预测因子权重对比

Tab.4  Comparison of modeling prediction factor weights from July to September in 2011 and 2022 in Guizhou Province

影响因子
排名1数值排名2数值排名3数值排名4数值排名5数值
7月AO(-1)东亚槽位置(-1)NAT(-3)北大西洋副高北界(-3)北太平洋遥相关(-1)
2011年7月3.478166.5-0.4317.5490.086
2022年7月-0.124166.00.9711.0200.136
8月AO(-2)东亚槽位置(-2)850hPa西太平洋信风(-1)东亚槽强度(-2)亚洲经向环流(-2)
2011年8月3.478166.55.34127 856.302.137
2022年8月-0.124166.08.04227 922.022.353
9月东亚槽位置(-3)东亚槽强度(-3)亚洲纬向
环流(-2)
欧亚纬向环流(-2)亚洲纬向环流(-3)
2011年9月166.527 856.37.6986.8717.404
2022年9月166.027 922.025.5267.1757.688

新窗口打开| 下载CSV


综上,影响干旱的预测因子较多,且各月预测因子权重各异,单独分析各因子难以有效预测贵州省干旱状况。分析2011、2022年干旱成因发现,尽管2个年份均处于拉尼娜背景下,但北太平洋与热带印度洋海温的不同导致海气相互作用的差异,增加了贵州省干旱预测的复杂性。因此,本文采用机器学习方法建立贵州省干旱预测模型,为干旱预测提供新的参考方案。

2.3.2 贵州省干旱模型建立与检验

为防止过拟合,贵州省干旱预测模型使用全年数据集进行建模,而未单独按月划分数据集。模型基于1981—2023年贵州省气候指数数据集和全省各站降水量距平百分率数据建立,样本总数为518条,共178 710个数据点。从中随机选取70%的数据作为模型训练集,用于模型构建;10%作为验证集,用于模型调优;剩余20%作为测试集,用于模型应用检验(2011、2022年干旱样本仅用于测试)。前期气候指数扩展的390个预测因子作为模型输入变量,降水量距平百分率作为目标变量,利用多种机器学习算法对模型进行构建、调优和检验,最终选取测试集检验效果最好的模型作为贵州省干旱预测模型。

训练阶段,各算法训练集准确率均约90%,通过验证集调优后,准确率提升至约92%。为检验模型实际应用能力,使用测试集对不同算法模型进行检验,图8为基于26种机器学习算法的干旱预测模型检验评估结果,5个评估指标按数值从低到高排序。可见,16个算法的准确率超过0.8,前3依次为Extra Tree Classifier、Linear SVC、Logistic Regression;5个算法平衡准确率超过0.6,前3依次为Decision Tree Classifier、Perceptron、Linear SVC;6个算法ROC AUC超过0.6,前3依次为Decision Tree Classifier、Perceptron、Linear SVC;F1分数超过0.8的算法有5个,前3依次为Linear SVC、Decision Tree Classifier、Perceptron。

图8

图8   基于26种机器学习算法的干旱预测模型准确率(a)、平衡准确率(b)、 受试者特征曲线下面积(c)、F1分数(d)、花费时间(e)检验评估结果

Fig.8   Test evaluation results for drought prediction models based on 26 machine learning algorithms, including accuracy (a), balanced accuracy (b), ROC AUC (c), F1 score (d), and time taken (e)


综合各评价指标,Linear SVC算法在测试集(包括2011、2022年)表现最佳,其准确率(超过80%)、平衡准确率、受试者特征曲线下面积、F1分数均位列前3,且运行时间最短,模型效率较高,故选择Linear SVC算法模型作为最终的干旱预测模型。为进一步验证模型的应用效果,选取2011年8月和2022年8月进行检验和对比分析(图9),可见Linear SVC算法模型预测出贵州省2011年8月和2022年8月全省降水量距平百分率均为负值,有利于预测干旱的发生。尽管模型对干旱程度的预测较实况偏轻,但总体上可为预报员提供有价值的参考。

图9

图9   贵州省2011年(a、b)、2022年(c、d)8月降水量距平百分率预测(a、c)与实况(b、d)对比(单位:%)

Fig.9   Comparison of predicted (a, c) and observed (b, d) precipitation anomaly percentages in August in 2011 (a, b) and 2022 (c, d) in Guizhou Province (Units: %)


3 结论

基于降水量数据、MCI指数、再分析资料结合持续性干旱的定义,对贵州省2011年和2022年2次严重气象干旱的大气环流背景和海温背景进行对比分析,得到以下主要结论。

2011、2022年均处于拉尼娜背景下,但北太平洋海温和热带印度洋海温分布的差异导致海气相互作用机制不同。2011年赤道印度洋至海洋性大陆区海温呈“西正东负”分布,西太副高因而偏东,西太平洋—东亚沿海地区出现气旋式环流异常,削弱了向贵州的水汽输送,进而引发干旱。2022年,北太平洋大范围偏暖,赤道印度洋至海洋性大陆区海温呈“西负东正”分布,在海洋性大陆区偏暖海温引导下,西太副高异常偏西、偏强且面积偏大,贵州省受副高控制盛行下沉气流,导致长时间晴热少雨天气并维持干旱。综上,水汽条件匮乏是2011年干旱的主要原因,而2022年干旱则由于西太副高控制下的持续下沉气流所致。

本文采用130项气候和环流指数结合机器学习方法对贵州省干旱事件进行建模,综合评估26种机器学习算法的性能,确定Linear SVC算法模型为最终的干旱预测模型。检验结果表明,该模型对贵州省2011、2022年干旱事件具有较好的预测能力。然而,模型在干旱强度方面的预测能力有待提升,尤其是对重度干旱区域的预测。因此,下一步将尝试细分数据集,并结合深度学习方法进一步提高重度干旱的预测能力。

参考文献

蔡怡亨, 李帅, 张强, , 2023.

1997—2021年四川省干旱时空变化特征分析

[J]. 干旱气象, 41(2): 241-250.

DOI      [本文引用: 1]

构建适宜的气象干旱指标是开展干旱监测和干旱评价业务服务的基础。基于1997—2021年四川省155个国家气象站逐日平均气温和降水,以及各县(市、区)农作物播种面积资料,通过改进气象干旱综合指数(Meteorological Drought Composite Index, MCI)中的季节调节系数,形成改进的气象干旱综合指数(Modified Meteorological Drought Composite Index, MCIm);再结合历年干旱受灾面积、有效灌溉面积修订区域性干旱过程识别方法,并识别出四川省历年区域性干旱过程51次,然后再利用经验正交函数(Empirical Orthogonal Function,EOF)、旋转经验正交函数(Rotated Empirical Orthogonal Function)、Morlet小波分析法,分析区域性干旱过程时空分布特征。结果表明:1997—2021年四川省发生区域性干旱过程的持续日数呈现出“先变短再增长再变短”,平均影响范围呈现出“先减小再增大再减小”,平均强度和综合强度呈现出“先减弱再增强再减弱”的变化趋势。平均年干旱过程累积日数总体呈现盆地多于盆周山区、盆周山区多于川西高原和攀西地区的特征。年累积MCIm距平EOF分解空间型存在全区一致特征,同时也存在南北反位相特征。四川省可划分为6个区域性干旱气候区,2009—2015年各区年累积MCIm周期变化比2001—2008年更明显。改进后的区域性干旱过程识别方法识别出的干旱过程与干旱灾情更为吻合,更能准确反映四川省干旱发生的实际状况。

陈军, 李小兰, 喻义军, , 2016.

贵州旱涝变化特征及其与西太平洋副高和海温的联系

[J]. 干旱气象, 34(3): 440-447.

DOI      [本文引用: 1]

利用国家气象信息中心整编的全国753站中贵州省16站逐日观测资料、NCEP/NCAR再分析资料以及NOAA的月平均海表温度资料,采用经验正交函数(EOF)展开、Morlet小波分析等方法对基于标准化降水指数(SPI)的贵州省旱涝时空分布特征进行研究,并分析贵州旱涝异常时的环流特征及与全球海表温度的关系。结果表明:(1)贵州SPI的各季节主模态空间分布均为全区一致型,春秋两季还表现出一定的干旱化趋势;春季和秋季的旱涝分布存在2 a、10 a左右的振荡周期,而夏季和冬季的振荡周期则以2 a、3 a及5 a左右为主;(2)春秋两季,当西太平洋副热带高压主体强度偏强(弱)、位置偏西(东)时,贵州地区降水偏少(多),易发生干旱(洪涝);而冬夏两季,当西太平洋副热带高压主体偏北(南)、位置偏东(西)时,贵州地区降水偏少(多),易发生干旱(洪涝);(3)贵州秋季SPI与前期、同期东印度洋—西太平洋区域的海温存在显著的负相关。

陈晓平, 陈易旺, 施建华, 2020.

基于机器学习的降雨量雷达回波数据建模与预测

[J]. 南京信息工程大学学报:自然科学版, 12(4): 483-494.

[本文引用: 1]

池再香, 杜正静, 陈忠明, , 2012.

2009—2010年贵州秋、冬、春季干旱气象要素与环流特征分析

[J]. 高原气象, 31(1): 176-184.

[本文引用: 1]

利用2009年9月—2010年5月贵州88个气象站地面观测资料, 800个自动气象站温度、 降水资料以及NCEP再分析资料, 分析了持续干旱过程中的大尺度环流背景及气象要素分布特征, 同时运用气候干湿指数、 综合气象干旱指数对此次持续干旱程度进行了模拟。结果表明, 贵州此次持续干旱天气主要发生在西太平洋副热带高压呈带状分布, 强度偏强\, 位置偏西\, 南支系统偏弱及冷空气活动路径偏北偏东的环流条件下。在干旱期间, 贵州西部地区气温为正距平, 降水为负距平, 空气相对湿度为38%~73%, 气候干湿指数<0.6; 东部地区气温除2009年11月和2010年4~5月为负距平外, 其余月份均为正距平, 降水基本上为负距平, 空气相对湿度为60%~81%, 除2009年11月和2010年4~5月气候干湿指数>1.0外, 其余月份均 

国家气候中心, 中国气象局预报与网络司, 中国气象局兰州干旱气象研究所, 2017. 气象干旱等级:GB/T 20481—2017[S]. 北京: 中国标准出版社.

[本文引用: 1]

何慧根, 张驰, 吴遥, , 2023.

重庆夏季高温干旱特征及其对拉尼娜事件的响应

[J]. 干旱气象, 41(6): 873-883.

[本文引用: 1]

胡学平, 王式功, 许平平, , 2014.

2009—2013年中国西南地区连续干旱的成因分析

[J]. 气象, 40(10): 1 216-1 229.

[本文引用: 1]

黄荣辉, 刘永, 王林, , 2012.

2009年秋至2010年春我国西南地区严重干旱的成因分析

[J]. 大气科学, 36(3): 443-457.

[本文引用: 1]

黎玥君, 郭品文, 2017.

基于BP神经网络的浙北夏季降尺度降水预报方法的应用

[J]. 大气科学学报, 40(3): 425-432.

[本文引用: 1]

李伟光, 易雪, 侯美亭, , 2012.

基于标准化降水蒸散指数的中国干旱趋势研究

[J]. 中国生态农业学报, 20(5): 643-649.

[本文引用: 1]

李忆平, 王劲松, 李耀辉, 2015.

2009/2010年中国西南区域性大旱的特征分析

[J]. 干旱气象, 33(4): 537-545.

DOI      [本文引用: 1]

针对目前各种干旱指数对干旱事件整体识别能力的局限性,采用一种新的客观识别方法“区域性极端事件客观识别方法(OITREE)”对2009~2010年中国西南地区的秋冬春连旱进行了特征识别。结果表明:(1)此次干旱事件的发生时段为2009年8月25日至2010年4月18日,历时237 d,为近50 a(1961~2010年)综合强度排名第五位的干旱事件,是一次极端干旱事件;(2)此次极端干旱过程最大影响面积为576.82万km2,影响范围涉及到云南全省、四川南部、贵州大部(主要是西部)以及重庆、广西西部,其中,云南、贵州和广西3省交界区干旱最严重,其次为云南的中部和中西部,且云南省不论受旱面积还是受旱强度都是最大的;(3)此次干旱过程有4个明显变化阶段:干旱增强、减弱、再增强、最后解除。第一阶段为2009年8月25日至10月下旬,干旱开始发展并持续增强,影响范围最大可达约370万km2,包括西南、华南、华东、华北及东北南部的小部分地区,持续达2个月,受影响的核心区域除了西南地区以外,还有华北和华南的部分区域;第二阶段为2009年11月初至12月中旬,干旱强度急剧下降,影响范围最小只有约50万km2,主要在西南地区,持续时间只有1个月;第三阶段,2009年12月中旬至2010年3月下旬,旱情再一次增强,干旱面积再次扩大,影响范围最大可达约200万km2,包括西南及西北地区东部,持续时间为3个月,是4个阶段中发展时间最长的,主要受影响的核心区域为西南地区;第四阶段,2010年3月下旬至4月中旬,干旱逐渐缓解,直到过程结束,旱情解除。OITREE方法能从不同层次和方面完整地描述干旱事件的时空变化特点,其判别结果与实际情况基本一致,是一种有效监测干旱的新方法。

李韵婕, 任福民, 李忆平, , 2014.

1960—2010年中国西南地区区域性气象干旱事件的特征分析

[J]. 气象学报, 72(2): 266-276.

[本文引用: 1]

卢维肖, 周易, 杨元建, , 2024.

基于WRF和随机森林的臭氧短期预报模型研究:以青岛为例

[J]. 环境生态学, 6(3): 84-92.

[本文引用: 1]

苗春生, 何东坡, 王坚红, , 2017.

基于C4.5算法的长江中下游地区夏季降水预测模型研究及应用

[J]. 气象科学, 37(2): 256-264.

[本文引用: 1]

沈皓俊, 罗勇, 赵宗慈, , 2020.

基于LSTM网络的中国夏季降水预测研究

[J]. 气候变化研究进展, 16(3): 263-275.

[本文引用: 1]

王芬, 张娇艳, 谷晓平, , 2017.

西太平洋副热带高压不同特征指数与贵州夏季降水的关系

[J]. 暴雨灾害, 36(4): 348-356.

[本文引用: 1]

王劲松, 郭江勇, 周跃武, , 2007.

干旱指标研究的进展与展望

[J]. 干旱区地理, 30(1): 60-65.

[本文引用: 1]

王素萍, 张存杰, 李耀辉, , 2014.

基于标准化降水指数的1960—2011年中国不同时间尺度干旱特征

[J]. 中国沙漠, 34(3): 827-834.

DOI      [本文引用: 1]

利用1960—2011年中国566个气象站逐日降水资料,采用标准化降水指数对近52年中国的干旱特征进行了详细分析。结果表明:近52年来,中国存在一条由东北向西南延伸的干旱趋势带,东北、内蒙古中东部、华北、西北地区东部以及西南地区东部趋于干旱,而西北地区西部的北疆地区、青海中部以及西藏中北部等地呈显著变湿趋势;华北地区干旱化主要是夏季趋于干旱引起的,东北和西南地区的干旱化主要是夏、秋季趋于干旱引起的,西北地区东部和长江中下游地区主要是春、秋季趋于干旱。东北地区20世纪70年代和2000年后轻旱以上日数较多,60年代干旱日数最少;华北地区和西北地区东部90年代最多,60—80年代旱日较少;西南地区东部2000年后干旱日数最多,60—70年代较少;长江中下游地区60年代和21世纪后干旱日数偏多,80年代较少。60年代,易旱区主要位于西北地区中、西部以及长江中下游部分地区;70年代,西北西部和东北地区是干旱的高发区;80年代,易旱区位于华北、黄淮、内蒙古中西部以及西南东部等地;90年代,易旱区转移到中部,西北地区东南部、华北、黄淮、江淮以及江汉等地是干旱的高发区;进入21世纪后,东北、内蒙古东部、西北地区东部、西南东部以及长江中下游的部分地区干旱高发。

王莺, 张强, 王劲松, , 2022.

21世纪以来干旱研究的若干新进展与展望

[J]. 干旱气象, 40(4): 549-566.

DOI      [本文引用: 1]

干旱是中国影响范围最广、造成经济损失最严重的自然灾害之一,直接威胁国家粮食安全和社会经济发展,对干旱问题的认识和研究有助于提升国家防旱减灾能力。自新中国成立以来,中国对于干旱气象的研究取得了丰硕的成果。本文以21世纪以来中国气象局干旱气候变化与减灾重点开放实验室为平台开展的与干旱气象相关的科研项目群取得的研究成果为基础,通过成果检索,对干旱监测技术、干旱时空分布规律、干旱致灾特征、干旱灾害风险及其对气候变暖的响应以及干旱灾害风险管理与防御技术等方面的新进展进行总结和归纳。同时,基于干旱气象研究的前沿发展趋势,提出中国未来干旱气象研究应在加强气候变化背景下干旱高发区综合性干旱观测试验基础上,从不同维度和尺度定量研究干旱形成机理,构建多源数据融合和多方法结合的综合干旱监测新方法,揭示干旱致灾机理,科学评估干旱灾害风险,提出具有可执行性的风险管理策略等重点科学问题上取得突破。这对于推动中国干旱气象研究具有积极意义。

王玥彤, 张娇艳, 何东坡, , 2020.

贵州省旱涝急转时空特征与大气环流异常的联系

[J]. 高原山地气象研究, 40(4): 41-46.

[本文引用: 1]

许丹, 龙俐, 张东海, , 2023.

基于MCI干旱综合指数的贵州省干旱时空分布及灾情变化特征

[J]. 干旱气象, 41(6): 897-909.

[本文引用: 1]

严小冬, 李扬, 夏阳, , 2019.

1961—2016年贵州省持续性干旱特征及成因分析

[J]. 中低纬山地气象, 43(3): 1-7.

[本文引用: 2]

杨金虎, 张强, 王劲松, , 2015.

近60年来西南地区旱涝变化及极端和持续性特征认识

[J]. 地理科学, 35(10): 1 333-1 340.

[本文引用: 1]

尹晗, 李耀辉, 2013.

我国西南干旱研究最新进展综述

[J]. 干旱气象, 31(1): 182-193.

DOI      [本文引用: 1]

随着全球气候变化,重大干旱等极端气候事件有增加趋势。我国历来是受干旱危害最严重的国家之一,近年来干旱强度和受旱区域不断增加,而且开始由干旱半干旱区向湿润区发展。雨水充沛、气候湿润的西南地区,近年来发生持续数年的严重干旱事件,给当地社会经济造成重大损失,并引起了广泛关注。许多学者也对西南干旱进行了分析研究,他们通过分析西南地区降水和温度的时空分布特征,以及影响西南干旱的大气环流和天气系统,寻找造成西南干旱的发生规律、特征和形成机理; 还有学者运用干旱指数、卫星遥感等方法研究了西南干旱的监测技术。本文研阅了近10 a 来大量相关文献,对西南干旱的最新研究成果进行了总结和评述,力图为西南乃至其它区域干旱的研究提供借鉴,为干旱防灾减灾提供帮助。

于浩慧, 周长艳, 陈超, , 2023.

2021年7—8月四川盆地高温热浪大气环流背景及影响分析

[J]. 干旱气象, 41(6): 923-932

[本文引用: 1]

张红丽, 张强, 刘骞, , 2016.

中国南方和北方气候干燥程度的变化特征及差异性分析

[J]. 高原气象, 35(5): 1 339-1 351.

[本文引用: 1]

张蕾, 姚叶青, 苗开超, , 2023.

基于FY-4A卫星和随机森林算法的西藏山南市雷电短临预报方法

[J]. 气象科技, 51(6): 867-878.

[本文引用: 1]

张强, 2022.

科学解读“2022年长江流域重大干旱”

[J]. 干旱气象, 40(4): 545-548.

DOI      [本文引用: 1]

今年从6月开始持续到目前的整个长江流域的干旱事件,不仅对农业和能源等各方面影响十分严重,而且干旱发展过程和影响特征还表现出许多与以往不同的独特性,对其进行科学分析十分必要。鉴于此,该文试图在科学与科普同时兼顾的基础上,分别从新常态与反常态两个视角,从干旱的表现特征、形成机制、影响特点及从中得到的启示与思考等方面,对当前还在肆虐的2022年长江流域严重干旱事件进行一些简单的科学解读,以促进社会公众对此次干旱事件的科学认识。

张强, 潘学标, 马柱国, , 2009. 干旱[M]. 北京: 气象出版社.

[本文引用: 1]

BREIMAN L, 2001.

Random forests

[J]. Machine Learning, 45(1): 5-32.

[本文引用: 1]

HAM Y G, KIM J H, LUO J J, et al, 2019.

Deep learning for multi-year ENSO forecasts

[J]. Nature, 573(7775): 568-572.

[本文引用: 1]

HASTIE T, TIBSHIRANI R, FRIEDMAN J, 2009. The elements of statistical learning: Data mining, inference, and prediction[M]. 2nd edition. New York: Springer.

[本文引用: 1]

ZHANG W, LEUNG Y, CHAN J C L, 2013.

The analysis of tropical cyclone tracks in the western north Pacific through data mining. part II: Tropical cyclone landfall

[J]. Journal of Applied Meteorology and Climatology, 52(6): 1 417-1 432.

[本文引用: 1]

/