基于随机森林算法的青藏高原东北边坡输电线路覆冰厚度预报模型
Wire icing thickness prediction model of transmission line in the northeastern slope region of Qinghai-Xizang Plateau based on random forest algorithm
通讯作者: 何金梅(1977—),女,甘肃兰州人,正高级工程师,主要从事专业气象预报服务工作。E-mail:441916974@qq.com。
责任编辑: 王涓力;校对:邓祖琴
收稿日期: 2024-05-14 修回日期: 2025-04-1
基金资助: |
|
Received: 2024-05-14 Revised: 2025-04-1
作者简介 About authors
吕玫霞(1995—),女,甘肃武威人,硕士,主要从事专业气象预报服务工作。E-mail:957985776@qq.com。
电线覆冰是危害青藏高原东北边坡地区输电线路安全运行的重要因素之一,研究区域内输电线路覆冰时空变化特征,建立覆冰预报模型,对电力部门融冰除冰及冰害防御有重要意义。基于随机森林算法,利用电力部门提供的2019-2022年青藏高原东北边坡地区输电线路覆冰个例,结合覆冰个例沿线气象实况监测资料,训练出最大等值覆冰厚度与气象要素间相关性的回归模型,并对模型进行评价。结果表明:覆冰线路主要分布在甘南高原、陇中高原、陇东高原及陇南山区地带,冬季覆冰事件频发;通过调整随机森林回归模型决策树的棵数、特征个数及最小叶子数可以有效提高模型预测精度;相对湿度、过去24 h降水量对各地理分区导线覆冰有较大影响;随机森林训练出的分区域输电线路最大等值覆冰厚度模型训练集平均绝对误差均小于2.8 mm,决定系数R2>0.7。随机森林模型能够预测青藏高原东北边坡地区输电线路最大等值覆冰厚度,可实现输电线路覆冰的短期预报。
关键词:
Wire icing is one of the important factors endangering the safe operation of power grid in northeastern slope region of Qinghai-Xizang Plateau. It is of great significance to study the temporal and spatial variation characteristics of transmission line icing and establish the icing forecasting model for the power department to remove ice and prevent ice damage. Based on the random forest algorithm, a regression model of the correlation between maximum equivalent ice thickness and meteorological elements was trained by using the cases of transmission line icing in northeastern slope region of Qinghai-Xizang Plateau from 2019 to 2022 provided by the power department, combined with the meteorological monitoring data along the icing cases, and the model was evaluated. The results show that transmission line icing accidents are mainly distributed in Gannan Plateau, Plateau of middle Gansu, Plateau of eastern Gansu, and Longnan mountainous area, and icing accidents occurred frequently in winter. The number of trees and features and the minimum number of leaves in the decision tree of the random forest regression model were adjusted to improve the prediction accuracy of the model. The relative humidity and the precipitation in the past 24 hours have great influence on transmission line icing in each geographical area. The mean absolute errors of the training set of maximum equivalent ice thickness prediction model of transmission line trained by random forest are all less than 2.8 mm, and the coefficient of determination R2 is above 0.7. Therefore, the random forest model can predict the maximum equivalent ice thickness of transmission lines in the northeastern slope region of Qinghai-Xizang Plateau and realize short-term forecast, reduce the economic loss caused by transmission line icing in power grid.
Keywords:
本文引用格式
吕玫霞, 闫昕旸, 何金梅, 程鹏, 王小勇, 李晓琴.
LYU Meixia, YAN Xinyang, HE Jinmei, CHENG Peng, WANG Xiaoyong, LI Xiaoqin.
0 引 言
输电线路覆冰是指气温低于0 ℃时,冷雾、冻雨或湿雪冻结在输电线路上的一种现象(Kringlebotn Nygaard et al., 2013),它会引发线路跳闸、导线舞动、过荷载、覆冰闪络等电气事故,严重情况下甚至可导致倒塔断线、电网解列、绝缘子闪络等现象(Niu et al.,2012;王传辉等,2019),严重损坏电力设备,危害国民经济。青藏高原东北边坡地形复杂,山地起伏,沟壑纵横,密集的输电线路在跨越山区时受地形导致的局地小气候影响较大(李清华等,2022),运行条件极为恶劣,该区域电线覆冰一直是危害电网安全运行的重要因素之一。近年来甘肃河东冬季降雪及极端寒冷天气呈增加趋势(赵一飞等,2013),更是加大了输电线路覆冰的频率(Cohen et al.,2018)。因此,研究区域输电线路覆冰时空变化特征,建立更加准确的覆冰预报模型,为电力部门提前采取防冰除冰措施提供科学依据,无疑具有极大的科学价值与现实意义。
影响覆冰厚度的气象因素主要有降水、温度、湿度、风速等(赵晓萌等,2011;朱君等,2011;胡艳楠等,2017;覃武等,2019)。目前覆冰预报模型大致可以分为物理学预报模型与统计学预报模型。物理学覆冰预报模型或者通过热力学、流体力学原理建立守恒方程,从微观层面将覆冰重量同各类气象要素建立联系(朱永灿等,2015),或者综合考虑雾凇和雨凇以及热力学原理,建立输电线路覆冰模型(邓芳萍等,2017)。物理模型能很好地模拟电线积冰增长情况,预测标准冰厚的时空增长过程,模拟时空分辨率较高,但由于覆冰形成的微物理过程十分复杂,建模时对实际物理过程的简化,以及模型中如液滴撞击速度等重要参数无法准确测量,导致此类模型在实际业务工作中很少应用(Li et al.,2014)。传统的统计学预报模型基于温度、气压、风速、风向和相对湿度等气象要素,与输电线路覆冰厚度做简单的线性拟合。该方法依赖于大量历史资料,操作简便,可以较快得到电线覆冰规律(温华洋等,2011;王奇等,2021),但模型泛化能力较弱,全局预测能力不强(Hao et al.,2019)。而基于机器学习方法所建立的统计学模型则表现出较高的预报准确率(Sun and Wang,2019),使用机器学习方法建立的多种覆冰预报模型,取得了很好的应用效果(Niu et al.,2017;林刚等,2018;Zhao et al.,2022)。目前可建立不同电线绝缘子仿真物理模型,实现绝缘子覆冰情况下冰层厚度及冰棱长度模拟(赵多青等,2022);还可融合Ridge及XGBoost等多种机器学习算法,学习历史时间序列下气象因子与覆冰厚度的相关性,结合WRF模式预报,实现覆冰预测(李晨曦,2023);另外考虑微地形因素结合CALMET模式,实现复杂地形下导线覆冰的数值模拟(王帅等,2024)。
目前,甘肃省针对具体线路的精细化覆冰预报模型研究工作尚未开展,与电力部门的迫切需求形成鲜明对比。本文利用甘肃省电力部门提供的2019—2022年青藏高原东北边坡地区共计14个覆冰个例及覆冰发生时段各气象监测站点资料,分析覆冰的时空变化特征,基于机器学习中的随机森林方法分区域建立输电线路覆冰预报模型,并检验模型的预报性能,以期为今后开展输电线路覆冰专项预报提供技术支撑,为甘肃电网减少覆冰带来的经济损失,实现“双碳”目标保驾护航。
1 研究区概况
图1
图1
覆冰区域及气象站点空间分布
Fig.1
Spatial distribution of transmission line icing region and meteorological stations
2 资料和方法
2.1 资 料
输电线路覆冰资料为甘肃省电力部门提供的2019年11月—2022年1月青藏高原东北边坡地区共计14个覆冰个例,包含个例发生时间、天气现象、地理位置、覆冰持续时间、覆冰形态、最大等值覆冰厚度等信息。
随机森林模型的因变量为覆冰个例出现时间段内的最大等值覆冰厚度。本研究共收集到8 063个有效样本,按照5个地理分区境内输电线路分别建立模型,建模时随机打乱所有样本,按照4∶1的分段抽样比例生成训练集和测试集。表1为5个地区训练集和测试集样本数。
表1 研究区域训练集和测试集样本数
Tab.1
样本 | Ⅰ区 | Ⅱ区 | Ⅲ区 | Ⅳ区 | Ⅴ区 |
---|---|---|---|---|---|
训练集 | 635 | 2 923 | 790 | 1 883 | 218 |
测试集 | 159 | 731 | 198 | 471 | 55 |
2.2 随机森林算法及模型构建
随机森林算法(Random Forest,RF)基于集成学习理论,使用Bootstrap抽样方式,通过构建多棵决策树形成森林,较好地解决了单个决策树容易出现过拟合的问题,学习速度较快,在处理离散变量及非线性回归问题方面有着出色表现,与传统的支持向量机等方法相比,RF具有准确率高、适应性强的特点(刘新伟等,2021)。
随机森林回归算法示意图见图2,本文构建的随机森林回归模型流程如图3所示。第1步使用覆冰个例发生时段内气温、降水、湿度、风速等6个气象因子作为模型输入,最大等值覆冰厚度作为模型输出,建立样本训练集。第2步样本训练首先针对数据分布不均匀的情况,使用Randperm方法打乱总样本数,解决类别不平衡问题;其次随机抽取出覆冰记录观测数据中的20%作为回归模型的测试数据,将剩余数据作为训练数据,由于各类特征数据间的差异性,将训练集与测试集进行归一化处理;然后使用Bootstrap抽样方式随机抽取n个样本数据集,未被抽取的剩余样本形成袋外数据(Out of Bag, OOB)(Rahman et al.,2006)。第3步随机抽取每个样本子集特征,按照最优特征子空间方法生成回归决策子树,每棵树不进行剪枝,将生成的决策子树建立随机森林(沈润平等,2017)。第4步对生成的RF模型进行参数调优及模型检验,生成最终预测结果。
图2
图3
图3
随机森林回归模型构建流程图
Fig.3
Flow chart of the random forest regression model construction
使用平均袋外误差
式中:Ntree为随机森林中决策树的棵数,i为回归树的序号,m为袋外样本个数,j为袋外样本编号,OOBi为第i个回归树的袋外误差,yj为袋外样本真实值,
2.3 模型评估指标
使用平均绝对误差(Mean Absolute Error, MAE)、平均偏差误差(Mean Bias Error, MBE)、决定系数(R2)、均方根误差(Root Mean Square Error, RMSE)进行模型的检验(王可心等,2021),计算公式分别为
式中:yi为因变量真实值,
计算特征变量因子的重要性评分(Variable Importance Measure, VIM),评分越高代表该变量因子重要程度越高,对因变量的影响程度越高,即回归模型解释程度越高(Groemping,2009)。VIM通过决策树平均袋外误差变化评估特征因子重要程度。首先计算m个袋外数据(OOB)的均方误差(Mean Square Error, MSE),为MSE1,MSE2,…,MSEm,其次随机置换m个OOB数据集特征分裂时选择的特征,形成新的OOB并计算MSE,重复M次,M为自变量的个数,使用随机置换后的OOB均方误差建立如下矩阵:
最后计算第i个特征变量因子的VIM,公式(杨明悦和毛献忠,2022)如下:
式中:ES代表标准误差,VIMi(MSE)代表第i个特征变量因子的重要性评分。
采用命中率(Probability Of Detection,POD)、空报率(False Alarm Rate,FAR)、漏报率(Missing Alarm Rate,MAR)评估模型拟合效果(唐文苑等,2017)。
2.4 参数调优
影响RF模型预测能力的3个重要可变参数为决策树的棵数Ntree、特征分裂时选择的特征个数f以及最小叶子数Lmin。一般情况下f取值为
1)默认Ntree最大为100,Lmin为5,然后分别观察5个地理分区建立100棵决策子树的
2)固定Lmin为5,当f=6时观察OOB误差随Ntree的变化(图4)。可以看到,随着Ntree增加,OOB误差逐渐趋于平稳。通常认为当OOB误差维持稳定时,决策树数目为最优。观察各区OOB误差变化情况,I区误差总体最高,决策树迭代70次以后,误差稳定在0.063左右;II区误差次高,决策树迭代80次以后,决策树误差稳定在0.057左右;IV区,决策树迭代50次以后,误差稳定在0.027左右;III区误差较低,决策树迭代90次以后,误差稳定在0.016左右;V区决策树迭代50次以后,误差稳定在0.012左右。
图4
图4
5个区域OOB误差与Ntree关系(Lmin=5, f=6)
Fig.4
The relationship between OOB errorand Ntree in five zones (Lmin=5 and f=6)
综合考虑5个区域OOB误差趋势,当决策树数目超过50以后,误差曲线下降趋势缓慢,趋于平稳,模型过拟合,增加决策树数量对减少误差效果不明显。因此Ⅰ~Ⅴ区选择决策树数目分别为70、80、90、50、50。
图5
表2 各区域模型参数调优结果
Tab.2
区域 | Ntree | f | Lmin |
---|---|---|---|
I区 | 70 | 6 | 5 |
II区 | 80 | 6 | 6 |
III区 | 90 | 6 | 2 |
IV区 | 50 | 6 | 1 |
V区 | 50 | 6 | 5 |
3 结果分析
3.1 输电线路覆冰灾害时空变化
2019—2022年14个输电线路覆冰个例共计72个电线区段发生覆冰。其中,Ⅱ区覆冰区段最多(34个),定西市24个区段发生覆冰,主要发生在定西东部通渭县,天水市10个,主要发生在秦州区、秦安县及武山县;Ⅳ区覆冰区段次多,为23个,主要发生在平凉中部华亭市、崆峒区及宁夏固原市;Ⅴ区、Ⅰ区、Ⅲ区分别出现7、6、2个覆冰区段,覆冰主要发生在兰州南部七里河区、陇南中部武都区及甘南州北部夏河县。Ⅲ区及固原南部最大等值覆冰厚度最大,为10 mm及以上,陇南北部、天水中部、定西北部及平凉东部最大等值覆冰厚度为4 mm及以下,其余地区最大等值覆冰厚度为4~10 mm(图6)。
图6
图6
2019-2022年输电线路覆冰个例位置分布及最大等值覆冰厚度(单位:mm)插值
Fig.6
Distribution of transmission line icing cases position and interpolation of maximum equivalent ice thickness (Unit: mm) during 2019-2022
图7
图7
2019—2022年输电线路覆冰区段个数月变化
Fig.7
Monthly variation of number of the transmission line icing section from 2019 to 2022
3.2 模型评价及检验
3.2.1 模型评价
通过多次交叉验证,选取最优值得出5个区域输电线路最大等值覆冰厚度预报模型的MAE、MBE、R²、RMSE评价结果如表3所示。各区域训练集平均绝对误差均小于2.8 mm,决定系数R2>0.7。Ⅲ区MAE、MBE及RMSE最高,其次为Ⅱ区和Ⅰ区,Ⅳ区及Ⅴ区的误差较小,MAE、MBE均小于0.950 mm,RMSE均小于1.680 mm,说明Ⅳ区及Ⅴ区模型预测偏差较小,预估能力较好。Ⅰ区、Ⅲ区、Ⅳ区及Ⅴ区训练集R²都在0.840以上,测试集R²在0.690以上,其中Ⅳ区及Ⅴ区训练集R²在0.913与0.960之间,测试集R²在0.765与0.841之间,代表Ⅳ区及Ⅴ区模型拟合效果较好,对最大等值覆冰厚度解释程度较强,具备较好的泛化能力。综合对比分析得到,Ⅳ区及Ⅴ区模型预测性能较优,预测结果较为理想;Ⅰ区模型预测精度较高,模型拟合优度较高;Ⅲ区模型自变量对因变量的解释能力较强;Ⅱ区训练集R²为0.701,模型自变量对最大等值覆冰厚度的解释能力尚可。
表3 输电线路最大等值覆冰厚度预报模型评价结果
Tab.3
区域 | MAE/mm | MBE/mm | R² | RMSE/mm | ||||
---|---|---|---|---|---|---|---|---|
训练集 | 测试集 | 训练集 | 测试集 | 训练集 | 测试集 | 训练集 | 测试集 | |
Ⅰ区 | 1.048 | 1.387 | -0.001 | -0.064 | 0.842 | 0.695 | 1.558 | 2.117 |
Ⅱ区 | 1.326 | 1.962 | -0.003 | -0.184 | 0.701 | 0.409 | 1.827 | 2.633 |
Ⅲ区 | 1.438 | 2.765 | 0.023 | 0.660 | 0.945 | 0.857 | 2.883 | 4.833 |
Ⅳ区 | 0.379 | 0.947 | 0.003 | 0.014 | 0.960 | 0.765 | 0.707 | 1.670 |
Ⅴ区 | 0.259 | 0.420 | 0.009 | 0.038 | 0.913 | 0.841 | 0.995 | 1.266 |
3.2.2 拟合效果
表4为输电线路最大等值覆冰厚度(Y)模型拟合效果评估,划分Y所属类别范围时参考《中重冰区架空输电线路设计技术规定》(国家电网有限公司,2024),其中除III区外,其余各区均不存在Y≥20 mm的样本;图8为5个区域输电线路最大等值覆冰厚度Y预测结果与真实值对比。综合可以看到,对于I区,模型训练集预测结果与真实值变化趋同,但10<Y<20 mm时存在漏报;Y≤10 mm时存在空报。对于II区,对Y≤10 mm样本,模型命中率(POD)较高,预测结果较好,存在少量漏报和空报情况;对10<Y<20 mm样本,模型POD较低,存在较高的漏报情况。对于III区,训练集、测试集与真实值拟合精度均较高,对Y≤10 mm样本,训练集没有漏报情况;对10<Y<20 mm样本,训练集没有空报情况;对Y≥20 mm样本,训练集与测试集均无漏报情况。对于IV区,对Y≤10 mm样本,POD超过0.896,拟合效果较好;对10<Y<20 mm样本,模型存在一定的空报情况。对于V区,训练集与测试集预测结果均较好,POD均达到0.667以上,测试集对Y≤10 mm样本的漏报率与10<Y<20 mm样本的空报率均为0。
表4 输电线路最大等值覆冰厚度(Y)模型拟合效果评估
Tab.4
区域 | 样本集 | POD | FAR | MAR | ||||||
---|---|---|---|---|---|---|---|---|---|---|
Y≤10 mm | 10<Y<20 mm | Y≥20 mm | Y≤10 mm | 10<Y<20 mm | Y≥20 mm | Y≤10 mm | 10<Y<20 mm | Y≥20 mm | ||
Ⅰ区 | 训练集 | 0.794 | 0.545 | / | 0.206 | 0 | / | 0 | 0.455 | / |
测试集 | 0.783 | 0.600 | / | 0.217 | 0 | / | 0 | 0.400 | / | |
Ⅱ区 | 训练集 | 0.858 | 0.136 | / | 0.133 | 0.319 | / | 0.012 | 0.854 | / |
测试集 | 0.834 | 0.098 | / | 0.158 | 0.350 | / | 0.012 | 0.896 | / | |
Ⅲ区 | 训练集 | 0.859 | 0.913 | 0.883 | 0.141 | 0 | 0.117 | 0 | 0.087 | 0 |
测试集 | 0.775 | 0.810 | 0.797 | 0.184 | 0.021 | 0.203 | 0.061 | 0.175 | 0 | |
Ⅳ区 | 训练集 | 0.946 | 0.791 | / | 0.001 | 0.207 | / | 0.054 | 0.003 | / |
测试集 | 0.896 | 0.611 | / | 0.019 | 0.347 | / | 0.088 | 0.096 | / | |
Ⅴ区 | 训练集 | 0.980 | 0.818 | / | 0.015 | 0.053 | / | 0.005 | 0.143 | / |
测试集 | 0.981 | 0.667 | / | 0.019 | 0 | / | 0 | 0.333 | / |
注:“/”表示无样本。
图8
图8
5个区域输电线路最大等值覆冰厚度(Y)模型预测结果与真实值对比
Fig.8
Comparison between the model prediction results of the maximum equivalent ice cover thickness (Y) and the real value of transmission lines in 5 zones
综合来看,II区、IV区及V区对10<Y<20 mm样本模型命中率均较高,预测结果与真实值拟合程度较好;III区及V区对10<Y<20 mm样本的命中率较高,且III区对Y≥20 mm样本的命中率较高,无漏报情况;II区对10<Y<20 mm样本漏报情况较多,其余各区预测结果漏报及空报情况均较少。
4 覆冰事件与气象因子的关系
V10、T、Tmax、Tmin、RH以及R24是反映输电线路覆冰程度的重要指标(黄新波等,2011),图9为5个区域6个气象因子的VIM特征图。可以看到,Ⅰ区RH重要性评分最高,接近于R24和T评分的2倍;Ⅰ区属于半干旱半湿润区,研究个例中输电线路出现雾凇的情况较多,而雾凇覆冰过程多为干增长(孙才新等,2003)。II区R24重要性评分排名最高,RH和Tmin次之;Ⅱ区个例覆冰过程多为混合冻结冰壳,雾雨凇交替在电线上积聚,这类混合凇覆冰增长过程介于干增长和湿增长之间(苑吉河等,2004),混合凇周期较长,空气湿度较大,存在足够多的过冷却水滴(黄筱婷等,2013),这与该区域覆冰个例前期降水带来充足水汽,雨凇和雾凇混合冻结附着在导线上,形成覆冰的情况较吻合。III区R24重要性评分远大于其他因子;该区域个例覆冰过程主要为雾凇,经电力部门观测,等值覆冰厚度随降雪天气持续而逐渐增长。Ⅳ区R24重要性评分接近于其他因子之和;该区域个例导线覆冰以雪凇、雾凇较多,雾凇最大附着厚度为70 mm。V区R24与RH因子重要性评分相当,对导线覆冰有较大影响;该区域导线覆冰主要为雾凇及混合凇,覆冰过程存在干增长及湿增长过程,降雪过程带来水汽,水蒸气凝华或冻结在导线易形成覆冰,另一方面空气湿度较高,水汽量处于过饱和状态,过冷却水滴易形成混合凇(彭曙蓉等,2016)。
图9
综合来看,所有分区的R24、RH对输电线路覆冰的影响最大,Tmin对Ⅱ、Ⅲ、Ⅴ区的影响、T对Ⅰ区的影响以及V10对Ⅳ区的影响同样不可忽视,这也是实际预报服务业务中需要关注的重点。
5 结论
本文利用甘肃省电力部门提供的2019—2022年青藏高原东北边坡地区共计14个覆冰个例,分析了覆冰的时空变化特征,基于机器学习中的随机森林算法分区域建立了输电线路覆冰预报模型,得到以下主要结论。
1)青藏高原东北边坡地区覆冰线路主要分布在甘南高原、陇中高原、陇东高原及陇南山区地带,定西、天水地区覆冰频次最多,甘南、临夏及固原地区最大等值覆冰厚度较大,覆冰出现时段主要分布在冬季12月至次年2月,其中2月出现的覆冰区段最多。
2)基于RF回归模型可以有效预测输电线路最大等值覆冰厚度,通过调整决策树棵数、特征分裂时选择的特征个数以及最小叶子数可以改变模型的拟合效果,提高模型预测精度,更好地解释最大等值覆冰厚度。
3)各模型预测结果与真实值变化形势趋同,Ⅳ区及Ⅴ区训练集R²均大于或等于0.913,测试集R²均大于或等于0.765,MAE、MBE及RMSE较小,模型拟合效果较好,对最大等值覆冰厚度解释程度较强,具备较好的泛化能力;Ⅰ区模型预测精度较高,模型拟合优度较高;Ⅲ区模型自变量对因变量的解释能力较强;Ⅱ区训练集R²为0.701,模型自变量对最大等值覆冰厚度的解释能力尚可。总体来看,各区域模型预测结果准确率较高,误差较低,可用于实际最大等值覆冰厚度预测业务中。
输电线路覆冰往往出现在高海拔山区,受局地气候影响明显,观测资料匮乏,这也是覆冰预报的难点。本文在有限资料的基础上,通过多次交叉试验,调整关键因子的取值,在最大等值覆冰厚度预报模型上进行了初步探索,但仍存在一定的不足,比如覆冰样本量较少、气象监测因子不足等。随着2024年甘肃省15套输电线路覆冰在线监测设备的投入使用,覆冰样本及气象监测因子的不断积累,模型的性能将逐步优化,进一步提高其预警和预报能力。
参考文献
山西省不同重现期下电线覆冰厚度空间分布及区划
[J].利用山西省18个积冰站电线积冰观测资料和91个气象站常规观测资料,采用逐步回归分析方法,针对不同气候区分别构建电线覆冰设计冰厚的气象估算模型,推算各站30 a、50 a、100 a重现期下的设计冰厚。在此基础上,结合DEM数据和电网运行覆冰观测资料,对设计冰厚进行地形订正和易冰区微地形运行经验修正,最终得到山西省电网电线覆冰厚度空间分布及区划结果。结果表明:(1)山西省电线覆冰的设计冰厚整体与气温、相对湿度、风速、水汽压等密切相关,其中高山区的设计冰厚还与降水量、日照时数关系密切,且受连续3 d的气象条件影响,而丘陵和平原区则与当日和前一日或前二日的气象条件密切相关;(2)构建的分区设计冰厚气象估算模型对各气候区的覆冰厚度模拟效果较好,估算偏差五台山前约2 mm,其余地区小于1.2 mm;(3)地形订正后的结果更为合理地反映山西省各重现期下电线覆冰厚度的空间特征,即覆冰厚度随纬度降低而减小,中、重冰区主要分布在恒山、五台山、管涔山、吕梁山、太岳山和太行山等高海拔地区,而沿黄河一带和盆地为轻冰区,且盆地覆冰最轻;(4)易覆冰区经运行经验修正后,其覆冰厚度能够更加精确表达局部微地形区覆冰真实情况,这对电力部门具有实际参考价值。
基于雷达产品和随机森林算法的冰雹天气分类识别及预报
[J].冰雹是一种致灾性较强的强对流天气, 但在气象业务工作中对其进行快捷、 准确的预警和预报仍有一定的难度。本文基于C波段雷达回波资料, 构建并应用随机森林模型对冰雹及其伴随强对流天气进行了分类识别及预报。结果发现, 随机森林模型对训练集(2008 -2017年)中四类冰雹天气(冰雹、 冰雹大风、 冰雹短强、 冰雹大风短强)的平均命中率(Probability of Detection, POD)为90.2%, 平均空报比率(False Alarm Ratio, FAR)为11.1%。对于2018 -2019年的独立样本测试集, 模型的平均POD和FAR则分别为72.8%和34.7%。因此, 本文构建的随机森林模型较为理想。应用模型和风暴单体识别与跟踪产品(Strom Cell Identification and Tracking, SCIT)对未来15~60 min的强对流天气进行预报, 结果表明四类冰雹天气的平均POD为74.8%, 平均临界成功指数为60.8%, 平均FAR为24.4%。因此, 利用C波段雷达产品, 随机森林模型能高效、 自动化且较为准确地分类预警、 预报冰雹及其伴随强对流天气, 可应用于天气预报业务工作。
基于随机森林的遥感干旱监测模型的构建
[J].利用遥感数据进行大面积旱情监测是现有干旱监测的重要方法之一,然而传统的遥感干旱监测方法主要侧重于对土壤湿度或植被状况等单一干旱响应因子进行监测,对综合多因子的干旱监测研究较为有限。随机森林是一种机器学习方法,具有学习过程快速、运算速度快、稳定性好、预测精度高的优点,近年来被应用于生态环境等多个领域。本文利用2001-2010年4-9月的MODIS数据提取的植被状态指数(VCI)、温度状态指数(TCI)和土地覆盖类型(LC),TRMM降水资料计算的TRMM-Z指数及SRTM-DEM、土壤有效含水量(AWC)等多个遥感及土壤资料提取的干旱因子为自变量,以气象站点的综合气象干旱指数(CI)为因变量,利用随机森林模型构建遥感干旱监测模型,并以河南省为研究区进行了评价和分析。该模型在2009-2010年的监测值和实测CI值的具有显著的相关性,并且二者干旱等级的一致率为81%。在2001-2010年4-9月间,模型监测值与气象站点的标准降水蒸散发指数(SPEI)总体干旱等级一致率为74.9%,较为一致,其中9月的模型结果与SPEI的干旱等级一致率最高,达到82.4%,空评估率和漏评估率最低;与10 cm土壤相对湿度的相关系数在0.475-0.639之间,达到极显著水平。河南省2011年4-6月干旱事件同样验证了本文构建的模型旱情监测结果,说明本模型能较好地就应用于监测区域旱情监测。
Warm Arctic episodes linked with increased frequency of extreme winter weather in the United States
[J].
Variable importance assessment in regression: Linear regression versus random forest
[J].
A classification method for transmission line icing process curve based on hierarchical K-means clustering
[J].
Modeling wet snow accretion on power lines: Improvements to previous methods using 50 years of observations
[J].
Multivariable time series prediction for the icing process on overhead power transmission line
[J].
The microphysics of ice accretion on wires: Observations and simulations
[J].
The general regression neural network based on the fruit fly optimization algorithm and the data inconsistency rate for transmission line icing prediction
[J].
Effect of bias and variance on estimation and classification error for prediction
[J].
Staged icing forecasting of power transmission lines based on icing cycle and improved extreme learning machine
[J].
Probability prediction method of transmission line icing fault based on adaptive relevance vector machine
[J].
/
〈 |
|
〉 |
