• CN 62-1175/P
  • ISSN 1006-7639
  • 双月刊
  • 中国科技核心期刊
  • 中国学术期刊综合评价数据库统计源期刊
  • 中文科技期刊数据库收录期刊

干旱气象, 2025, 43(5): 810-819 DOI: 10.11755/j.issn.1006-7639-2025-05-0810

研究论文

基于人工和地基器测数据的AI云识别方法

张德玉,1, 胡树贞,2, 秦三杰3, 张强1, 白明1, 庞成1, 魏荣妮1

1.甘肃省张掖市气象局,甘肃 张掖 734000

2.中国气象局气象探测中心,北京 100081

3.甘肃省气象局观测与网络处,甘肃 兰州 730020

AI cloud classification based on manual and ground-based instrumental data

ZHANG Deyu,1, HU Shuzhen,2, QIN Sanjie3, ZHANG Qiang1, BAI Ming1, PANG Cheng1, WEI Rongni1

1. Zhangye Meteorological Bureau of Gansu Province, Zhangye 734000, Gansu, China

2. CMA Meteorological Observation Center, Beijing 100081, China

3. Department of Observation and Network,Gansu Meteorological Bureau, Lanzhou 730020, China

通讯作者: 胡树贞(1985—),男,山东德州人,高级工程师,主要从事毫米波雷达资料分析及应用研究。E-mail:052310421hu@163.com

责任编辑: 邓祖琴;校对:黄小燕

收稿日期: 2024-11-28   修回日期: 2025-05-2  

基金资助: 中国气象局气象探测中心观测试验项目(GCSYJH23-23)
甘肃省气象局科研项目(Zd2024-A-1-A)

Received: 2024-11-28   Revised: 2025-05-2  

作者简介 About authors

张德玉(1978—),男,甘肃民乐人,高级工程师,主要从事气象雷达与大气探测研究。E-mail:zydeyu@163.com

摘要

为弥补“天气现象视频智能观测仪”在云状识别中存在的纯视觉观测局限,以2023年5月1日至2024年4月30日张掖国家气候观象台试验外场的毫米波云雷达、全天空成像仪等器测数据为基础,结合人工观测云状记录及地面自动站气象资料,构建多源融合的人工智能(Artificial Intelligence,AI)云状识别样本库。选取多种类型机器学习算法开展训练与性能评估,结果表明,支持向量机模型在综合识别精度与稳定性方面表现最佳,可实现对卷积云、卷云、高积云、高层云、雨层云、层云、层积云、积雨云、积云9种云状及降水天气的自动识别。通过4个典型日云分类个例的验证显示,模型能精准识别多层云结构,识别结果与人工观测高度一致。本文在数据集构建的多源融合性及算法适配性方面均有明显改进,云状识别种类增加33%,准确率提升15%。

关键词: 地基器测云; AI云识别; 毫米波云雷达; 全天空成像仪; 人工云状

Abstract

To compensate for the limitations of the Weather Phenomena Video Intelligent Observation Instrument in purely visual cloud classification, an AI (Artificial Intelligence) cloud classification sample library was constructed by integrating millimeter-wave cloud radar and all-sky imager measurements from the Zhangye National Climate Observatory experimental field during the period from May 1, 2023 to April 30, 2024, together with manual cloud observations and ground automatic station meteorological data. Multiple machine learning algorithms were applied for training and performance evaluation, and the Support Vector Machine model was identified as the most effective in terms of overall accuracy and stability. This model enables the automatic recognition of nine cloud types, cirrocumulus, cirrus, altocumulus, altostratus, nimbostratus, stratus, stratocumulus, cumulonimbus, and cumulus, as well as precipitation weather. Verification based on four typical daily cloud classification cases demonstrated that the model can accurately identify multilayer cloud structures, with results highly consistent with manual observations. This study achieves significant improvements in both data integration and algorithm adaptability, increasing the number of identifiable cloud types by 33% and enhancing classification accuracy by 15%.

Keywords: ground-based cloud observation; AI cloud classification; millimeter-wave cloud radar; all-sky imager; artificial cloud shape

PDF (12662KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张德玉, 胡树贞, 秦三杰, 张强, 白明, 庞成, 魏荣妮. 基于人工和地基器测数据的AI云识别方法[J]. 干旱气象, 2025, 43(5): 810-819 DOI:10.11755/j.issn.1006-7639-2025-05-0810

ZHANG Deyu, HU Shuzhen, QIN Sanjie, ZHANG Qiang, BAI Ming, PANG Cheng, WEI Rongni. AI cloud classification based on manual and ground-based instrumental data[J]. Arid Meteorology, 2025, 43(5): 810-819 DOI:10.11755/j.issn.1006-7639-2025-05-0810

0 引言

云的观测是气象业务中的核心内容,涵盖云高、云状和云量等关键要素。云观测方式经历了从人工到自动的演变。人工观测因其主观性强、误差较大、难以实现连续观测等问题,正逐步被自动观测取代。当前自动观测主要包括天基(如卫星)、空基(如飞机、飞艇、探空气球)和地基(如激光云高仪、云雷达、成像仪)3种方式(夏德深等,1999;路志英等,2000;周著华等,2005;张艳品等,2014)。天基观测能够实现对全球云况的监测,但空间分辨率较低(李晨蕊等,2022),且被动观测方式难以获取云顶以下的结构信息(Tan et al.,2024);空基观测能获取高质量垂直剖面信息,但观测范围有限、成本高,难以实现业务化运行;相比之下,地基观测部署灵活、成本较低,适用于长期业务化运行,成为当前主流的云观测手段。近年来,激光云高仪、全天空成像仪和毫米波云雷达的快速发展明显提升了地基观测的技术水平。其中,全天空成像仪在量监测方面趋于成熟,而毫米波云雷达因其可探测云顶、云底及云内部结构(Ming et al.,2021),并输出云内部反射率、垂直速度等多种云微物理量,是当前最有效的地基测云设备之一(李海飞等,2017;刘光普等,2019;姬雪帅等,2022;徐路扬等,2023;李慧等,2023;郭立平等,2024)。

目前,气象业务中广泛使用的“天气现象视频智能观测仪”主要依赖图像识别技术,通过卷积神经网络(Convolutional Neural Networks,CNN)等深度学习模型处理多路视频数据,实现天气现象与云分类的自动识别。然而,该系统作为纯视觉观测方式,存在以下缺陷:1)对多层云的识别能力较弱,尤其在低层云遮挡高层云时;2)夜间观测能力下降;3)云状识别准确性受限。针对上述问题,已有研究尝试融合云物理特征和图像纹理特征改进分类方法,如基于多通道红外图像和纹理特征的云类识别(孙学金等,2009),或基于毫米波云雷达特征参数的分级多阈值判别方法(杨晓等,2019)。此外,也有研究采用卷积神经网络、反向传播神经网络等AI方法对地基数据进行云状分类(余安安等,2021),但在观测数据融合与方法对比分析方面仍存在不足,尤其是在多源数据融合和垂直结构识别方面尚需改进。基于张掖国家气候观象台试验外场(简称“张掖外场”)2023年5月1日至2024年4月30日的观测数据,结合毫米波云雷达、全天空成像仪、人工观测记录和地面自动站资料,构建多源高质量AI训练样本库,并利用多种机器学习算法开展对9类云状及降水天气的自动识别研究,旨在提升地基云观测的智能化和精细化水平。

1 设备、资料与方法

1.1 观测设备

Ka波段毫米波云雷达型号为YLU4型,生产厂家为无锡智鸿达电子有限公司,具体性能指标见表1。观测的物理量包括反射率因子、径向速度、谱宽、云顶高度及云底高度等;主要产品包含质控后的基数据、液态含水量、衰减订正后的反射率、有效粒子半径等。

表1   Ka波段毫米波云雷达主要性能指标

Tab.1  Main performance indicators of Ka-band millimeter-wave cloud radar

技术体制工作频率天线口径/m探测高度范围距离分辨率/m观测模式脉冲宽度/us灵敏度/dBm
全固态,全相参多普勒35 GHz±200 MHz1.8100 m~15 km30垂直顶空、多普勒、脉冲压缩0.2、5、12、24-119.0、-133.0、-136.8、-139.8

新窗口打开| 下载CSV


全天空成像仪型号为ASC200型(表2),安徽云能天智能科技有限责任公司生产。其主要产品包括可见光原图、可见光云图、红外原图、红外增强图、红外云图及云量等。

表2   全天空成像仪主要性能指标

Tab.2  Main performance indicators of all-sky imager

红外波长/μm可见光视场角/(°)红外视场角/(°)采样周期/min可见光图像解析度/pixel红外图像解析度/pixel
8~14180160102 592×1 944640×512

新窗口打开| 下载CSV


1.2 资料与方法

1.2.1 资料

2023年5月1日至2024年4月30日08:00、14:00、20:00张掖外场的人工观测数据、毫米波云雷达数据、全天空成像仪数据以及来自“天擎·甘肃”的地面自动站相关数据。

1.2.2 方法

基于多源观测数据的融合结果确定云分类,进而构建AI样本库;采用多种机器学习算法对样本数据进行训练与评估,并通过优中选优的方法确定最优模型;对最优模型在各类别上的识别性能开展进一步评估;最后结合实况资料验证模型的可靠性并得出结论(杨晓等,2019;余安安等,2021;倾鹏程等,2022;宋冬昊等,2025)(图1)。

图1

图1   总体流程图

Fig.1   Overall flow chart


1.2.3 云状分类

依据《地面气象观测规范》(全国气象仪器与观测方法标准化技术委员会,2017)将云状划分为3族10属29类。鉴于研究初期技术条件限制,本研究以自动识别“10属”为目标。选取“天擎·甘肃”地面资料中张掖市6个地面站2023年5月1日至2024年4月30日的云状观测数据,共获得11 301次有效观测。结果显示,卷云、高积云、高层云和积云的出现频率分别为45%、33%、11%和8%;卷层云、卷积云、积雨云出现的次数分别为0次、40次和43次,属于低频类别。

卷层云数量为0,无法单独做为一类,同时卷层云与卷积云在物理特征上具有相似性,且卷积云数量有限,因此将卷积云和卷层云合并为一类,其余各属单独划分,最终形成9个分类,并据此对AI样本库进行标注(表3)。

表3   张掖市不同地区云状出现频次及云分类

Tab.3  Frequency of cloud types and cloud classification in different regions of Zhangye City

云族云属云码分类标签出现频次/次百分比/%
临泽山丹张掖民乐肃南高台合计
高云卷积云Cc119321114400.4
卷层云Cs100000000
卷云Ci29607416648871 0058105 06744.8
中云高积云Ac38335174134539694983 68332.6
高层云As41842501712871242221 23811.0
低云雨层云Ns51189869510.5
层云St613111071319730.6
层积云Sc71117424514341631.4
积雨云Cb8775897430.4
积云Cu9117223681672431259438.3

新窗口打开| 下载CSV


1.2.4 AI样本库构建

AI样本库的构建包括特征量提取、辅助资料提取、云分类标注及样本筛选等关键步骤,详细流程见图2

图2

图2   AI样本库构建流程

Fig.2   The construction process of the AI sample library


1)格式解析

毫米波云雷达的四类数据文件(质控后基数据、订正后反射率、液态水含量、有效粒子半径)存储结构一致,仅数据内容有所差异。以质控后基数据为例:文件由公共块和径向数据块构成,前者记录站点和任务等基础信息,后者包括多个子块,每个子块由径向头(观测要素及空间大小)、径向数据头(采样数量与存储规则)和径向数据(探测值)组成。观测要素包括反射率、径向速度和谱宽,每个要素含500个采样点,共计1 500个数据,径向分辨率为30 m、时间分辨率1 min、最大探测距离15 m(胡树贞等,2022;任丹阳等,2023;李慧等,2023;顾桃峰等,2023;张德玉等,2024a;张德玉等,2024b;张德玉等,2024c;王卫民等,2024)。

2)特征量提取

以反射率为例,定义序列Xkk为采样点,k=1,2,3,……,500)为第k个高度层的反射率因子,采样间隔D为30 m。通过逐点扫描,提取连续存在回波的区段并视为1层云体(张晋茹和杨莲梅,2019;陈冬冬等,2019;黄兴友等,2020;张志坚等,2020;胡树贞等,2020)。

Z=k=SEXkZa=ZE-SZm=maxXS,XS+1,XS+2,...,XEZn=minXS,XS+1,XS+2,...,XE

式中:Z为总反射率,Za为平均反射率,Zm为最大反射率,Zn为最小反射率,单位均为dBZ;SE为该层的起始索引和结束索引。

Hb=L+S×DHt=L+E×DTh=(E-S)×D

式中:HbHt分别为云底高度和云顶高度,L为探测起始距离,Th为云层厚度,单位均为m。

3)辅助资料提取和样本筛选

辅助资料包括全天空成像仪总云量、自动气象站逐小时观测资料(包括区站号、总云量、天气现象、高、中、低云状)及人工观测云状记录。

张掖外场毫米波云雷达为固定天线,仅观测天顶方向(90°仰角),而人工和自动站则面向全天空,观测覆盖范围存在差异。理论上,总云量越接近10成,云雷达数据越能代表全天空状况。以总云量作为阈值进行样本筛选时需在代表性和数量之间权衡,阈值过高会造成样本量太小,难以满足模型训练需求;阈值过低,则数据代表性不足,降低结果可靠性。经反复测试,最终选取总云量≥8成作为筛选阈值。此外,降水天气会显著影响毫米波云雷达的探测性能,为保证数据质量,结合自动站天气现象资料,剔除所有降水时段样本。依上述标准处理2023年5月1日至2024年4月30日的文件与数据,共获样本64 258条,经总云量与降水条件双重筛选后得到有效样本20 090条。

4)云分类标注

毫米波云雷达可穿透观测多层云,而人工与地面自动站观测仅限于视觉识别,导致云层数目存在差异,难以直接标注。对无法直接标注的样本,引入半监督分类方法,对未标注样本进行二次标注。比较转导支持向量机(Transductive Support Vector Machine,TSVM)、自训练分类器和标签传播算法三者的分类精度,结果表明转导支持向量机准确率最高,因此最终选择该算法。首先利用有标注样本训练初始支持向量机(Support Vector Machine,SVM)分类器,并对未标注样本进行预测,随后基于最大化间隔准则,迭代更新分类边界及样本标注,直至收敛或达到迭代次数上限。由于TSVM本质为二分类算法,多分类问题通过“一对一”方式转化为多个二分类任务实现。标注流程如图3所示,主要有以下4个步骤:1)依据《地面气象观测规范》(全国气象仪器与观测方法标准化技术委员会,2017)中各云属常见云底高度范围,结合观测数据将样本初步划分为高云、中云和低云;2)利用人工观测资料对各类样本进行标注;3)结合自动站观测数据进行辅助修正;4)采用TSVM对剩余未标注样本进行迭代标注。

图3

图3   云分类标注流程

Fig.3   Cloud classification labeling process


2 模型训练与评估

全部样本经洗牌与标准化处理,划分为训练集与测试集,各占样本总数的75%、25%。选择最佳特征量,依次输入支持向量机、逻辑回归、决策树、随机森林4种机器学习算法开展模型训练,各类学习模型借助网格搜索交叉验证(GridSearchCV)进行最佳参数匹配。训练结束后,通过模型评估和对比分析确定最佳模型。

2.1 特征量选择

特征量选择旨在从原始特征集合中筛选出对模型预测性能起关键作用的变量(陈挺等,2025),以减少冗余和过拟合风险。特征选择方法主要有3类:过滤法(Filter)、包裹法(Wrapper)和嵌入法(Embedded)(李郅琴等,2019),本文采用过滤法,具体流程如下:首先,采用方差阈值法剔除方差低于阈值0.1的特征,保留约80 %的主要特征;其次,通过卡方检验评估特征与目标变量的相关性,剔除低相关性特征;最后,结合相关系数和协方差矩阵筛选与目标变量高度相关的特征,最终获得27个特征量(表略)。

2.2 模型参数选择

采用GridSearchCV优化参数的基本流程为:1)明确参数(学习率、正则化参数等超参数)及候选取值范围;2)遍历所有参数组合,并交叉验证评估模型性能。其中交叉验证是将数据集划分为k个子集,每次选取其中一个子集作为验证集,剩余部分作为训练集,最终将平均值作为评估结果;3)根据交叉验证结果选择最优参数配置。

2.3 模型评估指标

主要有准确率(Accurcay)、精确率(Precision)、召回率(Recall)、F1分数、混淆矩阵、受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)、曲线下面积(Area Under the Curve,AUC)等,具体公式如下:

Accurcay=TP+TNTP+TN+FP+FNPrecision=TPTP+FPRecall=TPTP+FNF1=2×Precision×RecallPrecision+RecallFPR=FPTN+FP

式中:Accuracy为分类正确的样本数占总样本数的比例,用于衡量模型整体的分类性能;TP为真正例,即实际为正类且被模型判定为正类的样本数量;TN为真负例,即实际为负类且被模型判定为负类的样本数量;FP为假正例,即实际为负类但被模型判定为正类的样本数量;FN为假负例,即实际为正类但被模型判定为负类的样本数量;Precision为模型判定为正类的样本中,真正例的比例,用于衡量正类预测的准确性;Recall也叫真正率,即在实际为正类的样本中,被模型正确判定为正类的样本所占比例,表示模型对正类的覆盖程度,TPR含义同召回率;F1为Precision和Recall的调和平均,取值范围为0~1;FPR为假正率,即实际为负类但被预测为正类的样本比例;;混淆矩阵用于直观展示分类模型预测结果与实际观测结果之间的对应关系。

ROC是以FPR为横坐标,TPR为纵坐标绘制的曲线,反映模型在不同阈值下的性能表现;AUC表示ROC下的面积,取值范围为0.5~1.0,数值越大表示模型性能越好;宏平均是对每个类别分别计算AUC后取算数平均,能够反映各类别的整体表现;微平均是将所有类别的混淆矩阵元素相加,计算总体的TPR和FPR,进而得到微平均AUC。

2.4 最优模型选择

通过对比4类算法在测试集上的性能,结果表明SVM的各项评估指标上均表现最佳(表4),因而被确定为最终模型。

表4   各种模型评估指标

Tab.4  Evaluation indicators of each model

模型准确率精确率召回率F1分数均值综合排名
支持向量机0.940.850.780.810.851
逻辑回归0.890.630.600.610.682
决策树0.880.490.460.460.573
随机森林0.880.460.410.410.544

新窗口打开| 下载CSV


2.5 支持向量机在各分类上的评估

评估结果如图4所示,训练集的表现整体优于测试集。性能指标中,测试集的分类2、3、9表现最好,分类8和1表现最差;混淆矩阵主要数值集中在对角线上,表明模型整体分类效果良好,测试集上,分类2、3、9表现最好,分类8和1表现最差;微平均和宏平均AUC均在0.98以上,进一步表明模型整体性能优异。测试集的各分类中,AUC均在0.95以上,其中分类2、9、3表现最佳,分类8和1表现最差。

图4

图4   支持向量机模型9类云训练集(a、c、e)和测试集(b、d、f)的分类性能指标(a、b)、混淆矩阵(c、d)和ROC(e、f)

Fig.4   Classification performance metrics (a, b), confusion matrix (c, d), and ROC curves (e, f) of the SVM model for the 9-class cloud dataset on the training set (a, c, e) and test set (b, d, f)


综上,支持向量机在各分类上的整体表现良好。其中,分类效果最佳的是2、9、3类,最差的是8和1类。由图5可见,分类2、9、3样本数量最多,分类8和1样本数量最少。样本数量与分类效果高度一致,即样本数量越多,分类效果越好;反之则越差,表明模型在各类别的分类效果与样本数量成正比。

图5

图5   各种云分类的样本数量

Fig.5   Sample size of different cloud categories


2.6 特征量重要性评估

进一步采用夏普利可加性解释(SHapley Additive exPlanations,SHAP)方法对支持向量机进行特征量重要性评估(图6),排名前5的特征量依次为云底高度、云顶高度、云体厚度、液态水含量以及订正后反射率,表明几何结构和微物理特征在云分类中起关键作用。

图6

图6   特征量重要性评估

Fig.6   Evaluation of the importance of feature quantities


3 效果检验

为验证模型在实况数据中的适用性,开发了“基于人工和地基器测数据的AI云分类系统”。该系统将毫米波云雷达、全天空成像仪等设备获取的历史与实时数据存储于后台数据库,并通过前台调用AI模型实现云分类功能。系统可连续输出时间分辨率为20 s的云分类产品。张掖外场典型日AI云分类和毫米波云雷达反射率因子如图7所示,实况云状以地面自动站观测数据作为参照标准。2024年5月17日06:00—08:00,模型识别出2层云,低层主要为高积云、积云和层积云,并随时间发生转化,高层为卷云;实况观测到高积云和层积云,整体与模型结果基本一致。2024年9月4日14:00—16:00,模型识别出3层云,低层为积云,中层为高积云,高层为卷云(其中少量层积云属于分类误差);实况观测为积云和高积云,未出现卷云,推测为低层云遮挡所致,模型整体与实况相符。2024年7月18日15:00—17:00,模型在低层识别出降水和积云,在中高层识别出高层云、高积云和卷云;实况显示降水、高积云、高层云和积云,未观测到卷云,整体与模型结果基本一致。2024年7月18日18:00—20:00,模型识别出降水、积云和高积云,且反映出云底高度随时间逐渐升高、降水天气逐渐结束的过程,与实况观测完全一致。

图7

图7   张掖外场2024年5月17日06:00—08:00(a、b)、9月4日14:00—16:00(c、d)、7月18日15:00—17:00(e、f)及7月18日18:00—20:00(g、h)AI云分类(a、c、e、g)和毫米波云雷达反射率因子(单位:dBZ)(b、d、f、h)

Fig.7   AI-based cloud classification (a, c, e, g) and millimeter-wave cloud radar reflectivity factors (Unit: dBZ) (b, d, f, h) from the Zhangye field campaign during the periods of 06:00-08:00 on 17 May (a, b), 14:00-16:00 on 4 September (c, d), 15:00-17:00 on 18 July (e, f), and 18:00-20:00 on 18 July (g, h), 2024


4 讨论和结论

4.1 讨论

基于以上个例和系统性分析,发现毫米波云雷达可探测到最多的云层信息,地面自动站次之,人工观测最少,三者存在明显的层次性包含关系。说明自动站数据可作为人工观测的有效补充,甚至在部分情景下替代人工观测用于云分类标注。地面自动站与人工观测结果具有较高一致性,而人工观测的标注成本较高,因此利用自动站数据进行云分类标注具有可行性和效率优势,尤其适合大范围、长时序研究。样本数量不均衡明显影响分类效果,样本数量较少的云类识别效果较差,验证了样本均衡性对模型训练的重要性,在构建AI样本库时,应尽可能保证各分类样本均匀分布,以提高模型泛化能力。弱降水条件下,雷达探测的“云底”往往实际为“雨底”,易引起分类偏差。本研究提出将云和降水分开识别,并规定当云底高度低于200 m时统一识别为降水,以改善识别精度,但该阈值仍需进一步优化。单部雷达的一致性问题影响较小,但在未来多部雷达或跨厂家设备融合研究中,回波强度差异可能对分类结果产生显著影响,需要开展一致性校准与评估。

4.2 结论

本文基于2023年5月1日至2024年4月30日张掖外场的毫米波云雷达和全天空成像仪资料,结合人工和地面自动站观测的云状及天气现象,通过“确定云状分类、特征量提取、辅助资料提取、样本筛选、样本标注”等步骤,构建了多源融合的AI样本库。采用支持向量机、逻辑回归、决策树、随机森林4种算法进行训练和评估对比,最终确定支持向量机为最优模型。该模型可实现卷积云、卷云、高积云、高层云、雨层云、层云、层积云、积雨云、积云9类云状及降水天气的自动识别,准确率、精确率、召回率、F1分数分别达0.94、0.85、0.78和0.81。与已有研究相比,云状识别种类提升约33%,准确率提高约15%(余安安等,2021;喻皓,2024)。基于该模型开发的“基于人工和地基器测数据的AI云分类系统”进一步验证了其应用效果,结合地面自动站数据的典型个例分析表明,模型能够准确识别垂直方向上的多层云结构,有效弥补了“天气现象视频智能观测仪”纯视觉识别的不足。

相比CNN视觉识别方法(喻皓,2024),本文模型通过引入毫米波云雷达数据,显著改善了对云垂直结构的探测能力;在多源数据融合方面,也较BP神经网络更具优势,能够整合多类观测数据以增强模型泛化能力。尽管BP神经网络具备自动特征提取的优点,但在样本数量有限时其学习效果较差;本文通过人工特征提取结合多算法对比选择的方法,提升了模型的稳定性与适应性。

综上所述,本文在数据融合和方法论上均有明显改进,在云状识别种类、识别精度以及时间分辨率方面均较现有方法有显著提升,具备较高的业务化应用潜力。但由于研究基于单站资料,样本规模和空间分布存在局限,未来仍需通过引入更多站点及更长时间序列的数据,进一步优化模型性能,并最终实现对《地面气象观测规范》(全国气象仪器与观测方法标准化技术委员会,2017)中10属云状的全面自动识别,为构建面向未来的智能化云观测系统提供参考。

参考文献

陈冬冬, 赵静, 王柏林, , 2019.

FY-2F卫星和毫米波云雷达云高观测的个例对比分析

[J]. 气象科技, 47(3):495-501.

[本文引用: 1]

陈挺, 刘香君, 臧璇, , 2025.

深度特征选择方法研究综述

[J]. 计算机应用与软件, 42(7):1-11.

[本文引用: 1]

顾桃峰, 岳海燕, 伍光胜, , 2023.

毫米波云雷达与激光云高仪气象探测性能对比分析

[J]. 环境科学学报, 43(1):275-283.

[本文引用: 1]

郭立平, 刘姝, 李敬海, , 2024.

毫米波云雷达在高影响天气中的预警应用

[J]. 干旱气象, 42(3):465-472.

DOI      [本文引用: 1]

为提高城市高影响天气的精细化预报预警水平,利用雄安新区2020年1月—2023年12月容城气象站Ka波段毫米波云雷达反射率因子、径向速度等7种产品及地面气象资料和天气学、雷达回波图像形态分析等方法对雄安新区暴雨、大风、雾、霾及沙尘等高影响天气进行分析。结果表明:1)云雷达对含降水的高影响天气云体探测结构清晰、垂直分布特征直观。当春、夏、秋季回波强度≥21 dBZ(冬季≥15 dBZ)、伸展高度≥5 km(冬季≥2 km)的云体出现,且云体最低高度达150 m时,可看作地面降水将出现的特征指标,时间提前量平均达20 min左右,当回波强度减弱、云底高度抬升,降水趋于结束;各级降水中,暴雨的强回波伸展高度、云水含量等最大。2)当回波顶伸展高度达8 km之上而后快速下落至云顶高度≤2 km时,地面易出现8级以上大风,降水伴大风的回波特点为强回波区中形成明显的U或V型缺口,缺口区最大径向速度达12.5 m·s<sup>-1</sup>左右。3)云雷达反演滴谱数据产品可较好反映各级降水的粒子分布特征;垂直积分液态水含量(Vertically Integrated Liquid Water,VIL)对降水伴大风有预警指示意义,提前量0~30 min或以上。4)非含降水的高影响天气(雾、霾、沙尘等),云雷达回波强度等整体偏弱,各天气现象之间界限不清晰,但与降水天气发生转换时云雷达能快速、清晰地探测出降水云体,有利于提升降水的精细预报预警能力。

胡树贞, 曹晓钟, 陶法, , 2020.

船载毫米波云雷达观测西太平洋云宏观特征对比分析

[J]. 气象, 46(6):745-752.

[本文引用: 1]

胡树贞, 陶法, 张雪芬, , 2022.

基于毫米波云雷达的寒潮过程回波特征分析

[J]. 气象水文海洋仪器, 39(1):8-11.

[本文引用: 1]

黄兴友, 陆琳, 洪滔, , 2020.

利用毫米波云雷达数据反演层云微物理参数和云内湍流耗散率

[J]. 大气科学学报, 43(5):908-916.

[本文引用: 1]

姬雪帅, 王丽婧, 郭宏, , 2022.

基于多源观测资料对张家口一次雨雪天气降水相态特征的分析

[J]. 干旱气象, 40(3):507-515.

DOI      [本文引用: 1]

利用ERA5再分析资料及云雷达、微波辐射计和SA双偏振多普勒雷达等多源观测资料,分析2020年11月17&#x02014;19日张家口地区一次雨雪天气的降水相态演变特征。结果表明:在高空低槽、中低层低涡与地面倒槽配合下,高空槽后西北气流引导冷空气南下造成气温迅速下降,导致降水相态变化。过程前期整层大气均为强暖平流,且地面气温较高,降水相态为雨。18日傍晚冷平流发展强烈,各层温度迅速降低,整层变为冷层,导致降水相态转换为雪。散度和垂直速度的诊断表明降雨时段的动力强迫主要位于高层,降雪时段则主要位于低层。云雷达高分辨率资料可以反映0 ℃层变化,大于10 dBZ的质心变化可以指示降水强度变化,降雨时的基本速度最大可达6~8 m&#x000b7;s<sup>-1</sup>,而降雪时则小于 2 m&#x000b7;s<sup>-1</sup>。微波辐射计高分辨率时空资料可以准确判断雨雪转换时间,降水开始之前3~5 h积分水汽含量出现跃升与峰值。双偏振雷达和微波辐射计结合可以对降水粒子相态实现准确判断,可用于降水相态转换的临近预报。

李晨蕊, 伏晶, 刘维成, , 2022.

应用FY卫星产品分析陇东半干旱区特大暴雨事件云特征

[J]. 干旱气象, 40(6):954-967.

DOI      [本文引用: 1]

降水与云的发生发展密切相关,研究强对流云特征,对降水机理分析、降水监测和预报具有重要意义。2022年7月15日地处西北半干旱区的甘肃陇东出现一次特大暴雨过程,多站日降水量和小时降水量均突破历史极值,本文基于FY-4A、FY-4B静止卫星扫描成像辐射计(advanced geostationary radiation imager, AGRI)数据,FY-3D极轨卫星微波湿度计(micro-wave humidity sounder, MWHS)和微波温度计(micro-wave temperature sounder, MWTS)融合产品,分析此次特大暴雨事件中云宏微观特征、云系演变特征及大气环境条件。结果表明:(1)暴雨云系的云顶类型为过冷水云、混合云、不透明冰云和多层云等,发生强降水的云顶类型以不透明冰云为主,云顶高度达14 km以上;暴雨云系云体深厚,主要为小粒径冰云且伴有强烈上升气流。(2)此次暴雨事件存在对流云团新生、合并及加强过程,对流云团稳定维持是导致特大暴雨发生的主要原因,降水与云顶相当黑体亮温(black body temperature, TBB)及其变化的关系密切,TBB低值区对应强降水,且强降水发生前TBB迅速下降。(3)强降水发生前大气层结表现出浅层对流不稳定的特征,中低层强烈增湿是对流不稳定发展的主要原因,低层绝对湿度的差异造成了不稳定条件及降水量级的差异。

李海飞, 乐满, 杨飞跃, , 2017.

基于地基云雷达资料的淮南地区冬季云宏观特征

[J]. 干旱气象, 35(6):1 011-1 014.

[本文引用: 1]

李慧, 郑旭程, 苏立娟, , 2023.

基于毫米波云雷达的黄河流域内蒙古段云宏观特征分析

[J]. 干旱气象, 41(3):434-441.

DOI      [本文引用: 2]

云是地-气系统的重要组成部分,云宏观特征不仅与地-气系统的辐射收支及区域气候变化密切相关,还直接影响云降水过程模式预报的准确性,鉴于此本文基于2020年8月至2021年7月呼和浩特地区毫米波云雷达观测数据,对黄河流域内蒙古段云出现频率及垂直结构进行统计分析。结果表明:该地区多以晴空为主,全年晴空廓线超过了云雷达总采样廓线的70.00%,相比而言,云出现频率较小,6月最高值也仅为43.84%。云类型以中高云为主,云底高度多出现在3.00~4.00 km之间,云层较薄,厚度介于0.50~1.00 km的云出现频率最高。云宏观属性存在明显的季节变化和日变化特征,春季和夏季云的出现频率较高,分别为39.71%和35.77%,冬季云的出现频率最小,春、夏、秋季午后云出现频率明显高于上午时段。

李郅琴, 杜建强, 聂斌, , 2019.

特征选择方法综述

[J]. 计算机工程与应用, 55(24):10-19.

DOI      [本文引用: 1]

特征选择作为一个数据预处理过程,在数据挖掘、模式识别和机器学习中有着重要地位。通过特征选择,可以降低问题的复杂度,提高学习算法的预测精度、鲁棒性和可解释性。介绍特征选择方法框架,重点描述生成特征子集、评价准则两个过程;根据特征选择和学习算法的不同结合方式对特征选择算法分类,并分析各种方法的优缺点;讨论现有特征选择算法存在的问题,提出一些研究难点和研究方向。

刘光普, 黄思源, 梁莺, , 2019.

毫米波雷达在港口海雾观测和能见度反演中的应用

[J]. 干旱气象, 37(6):993-1 004.

[本文引用: 1]

路志英, 王长桥, 王萍, , 2000.

用小波分析提取云图纹理梯度特征

[J]. 模式识别与人工智能, 13(4):434-438.

[本文引用: 1]

倾鹏程, 陶法, 胡树贞, , 2022.

联合毫米波测云仪和全天空成像仪云分类方法

[J]. 广东气象, 44(2):73-77.

[本文引用: 1]

全国气象仪器与观测方法标准化技术委员会, 2017. 地面气象观测规范总则:GB/T 35221—2017[S]. 北京: 中国标准出版社.

[本文引用: 3]

任丹阳, 曹梅, 王瑞英, , 2023.

毫米波云雷达及探空反演的云垂直结构对比分析

[J]. 陕西气象(6):1-9.

[本文引用: 1]

宋冬昊, 王文明, 王敏仲, , 2025.

基于轻量级梯度提升机对毫米波雷达云回波数据分类

[J]. 科学技术与工程, 25(17):7 072-7 079.

[本文引用: 1]

孙学金, 刘磊, 高太长, , 2009.

基于模糊纹理光谱的全天空红外图像云分类

[J]. 应用气象学报, 20(2):157-163.

[本文引用: 1]

王卫民, 徐八林, 雷勇, , 2024.

Ka波段毫米波云雷达对青藏高原东南缘降水回波的分析

[J]. 气象, 50(3):291-302.

[本文引用: 1]

夏德深, 金盛, 王健, 1999.

基于分数维与灰度梯度共生矩阵的气象云图识别(Ⅱ):灰度梯度共生矩阵对纹理统计特征的描述

[J]. 南京理工大学学报, 23(4):289-292.

[本文引用: 1]

徐路扬, 翟亮, 王媛媛, , 2023.

多源遥感数据在北京春季沙尘天气监测中的应用评估

[J]. 干旱气象, 41(2):318-327.

DOI      [本文引用: 1]

利用2021年春季影响北京的3次沙尘(暴)天气过程(3月15日、28日和4月15日)中激光雷达、激光云高仪和云雷达3种遥感探测设备的探测数据,北京4个国家气象站能见度观测及北京市生态环境监测中心PM<sub>10</sub>监测数据,综合分析3种遥感探测设备对沙尘监测的特点及优劣,以期提高沙尘天气预报预警技术。结果表明:激光雷达的消光系数和退偏振比可以较准确地区分沙尘气溶胶和大气污染物,在边界层和对流层中下层沙尘表现为高消光系数(&gt;0.30 km<sup>-1</sup>)和高退偏振比(&gt;10%);云高仪的近地面后向散射系数、云底高度与PM<sub>10</sub>质量浓度、能见度变化有较好的对应关系,也能通过近地面后向散射系数的陡增和云底高度的下降来判断沙尘沉降;云雷达能探测到边界层(0~2 km)内的沙尘和对流层中上层(6~10 km)的沙尘云,且能探测垂直速度。综合来看,激光雷达是3类遥感探测设备中唯一能够区分沙尘和大气污染物的设备;云高仪在近地面层对沙尘的监测效果较好,且能够判断沙尘的持续时间;云雷达的探测距离最远且能探测垂直速度。

杨晓, 黄兴友, 杨军, , 2019.

毫米波雷达云回波的自动分类技术研究

[J]. 气象学报, 77(3):541-551.

[本文引用: 2]

余安安, 吴雪菲, 李栋, , 2021.

基于神经网络的毫米波测云雷达云状识别研究

[J]. 国外电子测量技术, 40(4):82-86.

[本文引用: 3]

喻皓, 2024.

基于卷积神经网络的地基云人工智能分类器研究

[J]. 自动化与仪器仪表(2):24-28.

[本文引用: 2]

张德玉, 秦三杰, 魏荣妮, , 2024a.

天气雷达实时回波省级直显系统设计与应用

[J]. 计算机技术与发展, 34(11):21-28.

[本文引用: 1]

张德玉, 魏荣妮, 张强, , 2024b.

天气雷达基数据通用工具包设计与实现

[J]. 信息技术与信息化(5):153-156.

[本文引用: 1]

张德玉, 张启超, 张强, , 2024c.

基于天擎的天气雷达基数据显示分析系统

[J]. 气象水文海洋仪器, 41(4):112-115.

[本文引用: 1]

张晋茹, 杨莲梅, 2019.

基于毫米波云雷达的伊犁河谷两次强降雪过程云特征观测分析

[J]. 沙漠与绿洲气象, 13(5):41-48.

[本文引用: 1]

张艳品, 章文星, 吕达仁, , 2014.

卫星(IASI探测仪)观测云顶高与地基云雷达观测的对比验证

[J]. 大气科学, 38(5):874-884.

[本文引用: 1]

张志坚, 张静, 蔡英琪, 2020.

毫米波云雷达系统观测试验结果分析

[J]. 气象水文海洋仪器, 37(3):17-20.

[本文引用: 1]

周著华, 白洁, 刘健文, , 2005.

MODIS多光谱云相态识别技术的应用研究

[J]. 应用气象学报, 16(5):678-684.

[本文引用: 1]

MING H, WANG M Z, WEI M, et al, 2021.

Study on the clouds detected by a millimeter-wave cloud radar over the hinterland of the Taklimakan Desert in April-June 2018

[J]. Journal of Meteorological Research, 35(6): 1 074-1 090.

DOI      [本文引用: 1]

TAN Z H, WANG J, GUO J P, et al, 2024.

Improving satellite-retrieved cloud base height with ground-based cloud radar measurements

[J]. Advances in Atmospheric Sciences, 41(11): 2 131-2 140.

DOI      [本文引用: 1]

/