• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于改进的VGG16模型的副热带高压相似识别及应用评估*

    时间:2023-06-17 15:10:05 来源:雅意学习网 本文已影响 雅意学习网手机站

    周必高 鲁小琴 郑 峰 黄克慧 洪水洁 谢海华 赵兵科

    1 浙江省温州市气象局,温州 325000 2 浙江省温州市台风监测预报技术重点实验室,温州 325000 3 中国气象局上海台风研究所,上海 200030 4 四创科技有限公司,福州 350000

    提 要:
    台风预报除常规方法外,查找历史相似作为预报和决策的参考依据是常用手段,但从海量历史台风中检索相似费时费力。提出了一种基于改进的视觉几何组模型VGG16的副热带高压(以下简称副高)相似检索方法,进行基于副高相似的历史相似台风查询。通过对1979—2020年台风季19 736个对应时次的副高图像提取、数据增强、模型学习和优化,并以学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)作为副高相似的度量指标,最终建立了改进的VGG16模型。试验结果表明,使用该模型可以找出较为相似的历史台风,模型检索得到的排名第一的历史相似台风与目标台风相似度高达92.55%,该方法可为台风预报业务人员提供了积极参考。同时,该模型相较于传统的人工识别,识别时间较短、检索效率高,可在业务及科研中推广应用。

    我国地处太平洋西岸,海岸线漫长,从广西到辽宁常年都会受到台风的影响(陈联寿和丁一汇,1979)。尤其在夏季,沿海及内陆受台风影响地区常常会因台风袭击而造成人员伤亡和重大财产损失,因此精准的台风路径、强度及风雨影响预报对保障人民的生命财产安全具有重大的现实意义。台风路径预报的准确性是开展防台减灾服务的基础。气象学家们针对台风路径预报的方法发展了大量统计或动力模型,同时也发现历史相似台风能够为台风路径、强度和风雨预报提供非常有价值的参考信息。已有的历史台风相似检索大多基于人工主观判别进行或者针对台风路径空间相似开展(刘勇等,2006;
    王远飞等,2006;
    鲁小琴等,2013;
    徐高扬和刘姚,2019),但存在以下问题:(1)历史数据中采用人工识别查找历史相似台风。该方法判别时间长,不能满足预报决策的实时性需求。(2)基于空间相似的历史台风自动检索。该方法速度快,但找到的历史相似台风,大部分由于和目标台风所对应的大尺度环境流场存在差异,并且造成的风雨影响及灾害也各异,因而此类相似台风并不一定属于气象意义上的相似台风。在此基础上,预报员们提出能否根据台风环境场的相似去查找历史相似台风,进而为当前台风预报和防台减灾决策提供更为科学且专业的参考。

    台风的移动受到各种复杂因素的影响,但实践表明牵引运动是最主要的因素,因此大型气压场的分布及与此相应的大范围深厚的基本气流是台风路径预报的重要根据(陈联寿和丁一汇,1979)。其中,副热带高压(以下简称副高)就是影响台风移动路径的一个非常重要的大型环流系统,其周期变化、形状特征及与西风槽的相互作用等,很大程度上引导着未来台风走向及可能带来的风雨影响。因此以副高相似来查询得到的历史相似台风,可能可为当前台风的路径及风雨影响预报提供较为精准的辅助资讯。

    科学家们已经开展了很多有关气象要素场的相似研究,大多基于格点数据进行距离或相关分析(李开乐,1986;
    罗阳,1996;
    罗阳和赵伟,2008;
    丁晨晨等,2019;
    黄小玉等,2019;
    宋文彬等,2020),并未针对某个特定的环流系统开展。事实上影响台风移动的副高具有特定的形状和相对的地理空间分布(如距离大陆远近等),因此具有图像特征识别功能的神经网络技术对实现大区域环境场中副高的识别和提取,并进行相似判定具有非常大的优势。且神经网络技术已在各行各业开展了大量的研究和应用,如人脸识别(吴素雯和战荫伟,2017)、字符识别(葛明涛等,2014)和语音识别(Xue et al,2014)等。气象领域中,黄小燕和金龙(2013)在综合考虑台风移动路径的气候持续因子和数值预报产品动力预报因子的基础上,建立了基于主成分分析的人工智能台风路径预报模型,预报精度高于气候持续法;
    叶小岭等(2014)基于主成分分析及RBF神经网络开展了浙江省台风灾害损失预测;
    代刊等(2013)基于自组织神经网络算法分析了华北区域夏季天气气候学特征;
    陈文兵等(2019)利用G-CNN模型开展了浓雾天气形势识别。以上研究表明基于一般神经网络技术在气象领域进行天气特征识别(如浓雾)或预报预测(如台风路径和强度、灾害等)已取得了一些成效,但采用神经网络技术对台风大尺度环境场中的副高进行识别和判定,成果鲜见。

    本文拟基于卷积神经网络(convolutional neural network,CNN)的视觉几何组模型(visual geo-metry group,VGG16)(Lecun et al,1998;
    Simonyan and Zisserman,2016)来识别台风大尺度环境场中的副高,并以学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)(Wang et al,2004)作为图像相似度量指标,建立副高相似的识别算法,进而开展对应历史相似台风查询,以期为台风路径预报提供更高效而精准的参考信息。

    1.1 数据说明

    本文中大尺度环境场主要用500 hPa位势高度来表征,资料来自ERA5再分析数据集(https:∥cds.climate.copernicus.eu/)。资料集覆盖时间范围为1979—2020年,时间分辨率为6 h(逐日00、06、12和18时,世界时,下同);
    空间范围为90°S~90°N、180°E~180°W,空间分辨率为1°×1°。为节约计算资源,只截取本研究关注的西北太平洋区域(10°S~75°N、75°E~165°W),用于开展对历史副高的识别和相似检索分析。

    台风路径数据(Ying et al,2014;
    Lu et al,2021)来自中国气象局热带气旋资料中心的台风最佳路径数据集(https:∥tcdata.typhoon.org.cn/zjljsjj_zlhq.html),包含1979—2020年发生在西北太平洋及南海地区的逐台风记录时间、中心经度和纬度、中心最大风速和最低气压,时间分辨率为6 h(逐日00、06、12和18时)。

    1.2 数据预处理

    为了便于后续算法模型对副高的识别,对ERA5再分析数据进行预处理:(1)数据提取。读取500 hPa位势高度层网格数据,并提取大于5880 gpm的格点数值用来表征副高。(2)数据清洗。采用图像形态学算法中的腐蚀和膨胀运算等技术,对部分孤立点、边缘处裂痕等异常数据进行剔除或弥补,对提取得到的副高图像进行边缘光滑,以提高副高相似分析的准确性。(3)近似多边形提取。采用Canny边缘检测技术,提取副高边缘上的离散点并连接形成多边形,将其作为最终副高轮廓。图1为2019年8月5日00时台风环境场和预处理提取得到的副高对照图,可见该时刻台风中心位于副高西南侧,在副高的影响下呈西北行趋势;
    而预处理提取到了完整的副高形态和分布。

    图1 2019年8月5日00时(UTC)(a)台风环境场和(b)预处理提取的副高(黑色三角形:台风中心位置) Fig.1 Comparison of (a) environmental field of typhoon and (b) extracted subtropical high at 0000 UTC 5 August 2019(black triangle: typhoon center)

    2.1 CNN基本结构

    CNN由输入层、隐含层和输出层组成(图2),隐含层中又包含卷积层、池化层和全连接层(Zeiler and Fergus,2014)。其中,在卷积层中,利用设定大小的卷积核和指定步长在输入图像(原图或特征图)上进行滑动并做卷积计算,该层的作用是提取输入图像的主要关键特征;
    池化层的作用是对提取的特征进行抽样,在减轻网络模型过拟合程度(Matsugu et al,2003)的同时可以减小后续运算量。卷积层和池化层合作,实现对输入图像的特征提取并抽样降维,能提取出副高形态中最具有代表性的关键特征;
    卷积层和池化层一般交替出现在网络中,一个卷积层加一个池化层被称为一个特征提取过程。最后,全连接层负责把提取的特征图连接起来,通过分类器得到最终的分类估算结果(郑泽宇等,2018)。

    图2 卷积神经网络结构示意图Fig.2 Structure diagram of convolutional neural network

    2.2 VGG16模型

    VGG16是CNN的一个经典模型,该模型具有5个卷积组(13个卷积层)和3个全连接层(图3),在使用同等大小卷积核的条件下,提升了网络的深度和效果(Simonyan and Zisserman,2016)。其网络结构非常一致,全部使用3×3卷积和2×2池化。该模型相比于其他卷积神经网络模型,主要采用连续的3×3的小卷积核代替较大卷积核。对于给定的特征图,连续采用小卷积核堆积的策略要优于大的卷积核,因为较高深度的多层非线性层能使卷积神经网络学习更复杂的模态,并且需要的参数较少,模型的计算代价更小,一定程度上提升了神经网络的效果。

    图3 VGG16网络架构Fig.3 Network architecture of VGG16

    2.3 LPIPS度量指标

    LPIPS也被称为“感知损失”,用于度量两张图像之间的相似程度。本研究当中主要使用LPIPS来度量两幅副高图像的相似程度。该指标在视觉相似性判断上更接近人类感知(Zhang et al,2018)。其计算公式如下:

    (1)

    为了便于比较输出图像相似度,副高x与x0的图片相似度P定义为:

    P(x,x0)=[1-d(x,x0)]×100

    (2)

    3.1 改进的VGG16副高识别模型构建

    VGG16模型是基于大图像数据库(ImageNet)训练而成的,具备较强的深度特征学习能力的参数和权重网,特别是对卷积层输入的图像轮廓、边缘、曲线等特征提取具有较强的能力。因此,为减少网络训练时间和提高网络训练效率,将已训练好的VGG16模型作为预训练模型,采用迁移学习的方式(关胤,2019),引入副高识别模型进行卷积层、池化层再训练。VGG16模型的输入和网络架构参数设置改进如下文所述,模型训练流程如图4所示。

    图4 副高相似识别模型训练流程图Fig.4 The training flow chart of similarity recognition model of subtropical high

    3.1.1 训练样本

    将输入的三通道彩色图改变为单通道灰度图,输入尺寸由224×224×3改为86×44×1。图像灰度化并框定小区域之后可以大幅减少计算量,同时可重点突出副高在大尺度环境场中的空间位置和大小。设置数据集中用于学习和测试的样本比例分别为80%和20%。

    3.1.2 数据增强

    为弥补CNN训练需要海量的数据样本而当前历史副高图库中的样本数量较少的缺陷,采用数据增强的方法,对已有的数据样本进行翻转、剪裁、高斯噪声等处理,并生成新的数据样本来补充原图库样本资料集,由此扩大了训练集和测试集的样本数量,同时提高了模型的泛化能力,并减少过度拟合。

    3.1.3 网络架构参数设置

    设定本模型中使用3个卷积组,网络架构的轻巧化有利于快速提取副高图像的特征数据;
    每个卷积组设定只含2个卷积层和1个池化层,但为充分提取副高细微图像特征,在个别卷积组中增加卷积核的数目;
    同时只进行图像特征提取,即去掉分类器,只包括卷积层、池化层和全连接层。

    3.2 模型训练

    模型训练采用Tensorflow深度学习框架,处理器使用Intel酷睿i7—9700,机器内存为16 GB,优化器使用Adam,批大小为30,学习率为4×10-3,损失函数采用Cross Entropy Loss计算。

    针对1979—2020年台风季19 736个对应时次的副高图像样本,设定8∶2的样本划分比例确定训练集和测试集,对模型进行学习训练(图5)。由图5a 可见,当迭代次数到达20次,该模型的训练集和测试集准确率都明显增加,迭代达80次之后,该模型的训练精准度和损失函数值趋于平衡,其训练集和测试集准确度峰值分别为89.7%和86.5%。从图5b中可以看出,迭代80~100次后,损失函数值达到最小,表明模型已收敛并稳定。保存此时模型结构参数及网络权重为最终副高相似识别模型。

    图5 1979—2020年台风季样本训练过程(a)准确率,(b)损失函数Fig.5 Training process of samples in typhoon season from 1979 to 2020(a) accuracy, (b) loss function

    4.1 模型的试验

    以0309号台风为例(以下称为目标台风),选2003年8月4日06时副高图像(图6a)作为检索目标,利用改进的VGG6模型进行相似检索试验。

    图6 (a)2003年8月4日06时0309号台风及其对应副高,(b~f)相似检索得到的历史相似台风及其对应副高(b)1713号,(c)0708号,(d)0108号,(e)1617号,(f)1319号(黑点:台风中心位置,黑线:前后36 h台风路径)Fig.6 (a) Typhoon No.0309 and its corresponding subtropical high at 06:00 UTC 4 August 2003, (b-f) historical similar typhoons and the corresponding subtropical high obtained by similar retrieval(b) No.1713, (c) No.0708, (d) No.0108, (e) No.1617, (f) No.1319(black dot: location of typhoon center, black line: typhoon track before and after 36 h)

    4.1.1 相似副高图像比较

    利用本模型检索得到的历史相似台风排名前五位的分别为1713号(图6b)、0708号(图6c)、0108号(图6d)、1617号(图6e)和1319号台风(图6f)。图6显示,相似台风对应时刻的副高形状(西伸型)、副高分布范围大小(南北跨度及东西长度)及伸至大陆以西时的略微南掉都非常一致。就视觉感知情况而言,其中1713号台风的对应时刻副高最为相似(图6b),0108号台风的对应时刻副高(图6d)相似度略差。

    4.1.2 LPIPS相似度值的比较

    计算检索得到的排名前五位台风对应时刻副高相似度LPIPS值(表1)。发现1713号台风的对应LPIPS值最高,同视觉感知情况一致;
    但是LPIPS值排在前五位的台风就视觉感知而言其相似程度排序会有不同,这与人眼识别和客观判据的差异有关。

    表1 前五位相似台风对应副高间的LPIPS值Table 1 The LPIPS value of corresponding subtropical high of top 5 similar typhoons

    综上所述可见,利用改进的VGG16模型识别检索到的历史相似台风对应的副高,从视觉特征上看与目标台风的副高大小、位置、形状是一致的,且对应的LPIPS值的大小与视觉特征的相似度也基本匹配。

    4.2 模型效果检验

    为了检验VGG16模型检索到的历史相似副高与目标副高的相似程度,以目标台风对应的2003年8月4日06时副高的相似检索结果为例,针对目标台风和历史相似台风对应时刻的副高区域分别提取近似多边形,分别定义为A和B,通过几何图像算法分别分析其大小(面积)、重心(位置)和形状(轮廓)等几何特征差异 (周必高等,2021),从几何学的角度综合比较其相似程度。

    4.2.1 大小相似度

    采用面积作为参数来衡量副高大小相似程度。获取A和B的面积SA和SB,使用式(3)计算面积相似度:

    SimArea(A,B)=1-abs(SA-SB)/Max(SA,SB)

    (3)

    式中:SA、SB分别为A和B的面积,abs(SA-SB)表示求取SA、SB差的绝对值,Max(SA,SB)为取SA、SB最大值,SimArea(A,B)为A和B间的面积相似度值。以目标副高的相似检索结果为例,面积大小相似度排名前五位如表2所示。

    表2 同表1,但为面积相似度 Table 2 Same as Table 1, but for area similarity

    4.2.2 位置相似度

    提取A和B的质心坐标A(Xa,Ya)、B(Xb,Yb)作为副高中心位置,其中质心定义为副高多边形的几何中心;
    通过欧氏距离计算两质心间的距离,并将距离归一化到[0,1]范围之内,作为位置相似度衡量指标。

    欧氏距离计算公式如下所示:

    (4)

    位置归一化算法如下所示:

    SimDis(A,B)=1/[Dis(A,B)/C+1]

    (5)

    式中:Xa、Ya和Xb、Yb分别为副高质心A和B的坐标,Dis(A,B)为A和B质心间的距离;
    C为A和B的任意边界点间距离的最大值,SimDis(A,B)为归一化后的位置相似度值。位置相似度排名前五位如表3所示。

    表3 同表1,但为位置相似度Table 3 Same for Table 1, but for location similarity

    4.2.3 轮廓相似度

    基于射线的几何匹配方法,以副高近似多边形的几何中心为原点,从原点发出射线与x轴的夹角为Qi,将Qi作为几何形状描述函数的参数,Qi∈[0,2π]。射线分别相交于近似多边形A和B的轮廓边界于点PAi和PBi,分别计算交点PAi和PBi到原点的距离:LA(Qi)=|PAiO|和LB(Qi)=|PBiO|。则A和B在Qi方向上的相似度为:

    (6)

    式中:Max[LA(Qi),LB(Qi)]为取这两个距离中的最大值,Simangle(Qi)则为A和B在Qi方向上的相似度值。

    旋转射线角度与近似多边形A、B连续相交,则A和B的形状轮廓相似度计算公式如下:

    (7)

    式中:M表示射线数量,A(M)=2e-1/M,用来调节差异距离大小,|LA(Qi)-LB(Qi)|为A和B在Qi方向的差距,SimShape(A,B)即为A和B的轮廓相似度。以目标副高的相似检索结果为例,轮廓相似度排名前五位如表4所示。

    表4 同表1,但为轮廓相似度Table 4 Same as Table 1, but for shape similarity

    4.2.4 综合相似度

    利用A和B之间的面积、位置和轮廓相似度进行综合相似度计算,计算公式如下:

    SimLand(A,B)=aSimArea(A,B)+

    bSimDis(A,B)+cSimShape(A,B)

    (8)

    式中:SimLand(A,B)为计算得到的A和B的综合相似度。a、b和c分别表示对应维度的权重值,根据业务应用经验设定a、b和c权重值分别为0.5、0.3 和0.2,综合相似度排名前五位如表5所示。

    表5 同表1,但为综合相似度Table 5 Same as Table 1, but for comprehensive similarity

    综上所述,通过对目标副高和相似副高的几何图像学大小、中心位置和轮廓各维度的比对,发现排名前五位的相似台风的面积如表2所述,相似度排序和VGG16模型检索出的结果完全一致。而相似副高的质心位置如表3所示,相似度排序和VGG16模型得出的结果也基本一致。轮廓相似度排序与模型检索稍有差异,一方面因为对副高本身外围边界的描述算法不尽完善;
    另外副高形态变化快,导致检索得到的相似副高与目标副高轮廓会略有差异。总而言之,基于综合的几何图像学比较了VGG16模型检索得到的相似副高与目标副高的相似度高度一致。表明改进后的VGG16模型在识别副高及查找历史相似副高和对应相似台风的分析中是非常有效的。

    本文针对影响台风路径移动的一个非常重要的大型环流系统——副高的相似度判别,提出了一种基于CNN技术的改进VGG16模型。利用1979—2020年台风季历史样本对模型进行训练和测试,使用LPIPS作为相似度量标准,进行历史副高相似识别。试验表明,通过该方法可以找到历史相似副高所对应的历史相似台风,解决了针对海量历史台风数据进行人工相似识别的难题;
    同时通过几何图像学相似检验其检索效果,结论基本一致。改进的VGG16模型检索效率高,可为预报员开展台风预报和防台减灾决策提供快速且更科学的参考。

    但影响台风移动的副高在时刻发生变化,当前时次相似,下一个时次可能发生较大的改变,故需要综合考虑某个时间段内平均环境场的相似,对台风未来的移动走向趋势引导才具有更重要的预报决策参考意义。另外,本文仅考虑了位势高度值为5880 gpm的副高主体对台风路径移动的影响,实际上有时副高主体的西北侧会向外伸出高压坝或高压脊(位势高度值不等于5880 gpm),其对台风移动也有很好的指示意义。因此,下一步将结合高压坝和高压脊,开展对确定时段内副高区域平均场的相似或者24、48、72 h预报场的相似检索,以期给出综合性更高,更为合理和科学的历史相似台风,为预报决策提供支撑。

    猜你喜欢 台风检索卷积 台风过韩环球时报(2022-09-07)2022-09-07基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02台风来了小读者(2020年4期)2020-06-16卷积神经网络的分析与设计电子制作(2019年13期)2020-01-14从滤波器理解卷积电子制作(2019年11期)2019-07-04台风爱捣乱小哥白尼(趣味科学)(2018年12期)2018-12-18基于傅里叶域卷积表示的目标跟踪算法北京航空航天大学学报(2018年1期)2018-04-20专利检索中“语义”的表现专利代理(2016年1期)2016-05-17国际标准检索质量与标准化(2010年5期)2010-05-03国际标准检索质量与标准化(2010年3期)2010-05-03

    推荐访问:高压 识别 模型

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章