• 工作总结
  • 工作计划
  • 心得体会
  • 领导讲话
  • 发言稿
  • 演讲稿
  • 述职报告
  • 入党申请
  • 党建材料
  • 党课下载
  • 脱贫攻坚
  • 对照材料
  • 主题教育
  • 事迹材料
  • 谈话记录
  • 扫黑除恶
  • 实施方案
  • 自查整改
  • 调查报告
  • 公文范文
  • 思想汇报
  • 当前位置: 雅意学习网 > 文档大全 > 公文范文 > 正文

    基于CNN-GRU和CA-VGG特征融合的调制识别模型

    时间:2023-06-24 12:00:05 来源:雅意学习网 本文已影响 雅意学习网手机站

    李濛,吴呈瑜,占敖

    (浙江理工大学信息科学与工程学院,浙江 杭州 310018)

    自动调制识别是目前非协作通信领域的关键技术,广泛应用于电子对抗、国家频谱管理中,随着技术的发展,现在的调制方式、通信信道越来越复杂,对自动调制识别的要求也越来越高,所以自动调制识别技术仍是通信信号处理领域的一个研究重点技术。

    传统的AMR(Automatic Modulation Recognition,自动调制识别)主要包括基于似然的假设检验方法和基于机器学习的分类方法。基于似然的假设检验方法是通过多重假设检验的问题来进行分类,通过设定门限进行判决来实现调制识别[1-2],但该方法过于依赖先验的调制模型,并且由于复杂的似然函数导致计算量偏大,因此其使用受到一定的限制。基于机器学习的分类方法是通过提取信号中的某些固定特征,再根据提取到的特征通过机器学习的分类算法进行分类识别[3-5],通常用于识别的特征包括小波变换特征、瞬时频率特征以及循环平稳特征等。不同的调制方式的特征各不相同,因此通过机器学习算法可对信号不同调制方式的特征进行分类。但是在实际信道中,由于噪声、衰落等因素,导致信号的特征并不明显,进而使得分类的准确率降低。

    近年来,深度神经网络(DNN,Deep Neural Network)在许多领域取得了丰硕的成果,尤其是在计算机视觉和自然语言处理方面。深度学习(DL,Deep Learning)技术的网络深度大大超过以往神经网络的深度,通过深度学习可以提取信号的浅层特征,并得到浅层特征的高维表征,并通过深度网络的自学习构建更好的分类判决模型,深度学习网络在图像领域,特别是图像的识别领域有着较大的发展[6-7],同样深度神经网络在自动调制识别上也存在较大的应用价值[8-9]。文献[10]首次将卷积神经网络应用与调制识别领域,并提出了公开调制信号数据集RadioML2016.10a。文献[11]提出一种基于卷积神经网络(CNN,Convolutional Neural Networks)和长短期记忆(LSTM,Long Short-Term Memory)的全连接深度神经网络(CLDNN,Convolutional Long short-term memory fully connected Deep Neural Networks)模型,实现了调制识别,但由于模型的深度较浅,分类效果并不理想。文献[12]提出了一种基于卷积神经网络的调制识别方式,首先通过交叉残差连接从星座图像中学习最相关的调制信号特征,训练网络完成后,可以通过模型对调制信号进行识别,但分类的准确率并不理想。文献[13]提出了一种基于生成对抗网络的通信信号调制识别方法。先利用辅助分类器生成对抗网络对数据进行扩充,再将经典模型AlexNet作为分类器实现了调制识别,但该方法稍显繁琐且分类准确率不高。

    针对以上问题,本文提出了一种自动调制识别的特征融合(MFF,Multi-Feature Fusion)网络,首先提出两种不同的神经网络对调制信号的深层特征进行提取,通过将星座图输入到嵌入了注意力机制(CA,Coordinate Attention)[14]的VGG16网络(CA-VGG)模块中提取二维图像特征,通过将I/Q和A/P数据输入到CNN-GRU(Gate Recurrent Unit)模块提取一维时间序列特征,然后充分利用不同特征输入的互补性进一步构建融合模型,以达到有效提高信号分类准确率的目的。最后,针对RadioML2016.10a数据集进行了消融实验和对比实验,结果表明本文提出的MFF模型能够有效实现调制信号的分类任务,并能有效提高调制识别的准确率。

    1.1 信号时域模型

    假设通过衰落信道和高斯白噪声的不同调制信号模型为:

    式中S(t)表示接收到的调制信号;
    x(t)为发送端发送的信号;
    h(t,τ)dτ表示莱斯和瑞利衰落通道;
    n(t)为加性高斯白噪声。

    首先将收到调制信号的瞬时幅度和瞬时相位值进行提取,由于调制信号是由I/Q两路信号构成,可以将接收到的信号S(t)通过I通道信号SI(t)和Q通道信号SQ(t)表示为式(2),则信号的瞬时幅度A(t)和瞬时相位P(t)分别由式(3)和式(4)所得:

    1.2 信号星座图

    星座图是一种常用于信号处理的可视化信号分析方法。通过将归一化的I/Q数据映射到复平面上的散射点,可以得到星座图作为调制无线电信号的二维表示。但是复平面是无限延伸的,而图像描述的区域是有限的,如果区域太大,星座图上的点会聚集到一起导致互相重叠,如果区域太小,星座图的部分信号特征会被忽略。考虑到算法的复杂度和性能,本文选择3×3的复平面并将转换为分辨率为224×224的星座图如图1所示。

    图1 11种调制方式星座图

    2.1 MFF网络模型

    MFF网络模型的结构包括CA-VGG模块和CNN-GRU两个模块。通过这两种模型可以有效地提取调制信号中的重要特征。最后为了充分利用不同输入类型数据特征的互补性,将两个模块的输出进行融合获得信号调制方式的预测概率。

    本文提出的MFF模型解决了缺少多维度特征输入的问题,通过将CNN-GRU和CA-VGG两个网络模型进行融合搭建起的MFF网络模型,提高了网络的泛化、感知能力,增强了特征提取能力。它可以将原始I/Q、A/P数据和星座图的作为网络的输入,并将这两种不同的输入送到两种模型中对进行特征提取。首先通过CA-VGG网络提取星座图的深层特征数据,再通过CA-VGG网络提取I/Q、A/P数据的细节特征数据,保证了对不同输入数据的特征进行高效提取,同时也兼顾全局及局部信息的作用,可以更有效地提取调制信号的特征数据,MFF网络的具体网络框架如图2所示:

    图2 MFF网络结构

    2.2 CA-VGG模块

    VGG16因其具有较好的深度及宽度,在分类的应用中具有一定的优势。VGG16网络的深度为16层,这种较深的网络通过逐层的抽象,能够不断学习由低到高各层的特征,在VGG16的基础上引入CA注意力单元具体的网络结构如图3所示,可以充分提取信号的深层特征,从而提高调制识别的准确率。

    图3 CA-VGG网络结构

    将I/Q数据转换为224×224的星座图像作为CA-VGG模块的输入,并对VGG16网络做了如下改进:首先在每个卷积层中均加入CA注意力单元来学习各通道的重要程度,通过注意力机制来进一步提高对调制识别有用的特征,同时抑制对调制识别无用的特征。为避免在训练中梯度爆炸及梯度消失的情况,本文在每个CA注意力单位后通过批标准层(BN,Batch Normalization)用于加快网络的训练和收敛的速度。激活函数选用Selu来增强网络的非线性、防止梯度消失、减少过拟合并提高网络训练的速度。考虑到全连接层会产生大量的参数,且对于分类没有明显帮助,去掉一层全连接层(FC,Fully Connected)来减少训练参数,进而提高了训练效率。本文增加了输入特征的维度,为防止过拟合,在FC层后面加入dropout,最后通过Softmax层进行最终的分类,由于本文采用的RadioML2016.10a数据集有11种调制信号,因此最终的输出是对应于11类调制信号的概率。

    (1)坐标注意力机制

    坐标注意力模块的本质是采用通道注意力机制,通过深度学习的方式自动获取图像各个特征通道的权重,来进一步增强特征中有用的部分并抑制特征中无用部分。坐标注意力机制灵活且轻量并有很强的通用性,可以方便地嵌入到其他常见的网络模型中。

    坐标注意力作为一种高效的注意力机制,不仅可以对通道间的信息进行了获取,同时也考虑了方向相关的位置信息。具体的实现步骤如下:

    第一步将坐标信息嵌入到通道注意力中,对于一个维度为(C,H,W)的输入,其中的C、H、W分别为输入特征图的通道数、高度和宽度,首先通过式(5)将输入特征的一个通道分别沿着X和Y两个方向进行特征聚合,高效地将空间坐标信息整合到注意力图中。

    高度为h的第c个通道的输出如公式(6)所示:

    同样地,宽度为w的第c个通道的输出如公式(7)所示:

    第二步坐标注意力的生成通过拼接两个方向的坐标信息,然后通过式(8)对拼接后的信息依次进行卷积、正则化和非线性激活等操作。

    其中,δ为非线性激活函数,F1是卷积变换函数。再将得到的f沿水平方向和垂直方向分解为fh、fw,并对两个张量分别进行卷积变换和非线性激活,如式(9)和式(10)所示:

    其中,Fh和Fw分别为对fh和fw的卷积变换函数,σ是Sigmoid激活函数。最后通过矩阵相乘的方法来求最终的注意力权重矩阵,经过yc(i,j)坐标注意力模块的输出如式(11)所示:

    坐标注意力模块结构如图4所示:

    图4 坐标注意力机制机制

    2.3 CNN-GRU模块

    CNN作为近年来最常用的人工神经网络,由于其良好的特征提取特性,开始应用于通信信号调制识别领域。2014年文献[13]提出了一种全新的门控循环单元GRU,GRU网络是LSTM网络的一种变体,成功应用在语音识别、自然语言处理等领域中。Chung等[14]对GRU和LSTM做了详细比较,GRU网络的作用与LSTM网络的效果相似,都可以解决循环神经网络(RNN,Recurrent Neural Network)中存在的梯度消失或梯度爆炸问题,但与LSTM相比GRU的网络结构更简单,有着更高的计算效率和处理速度。

    一个调制信号的时间序列具有时序依赖关系,GRU能够学习到这种依赖关系。通过建立多个GRU单元,使GRU网络能够学习到不同调制信号的变化趋势。因此,本文将CNN神经网络与GRU神经网络相结合,建立的CNN-GRU网络结构如图5所示:

    图5 CNN-GRU网络结构

    首先原始I/Q数据通过式(12)进行归一化操作,得到的矩阵中每个点的值都在0和1之间。然后,将I/Q数据转换得到的A/P数据通过式(13)也进行归一化为操作,将得到弧度的相位归一化到-1和+1之间,并将I/Q和A/P数据一并作为输入送到CNN-GRU模块中。

    式中SI(t),SQ(t)分别为I/Q通道信号,A(t)为瞬时幅度。

    网络结构部分由2个一维卷积层、2个最大池化层和2个GRU层级联构成。首先通过卷积神经网络对信号的I/Q和A/P数据进行卷积处理来初步提取特征,再进行最大池化操作,以减少特征图的尺寸。之后通过改变卷积核大小,再对信号进行一次卷积和最大池化操作来完成对输入数据的深层特征的提取,然后将特征输入到两层GRU网络层中对时间序列具有的时序的依赖关系进行提取,再把特征输入到全连接层中并采用Softmax激活函数进行归一化操作,最后输出11类调制信号的概率。

    2.4 模型融合

    为了取得更好的分类效果,将多种模型合并形成集合,并研究融合模型对分类的影响。将每个模型得到的结果通过平均最终的分类概率来累积。这一阶段的广义详细工作如下:设有n个模型{P1,P2,P3,...,Pn},每个模型对m个信号中的每个信号识别的最终概率如式(14)所示:

    式中,cnm表示模型n中第m个信号的识别概率。融合模型的最终识别率Pfinal可由式(15)描述:

    其中pn为模型n的权重,且p1+p2+,...,+pn=1。

    本文的MFF网络模型是基于CA-VGG模块和CNNGRU模块的融合模型。首先通过CA-VGG模型对星座图数据进行训练并预测,在训练过程中通过优化其学习率、激活函数等参数使得模型效果达到最优;
    然后构建CNN-GRU模型,通过调整卷积核、步长等参数优化模型效果;
    再进行模型融合。通过不同模型对星座图数据和A/P、I/Q数据进行训练,充分利用了不同类型数据的互补性,最后将两个模型信号调制识别的概率值进行加权求和获得融合模型的预测概率。

    式中,pm为融合模型的预测概率,pc和pv表示分别使用CNN-GRU和CA-VGG的预测概率。

    3.1 数据集及参数设置

    为了验证本文算法的性能,这里选用RadioML2016.10a[8]数据集进行实验,该数据集中共有220 000个信号样本,一共包括以下11种常见的调制信号(AM-DSB、AMSSB、WBFM、8PSK、CPFSK、GFSK、PAM4、QAM16、QAM64、QPSK)。其中的每个信号样本由128×2的IQ两路信号构成,信噪比从-20 dB到18 dB以每2 dB递进,数据集的数据形式为220 000×2×128。最后把训练集、测试集和验证集按照6:2:2的比例进行训练、测试和验证。

    实验使用了Python3.7 作为编程语言,以及Tensorflow2.2的Keras库来搭建神经网络训练,使用NVIDIA GeForce GTX 3060设备进行训练和测试。本文具体的软件及参数设置如表1所示:

    表1 实验参数详细信息

    3.2 消融实验

    为验证MFF网络中各模块对网络模型的影响,本节在RadioML2016.10a数据集上,使用4种模型进行消融实验。这里选用分类准确率作为评价指标,结果如表2所示。图6展示了不同信噪比下各网络模型识别准确率。首先使用CNN-GRU+VGG网络模型做基础网络架构并采用I/Q数据和星座图作为输入,识别率为60.9%。保持输入一致的情况下,在VGG的基础上加入CA注意力机制模块,得到的CNN-GRU+CA-VGG模型准确率较CNNGRU+VGG模型提升1.2%。保持CNN-GRU+VGG的网络架构不变并增加A/P数据作为CNN-GRU-1的输入,识别准确率较CNN-GRU+VGG模型提升0.9%。最后使用CNN-GRU-1+CA-VGG的网络结构,并将A/P、I/Q与星座图数据作为输入数据,使得本文的MFF模型识别准确率达到63.2%。

    表2 消融实验的识别准确率

    图6 消融实验识别准确率曲线

    从上面四种模型的仿真结果可以看出,在VGG16的网络结构中加入CA注意力机制对分类准确率的提升最为显著,达到1.2%,这是因为CA注意力机制的引入使得模型在更低的计算复杂度下收敛更快,通过在CNN-GRU模型中加入A/P数据的输入来增加输入数据特征带来了0.9%的分类准确率提升,最后本文的MFF模型识别准确率较CNN-GRU+VGG模型提升2.3%。

    3.3 对比实验

    为进一步验证本文提出的MFF模型的性能,选取了文献[17]的CLDNN、文献[18]的ResNet和DenseNet、文献[19]的PET-CGDNN、文献[20]的MCLDNN和本文的MFF模型进行对比实验。

    表3和图7展示了六种模型在RadioML2016.10a上的实验结果和识别曲线。在RadioML2016.10a数据集上,CLDNN、ResNet和DenseNet模型识别率较低,识别率比其他模型低5%以上,仅为55.8%、55.3%和55.5%;
    PETCGDNN模型识别率为60.4%,效果较好;
    MCLDNN模型识别准确率61.3%,比PET-CGDNN模型高0.9%;
    本文的MFF模型识别准确率为63.2%,优于参考文献[15-18]提出的模型。

    表3 对比模型实验结果

    图7 对比模型识别准确率曲线

    图7所示为六种模型在不同信噪比情况下的调制识别准确率。其中CLDNN[14]模型的网络结构过于简单,只通过一层CNN+LSTM对信号进行特征提取,算法复杂度较低,不能很好地学习数据的一般特征。ResNet和DenseNet[15]模型都有着大量的内部参数,但缺失了细节的特征,同时输入的数据量不大,导致分类效果较差。PET-CGDNN[16]模型算法复杂度较低,但损失了一部分精度。MCLDNN[17]模型采用多路通道对特征进行提取,通过增加输入数据种类和网络模型数量取得较好的分类性能,但同时也成倍地增加了整个模型的计算复杂度。本文提出的MFF网络模型的网络更深,可以提取更高层次的特征,并且CNN-GRU模块和CA-VGG模块的判别能力是互补的,因此能够高效地识别信号的调制方式。

    3.4 复杂度分析

    这里选取了学习参数、训练时间、训练周期、最小验证损失等5个关键指标来衡量6个模型的复杂度,并对训练过程进行评价如表4所示。模型的复杂性主要由学习参数反映、训练速度由训练时间和训练周期表示,而验证损耗最小则表现出收敛趋势。

    表4 复杂度分析

    从表4 可以看出,MFF的复杂度优于ResNet和DenseNet,但比其他模型的复杂度更高,这是由于本文的MFF模型通过多模型进行融合,导致学习参数较多,但MFF模型在数据集上的验证损失最小,进而提高了识别精度。对比表4中不同网络模型的训练时间和训练周期不难看出,本文提出的MFF网络的运行速度优于ResNet、DenseNet和MCLDNN。CLDNN和PET-CGDNN网络算法运行速度较快,但识别准确率低于本文模型。实验表明,MFF在识别精度方面优于其他网络模型,但是在训练时间和学习参数上仍有待提高。

    3.5 调制识别准确率分析

    MFF模型对RadioML2016.10a中各类信号识别准确率如图8所示。由图8(a)可以看出MFF模型对CPFSK的识别率最好;
    其中AM-SSB、BPSK、CPFSK、GFSK、PAM4、QAM16、QPSK调制信号在0 dB以上的信噪比环境下都有90%以上的识别率;
    AM-DSB、QAM64调制信号在0 dB以上的信噪比环境下都有80%左右的识别率;
    集成模型对WBFM信号的识别率最差,在0 dB以上的信噪比环境下仅有55%以上的识别率。可以看出[WBFM,AMDSB]两组调制信号容易分类误判,使得最终这2种调制信号识别率下降。

    当信噪比升高到6dB时,由图8(b)可以看出[WBFM,AM-DSB]2种调制方式仍然存在着分类误判;
    AM-DSB调制方式的识别率达到了91%能够有效被识别,但是WBFM调制方式仍然容易被误判为AM-DSB调制方式。从整体上看集成模型对11种调制方式分类识别有较好的效果。

    图8 MFF混淆矩阵

    为进行模型效果对比,选取效果较好的MCLDNN模型对RadioML2016.10a中各类信号进行识别,准确率如图9所示。从图8和图9中可以看出两个模型无论信噪比是0 dB还是6 dB都对WBFM调制方式不能进行有效的识别,其中的MFF网络模型通过两种不同的神经网络对信号特征提取并融合的方式,提升了对WBFM调制方式的识别率。但WBFM和AM-DSB这两种调制方式仍存在一定程度混淆,这也是以后需要改进的方向。

    图9 MCLDNN混淆矩阵

    本文提出一种MFF网络模型,通过CNN-GRU模块和CA-VGG两模块分别提取调制信号的一维时间特征和二维图像特征,进一步构建融合模型以有效提高调制识别性能。MFF模型较好地结合了CNN-GRU和CA-VGG网络的优点,其中CNNs用于提取多种输入特征的变化,GRU层用于处理时间序列模型,CA注意力机制用于提高对信号特征处理的效率与准确性。通过信号的多个特征输入,丰富了每一种调制方式的数据表示形式,实现了不同类型数据特征之间的互补,能够较好地解决信号调制识别问题。同时多特征提取的思想能够更好地提取并融合信号的内在特征,进而提高调制信号的识别准确率。实验结果表明,本文提出的MFF模型在一定程度上结合了不同维度的数据特征,性能上较其他基于深度学习的模型有进一步提高,能够有效提高调制识别准确率。考虑到还可以将信号眼图、信号频率图等数据作为输入,在未来的工作中,本文的模型可以进一步拓展来增加更多的输入特征,进而提高识别准确率。

    猜你喜欢注意力准确率分类让注意力“飞”回来小雪花·成长指南(2022年1期)2022-04-09分类算一算数学小灵通(1-2年级)(2021年4期)2021-06-09乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析健康之家(2021年19期)2021-05-23不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨医学食疗与健康(2021年27期)2021-05-132015—2017 年宁夏各天气预报参考产品质量检验分析农业科技与信息(2021年2期)2021-03-27分类讨论求坐标中学生数理化·七年级数学人教版(2019年4期)2019-05-20高速公路车牌识别标识站准确率验证法中国交通信息化(2018年5期)2018-08-21数据分析中的分类讨论中学生数理化·七年级数学人教版(2018年6期)2018-06-26教你一招:数的分类初中生世界·七年级(2017年9期)2017-10-13“扬眼”APP:让注意力“变现”传媒评论(2017年3期)2017-06-13

    推荐访问:调制 融合 识别

    • 文档大全
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章