每周文章分享
2022.07.25-2022.07.31
标题: RFAL:Adversarial Learning for RF Transmitter Identification and Classification
期刊: IEEE Transactions on Cognitive Communications and Networking, vol. 6, no. 2, pp. 783-801, June 2020.
作者: Debashri Roy, Tathagata Mukherjee, Mainak Chatterjee, Erik Blasch, and Eduardo Pasiliao
分享人: 河海大学——王伟弢
01
研究背景
BACKGROUND
研究背景
无线技术的最新进展导致此类网络的多个自主部署。由于跨分布式网络的节点必须共存,因此所有发射器和接收器都必须了解其射频(RF)环境,以便它们能够调整其传输和接收参数以适合其需求。为此,机器学习技术在该领域变得流行,因为它们可以学习、分析和预测表示RF环境的RF信号和相关参数。然而,在对手存在的情况下,干扰和欺骗等恶意活动是不可避免的,使得大多数机器学习技术在这种环境中无效。
02
关键技术
TECHNOLOGY
关键技术
在本文中,提出了射频对抗学习(RFAL)框架,通过设计和实施生成对抗网络(GAN)来构建一个强大的系统来识别恶意RF发射机。本文通过使用深度神经网络学习特征表示来利用发送器特定的“特征”,例如所有发送器中存在的同相(I)和正交(Q)不平衡(即I/Q不平衡),来自接收信号的I/Q数据作为输入。在检测和消除对抗性发射器之后,RFAL进一步使用这个学习到的特征作为“指纹”来对受信任的发射器进行分类。本文实现了一个生成模型,该模型学习已知发射机的I/Q值的样本空间,并使用学习到的表示来生成模拟这些发射机传输的信号。
该方法的创新和贡献如下:
1)本文使用具有两个主要组件的GAN实施RFAL。
2)RFAL首先使用卷积神经网络(CNN),它利用复值I/Q数据星座之间的相关性。本文还使用完全连接的深度神经网络(DNN)测试RFAL,该网络提高了CNN的准确性。最后,将具有长短期记忆(LSTM)和门控循环单元(GRU)的循环神经网络(RNN)与利用I/Q数据的时间序列特性的RFAL一起使用。
3)所提出工作的新颖性在于使用原始I/Q数据在真实硬件上准确建模和实现所提出的生成和判别模型。
03
算法介绍
ALGORITHMS
算法介绍
1. 生成对抗网络
图1 提出的RFAL GAN架构
如图1所示,提出的GAN框架有两个主要组成部分:使用给定数据分布生成错误数据的生成模型(G)和估计概率的判别模型(D)样本来自训练数据(即已知发射机)而不是G。对手生成随机调制方案(m(t))、信号幅度(r(t))和相位(l(t))并混合加性白高斯噪声(AWGN)(n(t))与错误信号。随着生成器从鉴别器中学习并提高其模仿真实数据的能力,生成的信号(g(t))本质上最初是随机的,它会随着时间的推移而改进。另一方面,鉴别器(D)从生成器(G)和可信发射器中获取输入。这有助于它学习区分真实输入和错误输入。已知的发射机数据被收集并作为原始I/Q值馈送到鉴别器(D)。
总的来说,本文的目标是以最大化D犯错概率的方式训练G。G根据D的反馈调整其超参数。本文认为GAN是一种生成相关数据样本的有效方法,从而逼近准确的生成模型,这是对手旨在实现的目标。一旦模型经过训练,RFAL就会使用生成器合成信号,以根据已知发射机的I/Q信号数据样本空间上的概率分布来模拟对抗发射机。
图2 GAN实现的简化视图
为了实现GAN,使用从可信发射器收集的“空中”信号数据。生成器(G)从相同的样本空间生成伪造数据以冒充受信任的发射器,真假I/Q数据以相等的概率馈送到鉴别器(D)。分别设计鉴别器和生成器,如图2所示。整体GAN实现如图3所示。
图3 对抗发射机检测的GAN实现
生成器首先生成(−∞,∞)内的随机数据。随着训练的发展,生成器了解到真实数据的样本空间是[−1,1]。因此,生成器将逐渐生成[-1,1]内的I/Q值,从而减少参数空间。鉴别器自动学习的时不变特征应该隐含地捕获I/Q数据中的固有不平衡。生成器逐渐学习多个训练时期的真实数据分布,并开始复制生成的I/Q值中的I/Q不平衡。
一旦生成初始随机值,它们将分别通过两个大小为512和1024的密集层,并使用tanh激活。然后使用sigmoid激活函数调用两倍样本大小的单个密集层。G继续学习数据分布(p_g)并在I/Q值的样本空间内生成大小为2048的伪造样本。
D由一个包含2048个节点的输入层、两个分别包含1024个和512个节点的隐藏层以及最后一个包含2个节点的softmax输出层组成,用于将输入分类为伪造的或可信的。本文在隐藏层使用tanh作为激活函数,并在这些层之间添加了0.5的Dropout以进行正则化。通过迭代顺序学习训练生成器和鉴别器,以随着时间的推移加强生成模型。
一旦鉴别器从伪造的发射器中识别出可信发射器,将可信发射器数据馈送到另一个DNN(卷积或全连接(密集)),以进一步分类为多个类别(由可信发射器的数量决定)。
2. 用于发射机分类的神经网络
1)CNN模型
图4 用于发射机分类的CNN实现
为了捕捉I/Q值之间的相关性,首先实现了一个卷积神经网络(CNN)。本文使用三个分别具有1024、512和256个滤波器的conv2D层、一个Flatten操作和三个大小分别为512、256和8个节点的完全连接(FC)层来实现CNN,如图4所示。本文使用在每个conv2D和密集层之后的Dropout分别为0.25和0.5。本文还在每个Conv2D层使用内核大小(2,3)和步幅(2,2)。本文在每个conv2D层之后应用一个池化层MaxPooling2D,池大小为(2,2),步幅为(2,2)。本文对所有卷积层和全连接层使用ReLU激活,最后一个使用softmax。最后一层中的节点数根据数据集具有的类数而变化。本文使用基于Adam(学习率为10^(-3))的优化和分类交叉熵训练。
需要注意的是,本文设计了只有3个卷积层和4个全连接层的CNN以加快训练速度,因为在增加层数后没有观察到测试精度的显著提高。
2)DNN模型
图5 发射机分类的DNN实现
除了上面讨论的CNN之外,本文还使用全连接(密集)DNN来完成可信发射机分类的任务。DNN的实现类似于GAN的判别器模型,如图5所示。唯一的区别是softmax输出层有8个节点来识别8个发射器(如果有k个发射器,则更一般地为k个节点)。本文实现了一个具有5层、1个输入层和4个密集层的DNN。本文对这个模型中的密集层使用tanh激活函数。应用偏差和正则化来避免欠拟合和过拟合。在这种情况下,也可以使用基于Adam的优化,学习率为10^(-3),进行分类交叉熵训练。
3)循环神经网络(RNN)
为了利用收集数据的时间序列特性,本文使用带有LSTM和门控循环单元(GRU)单元的RNN,因为两者都避免了“消失”或“爆炸”梯度问题。
图6 RNN模型中使用的LSTM单元架构
图7 发射机分类的RNN实现
本文设计并实现了一个带有LSTM的RNN,其结构如图7所示。使用2个LSTM层,依次具有1024和256个单元。接下来分别添加2个具有512和256个节点的全连接层。本文对输出使用批量归一化,并将其通过8个节点的密集层。使用ReLU作为LSTM层的激活函数,使用tanh作为密集层的激活函数。最后,使用基于随机梯度下降(SGD)(学习率为10^(-3))的优化和分类交叉熵训练。
图8 RNN模型中使用的GRU单元架构
使用LSTM单元的主要缺点是需要额外的内存。出于相同目的,GRU比LSTM少一个门,因此减少了内存和CPU占用。GRU单元像LSTM单元一样控制信息流,但不需要内存单元。本文使用GRU单元实现了循环模型,并使用了与LSTM实现相同的架构(GRU单元而不是前两层的LSTM单元)。与LSTM模型相比,提出的GRU网络需要更少的参数。在这种情况下,还使用基于SGD的优化器,学习率为10^(-3)。
04
实验结果
EXPERIMENTS
实验结果
1. CNN结果
图9 使用CNN进行发射机分类的准确度
图10 使用CNN进行发射机分类的混淆矩阵
一旦检测到并消除了对抗发射器,本文的系统就会使用神经网络对“可信”发射器进行分类。首先,使用提供的实现细节构建的CNN进行可信发射机分类。对于4和8个发射机分类,分别获得了89.07%和81.6%的准确率。两种情况的准确度和混淆矩阵如图9和图10所示。注意到训练和验证的准确性都随着epoch的数量而增加。然而,对于CNN实现,误报和漏报的数量有点高。直观地说,这表明与网络一起使用的卷积滤波器无法识别和编码此任务的判别特征。由于知道至少有一个区分发射器的判别特征(即I/Q不平衡),可以得出结论,与CNN一起使用的输入表示没有有效地编码这些特征,因此系统无法有效地学习它们。
2. DNN结果
图11 使用DNN进行发射机分类的准确度
图12 使用DNN进行发射机分类的混淆矩阵
为了克服CNN的缺陷,DNN对4个发射器的准确率为96.49%,对8个发射器的准确率为94.60%。准确度和混淆矩阵如图11和图12所示。很明显,与CNN相比,DNN的混淆矩阵中的假阳性和假阴性的数量要低得多,因此直观地说,与CNN相比,DNN可以从I/Q样本中捕获和学习更好的特征。从DNN学习到的特征的角度来看,很难解释这些系统学习到的特征类型。然而,由于分类任务归结为学习决策边界,并且最近已经表明DNN能够有效地学习此类边界的近似值,因此DNN性能更好的可能原因可能与学习决策有关,能够更好地近似表示此任务的决策边界的基础函数。
3. RNN(使用LSTM单元)结果
图13 使用LSTM单元的发射机分类收敛
图14 使用LSTM单元进行发射机分类的混淆矩阵
对于RNN,本文首先实现LSTM单元,分别对4个和8个发射机实现了97.40%和95.78%的测试准确度。准确度和混淆矩阵在图13和图14中给出。
4. RNN(使用GRU单元)结果
图15 使用GRU单元的发射机分类收敛
图16 使用GRU单元进行发射机分类的混淆矩阵
最后,使用GRU单元实现RNN,分别对4个和8个发射机实现了97.85%和97.06%的测试精度。准确度图和混淆矩阵如图16和图17所示。必须注意的是,GRU实现比使用LSTM单元的实现更准确。
在训练阶段,超参数根据分类交叉熵损失进行调整。有时,通过这种调整,模型往往会过度拟合训练数据。为了避免这种情况,在模型中使用了Dropout正则化。另一种监控并可能避免过度拟合的方法是在训练阶段使用交叉验证。这样确保提议的模型得到公平的训练,以便在测试阶段很好地概括。请注意,验证曲线的波动表明,对于具有一组特定超参数值的某些时期,模型往往会过度拟合数据,但在以后的时期中,超参数值会得到调整以抵消过拟合。此外,可以使用验证阶段的结果调整训练。请注意,由于I/Q样本表示时间序列数据,因此使用RNN对其进行建模是很自然的。由于RNN学习时间序列数据之间的时间相关性,因此它们可以对I/Q数据中的发射机特定变化进行编码,并且直观地使RNN在可信发射机分类任务上比CNN更好。
05
总结
CONCLUSION
总结
本文解决了构建稳健且有弹性的模型以在存在对手的情况下识别类似RF发射器的问题。本文提出并实施了RF对抗性学习(RFAL)框架,该框架包括一个判别模型,用于识别使用生成模型生成的数据训练的敌对发射器。RFAL还包含一个“可信发射器”识别系统,用于在识别出敌对发射器并将其排除在外后对已知发射器进行分类。
END
扫描二维码关注我们
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇