每周文章分享
2023.03.27-2023.04.02
标题: Intelligent Fault Diagnosis Method Based on Full 1-D Convolutional Generative Adversarial Network
期刊: IEEE Transactions on Industrial Informatics, vol. 16, no. 3, pp. 2044-2053, March 2020.
作者: Qingwen Guo, Yibin Li, Yan Song, Daichao Wang, and Wu Chen.
分享人: 河海大学——沈君豪
壹
背景介绍
机械健康监测在现代工业中占有重要地位。机器故障会造成巨大的经济损失,并对工人构成极大的威胁。因此,不断开发改进的、智能的机器故障诊断技术,以确保工业机器正常可靠地运行。深度学习是人工智能领域的突破,在语音识别、图像恢复、自然语言等领域表现出色在网络安全和资源共享方面也取得了重要进展。该方法在故障诊断中也越来越受欢迎,产生了一系列涉及智能诊断模型设计或预测的工作。然而,由于缺乏真实的标记故障数据,使得基于机器学习的故障诊断方法难以实现。
贰
关键技术
在本文提出了一种基于AC-GAN和1D CNN的深度学习故障诊断方法,同时满足了故障判别和多标签数据生成的要求。ACGAN与一维CNN的结合,是首次尝试用一维卷积网络作为故障特征发生器和判别器,解决故障诊断问题。
该方法的创新和贡献如下:
1)ACGAN与一维CNN的结合,首次尝试用一维卷积网络作为故障特征发生器和判别器,解决故障诊断问题。
2)ML1D-GAN通过在不同设备特性或运行条件下生成新的有意义的数据来解决机械故障诊断的难题。由于能够生成数据样本,该方法具有较强的泛化能力。
叁
算法介绍
1. 辅助分类器生成对抗网络(AC-GAN)
图1 提出的AC-GAN架构
传统的GAN架构基于二项零和博弈理论,生成器G和判别器D构成GAN,两者都可以是不同类型的网络结构,如自动编码器、全连接层、CNN。一般来说,非线性映射函数代表G和D。在训练过程中,D试图以高概率提供实际数据,以低概率提供来自G的样本。相比之下,假样本由G生成,G学习真实数据的分布来迷惑D。上面的对抗性训练可以引入同时提高G和D的性能。
辅助分类器GAN是GAN架构的一种变体,称为AC-GAN,如图1所示。其中除噪声z外,对应的类标签为每个生成的样本所拥有。c~pc对应的是一类振动数据。G使用两者生成数据Xfake=G(c;z)。源标签和类标签的概率分布由鉴别器给出。正确源和正确类的对数似然Ls和Lc构成目标函数,训练D最大化Ls+Lc,而训练G最大化Lc-Ls。独立于类标签的z表示是由AC-GAN学习的。改进后的GAN结构具有良好的训练性能和稳定性。
2. ML1D-GAN
1)故障诊断模型
图2 提出的ML1D-GAN架构
ML1D-GAN模型结构如图2所示。采集到的训练数据信号经过预处理后,经过处理,使其适合具有原始样本所有特征的训练。然后将嵌入类标签的原始随机噪声输入生成器模型,构建初始生成能力。在这个阶段,鉴别器是不可训练的,无法建立初始的鉴别能力。
生成器经过训练后,获得了混淆鉴别器的能力。它的参数必须固定,以获取生成数据,培养识别能力。在此阶段,由于一维卷积层具有较好的特征学习能力,发生器和鉴别器能够较好地学习振动信号的特征。ML1D-GAN鉴别器和生成器通过交替优化学习机制迭代训练,以提高其性能,直到达到纳什均衡。
在故障诊断阶段,利用生成的数据和真实故障数据集对故障分类器进行训练,建立故障诊断能力。将测试样本输入到ML1D-GAN的故障分类器中,进行故障诊断,并将诊断结果作为输出。
一旦鉴别器从伪造的发射器中识别出可信发射器,将可信发射器数据馈送到另一个DNN(卷积或全连接),以进一步分类为多个类别(由可信发射器的数量决定)。
2)生成过程
图3 生成方法结构
ML1D-GAN生成模型结构如图3所示。根据输入样本的标签,生成器对应新样本Xfake。新样本和原始样本Xreal组合用于真伪鉴别。损失函数利用真实性标签和类别标签错误交替迭代地训练生成器和鉴别器。因此,迭代完成后,可以生成具有特定类别的接近真实的故障数据样本。将生成的故障数据与自然故障数据相结合,训练故障分类器。
3)鉴别器训练
如图4所示,新样本Xfake标记为0,原始样本Xreal标记为1的类别标签。然后加载样本,并对真实性进行识别和分类。之后,输出的真实性被标记为dmreal, dkfake。
图4 故障诊断框架
4)生成器训练
Xfake的标签被设置为1,并被馈送到鉴别器1D CNN。真实性标记为0的错误判断表明鉴别器不能传递新生成的样本。然后通过损失函数调整并完成生成器的训练。
在训练过程中依次旋转鉴别器1D CNN和生成器G进行优化。生成器G首先固定,然后优化鉴别器,以最大限度地提高其诊断准确性。接下来,与前一步相比,鉴别器是固定的,然后生成器G是优化的。重复上述过程,直到鉴别器和生成器达到纳什均衡,完成ML1D-GAN的训练。
肆
实验结果
1. 数据集描述
通过德国帕德伯恩大学设计与驱动技术专业总统的模块化测试台获得数据集,表1操作参数。每个轴承测量约4s的振动信号,采样率为64khz,测量约256000点作为数据集的官方文档中的描述。在数据生成过程中,选取N15-M07-F04作为原始真实数据生成故障数据样本,验证了所提方法的泛化性能和可扩展性。以N09-M07-F10、N15-M07-F10和N15-M01-F10在不同转速、负载扭矩和径向力下作为试验数据。
表1 操作参数
2. ML1D-GAN故障诊断分析与比较
实验结果如图5所示。训练a, b, c, d, e, f的数据。用生成的数据对a和b进行训练,并分别在N15-M01-F10和N15-M07-F10上进行测试。c和d的训练数据中不包含生成的数据,但是测试数据中包含生成的样本。c和d的训练和测试数据不包含生成的样本。这些结果表明,ML1D-GAN生成器能够有效地捕获故障特征,并生成与真实故障特征兼容的新故障特征。因此,ML1D-GAN可以产生大量的故障样本,增强了故障诊断模型的泛化能力。
图5 比较不同训练和测试数据的测试精度
使用来自凯斯西储大学(CWRU)的实验数据集进行实验,图6给出了48k采样自由度下的实验结果,结果表明,ML1D-GAN生成器能够有效地捕获CWRU中的故障特征,并生成与实际损伤相匹配的新故障特征。
图6 测试不同数据集测试的准确性,a:对生成数据进行训练,对真实数据进行测试;b:用真实数据训练,用真实数据测试;c:实际数据训练和生成数据测试
图7显示了k-最近邻(KNN)、极限学习机(ELM)、分类与回归树(CART)、随机森林(RF)、支持向量机(SVM)、深度神经网络(DNN)与本文方法测试精度值的比较。实验结果表明,该模型比经典的机器学习算法表现出更有效的性能。
图7 kNN, ELM, CART, RF, SVM, DNN和ML1D-GAN的训练精度和测试精度比较
伍
总结
本文提出了一种原始故障诊断模型ML1D-GAN,提出的方法由于能够生成数据样本,具有较强的泛化能力。该模型通过嵌入随机噪声标签和上采样一维卷积运算,可以输出有效的故障数据。实验表明,将GANs与故障诊断方法相结合,可以自动生成有效的故障特征,并且在不同工况下对原始故障特征具有较强的鲁棒性,从而提高了所提模型的诊断能力。利用原始自然样本训练故障分类器,提高分类器的泛化能力。这一成果很好地解决了故障诊断数据样本缺乏和变异性不足的问题。在生成样本上训练的故障诊断模型在检测原始故障样本时具有良好的性能。
-END-
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇