每周文章分享
2023.02.13-2023.02.19
标题:Attention Recurrent Autoencoder Hybrid Model for Early Fault Diagnosis of Rotating Machinery
期刊:IEEE Transactions on Instrumentation and Measurement, vol. 70, pp. 1-10, 2021, Art no. 2505110.
作者:Xiangwei Kong, Xueyi Li, Qingzhao Zhou, Zhiyong Hu, and Cheng Shi.
分享人:河海大学——杨群
壹
背景介绍
旋转机械是当代工业中必不可少的组成部分,几乎覆盖了所有的制造业和运输业。因此,旋转机械的早期故障诊断至关重要。机器学习从数据分析中自动获得规律性并利用规律性预测未知数据,而作为机器学习的分支,深度学习基于人工神经网络进行表征学习,在解决许多传统机器学习领域的问题方面取得了显著的进步和优异的成绩。
RNN是深度学习领域的一种流行算法,可以将先前的信息链接到当前任务,不幸的是,随着距离的增加,RNN变得不能连接相关信息。长短时记忆(LSTM)网络是RNN的一种特殊形式,其特点是学习长距离相关性,并在多问题上取得了很好的效果。因此研究人员提出了种种基于LSTM的智能故障诊断方案,使得空间和时间相关性可以同时用于故障检测和相应故障类型的分类。但另一方面传统的基于深度学习的故障诊断方法仅通过单个损失函数优化网络参数,提取的特征往往不是输入信号最有价值的特征。
贰
关键技术
结合深度学习算法理论,对旋转机械系统关键部件在各种工况下的健康状态进行预测。首先,提取原始振动信号的时域特征,为了解决隐藏层特征提取不可控的问题,本文对模型进行了自编码器(AE)约束,提出了一种注意力回归AE混合模型网络。在一定程度上解决了传统方法过于依赖领域专家经验,深隐层特征无法控制的问题。通过对齿轮早期点蚀实验的对比实验,与其他流行的深度学习方法相比,取得了较好的效果。此外,其他方法只关注故障诊断,而本文则强调使用基于深度学习的方法同时进行故障诊断和严重性检测。本文的贡献总结如下:
1)本文解决了传统机器学习或深度学习方法中间过程无法调整的问题。通过AE,可以从网络提取的信号中获得最有价值的特征,用于旋转机械的故障诊断
2)该模型具有良好的通用性和可移植性。通过调整网络中损失的权重比,可以调整不同故障类型的权重。实验表明,该方法在各种负荷下都具有较高的预测精度。
3)将原始数据转换到其他域可能会导致部分信息丢失。本文提出的方法可以直接对旋转机械原始信号进行训练,避免了时频变换操作,简化了故障诊断过程。
4)该框架可以同时进行同步训练,而传统的AE至少需要两次网络训练才能完成。此外,采用批量归一化(BN)层来解决过拟合问题。
叁
算法介绍
本文提出的旋转机械故障诊断方法主要基于RNN、AE、BN和权重分配。如图1所示,本文针对旋转机械的早期故障诊断提出了一种新方法。通过增加LSTM单元扩展了传统AE。该方法采用双分支网络进行训练,通过调整权值分配,提取出最有价值的特征,提高了旋转机械故障诊断效果,该方法可以同时训练LSTM神经网络和AE。
图1 方法总体框架
1. LSTM单元(LSTM Cell)
图2 LSTM的基本结构
LSTM通过在传统RNN模型的输入、反馈和梯度爆发之间设置较长的时延,解决了RNN模型容易遗忘先前信息的问题。RNN的输入数据在特征采用非线性变换的过程中往往会发生变化。对于LSTM模型,输入数据专用于构建整个模块,主要用于输入数据转换。与RNN相比,独立模块结构更加复杂,阈值单元具有更多可调参数。图2表明了LSTM单元的结构。包含单元状态、遗忘门、输入门和输出门的结构。
2. 基于AE的注意力机制(AE for Attention)
图3 基于LSTM的AE的基本结构
AE是一种无监督算法,由两部分组成:编码过程和解码过程。它通常用于降维或特征提取,其基本结构如图3所示。左编码过程从原始输入数据X学习其隐式特征向量H,使得编码器可由函数H = f(X)表示。类似地,解码器R = g(H)的右侧将原始输入向量重构为R。在引入一些约束条件的情况下,向量R等于原始输入向量X。常见的约束是隐藏层矢量维度小于输入层矢量维度。在这种约束下,AE迫使编码器进程从原始数据中提取更多有用的特征。学习过程可以理解为最小化成本函数以确保重构数据和原始输入之间的最小误差的过程。
注意机制是人们利用有限的注意资源从大量信息中快速筛选出高价值信息的手段。注意力机制是一个不依赖于任何框架的概念。本文所采用的注意机制是基于AE技术,把注意力集中在原始振动信号的核心特征上,将注意机制附加到编码器-解码器框架。
3. 批归一化(Batch Normalization)
引入BN来归一化输入特征以固定均值和方差,该算法不仅大大提高了训练速度,而且加速了收敛过程。并且由于BN是类似于用于防止过拟合的dropout的正则化表达式,可以提高分类效果。此外,参数调整过程更加直接,初始化要求更低。
肆
实验结果
1. 齿轮测试实验
为了验证本文的方法,选取了5种不同健康状态的齿轮进行验证实验。试验设备的主要部分如图4所示。测试设备包括一个变速箱,两个马达,一个润滑冷却系统和一个加速传感器。电机功率为45kw,采样率设置为10.24 kHz,每组数据采样时间为6 s。采集到的振动信号通过数据采集卡传送给计算机。实验速度设定为900 r/min。为了验证该方法对不同载荷下不同健康状态齿轮的有效性,本实验采用6种载荷(50、100、200、300、400和500 N·m)进行试验。
图4 实验设备照片
齿轮点蚀的五种健康状况见表I。齿轮在五种健康状态下的早期点蚀如图5所示。
表I 磨损面积的近似百分比
在5个健康点蚀齿轮上进行了验证实验,每个齿轮在6种不同载荷下进行了试验。如图6所示,每一行代表相同载荷不同点蚀程度齿轮的原始振动信号。每一列表示在不同载荷下具有相同点蚀程度的齿轮的原始振动信号。
图5 五个齿轮在不同健康状态下的照片
图6 不同载荷下五种健康状态齿轮的原始振动信号
2. 实验算法验证
该方法共使用了13500个原始振动信号样本进行测试,其中每种载荷下的健康状态为450个样本。实验结果如图7所示。该方法具有良好的性能,尤其是在100-N·m载荷下准确率达到100%,其次是50-N·m载荷。在200 - 500 Nm载荷范围内,准确度分别为99.87%、99.96%、99.91%和99.56%。平均准确率为99.88%。
图7 不同载荷下的混淆矩阵 (a) 900 r/min_50 N·m. (b) 900 r/min_100 N·m. (c) 900 r/min_200 N·m. (d) 900 r/min_300 N·m.(e) 900 r/min_400 N·m. (f) 900 r/min_500 N·m.
3. 对比实验
本文提出的方法与其他流行的深度学习方法进行了比较,如图8所示。准确度是正确分类的样本数与样本总数之比,即正确诊断故障的百分比。准确度结果见表II。结果表明,该方法对不同载荷下齿轮点蚀的早期诊断精度最高。虽然其他方法如GRU、CNN、AE等也有很好的诊断效果,但在不同载荷下早期点蚀的诊断仍不稳定。本文提出的基于RNN、AE、BN和权重分配的方法能够有效地诊断齿轮的早期故障,并且在多工况下具有良好的诊断效果。多次测量可以减少误差。误差越小,分析结果的精度越高。
图8 不同载荷下不同方法的测试结果
表II 不同载荷下的测试平均准确度和标准差(%)
伍
总结
本文为了提高不同载荷下齿轮点蚀早期故障诊断能力,提出了一种注意力递归声发射混合模型网络。该方法通过调整两个损失函数的权重比例,同时优化多分支网络,使网络能够提取输入信号中最有价值的特征。实验结果表明,本文提出的方法能有效提高诊断准确率,具有较强的适应性。与其他深度学习方法相比,该方法在齿轮点蚀诊断中具有明显的优势和泛化性能。该方法为工业应用提供了有力的依据。未来的研究可以开展在包括外部环境条件,如强噪声对诊断结果的影响。
-END-
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇