2023.11.13-2023.11.19
每周文章分享
标题: Explainable Deep Ensemble Model for Bearing Fault Diagnosis Under Variable Conditions
期刊: IEEE SENSORS JOURNAL, VOL. 23, NO. 15, 1 AUGUST 2023
作者: Zhuyun Chen, Wu Qin, Guolin He, Jipu Li, Ruyi Huang ,Gang Jin , and Weihua Li
分享人: 河海大学——左青
研究背景
基于深度学习的智能诊断方法已广泛应用于航空航天、轨道交通、汽车、轨道车辆等领域。然而,深度神经网络是由多层非线性变换来学习输入的特征映射,导致了黑盒特征。在预测和维护决策中,它通常被批评为不透明和难以解释。同时,由于制造过程中机器工况的可变性,传统的深度学习诊断方法与实际应用之间还存在一定差距。为了解决这些问题,本文提出了一种可解释的深度集成模型用于轴承故障诊断,该模型既利用了特征学习能力,又提高了模型的可解释性。此外,还设计了一种增强的Grad-CAM技术,用于可视化模型在决策中捕获的利益。该方法可以直接对原始时间输入进行特征自动提取和故障分类,无需进行任何转换,增强了模型的互操作性和泛化能力。
关键技术
本文提出了一种可解释的深度集成模型用于轴承故障诊断,该模型既利用了特征学习能力,又提高了模型的可解释性。首先,设计基于双向长短期记忆(BiLSTM)的残差网络作为主干学习框架,对原始一维时间序列信号进行关联特征提取;然后,采用多尺度集成学习策略构建多分支模型,进行特征融合和最终故障诊断。模型训练完成后,在卷积层中嵌入一种增强的梯度加权类激活映射技术(1-D Grad-CAM++),实现感兴趣区域的可视化,并将轴承故障机制模型的先验知识有效结合,从而更好地理解学习到的特征和模型的决策。
该方法的创新和贡献如下:
1)提出了一种可解释的深度集成模型,用于在变化的工作条件下对轴承进行故障诊断,既利用了特征学习能力,又提高了模型的可解释性。
2)设计了一种多尺度学习策略,用于从原始一维时间序列信号中提取不同尺度的特征,并构建了一个多分支模型进行特征融合和最终的故障诊断。
3)嵌入了一种增强的梯度加权类激活映射技术,命名为1-D Grad-CAM++,用于可视化卷积层中的感兴趣区域,并结合轴承故障机理知识,提供对模型学习特征和决策的更好理解。
算法介绍
(1)多分支与多尺度学习策略
图1 多分支多尺度学习策略
由于载荷和速度的变化,从滚动轴承测量到的振动信号通常是非平稳的,具有高复杂性、耦合性和不确定性。此外,不同故障类型引起的特征频率差异很大,导致故障特征在不同尺度上的分布。因此,振动信号具有多尺度特性,在多个时间尺度上包含复杂的特征信息。
多尺度学习策略的目的是生成多尺度信号特征,以综合学习不同的判别特征。因此,具有不同尺度特征的信号可以被送入多个不同的神经网络分支进行进一步处理。如图1所示,多尺度结构由多尺度平均池化阶段和卷积层组成。在多尺度特征提取阶段,对原始信号进行下采样以减少通过对相邻信号取的平均值,并将得到的平均值排列成一个新的信号序列。假设原始输入1-D信号的长度为2048,输入信号需要在网络最开始经过一层均值池化,进行不同的下采样,得到不同尺度的子信号。这一层的尺度是S = n (n = 1,…,N),其中N为最大层尺度。池化步长等于尺度对应,输出大小为2048/(2n−1)。这意味着当S = 1时,平均池化层的输出大小为2048/(2−1)= 2048,对应于原始时间序列。后续卷积层中的填充设置为相同的,以便子信号的长度与卷积核的大小成正比,并保持恒定值。对不同长度的子信号使用不同大小的卷积核进行特征提取。
(2)残余BiLSTM结构
随着数据集复杂度的增加,CNN的结构变得越来越复杂,层数也越来越多,容易导致网络中出现梯度消失等问题。为了解决这个问题,本文采用了单残留块的结构,如图2所示。单层网络通常由卷积层(用于特征提取)和批处理归一化(BN)层(用于解决过拟合)组成。
图2 构建残差BiLSTM结构
在残差结构中,每个残差块的输出与输入的差称为残差,当残差趋于零和时达到最佳状态,继续增加残差网络的深度,也会保持在最佳状态。如果残差块的输入为Xl,则最终输出可以表示为:
当残差块之间的尺寸不匹配时,需要进行线性映射使尺寸匹配,可以表示为:
此外,考虑到网络的整体深度和复杂性,将卷积层的输出大小附加到BiLSTM上。如图2所示,利用模型残差结构提取特征后,利用BiLSTM捕捉特征的时间依赖性,充分表征时间序列数据。BiLSTM将LSTM的两个隐藏层连接到输出层。在应用程序提示中将两个LSTM作为一个层有助于增强学习的长期依赖性,从而提高诊断性能。神经网络在每个尺度上的最后一层是全连通层,该层输出神经网络在每个尺度上提取的所有特征,然后融合得到的特征生成单个特征向量,该特征向量馈送到全连通层,用于后续的故障分类。
(3)1-D Grad-CAM++的模型可解释性
Grad-CAM++是一种最先进的可视化技术,用于解释图像中不同区域的重要性,有助于预测给定的CNN模型。作为现有的Grad-CAM技术的扩展。原始的Grad-CAM技术仅使用卷积层输出的特征映射的线性组合来考虑特定图像的类显著性。然而,Grad-CAM++是这一基本思想的扩展,它考虑了高阶信息,如图像中特征之间的环境和空间关系,以更好地解释为什么模型做出了某些预测。这种方法能够识别图像中对做出准确预测最重要的区域,并且不依赖于数值导数或输入扰动。与其他流行的技术(如Grad-CAM、引导反向传播和分层相关传播)相比,Grad-CAM++提供了几个优势,包括在保持高精度性能的同时增加了可解释性和透明度。因此,本研究将GradCAM++修改为1-D GradCAM++,以提高1-D原始时间序列数据输入构建的多尺度深度学习集成模型的透明度和可解释性。改进后的方法有助于识别在故障诊断过程中起关键作用的时间序列数据区域,同时保持较高的准确性。图3显示了所提出的1-D Grad-CAM++方法在提供可解释性和透明度方面的有效性,同时识别原始时间序列数据中的关键区域,这些区域对最终故障诊断有重要贡献
图3 1-D Grad-CAM++的模型可解释性
在Grad-CAM++中,由模型得到的权值是高阶导数的组合,则c类各通道的权值和最终生成的类激活图分别可以表示为:
实验分析
1.实验设置
为了研究该模型的故障诊断能力,生成了不同转速条件下的模拟滚动轴承(SRB)数据集。每个样本的长度为2048,每种工况下每个故障300个样本。构建的数据集如表1所示。
表1 SRB数据集
对于每个健康状态有三个不同速度的数据集,并且来自不同速度但具有相同健康状态的样本被设置为相同的标签,总共有900个样本,因此数据集总共有2700个样本。采用十倍交叉验证的方法,将数据集划分为10个相同大小的数据集,每个实验保留一个子集作为测试集,用于测试模型,其余9个子集用于训练模型。剩下的9个子集用于训练模型,并使用平均精度作为最终结果。
用来比较的方法:CNN-BiLSTM(方法1), RCNN-BiLSTM(方法2), MSCNN-BILSTM(方法3), Ensemble MSRCNN-BiLSTM(本文的方法)。
2. 诊断结果分析
图4 SRB数据集下的诊断精度
经交叉验证,各轴承状态的诊断精度和标准差如图4所示。可以看出,在不同承载状态下,方法3和本文的方法在多尺度结构下的分类性能优于其他两种单尺度结构的分类性能。方法1的平均准确率仅为90.46%,且标准差较大,说明网络在模型训练中存在不稳定性,而方法2附加残差结构的测试准确率为92.91%,略高于方法1。这是有可能的,训练深度神经网络会陷入过拟合的障碍。经验表明,残差结构增加的卷积层的训练过程由于参数和身份连接较少,更容易收敛,使得网络提取的特征更充分,模型更稳定。方法3和所提方法的平均诊断准确率分别为98.07%和99.08%,所提模型的标准差低于其他三种模型,表明其具有较好的稳定性和诊断性能。
3. 学习表征的可视化分析
为了进一步了解多尺度结构如何提取丰富和互补的特征,在该方法中,给出了在每个尺度下不同转速下内圈故障信号的学习特征。600r/min转速下的特征可视化结果如图5所示。图内包含4个尺度,它们都是相同速度的相同形状和振幅的相同样本,但激活图中的热值分布不相同。
图5 600 r/min下四种比例输入的类激活图
可以看出,对于单尺度CNN,构建的一维Grad-CAM++在输出最终的类激活图之前,对特征图进行了上采样操作,使得生成的类激活图的维度与输入信号一致,激活区域与原始输入信号相互对应。
激活度较大的区域之间表现出周期性,表现出内环故障的频率特征,激活度的强弱与振动响应的幅值正相关,也表现出调幅现象,因此尺度1结构可以识别内环故障信号。
此外,当输入内圈故障样本为600r/min时,所提模型在不同转速工况下对样本的激活程度更强,且激活程度集中在冲击区。两个相邻高亮区域之间的距离与内赛跑通过周期一致,如图中红框线所示。激活度的强弱反映了内圈故障的频率特征和调幅现象,与内圈故障的振动特征相一致。这表明该网络可以更好地以不同的速度激活内圈故障样本,将特征提取可视化,并产生符合内圈故障机制的结果。
4. 聚类分析与特征可视化
在凯斯西储大学(CWRU)的数据集中,有4个工况,分别为A、B、C、D,分别表示0、1、2、3 HP的负载,负载和转速的对应关系是一致的。采用t随机邻居嵌入(SNE)技术进行特征约简和聚类分析,如图5所示。
本文所提出的方法聚类和分类性能明显优于其他三种比较方法。特别是,在方法1 - 3中,在第2类中有更多的特征被错误分类和错误聚类,因此有可能在第2类中包含有噪声的样本,这些样本与同一类中的其他样本没有相似的特征。这可能使大多数方法难以准确地识别和分组测试样本。因此,可以预期所提出的模型在故障诊断方面有较好的表现,具有较好的故障诊断能力。
总结
本文提出了一种可解释的集成学习驱动的MSRCNN与BiLSTM相结合,用于变工况下的故障诊断。将该模型与不同深度学习模型在实验数据集下的性能进行了比较。通过对变速、变负荷和复杂工况的分析,验证了所提模型的优越性。将诊断过程中表征的可视化结果与故障机理相结合,为可解释性提供了有效手段。实验结果表明,该方法能有效提高故障诊断精度,并提供多尺度结构卷积过程的可视化。
END
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇