(论文速读)SFAFBR:一种自监督的人工特征偏置校正框架
论文题目Artificial Feature Bias Rectified by Self-Supervised Learning for Rolling Bearings Fault Diagnosis Under Limited Labeled Vibration Signals有限标记振动信号下滚动轴承故障诊断的自监督学习修正人工特征偏差期刊IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT摘要考虑到滚动轴承总标记故障信号难以采集解决有限标记振动信号对故障智能诊断的挑战迫在眉睫。在这种情况下人工特征和机器学习(ML)技术的结合是处理这个问题的一种潜在方法因为ML技术具有简单的结构因此与基于深度学习(DL)的方法相比在训练过程中不需要大量标记信号。然而由于人工特征是基于专家的主观经验因此通常存在偏差这可能导致基于ML的方法的性能下降。为了解决这一问题提出了一种自监督的人工特征偏置校正框架(SFAFBR)。具体来说振动信号的人工特征来自小波包(WPs)小波包通过引导深度网络学习与深度网络相结合。学习到的特征与原始人工特征密切相关但由于深度模型的稀疏表达偏差得到了纠正。然后在此基础上构建基于ML的分类器来执行最终诊断。该框架在两个轴承数据集上分别获得了97.79%和94.84%的诊断准确率。结果表明利用深度网络辅助校正人工特征偏差是解决有限标记振动信号下滚动轴承故障诊断问题的一种有前途的方法。用自监督学习纠正人工特征偏差一种面向有限标注数据的滚动轴承故障诊断新框架一、背景与问题为什么有限标注数据是工业诊断的核心难题滚动轴承是现代工业机械系统中不可缺少的关键部件其工况直接影响整机的安全与效率。因此对轴承进行及时、准确的智能故障诊断至关重要。然而在工业现实中有两个客观困难长期制约着智能诊断方法的发展第一故障样本极难收集。工业设备不允许在故障状态下长期运行加之个体故障的随机性使得可供训练的标注故障样本数量极其有限。这让当前主流的深度学习方法面临严重的数据饥渴问题——深度网络强大的特征提取能力背后是对海量标注数据的依赖。第二现有解决方案各有局限。学界已提出多种应对策略数据增强如GAN生成样本依赖对抗网络生成质量难以保证半监督学习如伪标签传播依赖高质量的初始标注元学习如N-way K-shot需要大量有标注的支持集迁移学习依赖源域与目标域之间的分布对齐。这些方法的共同短板是在完全缺乏标注支持集的极端场景下性能会显著下降。二、为什么不直接用机器学习加人工特征——人工特征偏差问题的根源面对上述困境一个自然的想法是既然深度学习太重为什么不退回到更轻量的方案——用专家设计的人工特征结合传统机器学习ML来完成诊断这条路确实有吸引力ML模型结构简单不需要海量标注数据。然而这篇论文敏锐地指出了这条路的核心瓶颈——人工特征存在固有偏差Artificial Feature Bias。所谓人工特征是领域专家根据丰富的工程经验从振动信号中手工定义或提取的特征如时频域统计量、能量分布等。人工特征偏差主要来源于两个方面低相关性Low Correlation专家凭主观经验选取的特征未必与具体的诊断任务高度相关导致特征的判别能力不足。知识冲突Knowledge Conflict不同人工特征之间可能存在语义矛盾或信息冗余使得特征集合整体上存在内部矛盾。正是这两类偏差导致基于人工特征的ML方法在诊断性能上普遍弱于深度学习方法。本文的核心洞见是如果能在保留ML方法轻量优势的同时借助深度网络来自动纠正人工特征中的偏差那么就能兼得两者之长——既降低对标注数据的需求又提升诊断精度。三、SFAFBR核心方法详解本文提出的方法名为SFAFBRSelf-supervised Framework of Artificial Feature Bias Rectification人工特征偏差自监督纠正框架。Fig. 2 — SFAFBR整体结构图整个框架由两个模块组成Module 1人工特征偏差纠正模块自监督训练仅需无标注数据Module 2ML诊断模块仅需极少量标注数据3.1 Module 1WP人工特征的构建在进行偏差纠正之前首先需要一组初始人工特征作为纠正的对象和目标。论文选用小波包Wavelet Packet, WP分解来构建这组特征。选择WP的理由非常充分小波基的正交性保证了信号的最优分解WP能够同时对低频和高频子带进行进一步分解所生成的各子带之间信息冗余最小知识冲突天然较小——这正是其他特征构建方法如VMD、时域/频域统计特征所欠缺的。具体做法是将原始振动信号进行4层WP分解ρ4在最终的 2⁴16 个子带上各自重构信号计算每个子带重构信号的能量值作为一维人工特征从而得到16维的WP人工特征向量。WP分解中使用Daubechies小波族的db3基函数熵准则选用Shannon熵。为什么ρ4是最优论文进行了系统的消融实验ρ过小时生成的特征数量不足与诊断任务的相关性弱ρ过大时特征间知识冲突和信息冗余急剧增加反而加剧偏差。实验结果呈现近似正态分布的趋势在ρ4时取得最优。3.2 Module 1深度纠偏网络Deep Rectification Network这是整个框架最核心的创新所在。核心思想人工特征本身来源于原始信号。因此可以将原始信号 → 人工特征这一映射关系视为一种自监督信息用来训练深度网络。深度网络在拟合这一映射的过程中会通过其稀疏表达能力在潜空间potential space中形成一个去偏版的特征表示——这就是论文定义的上位特征Epitaxial Features。上位特征的优越性在于它既保留了人工特征中蕴含的专家知识又融合了深度网络通用特征的数据驱动优势泛化能力更强。网络结构论文采用ResNet作为纠偏网络的骨干利用残差结构解决训练深度增加和少量数据带来的训练误差问题。采用一对一纠偏策略——针对16个WP人工特征分别训练16个独立的ResNet纠偏网络每个网络输出20维上位特征取FC1层输出16个网络拼接后得到1×320维的上位特征向量。Table I — 深度纠偏网络参数列表训练目标损失函数其中是网络FC2层的输出是第c个WP人工特征值。整个训练过程只使用无标注数据完全符合自监督学习的范式。Fig. 2 — Module 1训练流程自监督反向传播部分3.3 Module 2ML线性判别分类器完成特征纠偏后Module 2使用线性判别分析LDA由奇异值分解SVD求解作为分类器输入为上位特征向量仅需极少量标注样本实验中为5个/类即可完成训练。Fig. 3 — 线性判别器训练流程图使用LDA这一简单分类器并非妥协而是有意为之——这恰恰可以证明只要上位特征质量足够高即便是最简单的线性分类器也能达到优异的诊断性能。3.4 整体诊断工作流整个诊断流程分为五步Fig. 4 — 整体故障诊断流程图振动传感器采集1D时序信号将数据划分为无标注集、少量标注集和验证集用无标注数据训练深度纠偏网络用训练好的纠偏网络提取上位特征配合少量标注数据训练ML线性判别器用验证集进行故障诊断验证。四、实验设计4.1 数据集论文在两个公开轴承数据集上进行验证CWRU数据集凯斯西储大学全球公认的轴承故障诊断基准数据集故障类型通过电火花加工人工制造。采样频率12 kHz转速1797 r/min共10类轴承状态不同故障部位 × 不同故障尺寸。每类生成400个样本划分为200个用于无标注训练100个用于ML训练取5个100个用于验证取75个。XJTU数据集西安交通大学基于加速寿命试验的实际故障数据模拟轴承从正常到失效的全生命周期更贴近工业现实。采样频率25.6 kHz转速2100 r/min。值得注意的是论文专门提取了早期故障阶段数据这无疑增加了诊断难度。共10类故障状态样本划分方式与CWRU一致。Table II — CWRU与XJTU数据集详细信息Fig. 5 — CWRU测试台示意图Fig. 6 — XJTU测试台照片Fig. 7 — XJTU轴承失效类型图4.2 对比方法论文共对比了6种方法覆盖自监督与监督两大类方法类别核心思想SSF自监督对比学习SimSiam算法提取通用特征AFFE自监督对比学习数据增强 Bootstrap Your Own Latent网络SSPT自监督预训练任务5种信号变换构建预训练任务S3M自监督预训练任务2种预训练任务提取全局与局部特征1D-2D JCNN监督深度学习1D与2D卷积神经网络联合EMD-1DCNN监督深度学习EMD分解 1D CNN实验统一超参数Adam优化器学习率 lr1×10⁻³batch size30迭代轮数100每组实验重复10次取均值和标准差。五、实验结果与分析5.1 诊断精度对比Table III — 两个数据集上各方法的实验结果汇总核心结论SFAFBR在CWRU数据集上达到97.79±0.695%在XJTU数据集上达到94.84±1.285%在所有方法中综合表现最优。与监督方法相比SFAFBR仅使用了1D-2D JCNN所需标注数据量的2.5%5个 vs 200个/类达到相近精度在XJTU数据集上甚至超越了所有监督方法——SFAFBR的94.84%对比EMD-1DCNN的91.90%。这说明融入专家知识的上位特征在区分真实工程信号方面具有天然优势。与同类SSL方法相比其他4种SSL方法在仅60个无标注样本的极端条件下难以提取优质通用特征而SFAFBR只需纠正人工特征偏差对无标注数据量要求更低优势明显。5.2 泛化性能标准差分析Fig. 8 — 两个数据集上各方法实验结果差异图含标准差误差棒标准差反映了方法在随机实验中的稳定性。特征偏差越大随机实验中的标准差往往越大。由于SFAFBR通过自监督机制显著纠正了特征偏差其标准差在5种SSL方法中最小充分说明该方法具有更强的泛化能力和鲁棒性。5.3 各健康状态分析混淆矩阵Fig. 9 — 各方法在XJTU数据集上的混淆矩阵以XJTU数据集为例进行细粒度分析EMD-1DCNN在No.4和No.5两类故障上混淆严重而SFAFBR对这两类分别达到99%和97%的诊断率。这说明即使监督方法使用大量标注样本其通用特征仍可能不完整对混淆故障类区分困难而SFAFBR的上位特征融入了大量专家经验知识对混淆故障的区分能力更强。四种SSL方法在No.2、No.3、No.4三类故障上均出现混淆SFAFBR对这三类分别提升至91%、75%、99%。5.4 特征空间可视化t-SNE分析Fig. 10 — 各方法特征空间的t-SNE可视化图Table IV — 特征空间参数类间距/类内距/λ值计算结果论文引入参数λ L_inter / L_intra类间距与类内距之比来定量衡量特征空间质量λ越大代表特征空间中不同类别区分越清晰。计算结果显示SFAFBR的λ1.069在所有SSL方法中最高SSF: 0.814AFFE: 0.941SSPT: 0.197S3M: 0.949进一步证明上位特征质量优越。虽然两种监督方法的λ值更高依靠大量标注样本的训练优势但结合混淆矩阵分析可知这种更好看的特征空间并不总是转化为更好的下游诊断性能——SFAFBR的上位特征中丰富的专家知识使其在相对较小的λ值下依然取得了超越监督方法的诊断性能。5.5 人工特征构建方式对比Fig. 11 — 不同人工特征构建方式的t-SNE可视化Table V — 不同人工特征方式在两个数据集上的诊断精度对比Table VI — 不同人工特征方式的特征空间参数对比论文对比了5种人工特征构建方式方法特征类型CWRU精度XJTU精度WP-16本文16维WP能量特征97.79%94.84%SFAFBR-16F16维频域统计特征93.37%87.16%SFAFBR-16S16维时域统计特征86.56%83.85%SFAFBR-16V16维VMD能量特征76.27%84.78%SFAFBR-8V8维VMD能量特征91.77%86.10%WP特征全面领先的原因VMD方法存在残差分量引入额外偏差时频域统计特征只关注信号的单一侧面且任意组合导致更大的知识冲突而WP正交分解天然保证了特征间的最小冗余偏差最小。5.6 偏差纠正能力验证Fig. 12 — 不同人工特征纠正前后的诊断精度对比条形图对所有5种人工特征类型均进行了纠正实验结果表明所有类型的人工特征经过深度网络纠正后诊断性能均有提升充分验证了深度网络作为偏差纠正工具的有效性。以WP特征为例纠正后的特征空间λ值从0.883直接使用WP特征LDA提升至1.069SFAFBR特征空间优化效果显著。5.7 关键参数分析参数ρWP分解层数实验结果呈正态分布趋势ρ4对应16维特征时取得最优性能CWRU: 97.79%XJTU: 94.84%。参数zi上位特征维度结果呈先升后降趋势维度过低则上位特征不足以表征原始信号维度过高则导致过拟合。综合实验zi20为最优值。Fig. 14 — 不同上位特征维度zi下的误差折线图六、局限性与未来展望论文作者坦诚地指出了SFAFBR的不足一对一纠偏策略导致深度网络数量是其他方法的数倍16个纠偏网络模型总参数量显著增加训练时间延长。不过作者也指出当这些代价能够有效解决实际工程挑战时它们是合理的。未来研究方向将重点关注数据不均衡问题这是更贴近工业现实的挑战场景。七、总结SFAFBR的核心价值可以用一句话概括用深度网络纠正人工特征偏差用上位特征驱动机器学习在极少标注数据下实现可靠的轴承故障诊断。这篇论文的贡献不仅在于提出了一种新的方法更在于揭示了一个长期被忽视的问题——人工特征偏差是制约ML方法诊断性能的关键瓶颈并给出了一个优雅的解决方案让深度网络做特征医生让机器学习做诊断专家各司其职相得益彰。对于工业场景中标注样本极其稀缺的实际应用SFAFBR提供了一种实用且高效的新思路。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2423454.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!