(论文速读)SFAFBR:一种自监督的人工特征偏置校正框架

news2026/4/2 2:50:45
论文题目Artificial Feature Bias Rectified by Self-Supervised Learning for Rolling Bearings Fault Diagnosis Under Limited Labeled Vibration Signals有限标记振动信号下滚动轴承故障诊断的自监督学习修正人工特征偏差期刊IEEE TRANSACTIONS ON INSTRUMENTATION AND MEASUREMENT摘要考虑到滚动轴承总标记故障信号难以采集解决有限标记振动信号对故障智能诊断的挑战迫在眉睫。在这种情况下人工特征和机器学习(ML)技术的结合是处理这个问题的一种潜在方法因为ML技术具有简单的结构因此与基于深度学习(DL)的方法相比在训练过程中不需要大量标记信号。然而由于人工特征是基于专家的主观经验因此通常存在偏差这可能导致基于ML的方法的性能下降。为了解决这一问题提出了一种自监督的人工特征偏置校正框架(SFAFBR)。具体来说振动信号的人工特征来自小波包(WPs)小波包通过引导深度网络学习与深度网络相结合。学习到的特征与原始人工特征密切相关但由于深度模型的稀疏表达偏差得到了纠正。然后在此基础上构建基于ML的分类器来执行最终诊断。该框架在两个轴承数据集上分别获得了97.79%和94.84%的诊断准确率。结果表明利用深度网络辅助校正人工特征偏差是解决有限标记振动信号下滚动轴承故障诊断问题的一种有前途的方法。用自监督学习纠正人工特征偏差一种面向有限标注数据的滚动轴承故障诊断新框架一、背景与问题为什么有限标注数据是工业诊断的核心难题滚动轴承是现代工业机械系统中不可缺少的关键部件其工况直接影响整机的安全与效率。因此对轴承进行及时、准确的智能故障诊断至关重要。然而在工业现实中有两个客观困难长期制约着智能诊断方法的发展第一故障样本极难收集。工业设备不允许在故障状态下长期运行加之个体故障的随机性使得可供训练的标注故障样本数量极其有限。这让当前主流的深度学习方法面临严重的数据饥渴问题——深度网络强大的特征提取能力背后是对海量标注数据的依赖。第二现有解决方案各有局限。学界已提出多种应对策略数据增强如GAN生成样本依赖对抗网络生成质量难以保证半监督学习如伪标签传播依赖高质量的初始标注元学习如N-way K-shot需要大量有标注的支持集迁移学习依赖源域与目标域之间的分布对齐。这些方法的共同短板是在完全缺乏标注支持集的极端场景下性能会显著下降。二、为什么不直接用机器学习加人工特征——人工特征偏差问题的根源面对上述困境一个自然的想法是既然深度学习太重为什么不退回到更轻量的方案——用专家设计的人工特征结合传统机器学习ML来完成诊断这条路确实有吸引力ML模型结构简单不需要海量标注数据。然而这篇论文敏锐地指出了这条路的核心瓶颈——人工特征存在固有偏差Artificial Feature Bias。所谓人工特征是领域专家根据丰富的工程经验从振动信号中手工定义或提取的特征如时频域统计量、能量分布等。人工特征偏差主要来源于两个方面低相关性Low Correlation专家凭主观经验选取的特征未必与具体的诊断任务高度相关导致特征的判别能力不足。知识冲突Knowledge Conflict不同人工特征之间可能存在语义矛盾或信息冗余使得特征集合整体上存在内部矛盾。正是这两类偏差导致基于人工特征的ML方法在诊断性能上普遍弱于深度学习方法。本文的核心洞见是如果能在保留ML方法轻量优势的同时借助深度网络来自动纠正人工特征中的偏差那么就能兼得两者之长——既降低对标注数据的需求又提升诊断精度。三、SFAFBR核心方法详解本文提出的方法名为SFAFBRSelf-supervised Framework of Artificial Feature Bias Rectification人工特征偏差自监督纠正框架。Fig. 2 — SFAFBR整体结构图整个框架由两个模块组成Module 1人工特征偏差纠正模块自监督训练仅需无标注数据Module 2ML诊断模块仅需极少量标注数据3.1 Module 1WP人工特征的构建在进行偏差纠正之前首先需要一组初始人工特征作为纠正的对象和目标。论文选用小波包Wavelet Packet, WP分解来构建这组特征。选择WP的理由非常充分小波基的正交性保证了信号的最优分解WP能够同时对低频和高频子带进行进一步分解所生成的各子带之间信息冗余最小知识冲突天然较小——这正是其他特征构建方法如VMD、时域/频域统计特征所欠缺的。具体做法是将原始振动信号进行4层WP分解ρ4在最终的 2⁴16 个子带上各自重构信号计算每个子带重构信号的能量值作为一维人工特征从而得到16维的WP人工特征向量。WP分解中使用Daubechies小波族的db3基函数熵准则选用Shannon熵。为什么ρ4是最优论文进行了系统的消融实验ρ过小时生成的特征数量不足与诊断任务的相关性弱ρ过大时特征间知识冲突和信息冗余急剧增加反而加剧偏差。实验结果呈现近似正态分布的趋势在ρ4时取得最优。3.2 Module 1深度纠偏网络Deep Rectification Network这是整个框架最核心的创新所在。核心思想人工特征本身来源于原始信号。因此可以将原始信号 → 人工特征这一映射关系视为一种自监督信息用来训练深度网络。深度网络在拟合这一映射的过程中会通过其稀疏表达能力在潜空间potential space中形成一个去偏版的特征表示——这就是论文定义的上位特征Epitaxial Features。上位特征的优越性在于它既保留了人工特征中蕴含的专家知识又融合了深度网络通用特征的数据驱动优势泛化能力更强。网络结构论文采用ResNet作为纠偏网络的骨干利用残差结构解决训练深度增加和少量数据带来的训练误差问题。采用一对一纠偏策略——针对16个WP人工特征分别训练16个独立的ResNet纠偏网络每个网络输出20维上位特征取FC1层输出16个网络拼接后得到1×320维的上位特征向量。Table I — 深度纠偏网络参数列表训练目标损失函数其中是网络FC2层的输出是第c个WP人工特征值。整个训练过程只使用无标注数据完全符合自监督学习的范式。Fig. 2 — Module 1训练流程自监督反向传播部分3.3 Module 2ML线性判别分类器完成特征纠偏后Module 2使用线性判别分析LDA由奇异值分解SVD求解作为分类器输入为上位特征向量仅需极少量标注样本实验中为5个/类即可完成训练。Fig. 3 — 线性判别器训练流程图使用LDA这一简单分类器并非妥协而是有意为之——这恰恰可以证明只要上位特征质量足够高即便是最简单的线性分类器也能达到优异的诊断性能。3.4 整体诊断工作流整个诊断流程分为五步Fig. 4 — 整体故障诊断流程图振动传感器采集1D时序信号将数据划分为无标注集、少量标注集和验证集用无标注数据训练深度纠偏网络用训练好的纠偏网络提取上位特征配合少量标注数据训练ML线性判别器用验证集进行故障诊断验证。四、实验设计4.1 数据集论文在两个公开轴承数据集上进行验证CWRU数据集凯斯西储大学全球公认的轴承故障诊断基准数据集故障类型通过电火花加工人工制造。采样频率12 kHz转速1797 r/min共10类轴承状态不同故障部位 × 不同故障尺寸。每类生成400个样本划分为200个用于无标注训练100个用于ML训练取5个100个用于验证取75个。XJTU数据集西安交通大学基于加速寿命试验的实际故障数据模拟轴承从正常到失效的全生命周期更贴近工业现实。采样频率25.6 kHz转速2100 r/min。值得注意的是论文专门提取了早期故障阶段数据这无疑增加了诊断难度。共10类故障状态样本划分方式与CWRU一致。Table II — CWRU与XJTU数据集详细信息Fig. 5 — CWRU测试台示意图Fig. 6 — XJTU测试台照片Fig. 7 — XJTU轴承失效类型图4.2 对比方法论文共对比了6种方法覆盖自监督与监督两大类方法类别核心思想SSF自监督对比学习SimSiam算法提取通用特征AFFE自监督对比学习数据增强 Bootstrap Your Own Latent网络SSPT自监督预训练任务5种信号变换构建预训练任务S3M自监督预训练任务2种预训练任务提取全局与局部特征1D-2D JCNN监督深度学习1D与2D卷积神经网络联合EMD-1DCNN监督深度学习EMD分解 1D CNN实验统一超参数Adam优化器学习率 lr1×10⁻³batch size30迭代轮数100每组实验重复10次取均值和标准差。五、实验结果与分析5.1 诊断精度对比Table III — 两个数据集上各方法的实验结果汇总核心结论SFAFBR在CWRU数据集上达到97.79±0.695%在XJTU数据集上达到94.84±1.285%在所有方法中综合表现最优。与监督方法相比SFAFBR仅使用了1D-2D JCNN所需标注数据量的2.5%5个 vs 200个/类达到相近精度在XJTU数据集上甚至超越了所有监督方法——SFAFBR的94.84%对比EMD-1DCNN的91.90%。这说明融入专家知识的上位特征在区分真实工程信号方面具有天然优势。与同类SSL方法相比其他4种SSL方法在仅60个无标注样本的极端条件下难以提取优质通用特征而SFAFBR只需纠正人工特征偏差对无标注数据量要求更低优势明显。5.2 泛化性能标准差分析Fig. 8 — 两个数据集上各方法实验结果差异图含标准差误差棒标准差反映了方法在随机实验中的稳定性。特征偏差越大随机实验中的标准差往往越大。由于SFAFBR通过自监督机制显著纠正了特征偏差其标准差在5种SSL方法中最小充分说明该方法具有更强的泛化能力和鲁棒性。5.3 各健康状态分析混淆矩阵Fig. 9 — 各方法在XJTU数据集上的混淆矩阵以XJTU数据集为例进行细粒度分析EMD-1DCNN在No.4和No.5两类故障上混淆严重而SFAFBR对这两类分别达到99%和97%的诊断率。这说明即使监督方法使用大量标注样本其通用特征仍可能不完整对混淆故障类区分困难而SFAFBR的上位特征融入了大量专家经验知识对混淆故障的区分能力更强。四种SSL方法在No.2、No.3、No.4三类故障上均出现混淆SFAFBR对这三类分别提升至91%、75%、99%。5.4 特征空间可视化t-SNE分析Fig. 10 — 各方法特征空间的t-SNE可视化图Table IV — 特征空间参数类间距/类内距/λ值计算结果论文引入参数λ L_inter / L_intra类间距与类内距之比来定量衡量特征空间质量λ越大代表特征空间中不同类别区分越清晰。计算结果显示SFAFBR的λ1.069在所有SSL方法中最高SSF: 0.814AFFE: 0.941SSPT: 0.197S3M: 0.949进一步证明上位特征质量优越。虽然两种监督方法的λ值更高依靠大量标注样本的训练优势但结合混淆矩阵分析可知这种更好看的特征空间并不总是转化为更好的下游诊断性能——SFAFBR的上位特征中丰富的专家知识使其在相对较小的λ值下依然取得了超越监督方法的诊断性能。5.5 人工特征构建方式对比Fig. 11 — 不同人工特征构建方式的t-SNE可视化Table V — 不同人工特征方式在两个数据集上的诊断精度对比Table VI — 不同人工特征方式的特征空间参数对比论文对比了5种人工特征构建方式方法特征类型CWRU精度XJTU精度WP-16本文16维WP能量特征97.79%94.84%SFAFBR-16F16维频域统计特征93.37%87.16%SFAFBR-16S16维时域统计特征86.56%83.85%SFAFBR-16V16维VMD能量特征76.27%84.78%SFAFBR-8V8维VMD能量特征91.77%86.10%WP特征全面领先的原因VMD方法存在残差分量引入额外偏差时频域统计特征只关注信号的单一侧面且任意组合导致更大的知识冲突而WP正交分解天然保证了特征间的最小冗余偏差最小。5.6 偏差纠正能力验证Fig. 12 — 不同人工特征纠正前后的诊断精度对比条形图对所有5种人工特征类型均进行了纠正实验结果表明所有类型的人工特征经过深度网络纠正后诊断性能均有提升充分验证了深度网络作为偏差纠正工具的有效性。以WP特征为例纠正后的特征空间λ值从0.883直接使用WP特征LDA提升至1.069SFAFBR特征空间优化效果显著。5.7 关键参数分析参数ρWP分解层数实验结果呈正态分布趋势ρ4对应16维特征时取得最优性能CWRU: 97.79%XJTU: 94.84%。参数zi上位特征维度结果呈先升后降趋势维度过低则上位特征不足以表征原始信号维度过高则导致过拟合。综合实验zi20为最优值。Fig. 14 — 不同上位特征维度zi下的误差折线图六、局限性与未来展望论文作者坦诚地指出了SFAFBR的不足一对一纠偏策略导致深度网络数量是其他方法的数倍16个纠偏网络模型总参数量显著增加训练时间延长。不过作者也指出当这些代价能够有效解决实际工程挑战时它们是合理的。未来研究方向将重点关注数据不均衡问题这是更贴近工业现实的挑战场景。七、总结SFAFBR的核心价值可以用一句话概括用深度网络纠正人工特征偏差用上位特征驱动机器学习在极少标注数据下实现可靠的轴承故障诊断。这篇论文的贡献不仅在于提出了一种新的方法更在于揭示了一个长期被忽视的问题——人工特征偏差是制约ML方法诊断性能的关键瓶颈并给出了一个优雅的解决方案让深度网络做特征医生让机器学习做诊断专家各司其职相得益彰。对于工业场景中标注样本极其稀缺的实际应用SFAFBR提供了一种实用且高效的新思路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2423454.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…