别再只盯着代码了!手把手带你读懂东南大学轴承故障数据集(含8通道信号含义详解)
东南大学轴承故障数据集深度解析从传感器信号到故障诊断实战在工业设备健康监测领域轴承故障诊断一直是研究热点而高质量的数据集是算法验证和模型训练的基础。东南大学发布的轴承故障数据集因其完整的工况覆盖和多通道信号采集成为该领域广泛使用的基准数据。但初次接触这个数据集的研究者往往会被复杂的目录结构和多通道信号弄得一头雾水——哪个CSV文件对应哪种故障8个通道各自代表什么物理量不同转速和负载工况下数据有何差异本文将带您深入数据源头拆解这个数据集的组成逻辑让您在使用时不再困惑。1. 试验平台与数据采集原理要理解数据集首先需要了解数据是如何产生的。东南大学的试验平台模拟了工业场景中典型的旋转机械系统由以下几个核心部件组成驱动部分三相异步电机配合变频控制器可精确调节转速测试中采用20Hz和30Hz两档传动系统包含行星齿轮箱和平行齿轮箱两级减速装置负载模拟通过磁粉制动器施加可控负载对应0V和2V两个档位传感系统8个高精度传感器实时采集振动和扭矩信号这个平台的精妙之处在于其多位置同步监测能力。不同于单一振动信号采集它通过多个加速度计布置在关键节点形成了完整的振动信号图谱电机壳体垂直振动通道1行星齿轮箱XYZ三向振动通道2-4电机输出轴扭矩通道5平行齿轮箱XYZ三向振动通道6-8所有信号以5120Hz采样率同步采集确保时域特征的相位一致性。这种设计使得研究者不仅能判断是否有故障还能通过信号传播路径分析故障位置和严重程度。2. 数据集目录结构与命名规则下载解压后的数据集目录看似复杂实则遵循清晰的逻辑。以轴承数据bearingset为例其组织结构如下bearingset/ ├── 20Hz_0V/ # 低速无负载工况 │ ├── ball.csv # 滚子故障 │ ├── health.csv # 正常状态 │ ├── inner.csv # 内圈故障 │ └── outer.csv # 外圈故障 └── 30Hz_2V/ # 高速带负载工况 ├── ball.csv ├── health.csv ├── inner.csv └── outer.csv关键命名规律第一级目录表示工况组合[转速]Hz_[负载]V第二级CSV文件名表示故障类型health正常、ball滚子、inner内圈、outer外圈复合故障内圈外圈同时故障单独存储在combination.csv每个CSV文件包含约120万行数据对应4分钟连续采集8列分别对应不同传感器通道。这种结构设计让研究者可以方便地按需加载特定工况和故障类型的数据。3. 8通道信号详解与物理意义理解每个通道的物理含义是正确使用该数据集的关键。下面通过表格详细说明各通道的信号来源和诊断价值通道信号类型传感器位置典型特征诊断价值1振动加速度电机外壳垂直方向反映电机转子不平衡、轴承磨损初级故障筛查2振动加速度(X轴)行星齿轮箱包含齿轮啮合频率及其谐波齿轮局部故障检测3振动加速度(Y轴)行星齿轮箱对轴承外圈故障敏感轴承故障定位4振动加速度(Z轴)行星齿轮箱轴向力变化特征明显复合故障分析5扭矩电机输出轴反映负载波动故障严重程度评估6振动加速度(X轴)平行齿轮箱包含低速级齿轮特征断齿等严重故障检测7振动加速度(Y轴)平行齿轮箱对安装松动敏感机械松动诊断8振动加速度(Z轴)平行齿轮箱轴向振动传递路径系统级故障分析通道协同分析技巧电机振动通道1异常但齿轮箱振动正常 → 可能电机轴承问题行星齿轮箱Y轴通道3出现特征频率 → 提示轴承外圈故障扭矩信号通道5波动增大 → 可能齿轮断齿或严重磨损4. 典型故障特征与工况影响分析不同故障类型在多通道信号中会呈现不同的特征模式。以下是几种典型故障的信号表现4.1 滚子故障ball.csv特征表现通道1出现明显的轴承通过频率BPFO高频段2kHz能量显著增加扭矩信号呈现周期性微小波动# 滚子故障特征提取示例 import numpy as np from scipy.signal import stft def detect_ball_fault(vibration_signal, fs5120): # 计算包络谱 analytic_signal hilbert(vibration_signal) envelope np.abs(analytic_signal) envelope_spectrum np.fft.fft(envelope) # 查找轴承特征频率峰值 freq np.fft.fftfreq(len(envelope), 1/fs) peak_idx np.argmax(envelope_spectrum[1:len(freq)//2]) 1 return freq[peak_idx], envelope_spectrum[peak_idx]4.2 内圈故障inner.csv识别要点通道3行星齿轮箱Y轴出现转频边带故障特征频率随转速变化明显负载增加时故障特征幅值增大注意内圈故障信号往往被强烈的齿轮啮合频率掩盖需要先用带通滤波去除干扰4.3 工况差异对比20Hz_0V vs 30Hz_2V不同工况下同一故障的表现可能大不相同特征项20Hz_0V工况30Hz_2V工况信号幅值较低约0.5-1V较高约1.5-3V背景噪声较明显被强信号部分掩盖故障特征需要增强处理更易识别但可能饱和最佳分析通道通道1电机振动通道3行星齿轮箱Y实际分析建议先从30Hz_2V数据入手故障特征更明显对比同一故障在不同工况下的表现验证诊断可靠性注意传感器量程限制高负载时可能出现信号削峰5. 数据预处理与特征工程实战原始振动信号通常不能直接输入模型需要经过精心设计的预处理流程5.1 标准处理流程数据分段将长时序切分为2-4秒的片段约10,240-20,480采样点去趋势消除传感器基线漂移from scipy.signal import detrend segment detrend(segment, typelinear)带通滤波保留100Hz-2000Hz关键频段归一化按通道独立归一化到[-1,1]范围5.2 时频特征提取策略针对不同故障类型推荐采用不同的特征组合滚子故障重点提取包络谱峰值、高频段RMS值内圈故障关注1-3倍转频附近的边带能量齿轮故障需要分析齿轮啮合频率谐波# 多特征并行提取示例 def extract_features(signal, fs5120): features {} # 时域特征 features[peak] np.max(signal) features[rms] np.sqrt(np.mean(signal**2)) # 频域特征 fft np.abs(np.fft.fft(signal)[:len(signal)//2]) features[dominant_freq] np.argmax(fft) * fs / len(signal) # 时频特征 _, _, Zxx stft(signal, fsfs, nperseg256) features[stft_energy] np.sum(np.abs(Zxx)**2) return features5.3 格拉姆角场应用技巧将时序信号转换为格拉姆角场(GAF)图像时关键参数设置分段长度建议256-512采样点约0.05-0.1秒重叠率50%-75%以获得足够训练样本图像尺寸64×64平衡信息保留与计算效率提示GAF对转速波动敏感建议先进行转速归一化处理6. 常见问题与解决方案在实际使用该数据集时研究者常遇到以下典型问题Q1如何选择分析通道初步筛查通道1电机振动最敏感精确定位结合通道3行星齿轮箱Y轴和通道7平行齿轮箱Y轴扭矩信号通道5用于验证负载相关性Q2不同故障类型的样本不平衡怎么办数据增强使用时序拉伸、添加噪声等方法扩充少数类分层采样确保每批训练数据包含所有故障类型损失函数调整给少数类分配更高权重Q3模型在20Hz数据表现差检查是否包含足够的低频特征尝试对低速数据进行上采样增加对背景噪声的鲁棒性处理Q4如何验证特征有效性可视化不同故障的特征分布使用随机森林等模型评估特征重要性通过t-SNE降维观察类别可分性在工业现场部署模型时建议先用30Hz_2V数据训练基础模型再用20Hz_0V数据进行微调以适应不同工况。实际应用中行星齿轮箱Y轴通道3的振动信号通常最具诊断价值特别是在轴承外圈故障检测中表现出色。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2519415.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!