小波变换+注意力机制成为nature收割机

news2025/5/17 16:47:17

小波变换作为一种新兴的信号分析工具,能够高效地提取信号的局部特征,为复杂数据的处理提供了有力支持。然而,它在捕捉数据中最为关键的部分时仍存在局限性。为了弥补这一不足,我们引入了注意力机制,借助其能够强化关注重点的优势,将小波变换与注意力机制相结合。这种结合不仅能够更全面、深入地挖掘数据特征,还能显著提升模型的性能和对复杂数据的处理能力。

这种创新的结合方式不仅在技术层面具有开创性,更在实际应用中展现出巨大的潜力。例如,在滚动轴承故障分类任务中,一种新颖的方法将一维改进的自注意力增强卷积神经网络与经验小波变换相结合,最终实现了100%的分类准确率。这一成果充分证明了小波变换与注意力机制结合的强大效果。

在学术界和工业界,小波变换与注意力机制的结合正变得越来越热门。它在去噪、检测等众多任务中均表现出色,为相关领域的研究和应用提供了新的思路和方法。同时,这一结合也为未来的研究提供了广阔的创新空间。

为了帮助有志于发表论文的同学们,我精心挑选了11篇最新的小波变换与注意力机制结合的创新方案。这些方案的代码大多已经开源,方便大家复现和寻找灵感。

我整理了一些时间序列【论文+代码】合集,需要的同学公人人人号【AI科研算法paper】发666自取。

我还整理出了相关的论文+开源代码,以下是精选部分论

                                                                论文1

标题:

Attention-Based CNN Fusion Model for Emotion Recognition During Walking Using Discrete Wavelet Transform on EEG and Inertial Signal

基于注意力机制的卷积神经网络融合模型,用于在行走过程中通过离散小波变换对EEG和惯性信号进行情绪识别

方法:

  • 使用虚拟现实头戴式显示器(VR-HMD)设备刺激受试者的情绪,同时收集行走过程中的EEG和惯性信号。

  • 通过离散小波变换(DWT)将多模态信号分别表示为虚拟情绪图像,作为输入提供给基于注意力机制的卷积神经网络(CNN)融合模型。

  • 设计了一个简单轻量级的网络结构,整合了通道注意力机制,以提取和增强特征。

  • 提出了一种决策融合算法,结合了Critic方法和多数投票策略,以确定影响最终决策结果的权重。

5.13.png

创新点:

  • 提出了一个新的方法,通过多模态融合和端到端深度学习训练,准确地识别行走过程中的情绪。

  • 设计了一种基于DWT的简单有效的特征转换方法,将输入信号表示为时频域。

  • 开发了一种结合通道注意力机制的CNN结构,CNN根据传感器多通道信号的相关性提取区分性特征,通道注意力机制自适应地强调特征图中的关键部分,以实现进一步的特征优化。

  • 提出了一种决策融合算法,使用评估矩阵和Critic方法对可能影响最终决策的预测标签进行加权,根据多数投票策略获得行走过程中情绪的最终预测结果。

  • 使用VR-HMD设备使受试者沉浸在虚拟环境中,以产生快乐和恐惧情绪,从而刺激真实而深刻的情绪。

  • 性能提升的具体数据:

  • 提出的方法在比较实验中表现优于其他现有的最先进工作,准确率达到98.73%。

小波.png

                                                                   论文2

标题:

Capsule Endoscopy Multi-classification via Gated Attention and Wavelet Transformations

通过门控注意力和小波变换进行胶囊内镜多分类

方法:
    • 结合了Omni Dimensional Gated Attention(OGA)机制和小波变换技术,以增强模型在胶囊内镜图像中的特征提取能力。

    • 利用小波变换技术,包括Stationary Wavelet Transform(SWT)和Discrete Wavelet Transform(DWT),来捕获图像的空间和频率域信息。

    • 将从SWT和DWT提取的特征进行通道级连接,以捕获多尺度特征,这对于检测息肉、溃疡和出血等病变至关重要。

    • 使用基于ResNet的编码器-解码器框架,其中编码器利用修改后的ResNet18骨干网络提取输入帧的复杂多级特征

    截图20250508141600.png

    创新点:

    • 提出了一种新的深度学习模型,通过结合OGA机制和小波变换技术,提高了对胃肠道异常的自动分类能力。

    • 通过OGA动态生成空间、通道、滤波器和核级注意力,使模型能够专注于每个维度中的相关特征。

    • 利用SWT和DWT特征捕获多尺度信息,这对于准确区分不同类型的异常至关重要。

    • 模型在不平衡的胶囊内镜数据集上实现了更高的分类准确率。性能提升的具体数据:

    • 提出的模型在训练集上达到了92.76%的准确率,在验证集上达到了91.19%的准确率。

    • 平衡准确率(Balanced Accuracy)为94.81%,AUC为87.49%,F1分数为91.11%,精确度为91.17%,召回率为91.19%,特异性为98.44%。

    小波3.png

                                                                     论文3

    标题:

    Enhanced Fault Diagnosis in Motor Bearings: Leveraging Optimized Wavelet Transform and Non-Local Attention

    利用优化的小波变换和非局部注意力提升电机轴承故障诊断

    法:

    • 提出了一种新的方法,结合优化的连续小波变换(OCWT)和非局部卷积块注意力模块(NCBAM)来提升电机轴承故障诊断的准确性。

    • 使用技能优化算法(SOA)对OCWT进行微调,SOA分为两个关键部分:获取专业知识(探索)和增强个体能力(利用)。

    • NCBAM用于分类,能够捕捉空间和通道维度上的长程依赖关系。

    • 模型使用学习矩阵,能够综合空间、通道和时间数据,通过提取复杂的相关性来平衡不同数据的贡献

    小波3.png

    创新点:

    • 提出了一种新的故障诊断方法,通过结合优化的小波变换和非局部注意力机制,显著提高了电机轴承故障诊断的准确性。

    • 通过SOA对OCWT进行优化,提高了小波变换的性能。

    • 利用NCBAM捕捉长程依赖关系,增强了特征学习和分类性能。

    • 通过学习矩阵综合多维度数据,提高了模型对复杂工业数据的处理能力。

    • 性能提升的具体数据:

    • 在轴承数据集上,模型达到了平均准确率94.17%。

    • 在齿轮箱数据集上,模型达到了平均准确率95.77%。

    小波2.png

                                                                         论文4

    标题:

    Streamflow modelling and forecasting for Canadian watersheds using LSTM networks with attention mechanism

    使用带有注意力机制的LSTM网络对加拿大流域的径流建模和预测

    法:

    • 研究了序列到序列的机器学习(ML)架构,特别是标准和基于注意力的编码器-解码器长短期记忆(LSTM)模型,用于加拿大流域的径流预测。

    • 这些模型使用过去水文气象状态和每日气象数据作为输入,预测未来几天的径流。

    • 在加拿大五大湖圣劳伦斯地区的10个不同流域进行了测试,这些流域位于加拿大经济中心地带。

    小波7.png

    创新点:

    • 首次将注意力机制应用于加拿大水文学,证明了其在径流预测中的重要性和有效性。

    • 注意力模型在所有流域中均显著优于标准模型,特别是在未见数据上的表现更为突出。

    • 提出了基于LSTM的编码器-解码器架构,能够处理序列到序列的预测问题,将固定长度的输入向量映射到固定长度的输出向量。性能提升的具体数据:

    • 注意力模型在未见数据上的平均Nash–Sutcliffe效率为0.985,Kling-Gupta效率为0.954,远高于标准模型的0.668和0.827。

    • 注意力模型在预测当天径流(零天预测)时,平均RMSE为8.2 m³/s,而标准模型为40.39 m³/s,显示出显著的性能提升。

    小波6.png

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2377826.html

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

    相关文章

    【无标题】威灏光电哲讯科技MES项目启动会圆满举行

    5月14日,威灏光电与哲讯科技MES项目启动会在威灏光电总部隆重举行。威灏光电董事长江轮、总经理刘明星、哲讯科技总经理崔新华、副总王子文及双方项目组成员共同出席,标志着两家企业在数字化领域的第二次深度合作正式启航。 强强联手,二度合作…

    display:grid网格布局属性说明

    网格父级 &#xff1a;display:grid&#xff08;块级网格&#xff09;/ inline-grid&#xff08;行内网格&#xff09; 注意&#xff1a;当设置网格布局&#xff0c;column、float、clear、vertical-align的属性是无效的。 HTML: <ul class"ls02 f18 mt50 sysmt30&…

    排序算法之高效排序:快速排序,归并排序,堆排序详解

    排序算法之高效排序&#xff1a;快速排序、归并排序、堆排序详解 前言一、快速排序&#xff08;Quick Sort&#xff09;1.1 算法原理1.2 代码实现&#xff08;Python&#xff09;1.3 性能分析 二、归并排序&#xff08;Merge Sort&#xff09;2.1 算法原理2.2 代码实现&#xf…

    Java 并发编程归纳总结(可重入锁 | JMM | synchronized 实现原理)

    1、锁的可重入 一个不可重入的锁&#xff0c;抢占该锁的方法递归调用自己&#xff0c;或者两个持有该锁的方法之间发生调用&#xff0c;都会发生死锁。以之前实现的显式独占锁为例&#xff0c;在递归调用时会发生死锁&#xff1a; public class MyLock implements Lock {/* 仅…

    基于对抗性后训练的快速文本到音频生成:stable-audio-open-small 模型论文速读

    Fast Text-to-Audio Generation with Adversarial Post-Training 论文解析 一、引言与背景 文本到音频系统的局限性&#xff1a;当前文本到音频生成系统性能虽佳&#xff0c;但推理速度慢&#xff08;需数秒至数分钟&#xff09;&#xff0c;限制了其在创意领域的应用。 研究…

    ADC深入——SNR、SFDR、ENOB等概念

    目录 SNR&#xff08;Spurious‑Free Dynamic Range 信噪比&#xff09; ENOB&#xff08;Effective Number Of Bits 有效位&#xff09; SFDR&#xff08;Spurious‑Free Dynamic Range&#xff09; 感觉SNR和SFDR差不多&#xff1f;看看下图 输入带宽 混叠 带通采样/欠…

    硬件厂商的MIB文档详解 | 如何查询OID? | MIB Browser实战指南-优雅草卓伊凡

    硬件厂商的MIB文档详解 | 如何查询OID? | MIB Browser实战指南-优雅草卓伊凡 一、硬件厂商的MIB文档是什么&#xff1f; 1. MIB的本质&#xff1a;设备的”数据字典” MIB&#xff08;Management Information Base&#xff09; 是SNMP协议的核心数据库&#xff0c;定义了设备…

    阿里开源通义万相 Wan2.1-VACE,开启视频创作新时代

    0.前言 阿里巴巴于2025年5月14日正式开源了其最新的AI视频生成与编辑模型——通义万相Wan2.1-VACE。这一模型是业界功能最全面的视频生成与编辑工具&#xff0c;能够同时支持多种视频生成和编辑任务&#xff0c;包括文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展…

    小学数学题批量生成及检查工具

    软件介绍 今天给大家介绍一款近期发现的小工具&#xff0c;它非常实用。 软件特点与出题功能 这款软件体积小巧&#xff0c;不足两兆&#xff0c;具备强大的功能&#xff0c;能够轻松实现批量出题。使用时&#xff0c;只需打开软件&#xff0c;输入最大数和最小数&#xff0c…

    5.13/14 linux安装centos及一些操作命令随记

    一、环境准备 VMware Workstation版本选择建议 CentOS 7 ISO镜像下载指引 虚拟机硬件配置建议&#xff08;内存/处理器/磁盘空间&#xff09; 二、系统基础命令 一、环境准备 1.VMware Workstation版本选择建议 版本选择依据 选择VMware Workstation的版本时&#xff0c…

    Baklib加速企业AI数据智理转型

    Baklib智理AI数据资产 在AI技术深度渗透业务场景的背景下&#xff0c;Baklib通过构建企业级知识中台架构&#xff0c;重塑了数据资产的治理范式。该平台采用智能分类引擎与语义分析模型&#xff0c;将分散在邮件、文档、数据库中的非结构化数据转化为标准化的知识单元&#xf…

    基于协同过滤的文学推荐系统设计【源码+文档+部署】

    基于协同过滤的文学推荐系统设计 摘要 随着信息技术的飞速发展和文学阅读需求的日益多样化&#xff0c;构建一个高效、精准的文学推荐系统变得尤为重要。本文采用Spring Boot框架&#xff0c;结合协同过滤算法&#xff0c;设计并实现了一个基于用户借阅行为和社交论坛互动的文学…

    数据结构与算法——单链表(续)

    单链表&#xff08;续&#xff09; 查找在指定位置之前插入结点在指定位置之后插入结点删除pos位置的结点删除pos位置之后的结点销毁 查找 遍历&#xff1a;pcur指向头结点&#xff0c;循环&#xff0c;当pucr不为空进入循环&#xff0c;pucr里面指向的数据为要查找的值的时候…

    全面且深度学习c++类和对象(上)

    文章目录 过程和对象类的引入&#xff0c;类的定义类的访问限定符及封装类的访问限定符封装 类的实例化类大小内存对齐规则&#xff1a; this指针this特性 过程和对象 C语言面向过程设计&#xff0c;c面向对象设计&#xff0c; 举例&#xff1a;洗衣服 C语言&#xff1a;放衣服…

    开源情报如何成为信息攻防的关键资源

    相比于传统情报&#xff0c;开源情报具有情报数量大、情报质量好、情报成本低、情报可用性强等优势。这是开源情报能够成为信息攻防关键资源的主要原因。 海量信息让开源情报具有更大潜力。一是开源情报体量巨大。信息化时代是信息爆炸的时代&#xff0c;网络上发布的各种信息…

    【风控】用户特征画像体系

    一、体系架构概述 1.1 核心价值定位 风控特征画像体系是通过多维度数据融合分析&#xff0c;构建客户风险全景视图的智能化工具。其核心价值体现在&#xff1a; 全周期覆盖&#xff1a;贯穿客户生命周期的营销、贷前、贷中、贷后四大场景立体化刻画&#xff1a;整合基础数据…

    Unity:场景管理系统 —— SceneManagement 模块

    目录 &#x1f3ac; 什么是 Scene&#xff08;场景&#xff09;&#xff1f; Unity 项目中的 Scene 通常负责什么&#xff1f; &#x1f30d; 一个 Scene 包含哪些元素&#xff1f; Scene 的切换与管理 &#x1f4c1; 如何创建与管理 Scenes&#xff1f; 什么是Scene Man…

    SZU 编译原理

    总结自 深圳大学《编译原理》课程所学相关知识。 文章目录 文法语法分析自顶向下的语法分析递归下降分析LL(1) 预测分析法FIRST 集合FOLLOW 集合 文法 乔姆斯基形式语言理论&#xff1a; 表达能力&#xff1a;0型文法 > 1型文法 > 2型文法 > 3型文法。 0 型文法&am…

    【程序员AI入门:模型】19.开源模型工程化全攻略:从选型部署到高效集成,LangChain与One-API双剑合璧

    一、模型选型与验证&#xff1a;精准匹配业务需求 &#xff08;一&#xff09;多维度评估体系 通过量化指标权重实现科学选型&#xff0c;示例代码计算模型综合得分&#xff1a; # 评估指标权重与模型得分 requirements {"accuracy": 0.4, "latency": …

    ARM Cortex-M3内核详解

    目录 一、ARM Cortex-M3内核基本介绍 &#xff08;一&#xff09;基本介绍 &#xff08;二&#xff09;主要组成部分 &#xff08;三&#xff09;调试系统 二、ARM Cortex-M3内核的内核架构 三、ARM Cortex-M3内核的寄存器 四、ARM Cortex-M3内核的存储结构 五、ARM Co…