深度学习登上Nature子刊!特征选择创新思路

news2025/6/9 11:42:57

2025深度学习发论文&模型涨点之——特征选择

特征选择作为机器学习与数据挖掘领域的核心预处理步骤,其重要性在当今高维数据时代日益凸显。

通过识别最具判别性的特征子集,特征选择算法能够有效缓解"维度灾难"、提升模型泛化能力,并增强结果的可解释性。近年来,随着深度学习与异构数据的快速发展,传统过滤式(Filter)、包裹式(Wrapper)和嵌入式(Embedded)方法正面临新的挑战与革新。

我整理了一些特征选择【论文+代码】合集,需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1:

Recent advances in feature selection and its applications

特征选择的最新进展及其应用

方法

稀疏性特征选择:通过在损失函数中加入稀疏性约束(如L1范数)来选择特征,适用于高维小样本数据。

多源特征选择:利用来自不同源的知识(如样本相似性或特征属性)来增强特征选择的可靠性。

分布式特征选择:采用分布式计算策略,如MPI和MapReduce,以提高特征选择算法在大规模数据集上的可扩展性。

多视图特征选择:结合来自不同视图(如医学检查中的临床、影像、免疫学等)的信息,以提高特征选择的效果。

图片

创新点

稀疏性特征选择改进:通过结构化稀疏性诱导范数(如组Lasso和弹性网)改进了Lasso方法,能够更好地处理组结构数据。

多源知识融合:提出了将不同源的知识转换为样本或特征知识的方法,提高了特征选择在小样本问题上的性能。

分布式计算支持:通过分布式计算模型,实现了在大规模数据集上的高效特征选择,计算速度提升了约10倍。

多视图学习增强:在多视图学习中,考虑了视图之间的关系,通过张量积空间表示这种关系,提高了特征选择的性能。

图片

论文2:

IGANN SPARSE: BRIDGING SPARSITY AND INTERPRETABILITY WITH NON-LINEAR INSIGHT

IGANN SPARSE:通过非线性洞察力连接稀疏性和可解释性

方法

非线性特征选择:IGANN Sparse通过非线性特征选择过程在训练期间促进稀疏性,确保通过改进模型稀疏性提高可解释性,同时不牺牲预测性能。

极端学习机(ELM):利用ELM进行快速训练,ELM是一种简单的前馈神经网络,使用比基于梯度的算法更快的学习方法。

贝叶斯信息准则(BIC):在特征选择过程中使用BIC来平衡模型拟合和复杂性,仅保留对模型预测具有显著解释能力的特征。

图片

创新点

非线性关系捕捉:IGANN Sparse能够捕捉数据中的非线性关系,这是传统线性特征选择方法所无法实现的。

稀疏性与可解释性平衡:在保持与非稀疏模型相当的预测性能的同时,显著减少了特征数量,提高了模型的可解释性。

性能提升:在多个数据集上,IGANN Sparse的预测性能优于或接近非稀疏模型,同时特征数量减少了约75%。

特征选择能力:与Lasso等传统特征选择方法相比,IGANN Sparse在多数数据集上表现更好,特别是在非线性关系丰富的数据集上。

图片

论文3:

All-optical VPN Utilizing DSP-based Digital Orthogonal Filters Access for PONs

基于DSP数字正交滤波器的全光VPN接入PONs

方法

数字滤波器多址接入(DFMA)技术:利用集中式SDN控制器管理的动态软件可重构嵌入式数字正交滤波器,显著增强基于DSP的光收发器和网络操作的功能性、可升级性和灵活性。

动态数字滤波器分配与回收:通过SDN可控的动态数字滤波器分配和回收机制,实现多个VPN通信的动态建立和取消。

多种信号格式支持:系统支持脉冲幅度调制(PAM)、正交幅度调制(QAM)和正交频分复用(OFDM)等多种信号格式。

单收发器设计:每个ONU仅需一个终端收发器即可同时向上游(US)/VPN数据传输到OLT或其他ONU,显著降低网络建设和运营成本。

图片

创新点

全光VPN的动态性:首次在DFMA-PON中实现全光VPN的动态建立和取消,支持任意流量的VPN通信。

信号格式灵活性:系统不受限于固定信号格式,可使用多种信号格式,提升了网络的适应性和灵活性。

成本效益:通过单收发器设计和数字信号处理(DSP)实现信号复用和解复用,减少了昂贵的光/电组件需求,显著降低了网络复杂性和成本。

性能提升:在25公里单模光纤传输中,DS OFDM信号的误码率(BER)低于前向纠错(FEC)限制的3.8×10^-3,US/VPN信号的功率惩罚小于2dB。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2405313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

javaSE复习(7)

1.KMP算法 使用KMP算法在主串 "abaabaabcabaabc" 中搜索模式串 "abaabc",到匹配成功时为止,请问在匹配过程中进行的单个字符间的比较次数是()。 10次 用于互斥时 初值为1 在一个并发编程环境中&#xff0c…

WireShark相关技巧

文章目录 1 Wireshark如何设置解析SIP 1 Wireshark如何设置解析SIP 编辑->首选项->protocols->sip 选中sip 2 点击“编辑”->“首选项”->“protocol”->ESP ,按照如下红框显示,进行勾选,点击应用

DAY 45 Tensorboard使用介绍

知识点回顾: tensorboard的发展历史和原理tensorboard的常见操作tensorboard在cifar上的实战:MLP和CNN模型 作业:对resnet18在cifar10上采用微调策略下,用tensorboard监控训练过程。 PS: tensorboard和torch版本存在一定的不兼容…

台式机电脑CPU天梯图2025年6月份更新:CPU选购指南及推荐

组装电脑选硬件的过程中,CPU的选择无疑是最关键的,因为它是最核心的硬件,关乎着一台电脑的性能好坏。对于小白来说,CPU天梯图方便直接判断两款CPU性能高低,准确的说,是多核性能。下面给大家分享一下台式机电脑CPU天梯图2025年6月版,来看看吧。 桌面CPU性能排行榜2025 台…

将单体架构项目拆分成微服务时的两种工程结构

一.独立Project 1.示意图 此时我们创建一个文件夹,在这个文件夹中,创建N个Project,每一个Project对应一个微服务,组成我们的最终的项目。 2.特点 适合那种超大型项目,比如淘宝,但管理负担比较重。 二.Mave…

Unity3D 开发中的创新技术:解锁 3D 开发的新境界

在 3D 开发的广袤天地里,Unity3D 一直是众多开发者的得力伙伴。可如今,普通的开发方式似乎难以满足日益增长的创意与效率需求。你是否好奇,凭什么别家团队能用 Unity3D 打造出令人拍案叫绝的 3D 作品,自己却总感觉差了那么一点火候…

UOS 20 Pro为国际版WPS设置中文菜单

UOS 20 Pro为国际版WPS设置中文菜单 查看UOS操作系统系统安装国际版wps并汉化方法1:下载zh_CN.tar.gz语言包方法2:手动从国内版wps12的包中提取中文菜单解压国内版wps的包 复制中文语言包到wps国际版目录下安装Windows字体 安装开源office 查看UOS操作系统系统 # 查…

单例模式与锁(死锁)

目录 线程安全的单例模式 什么是单例模式 单例模式的特点 饿汉实现方式和懒汉实现方式 饿汉⽅式实现单例模式 懒汉⽅式实现单例模式 懒汉⽅式实现单例模式(线程安全版本) 单例式线程池 ThreadPool.hpp threadpool.cc 运行结果 线程安全和重⼊问题 常⻅锁概念 死…

理解世界如淦泽,穿透黑幕需老谋

理解世界如淦泽,穿透黑幕需老谋 卡西莫多 2025年06月07日 安徽 极少主动跟别人提及恩师的名字,生怕自己比孙猴子不成器但又比它更能惹事的德行,使得老师跟着被拖累而脸上无光。不过老师没有象菩提祖师训诫孙猴子那样不能说出师傅的名字&a…

第三讲 Linux进程概念

1. 冯诺依曼体系结构 我们买了笔记本电脑, 里面是有很多硬件组成的, 比如硬盘, 显示器, 内存, 主板... 这些硬件不是随便放在一起就行的, 而是按照一定的结构进行组装起来的, 而具体的组装结构, 一般就是冯诺依曼体系结构 1.1. 计算机的一般工作逻辑 我们都知道, 计算机的逻…

stm32-c8t6实现语音识别(LD3320)

目录 LD3320介绍: 功能引脚 主要特色功能 通信协议 端口信息 开发流程 stm32c8t6代码 LD3320驱动代码: LD3320介绍: 内置单声道mono 16-bit A/D 模数转换内置双声道stereo 16-bit D/A 数模转换内置 20mW 双声道耳机放大器输出内置 5…

爬虫学习记录day1

什么是逆向? 数据加密 参数加密 表单加密扣js改写Python举例子 4.1 元素:被渲染的数据资源 动态数据 静态数据 如果数据是加密的情况则无法直接得到数据 4.2 控制台:输出界面 4.3 源代码页面 4.4 网络:抓包功能,获取浏…

agent基础概念

agent是什么 我个人认为agent并没有一个所谓完美的定义,它是一个比较活的概念,就像是你眼中的一个机器人你希望它做什么事,和我眼中的机器人它解决事情的流程,其实是可以完全不同的,没有必要非得搞一个统一的概念或流程来概况它。但我们依然可以概况几个通用的词来描述它…

让音乐“看得见”:使用 HTML + JavaScript 实现酷炫的音频可视化播放器

在这个数字时代,音乐不仅是听觉的享受,更可以成为视觉的盛宴!本文用 HTML + JavaScript 实现了一个音频可视化播放器,它不仅能播放本地音乐、控制进度和音量,还能通过 Canvas 绘制炫酷的音频频谱图,让你“听见色彩,看见旋律”。 效果演示 核心功能 本项目主要包含以下…

CAD实体对象智能识别

CAD实体对象智能识别 概述 实体对象智能识别能够在CAD图纸中智能识别和匹配相似的实体对象。该系统采用模式匹配算法,支持几何变换(缩放、旋转),并提供了丰富的配置选项和可视化界面。 系统提供两种主要的识别方式:…

LabVIEW音频测试分析

LabVIEW通过读取指定WAV 文件,实现对音频信号的播放、多维度测量分析功能,为音频设备研发、声学研究及质量检测提供专业工具支持。 主要功能 文件读取与播放:支持持续读取示例数据文件夹内的 WAV 文件,可实时播放音频以监听被测信…

RoseMirrorHA 双机热备全解析

在数字化时代,企业核心业务系统一旦瘫痪,每分钟可能造成数万甚至数十万的损失。想象一下,如果银行的交易系统突然中断,或者医院的挂号系统无法访问,会引发怎样的连锁反应?为了守护这些关键业务,…

day 18进行聚类,进而推断出每个簇的实际含义

浙大疏锦行 对聚类的结果根据具体的特征进行解释,进而推断出每个簇的实际含义 两种思路: 你最开始聚类的时候,就选择了你想最后用来确定簇含义的特征, 最开始用全部特征来聚类,把其余特征作为 x,聚类得到…

LLMs 系列科普文(6)

截止到目前,我们从模型预训练阶段的数据准备讲起,谈到了 Tokenizer、模型的结构、模型的训练,基础模型、预训练阶段、后训练阶段等,这里存在大量的术语或名词,也有一些奇奇怪怪或者说是看起来乱七八糟的内容。这期间跳…

serv00 ssh登录保活脚本-邮件通知版

适用于自己有服务器情况,ssh定时登录到serv00,并在登录成功后发送邮件通知 msmtp 和 mutt安装 需要安装msmtp 和 mutt这两个邮件客户端并配置,参考如下文章前几步是讲配置这俩客户端的,很简单,不再赘述 用Shell脚本实…