顶会新热门:机器学习可解释性

news2025/6/2 12:27:20

 

🧀机器学习模型的可解释性一直是研究的热点和挑战之一,同样也是近两年各大顶会的投稿热门。

🧀这是因为模型的决策过程不仅需要高准确性,还需要能被我们理解,不然我们很难将它迁移到其它的问题中,也很难进行算法的debug。

🧀更重要的是,提高机器学习可解释性可以帮助我们提高模型的透明度和用户信任度,还能引导模型的开发和优化过程,有效识别和防止潜在的偏差问题,这对金融、医疗等领域至关重要。

🧀目前这方向有四种主流方法:局部解释性方法、全局解释性方法、基于规则的解释性方法和机制性解释性方法。为了方便大家找idea,我根据这四种方法整理好了15篇最新的论文,开源代码已附,想发论文的朋友别错过。

有需要的小伙伴可以关注人人人人公众号(AI科技探寻)免费领取

我还整理出了相关的论文+开源代码,以下是精选部分论文

 

论文1

标题:

Further Insights: Balancing Privacy, Explainability, and Utility in Machine Learning-based Tabular Data Analysis

进一步见解:平衡基于机器学习的表格数据分析中的隐私性、可解释性和效用性

法:

    • 隐私保护机制:采用(𝜖,𝛿)-差分隐私与生成对抗网络(GAN)相结合的方法,通过向数据中添加噪声来保护隐私。

    • 效用评估:通过比较模型在原始数据集和匿名化数据集上的准确率来量化数据效用损失。

    • 可解释性评估:使用多种模型解释方法,如模型性能评估、变量重要性分析、部分依赖曲线(PD)和累积局部依赖(AL)曲线,来评估模型的可解释性。

    • 优化方法:定义了一个综合的权衡标准,通过线性优化方法和兼容性矩阵,系统地探索不同的隐私参数配置,以找到最优的隐私增益和可解释性相似度,同时最小化效用损失。

    创新点:

    • 隐私与效用的平衡:通过优化方法,成功地在保护隐私的同时,最小化了数据效用的损失。例如,在使用Logistic回归分类器时,当隐私参数𝜎=1时,隐私增益达到最大,同时效用损失保持在较低水平。

    • 可解释性的提升:通过引入多种解释方法,显著提高了模型的可解释性。例如,对于Gaussian NB分类器,使用变量重要性解释方法时,可解释性相似度在𝜎=0.8时达到0.58,表明模型在隐私保护下仍能提供高质量的解释。

    • 综合权衡标准:提出了一个综合的权衡标准,能够同时考虑隐私、效用和可解释性,为实际应用中平衡这些因素提供了有效的工具。通过兼容性矩阵,能够为不同的分类器和数据集找到最优的配置,确保在隐私保护和模型解释性之间达到最佳平衡。

     

    论文2

    标题:

    Investigating Adversarial Attacks in Software Analytics via Machine Learning Explainability

    通过机器学习可解释性研究软件分析中的对抗性攻击

    法:

    • 对抗性攻击方法:提出了一种基于机器学习可解释性的对抗性攻击方法,通过修改模型解释技术识别的前𝑘个重要特征来生成对抗性样本。

    • 特征重要性评估:使用SHAP、LIME和PyExplainer等可解释性技术来识别对模型决策影响最大的特征。

    • 攻击效果评估:通过攻击成功率(ASR)指标来评估对抗性攻击的效果,同时考虑了攻击的不可感知性(ℓ0扰动)。

    • 多目标优化:采用多目标优化方法,同时最大化ASR和最小化需要修改的特征数量,以实现攻击效果和不可感知性之间的平衡。

    创新点:

    • 攻击成功率的显著提升:通过修改仅前3个重要特征,攻击成功率(ASR)最高可达86.6%,显著高于现有方法。例如,在使用SHAP解释方法时,对Postgres数据集的攻击成功率达到了80.3%。

    • 不可感知性的优化:在保持高攻击成功率的同时,通过最小化ℓ0扰动,确保了攻击的不可感知性。与现有方法相比,该方法在不可感知性方面表现更优,例如在对CLCDSA数据集的攻击中,仅需修改1个特征即可达到61.4%的ASR。

    • 对多种模型和数据集的普适性:该方法不仅适用于单一模型或数据集,而且在多种机器学习模型和软件分析任务数据集上均表现出色,具有广泛的适用性。

     

    论文3

    标题:

    Regulating Explainability in Machine Learning Applications – Observations from a Policy Design Experiment

    监管机器学习应用中的可解释性——政策设计实验的观察

    方法:

    • 跨学科合作:通过跨学科团队(包括AI和政策背景的研究人员)的持续合作,进行为期十周的实验研究,共同设计可解释性政策。

    • 迭代政策设计:采用迭代方法,每周进行政策草案的制定、尝试遵守和评估,逐步改进政策内容。

    • 证据评估:讨论和评估不同类型的证据(如技术解释、用户研究等)在证明政策合规性中的作用。

    • 案例研究:基于医疗和金融领域的实际案例,评估政策在不同场景下的适用性和有效性

    创新点:

      • 政策设计的可行性验证:通过实验验证了跨学科团队在短时间内设计出可行的可解释性政策的可能性,为政策制定提供了新的思路和方法。

      • 政策内容的改进:通过迭代过程,显著改进了政策内容,使其更加具体、可操作和可执行。例如,在第七周的政策草案中,详细规定了对最终用户和受影响用户的解释要求。

      • 证据评估的重要性:强调了在政策设计过程中讨论证据的重要性,特别是用户研究在评估解释有效性中的关键作用。这一发现为政策制定提供了新的视角,确保政策不仅在技术上可行,而且在实际应用中有效。

       

      论文4

      标题:

      The efficacy of machine learning models in lung cancer risk prediction with explainability

      机器学习模型在肺癌风险预测中的效能与可解释性

      法:

      • 数据集分析:使用包含22个肺癌相关特征的公开数据集,分析特征之间的关系和分布。

      • 模型选择与训练:选择并训练了四种机器学习模型(SVM、KNN、DT、RF),通过网格搜索算法进行超参数调优,以提高模型性能。

      • 模型解释方法:使用决策边界、LIME和决策树提取等方法对模型的预测结果进行解释,提高模型的可解释性。

      • 性能评估:通过交叉验证和测试集评估模型的准确率、精确率、召回率和F1分数,同时分析学习曲线以评估模型的训练效果。

      创新点:

        • 模型性能的显著提升:通过超参数调优,四种模型的准确率均达到了99%以上,其中SVM和KNN的准确率从95%和92%分别提升到100%和99%,显著提高了模型的预测性能。

        • 可解释性的增强:通过多种解释方法,为非技术用户提供了模型决策的逻辑解释,增强了用户对模型的信任。例如,使用LIME方法解释KNN模型时,能够清晰地展示影响预测结果的关键特征及其值范围。

        • 实际应用的可行性:研究结果表明,这些机器学习模型不仅在性能上表现出色,而且在实际应用中具有高度的可行性和可解释性,为肺癌风险预测提供了有力的工具。

         

         

         

         

        本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2394186.html

        如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

        相关文章

        《STL--stack 和 queue 的使用及其底层实现》

        引言: 上次我们学习了容器list的使用及其底层实现,相对来说是比较复杂的,今天我们要学习的适配器stack和queue与list相比就简单很多了,下面我们就开始今天的学习: 一:stack(后进先出&#xff…

        基于springboot的医护人员排班系统设计与实现(源码+文档+部署讲解)

        技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文…

        CRISPR-Cas系统的小型化研究进展-文献精读137

        Progress in the miniaturization of CRISPR-Cas systems CRISPR-Cas系统的小型化研究进展 摘要 CRISPR-Cas基因编辑技术由于其简便性和高效性,已被广泛应用于生物学、医学、农学等领域的基础与应用研究。目前广泛使用的Cas核酸酶均具有较大的分子量(通…

        利用python工具you-get下载网页的视频文件

        有时候我们可能在一个网站看到一个视频(比如B站),想下载,但是页面没有下载视频的按钮。这时候,我们可以借助python工具you-get来实现下载功能。下面简要说下步骤 (一)因为使用的是python工具&a…

        【stm32开发板】单片机最小系统原理图设计

        一、批量添加网络标签 可以选择浮动工具中的N,单独为引脚添加网络标签。 当芯片引脚非常多的时候,选中芯片,右键选择扇出网络标签/非连接标识 按住ctrl键即可选中多个引脚 点击将引脚名称填入网络名 就完成了引脚标签的批量添加 二、电源引…

        实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.2 R语言解题

        本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第5章析因设计引导5.7节思考题5.2 R语言解题。主要涉及方差分析&#xff0c;正态假设检验&#xff0c;残差分析&#xff0c;交互作用。 dataframe<-data.frame( Surfacec(74,64,60,92…

        2025山东CCPC题解

        文章目录 L - StellaD - Distributed SystemI - Square PuzzleE - Greatest Common DivisorG - Assembly Line L - Stella 题目来源&#xff1a;L - Stella 解题思路 签到题&#xff0c;因为给出的字母不是按顺序&#xff0c;可以存起来赋其值&#xff0c;然后在比较。 代码…

        CentOS Stream 9 中部署 MySQL 8.0 MGR(MySQL Group Replication)一主两从高可用集群

        &#x1f407;明明跟你说过&#xff1a;个人主页 &#x1f3c5;个人专栏&#xff1a;《MySQL技术精粹》&#x1f3c5; &#x1f516;行路有良友&#xff0c;便是天堂&#x1f516; 目录 一、前言 1、MySQL 8.0 中的高可用方案 2、适用场景 二、环境准备 1、系统环境说明…

        pycharm 新UI 固定菜单栏 pycharm2025 中文版

        pycharm 新UI 文件 -> 设置 -> 外观与行为 -> 外观 -> UI选项 -> 主菜单:显示在主工具栏上方. 即可固定

        我的世界Java版1.21.4的Fabric模组开发教程(十一)创建方块

        这是适用于Minecraft Java版1.21.4的Fabric模组开发系列教程专栏第十一章——创建方块。想要阅读其他内容&#xff0c;请查看或订阅上面的专栏。 方块(Block) 是构成Minecraft世界的主要组成部分&#xff0c;是组成游戏地图的最基本单元&#xff0c;也是模组开发的核心元素之一…

        VR/AR 视网膜级显示破局:10000PPI 如何终结颗粒感时代?

        一、传统液晶 “纱窗效应”&#xff1a;VR 沉浸体验的最大绊脚石 当用户首次戴上 VR 头显时&#xff0c;眼前密密麻麻的像素网格往往打破沉浸感 —— 这正是传统液晶显示在近眼场景下的致命缺陷。受限于 500-600PPI 的像素密度&#xff0c;即使达到 4K 分辨率&#xff0c;等效到…

        系统思考:化繁为简的艺术

        系统思考&#xff0c;其实是一门化繁为简的艺术。当我们能够把复杂的问题拆解成清晰的核心以及更加简单&#xff0c;从而提升团队的思考品质和行动品质&#xff0c;发挥最大的合力。 每个公司都想在某方面成为最优秀的&#xff0c;但是实际上具有穿透性的洞察力和摆脱虚荣心的清…

        Angularjs-Hello

        1 关于Angularjs 最近因为项目需要又要做这个&#xff0c;所以简单复习下。其实这个大概7&#xff0c;8年前就用过&#xff0c;当时做了几个简单页面觉得太简单就还是回去做嵌入式了。按照互联网技术的进化速度&#xff0c;本来以为早死在 沙滩上了&#xff0c;没想到现在还在坚…

        Linux 1.0.4

        父子shell linux研究的就是shell 打开两个窗口就是两个shell 终端的软件有很多 bash也是一个软件 我们在terminal里面再打开一个bash&#xff0c;然后再次使用ps命令发现多出来一个bash&#xff0c;之后点击exit只是显示了一个exit&#xff0c;这个只是退出了在terminal中打开…

        Qt -下载Qt6与OpenCV

        博客主页&#xff1a;【夜泉_ly】 本文专栏&#xff1a;【暂无】 欢迎点赞&#x1f44d;收藏⭐关注❤️ 前言 呃啊&#xff0c;本来就想在 Qt 里简单几个 OpenVC 的函数&#xff0c;没想到一搞就是一天。 我之前的开发环境是 Qt 5.14.2&#xff0c;使用 MinGW 7.3.0 64-bit 编…

        机器学习无监督学习sklearn实战一:K-Means 算法聚类对葡萄酒数据集进行聚类分析和可视化( 主成分分析PCA特征降维)

        本项目代码在个人github链接&#xff1a;https://github.com/KLWU07/Machine-learning-Project-practice/tree/main/1-Wine%20cluster%20analysis 如果对于聚类算法理论不理解可参考这篇之前文章机器学习中无监督学习方法的聚类&#xff1a;划分式聚类、层次聚类、密度聚类&…

        可灵2.1 vs Veo 3:AI视频生成谁更胜一筹?

        在Google发布Veo 3几天后,可灵显然感受到了压力,发布了即将推出的视频模型系列可灵 2.1的早期体验版。 据我了解,有三种不同的模式: 可灵 2.1 标准模式: 720p分辨率 仅支持图像转视频(生成更快,一致性更好) 5秒视频仍需20积分 可灵 2.1 专业模式: 1080p分辨率 仅在图…

        LLM优化技术——Paged Attention

        在Transformer decoding的过程中&#xff0c;需要存储过去tokens的所有Keys和Values&#xff0c;以完成self attention的计算&#xff0c;称之为KV cache。 &#xff08;1&#xff09;KV cache的大小 可以计算存储KV cache所需的内存大小&#xff1a; batch * layers * kv-he…

        推荐几个不错的AI入门学习视频

        引言&#xff1a;昨天推荐了几本AI入门书&#xff08;AI入门书&#xff09;&#xff0c;反响还不错。今天&#xff0c;我再推荐几个不错的AI学习视频&#xff0c;希望对大家有帮助。 网上关于AI的学习视频特别多。有收费的&#xff0c;也有免费的。我今天只推荐免费的。 我们按…

        采用Bright Data+n8n+AI打造自动化新闻助手:每天5分钟实现内容日更

        一、引言 在信息爆炸的时代&#xff0c;作为科技领域的内容创作者&#xff0c;我每天都要花费2-3小时手动收集行业新闻、撰写摘要并发布到各个社群。直到我发现Bright Datan8nAI这套"黄金组合"&#xff0c;才真正实现了从"人工搬运"到"智能自动化&qu…