【每周CV论文推荐】初学模型蒸馏值得阅读的文章

news2025/7/6 20:42:13

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

模型蒸馏是非常重要的模型压缩方法,在学术界研究非常广泛,本次我们来简单给大家推荐一些初入该领域值得阅读的工作。

作者&编辑 | 言有三

1 基于优化目标驱动的知识蒸馏框架

Hinton最早在文章“Distilling the knowledge in a neural network”中提出了知识蒸馏的概念,其核心思想是一旦复杂网络模型训练完成,便可以用另一种训练方法从复杂模型中提取出来更小的模型。

文章引用量:11000+

推荐指数:✦✦✦✦✦

0879ee4c2f14f9bb8a6bfbf01d2d4a89.png

[1] Hinton G, Vinyals O, Dean J. Distilling the knowledge in a neural network[J]. arXiv preprint arXiv:1503.02531, 2015, 2(7).

2 基于特征匹配约束的知识蒸馏框架

上述基本的蒸馏框架以优化目标来约束teacher模型和student模型进行协同学习,模型学习的具体细节难以控制,会让训练不稳定且缓慢,更通用的方法其实是利用隐藏层特征来进行匹配约束,典型框架是FitNets。

文章引用量:2000+

推荐指数:✦✦✦✦✦

5284d9bf9c7ab8dd44f7e654c829b9c8.png

[2] Romero A, Ballas N, Kahou S E, et al. Fitnets: Hints for thin deep nets[J]. arXiv preprint arXiv:1412.6550, 2014.

[3] Huang Z, Wang N. Like what you like: Knowledge distill via neuron selectivity transfer[J]. arXiv preprint arXiv:1707.01219, 2017.

3 自蒸馏框架

在上面我们介绍的框架中,假设教师模型一定是比学生模型表现更好,但是教师模型的存在增加了训练的难度,而且教师模型的存在是否一定是必要的,研究者后面开始思考不需要教师模型的框架,这些可以统一归为自蒸馏框架。

文章引用量:1000+

推荐指数:✦✦✦✦✧

a86a9bfaef0203019add698cf2f37cef.png

[4] Zhang Y, Xiang T, Hospedales T M, et al. Deep mutual learning[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 4320-4328.

[5] Zhang L, Song J, Gao A, et al. Be your own teacher: Improve the performance of convolutional neural networks via self distillation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019: 3713-3722.

4 对知识蒸馏的理解

关于知识蒸馏本身的有效性问题,这几年研究者有不少新的发现,比如知识蒸馏到底是不是真的比从头训练小模型更好,教师模型的存在是必要的吗,教师模型是不是越强越好,与剪枝量化框架的结合,大家也可以多关注关注。

文章引用量:300+

推荐指数:✦✦✦✦✧

dd90353687b967e0689dd5ba3c6d2869.png

[6] Cho J H, Hariharan B. On the efficacy of knowledge distillation[C]//Proceedings of the IEEE/CVF international conference on computer vision. 2019: 4794-4802.

[7] Yuan L, Tay F E H, Li G, et al. Revisit knowledge distillation: a teacher-free framework[J]. 2019.

5 如何实战

为了帮助大家掌握模型优化压缩的相关知识!我们推出了相关的专栏课程《深度学习之模型优化:理论与实践》,讲解模型剪枝、模型量化、模型蒸馏等方向的理论与实践,感兴趣可以进一步阅读:

【视频课】AI必学,超10小时,4大模块,掌握模型优化核心技术!

7b054a746ef55133b59350adc905016c.png

总结

本次我们介绍了模型蒸馏的一些典型研究,从事相关方向的朋友可以通过阅读这些文章进行初步了解,模型蒸馏是掌握模型压缩任务的必经之路。

有三AI- CV夏季划

2267b0021d1286b7db0c55e465dd0c4a.png

如何系统性地从零进阶计算机视觉,永久系统性地跟随我们社区学习CV的相关内容,请关注有三AI-CV夏季划组,阅读了解下文:

【CV夏季划】2022年正式入夏,从理论到实践,如何系统性进阶CV?(产学研一体的超硬核培养方式)

814218066b58add0ae317db3f385758d.jpeg

转载文章请后台联系

侵权必究

b3912a5de2864a18ffe9843cafa459c7.jpeg

68ced7a5839f1e2065ffa183f2400c2a.png

eb78e096dbbc440021147f311b817a89.png

往期相关精选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/37120.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HTML5期末考核大作业网站——卫生与健康HTML+CSS+JavaScript

🎀 精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

SpringBoot SpringBoot 原理篇 1 自动配置 1.14 自动配置思想

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 原理篇 文章目录SpringBootSpringBoot 原理篇1 自动配置1.14 自动配置思想1.14.1 自动配置原理1 自动配置 1.14 自动配置思…

LeetCode_dijkstra 算法_困难_882.细分图中的可到达节点

目录1.题目2.思路3.代码实现(Java)1.题目 给你一个无向图(原始图),图中有 n 个节点,编号从 0 到 n - 1。你决定将图中的每条边细分为一条节点链,每条边之间的新节点数各不相同。 图用由边组成…

使用 Next.js 搭建 Monorepo 组件库文档

文章为稀土掘金技术社区首发签约文章,14 天内禁止转载,14 天后未获授权禁止转载,侵权必究! 阅读本文你将: 使用 pnpm 搭建一个 Monorepo 组件库使用 Next.js 开发一个组件库文档changesets 来管理包的 version 和生成…

Linux进程总结详解(上——初识)

Linux进程 文章目录Linux进程前言——先从硬件和软件谈起一、冯诺依曼体系结构二、操作系统概念一、进程介绍概念进程控制块查看进程通过系统创建进程二、进程状态1.内核代码如下:总结前言——先从硬件和软件谈起 一、冯诺依曼体系结构 定义:数学家冯诺…

【数据结构】二叉树的遍历

目录☀️二叉树的构建☀️二叉树的遍历🌻前序遍历🌻中序遍历🌻后序遍历☀️完整代码展示☀️二叉树的构建 便于理解二叉树的遍历,这里我们手动简单构建一个二叉树,当然,此处二叉树的构建并不是真正二叉树的…

C++类与对象(一)

目录 一、面向过程和面向对象认识 二、类的引入 三、类的定义 类的两种定义方式: 四、类的访问限定符及封装 4.1 访问限定符 4.2 封装 五、类的作用域 六、类的实例化 七、类对象模型 7.1 如何计算类对象的大小​​​​​ 7.2 类对象的存储方式 7.3 结…

SpringBoot+Mybaits搭建通用管理系统实例十一:数据缓存功能实现

一、本章内容 使用ehcache实现系统缓存功能,并配置实现mybatis的二级缓存,自定义分页缓存的key,识别实体类型,并根据实体属性的配置,组合生成key值用于标识缓存数据。 完整课程地址二、开发视频 SpringBoot+Mybaits搭建通用管理系统实例三:缓存管理功能实现 三、缓存配置 …

滚动吧,数字

朋友有个需求关于金币滚动效果,网上也有很多教程;但多不太符合他的需求,所有利用空余时间帮他做了一个通用组件。 效果图如下: 1、按照次数和速度进行,对应的滚动效果。 2、缓动效果可以根据自己的情况进行修改。 项目地址&#x…

windows安装VMware虚拟机(附带CentOS7部署)

软件下载 链接:https://pan.baidu.com/s/1Vw2Bilf9uf-EYR6_MR86aA?pwdd2qr 提取码:d2qr VMware安装 通你上述链接下载VMware安装包,没有特别选项,选安装位置无脑下一步安装,安装完成后会提示你输入激活码&#xf…

Java中的OpenCV-图像处理

我们将在本文中介绍以下高级图像处理操作:Canny 边缘检测轮廓和形状识别Canny 边缘检测:Canny 边缘检测是一种流行的边缘检测算法。它是由 John F. Canny 在 1986 年开发的。它是一个多阶段算法,我们将按如下方式经历每个阶段:噪声…

Java与GitLab OpenAPI交互

通过Gitlab Open api代码来操作代码的合并及关闭&#xff0c;项目的模板生成........ 方式一&#xff1a; 使用java-gitlab-api(推荐) 接口文档Java Gitlab API Documentation <dependency> <groupId>org.gitlab</groupId> <art…

49 多个 classloader 加载的同类限定名的Class 在 jhat 中显示不全

前言 呵呵 这是在之前 排查一个 flink 的相关问题的时候 发现的一个问题 flink 默认的 job 隔离是基于 Classloader 来进行隔离的 直到 最近才有时间来看一下 这个问题的原因, 究其代码 也还是比较容易找到 大致记录一下 以下内容, 截图 基于 jdk8 测试用例 /*** …

要闻 | 人大金仓重磅亮相2022南京软博会

“软件赋能 数智转型”&#xff0c;2022中国&#xff08;南京&#xff09;国际软件产品和信息服务交易博览会&#xff08;下称“南京软博会”&#xff09;于11月23至25日顺利举行。人大金仓重磅亮相本次展会&#xff0c;并受邀出席同期召开的2022中国&#xff08;南京&#xff…

【LeetCode每日一题】——37.解数独

文章目录一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【解题思路】七【题目提示】八【时间频度】九【代码实现】十【提交结果】一【题目类别】 数组 二【题目难度】 困难 三【题目编号】 37.解数独 四【题目描述】 编写一个程序&#xff…

抢先看!阿里发布2023最新版分布式核心小册,GitHub标星破已千万

什么是分布式 一个分布式系统你可以看做是一组计算机系统一起工作&#xff0c;而在终端用户的视角看过去&#xff0c;就像一台计算机在工作一样 。 这组一起工作的计算机&#xff0c;拥有共享的状态 &#xff0c;他们同时运行&#xff0c;独立机器的故障不会影响整个系统的正常…

1、认识时间复杂度和简单的排序算法

目录时间复杂度选择排序冒泡排序异或交换解释案例综上插入排序二分查找拓展对数器时间复杂度 如果一个操作时间和数据量没有关系&#xff0c;则是常数时间的操作 比如一个数组arr[n]这就是算一个偏移量&#xff0c;然后找到这个位置的值&#xff0c;这就是常数时间&#xff0c…

力扣(LeetCode)882. 细分图中的可到达节点(C++)

spfa 将边细分成节点&#xff0c;如果一条边细分出 nnn 个结点&#xff0c;那么边的两个端点距离 n1n1n1 &#xff0c;边长 n1n1n1。提示中给出&#xff0c;一共 300030003000 个初始结点&#xff0c;无向边的数目小于等于 100001000010000 &#xff0c;这是提示我们最多有 20…

服务器怎么远程连接控制

服务器怎么远程连接控制 我是艾西&#xff0c;还是有很多小白同学问我服务器怎么远程连接。那么今天我们重点来教教大家如何用电脑远程服务器配上图文教程&#xff0c;让不懂的新手小白一看就会&#xff0c;分分钟上手教程 远程服务器需要一台电脑俗称“PC”就是我们自己平时经…

红外遥控视力自动检测系统的设计与实现

红外线视力检测系统的设计与实现 实现方法 分为两部分 上位机-------------串口通讯-------------下位机 上位机&#xff1a;使用LabVIEW软件编写窗口软件。 串口通讯&#xff1a;USB线进行链接通讯。 下位机&#xff1a;AT89C52单片机开发板 说明&#xff1a;Labvi…