YOLO系列算法改进 | 主干改进篇 | 替换QARepVGG量化感知重参数化网络 | 通过权重与激活分布的协同优化,在保持部署推理速度的同时解决INT8量化精度崩塌难题 | AAAI 2024
0. 前言本文介绍QARepVGG量化感知重参数化网络,并将其集成到ultralytics最新发布的YOLOv26目标检测算法中,替换原有Backbone网络。QARepVGG通过重新设计RepVGG的多分支结构(移除Identity与1×1分支的BN层、在分支融合后添加后置BN),从根本上解决了重参数化网络在INT8量化时的精度崩塌问题。将QARepVGG作为YOLOv26的新主干网络,能够在不增加任何推理开销的前提下,将模型INT8量化精度损失从原来的20%以上压缩至2%以内,特别适用于边缘计算、移动端部署、无人机巡检等对模型体积和推理延迟有严格要求的硬件受限场景,让高精度重参数化网络真正实现“训练后即量化、量化后即部署”的工业级落地。专栏链接:YOLO系列算法改进专栏链接专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!目录0. 前言1. QARepVGG网络简介2.QARepVGG网络原理与创新点🧠QARepVGG网络基本原理🎯QARepVGG网络创新点3.具体改进步骤🍀🍀步骤1:创建QARepVGG.py文件🍀🍀步骤2:tasks.py文件修改⚡1.QARepVGG网络导入⚡2.QARepVGG网络注册⚡3. 其他修改1(Ctrl+F搜索定位一下)⚡4. 其他修改2(Ctrl+F搜索定位一下)⚡5. 其他修改3(_predict_once函数修改)🍀🍀步骤3:创建YAML配置文件🍀🍀步骤4:新建train.py文件训练模型🍀🍀步骤5:模型结构打印结果1. QARepVGG网络简介性能和推理速度之间的权衡对于实际应用至关重要,而结构重参数化正成为一种越来越流行的 ConvNet 架构。尽管如此,当需要 INT8 推理时,其量化性能通常因性能下降过大而无法部署(例如,在 ImageNet 上 Top-1 精度下降超过 20%)。本文深入探讨了这种失败的潜在机制,发现原始设计不可避免地放大了量化误差。作为补救措施,我们提出了一种简单、鲁棒且有效的量化友好型重参数化结构,它同样享有重参数化的优势,同时大大缩小了 RepVGG 在 INT8 与 FP32 精度之间的差距。无需任何花哨的技巧,通过标准的训练后量化(PTQ),我们将 ImageNet 上的 Top-1 精度下降控制在 2% 以内。我们还在各种视觉任务上验证了所提结构的有效性,包括分类、检测和分割。原始论文:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2489775.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!