YOLO26改进86:全网首发--c3k2模块添加DynamicFilter模块
论文介绍配备多头自注意力机制(MHSA)的模型在计算机视觉领域已取得显著性能。这类模型的计算复杂度与输入特征图像素数量的平方成正比,导致处理速度较慢,尤其在处理高分辨率图像时更为明显。为解决这一问题,研究者提出新型令牌混合器作为MHSA的替代方案:基于快速傅里叶变换(FFT)的令牌混合器实现了与MHSA相似的全局操作,但计算复杂度更低。尽管具有这些优势,基于FFT的令牌混合器与快速演进的MetaFormer架构的兼容性尚未得到深入验证。本研究提出名为动态滤波器的新型令牌混合器,并构建DFFormer和CDFFormer两种图像识别模型以填补上述研究空白。图像分类与下游任务的结果、分析及可视化表明,这些模型具有显著效果。特别是在处理高分辨率图像识别时,其吞吐量和内存效率表现突出。实验结果表明,动态滤波器应被视为值得重点考虑的令牌混合器选项之一。代码已开源:https://github.com/okojoalg/dfformer文章地址:地址改进步骤步骤1新建ultralytics\nn\extra_modules\block.py,添加如下代码:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2413550.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!