视觉小目标检测论文速读
本文主要针对三篇文章典型文章。
一. SuperYOLO
Super Resolution Assisted Object Detection in Multimodal Remote Sensing Imagery

1. 主要工作:
- 首先
去掉Focus模块取保持HR特征, 避免分辨率下降,有效克服小目标空间损失的减少。 - 利用
像素级多模态融合(RGB+IR)来提取信息,以增强RSI中小对象的更合适和有效的特征。 - 设计了一个简单灵活的
SR(Super Resolution)分支,用于学习HR特征表示,只用在训练阶段。它可以区分来自广阔背景的小目标低分辨率(LR)输入。SR分支在推理阶段被丢弃
2. 算法细节:
- Backbone:以
YOLOv5s作为baseline

- SR分支结构:Encode-Decoder model, 结合文理信息与语义信息。

二. SLICING AIDED HYPER INFERENCE AND FINE-TUNING FOR SMALL OBJECT DETECTION
参考:https://blog.csdn.net/weixin_54546190/article/details/124307316
1. 主要工作:
提出了一个通用解决方案,基于切片辅助的推理和高分图像中小目标障碍物微调。

2. 算法细节:

- 切片辅助的微调: 实际是
数据增强
一张原始图片,切M×N patches, resize 宽度为800-1333,+ pretrained model->fine-tuned model - 切片辅助的推理
一张原始图片,切成有重叠的M×N patches(如下图), resize 放大, 每一张分别forward;
(可选FI)原始图片的 inference;
合并起来,再postprocess

三. Anchor Retouching via Model Interaction for Robust Object Detection in Aerial Images
1. 前言
anchor-free: 小目标检测效果好,大目标有问题
anchor-based: 大目标检测效果好,小目标有问题

2. 主要工作:
RoI Trans + DEA
DEA Head: 构造Sample discriminator, 样本筛选。作用是生成更多的小目标的正向样本,提高训练时样本质量,如下图对样本分布做了统计。

3. 算法细节:
DEA HEAD = DEA(anchor-free,Fcos) + Faster-RCNN(anchor-based)

Sampler discriminator 伪代码




















