Ocean: Object-aware Anchor-free Tracking

news2025/5/19 2:03:20

领域Object tracking
It aims to infer the location of an arbitrary target in a video sequence, given only its location in the first frame

问题/现象

  1. Anchor-based Siamese trackers have achieved remarkable advancements in accuracy, yet the further improvement is restricted by the lagged tracking robustness.
    Anchor-based Siamese trackers精确度还行但鲁棒性不行

  2. In prior Siamese tracking approaches, the classification confidence is estimated by the feature sampled from a fixed regular region in the feature map. This sampled feature depicts a fixed local region of the image, and it is not scalable to the change of object scale. As a result, the classification confidence is not reliable in distinguishing the target object from complex background.
    分类置信度是通过从固定的局部区域得到的特征估计出来的,所以当物体尺度变化的时候它并不会改变。所以当要从复杂的背景区分目标物体时,这个分类器是不可靠的。

  3. regression network in anchor-based methods is only trained on the positive anchor boxes. This mechanism makes it difficult to refine the anchors whose overlap with the target objects are small.

    This will cause tracking failures especially when the classification results are not reliable. The regression network is incapable of rectifying this weak prediction because it is previously unseen in the training set.

    原因是因为anchor-based methods的回归网络仅在正样本(当框和目标物体的重合超过一个标准时,称这个框为正样本)上训练(训练集中只有分类正确的时候,offset是什么。没有分类错误的样本)。这使得它很难去refine anchorsanchor和目标物体的重叠很少时(因为这个时候的框为负样本,previously unseen in the training set.,先前/训练时没见过这样的)。也就是当前面分类错误的时候,后面的回归网络也没有修正这个不准确的预测的能力

can we design a bounding-box regressor with the capability of rectifying inaccurate predictions?

YES!
在这里插入图片描述

这篇文章提出的跟踪器哈哈:Object-aware Anchor-Free Networks(Ocean)
(对应上述问题123)

  1. consists of two components: an object-aware classification network and a bounding-box regression network.(anchor free的)

  2. The classification is in charge of determining whether a region belongs to foreground or background
    分类器分出前景和背景(分类只采样距离中心近的点为正样本)(同时使用了object-aware featureregular-region feature。与之前anchor free方法,如FCOS不同的是增加了一个object-aware feature,且FCOS分类和回归都是计算所有落在GT内的点;)
    introduce a feature alignment module to learn an object-aware feature from predicted bounding boxes. The object-aware feature can further contribute to the classification of target objects and background.
    同时引进一个特征对齐的模块来学习 object-aware feature,使得更好的实现背景和目标物体之间的区分,也获得了一个全局的外观描述。
    实现:将卷积核的固定采样位置对齐到预测的回归box(图2c)。回归box是通过bounding-box regression network得来的哦。对于classification map上的每个位置(dx, dy),都有一个对应的回归预测框M=(mx, my, mw, mh)mx, my表示中心,mw, mh表示宽高。目标就是从候选框M中采样特征来预测(dx, dy)的分类得分。

  3. regression aims to predict the distances from each pixel within the target objects to the four sides of the groundtruth bounding boxes.
    回归用来预测目标物体中的每个像素点到真实锚框的四条边的距离。(训练时候的样本是all the pixels in the groundtruth bounding box)

Since each pixel in the groundtruth box is well trained, the regression network is able to localize the target object even when only a small region is identified as the foreground.
就算只有很小一块区域被分类为前景,由于each pixel in the groundtruth box is well trained,所以该回归有修正前面不太正确的预测的可能性

(这样理解:anchor-based一个框是一个样本,这里一个像素是一个样本。前面的训练集是正确的框怎么偏移到groundtruth,后面的是每个像素到框的距离。那么当框和目标物体重叠很小但被预测为正确的框的时候。对于anchor-based,因为实际上它是负样本,所以没见过,没训练过。但对于anchor free的,即使预测为前景实际也为前景的部分很小,那也还是有实际为前景且被正确预测为前进的像素点存在的,训练的时候见过,所以有纠正预测的可能)

在这里插入图片描述

  • 回归的时候所有位于groundtruth box内的像素都被标注为正样本
  • 对于Regular-region classification,靠近目标中心点的一小部分区域内的像素为正样本
  • 对于Object-aware classificationthe IoU of predicted box and groundtruth box被用作标签。

more details are provided in this paper:Ocean: Object-aware Anchor-free Tracking

补充(超简版):

  • anchor-based methodsVSanchor free methods
    • anchor-based :
      • 相比于anchor free,它使用预定义的anchor框来匹配真实的目标框
      • 过程:生成 anchor boxes,判断每个 anchor box foreground还是background(二分类),对anchor box进行微调(这部分就是前文提到的refine),使得 positive anchor 和真实框(Ground Truth Box)更加接近(使用regression
    • anchor free:
      • Different from anchor-based methods which estimate the offsets of anchor boxes, anchor-free mechanisms predict the location of objects in a direct way.
      • 基于角点的/中心点的/全卷积的
  • 目标跟踪VS目标检测
    • 目标检测是事先针对特定目标的,比如人头检测、动物检测,目标跟踪则是对于任意目标的跟踪,即事先是不知道跟踪的具体目标的。(但是检测器也可以根据人们需要检测的目标进行初始化,这样好像又有点像跟踪器了->基于检测的目标跟踪。而且感觉基于检测的的目标跟踪有点 杀鸡用牛刀 了吧,因为根本不需进行目标识别,不需要每一帧都去检测,就只是目标跟踪就好了)
    • 理想的跟踪器应该不需要每一帧都暴力检测目标所在的位置,而是可以充分利用帧间信息,目标周围的环境信息,甚至根据周边环境推测得到的三维信息等,更加高效的确定目标所在的位置
    • 再想象一个场景:一个被设计用来检测行人的目标检测器,如果将其应用到马路场景上,检测器将会检测到马路上的大量行人。如果只想跟踪某个行人,那么检测器的结果并不是人们想要的。但这时跟踪器就完全不一样了,给跟踪器指定初始跟踪行人后,它将可以在后续的过程中只跟踪指定的行人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2378936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机网络(1)——概述

1.计算机网络基本概念 1.1 什么是计算机网络 计算机网络的产生背景 在计算机网络出现之前,计算机之间都是相互独立的,每台计算机只能访问自身存储的数据,无法与其他计算机进行数据交换和资源共享。这种独立的计算机系统存在诸多局限性&#…

刘家祎双剧收官见证蜕变,诠释多面人生

近期,两部风格迥异的剧集迎来收官时刻,而青年演员刘家祎在《我家的医生》与《无尽的尽头》中的精彩演绎,无疑成为观众热议的焦点。从温暖治愈的医疗日常到冷峻深刻的少年救赎,他以极具张力的表演,展现出令人惊叹的可塑…

Axure制作可视化大屏动态滚动列表教程

在可视化大屏设计中,动态滚动列表是一种常见且实用的展示方式,能够有效地展示大量信息。本文将详细介绍如何使用Axure制作一个动态滚动的列表展示模块。 一、准备工作 打开Axure软件:确保你已经安装并打开了Axure RP软件。创建新项目&#x…

MATLAB实现振幅调制(AM调制信号)

AM调制是通信专业非常重要的一个知识点。今天我们使用MATLAB编程实现AM调制。 我们实现输入一个载波信号的频率与调制信号的频率后,再输入调幅度,得到已调信号的波形与包络信号的波形,再使用FFT算法分析出已调信号的频谱图。 源代码&#x…

6.1.1图的基本概念

基本概念 图: 顶点集边集 顶点集:所有顶点的集合,不能为空(因为图是顶点集和边集组成,其中一个顶点集不能为空,则图肯定不为空) 边集:所有边的集合,边是由顶点集中的2…

Linux面试题集合(6)

创建多级目录或者同级目录 mkdir -p 文件名/文件名/文件名 mkdir -p 文件名 文件名 文件名 Linux创建一个文件 touch 文件名 DOS命令创建文件 echo 内容>文件名(创建一个有内容的文件) echo >文件名(创建一个没有内容的文件&#xff09…

时间筛掉了不够坚定的东西

2025年5月17日,16~25℃,还好 待办: 《高等数学1》重修考试 《高等数学2》备课 《物理[2]》备课 《高等数学2》取消考试资格学生名单 《物理[2]》取消考试资格名单 职称申报材料 2024年税务申报 5月24日、25日监考报名 遇见:敲了一…

YOLOv7训练时4个类别只出2个类别

正常是4个类别: 但是YOLOv7训练完后预测总是只有两个类别: 而且都是LFM和SFM 我一开始检查了下特征图大小,如果输入是640*640的话,三个尺度特征图是80*80,40*40,20*20;如果输入是416*416的话,三个尺度特征…

【论文阅读】针对BEV感知的攻击

Understanding the Robustness of 3D Object Detection with Bird’s-Eye-View Representations in Autonomous Driving 这篇文章是发表在CVPR上的一篇文章,针对基于BEV的目标检测算法进行了两类可靠性分析,即恶劣自然条件以及敌对攻击。同时也提出了一…

flutter 配置 安卓、Ios启动图

android 配置启动图 launch_background.xml <?xml version"1.0" encoding"utf-8"?> <!-- Modify this file to customize your launch splash screen --> <layer-list xmlns:android"http://schemas.android.com/apk/res/android&…

基于朴素贝叶斯与 LSTM 的假新闻检测模型对比分析

一、引言 在信息爆炸的时代&#xff0c;假新闻的传播对社会产生了诸多负面影响。如何快速、准确地识别假新闻成为了重要的研究课题。本文将对比传统机器学习算法&#xff08;朴素贝叶斯&#xff09;与深度学习模型&#xff08;LSTM&#xff09;在假新闻检测任务中的性能表现&am…

【LeetCode 热题 100】搜索插入位置 / 搜索旋转排序数组 / 寻找旋转排序数组中的最小值

⭐️个人主页&#xff1a;小羊 ⭐️所属专栏&#xff1a;LeetCode 热题 100 很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~ 目录 搜索插入位置搜索二维矩阵在排序数组中查找元素的第一个和最后一个位置搜索旋转排序数组寻找旋转排序数组中的最小值…

副业小程序YUERGS,从开发到变现

文章目录 我为什么写这个小程序网站转小程序有什么坑有什么推广渠道个人开发者如何变现简单介绍YUERGS小程序给独立开发者一点小建议 我为什么写这个小程序 关注我的粉丝应该知道&#xff0c;我在硕士阶段就已经掌握了小程序开发技能&#xff0c;并写了一个名为“约球online”…

基于LLM合成高质量情感数据,提升情感分类能力!!

摘要&#xff1a;大多数用于情感分析的数据集缺乏意见表达的上下文&#xff0c;而上下文对于理解情绪往往至关重要&#xff0c;并且这些数据集主要局限于几种情绪类别。像 GPT-4 这样的基础大型语言模型&#xff08;Foundation Large Language Models&#xff0c;LLMs&#xff…

网络检测工具InternetTest v8.9.1.2504 单文件版,支持一键查询IP/DNS、WIFI密码信息

—————【下 载 地 址】——————— 【​本章下载一】&#xff1a;https://drive.uc.cn/s/295e068b79314 【​本章下载二】&#xff1a;https://pan.xunlei.com/s/VOQDXguH0DYPxrql5y2zlkhTA1?pwdg2nx# 【百款黑科技】&#xff1a;https://ucnygalh6wle.feishu.cn/wiki/…

【网络编程】十、详解 UDP 协议

文章目录 Ⅰ. 传输层概述1、进程之间的通信2、再谈端口号端口号的引出五元组标识一个通信端口号范围划分常见的知名端口号查看知名端口号协议号 VS 端口号 3、两个问题一个端口号是否可以被多个进程绑定&#xff1f;一个进程是否可以绑定多个端口号&#xff1f; 4、部分常见指令…

[目标检测] YOLO系列算法讲解

前言 目标检测就是做到给模型输入一张图片或者视频&#xff0c;模型可以迅速判断出视频和图片里面感兴趣的目标所有的位置和它 的类别&#xff0c;而当前最热门的目标检测的模型也就是YOLO系列了。 YOLO系列的模型的提出&#xff0c;是为了解决当时目标检测的模型帧率太低而提…

.NET NativeAOT 指南

目录 1. 引言 2. 什么是 .NET NativeAOT&#xff1f; 2.1 NativeAOT 的定义 2.2 NativeAOT 与传统 JIT 的对比 2.3 NativeAOT 的适用场景 3. NativeAOT 的核心优势 3.1 性能提升 3.2 简化部署 3.3 更小的应用体积 3.4 知识产权保护 4. NativeAOT 的基本用法 4.1 环境…

uniapp-商城-57-后台 新增商品(弹窗属性数据添加父级)

后台增加商品&#xff0c;需要添加相关的数据信息&#xff0c;这里还要添加属性&#xff0c;前面已经对相关的界面布局继续了编写。这里还要对页面添加的数据&#xff0c;置入到云数据库&#xff0c;继续永久保存&#xff0c;便于后期的使用。这里主要是讲属性数据 父级信息的添…

摩方 12 代 N200 迷你主机(Ubuntu 系统)WiFi 抓包环境配置教程

摩方12代N200迷你主机标配 Intel AX201无线网卡&#xff0c;支持 WiFi 6 协议&#xff08;802.11ax&#xff09;及蓝牙5.2。此网卡兼容主流抓包工具&#xff0c;但需注意&#xff1a; 驱动兼容性&#xff1a;Ubuntu 20.04及以上内核版本&#xff08;5.4&#xff09;默认支持AX2…