每日学术速递5.9

news2025/6/20 15:50:13

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.Tracking through Containers and Occluders in the Wild(CVPR 2023)

标题:在野外通过容器和遮挡物进行追踪

作者:Basile Van Hoorick, Pavel Tokmakov, Simon Stent, Jie Li, Carl Vondrick

文章链接:https://arxiv.org/abs/2305.03052v1

项目代码:https://tcow.cs.columbia.edu/

摘要:

        在杂乱和动态的环境中持续跟踪对象仍然是计算机视觉系统的一项艰巨挑战。在本文中,我们介绍了 TCOW ,这是一种通过严重遮挡和遏制进行视觉跟踪的新基准和模型。我们设置了一个任务,目标是在给定视频序列的情况下,分割目标对象的投影范围以及周围存在的容器或遮挡物。为了研究这项任务,我们创建了合成和带注释的真实数据集的混合物,以支持在各种形式的任务变化(例如移动或嵌套包含)下对模型性能进行监督学习和结构化评估。我们评估了两个最近的基于 transformer 的视频模型,发现虽然它们在某些任务变化设置下能够令人惊讶地跟踪目标,但在我们可以声称跟踪模型已经获得了对象永久性的真实概念之前,仍然存在相当大的性能差距.

2.LIMOT: A Tightly-Coupled System for LiDAR-Inertial Odometry and Multi-Object Tracking

标题:LIMOT:用于 LiDAR 惯性里程计和多目标跟踪的紧耦合系统

作者:Chung-Ching Lin, Jiang Wang, Kun Luo, Kevin Lin, Linjie Li, Lijuan Wang, Zicheng Liu

文章链接:https://arxiv.org/abs/2305.00406v1

项目代码:https://github.com/microsoft/AdaM

摘要:

        同步定位与地图构建 (SLAM) 对于自动驾驶的实施至关重要。大多数 LiDAR 惯性 SLAM 算法都假设静态环境,导致动态环境中的定位不可靠。此外,准确跟踪运动物体对于自主车辆运行的控制和规划具有重要意义。本研究提出了 LIMOT,这是一种紧密耦合的多目标跟踪和 LiDAR 惯性 SLAM 系统,能够准确估计自我车辆和物体的姿态。首先,我们使用物体检测器生成的 3D 边界框来表示所有可移动物体,并使用惯性测量单元 (IMU) 预积分结果执行 LiDAR 里程计。基于滑动窗口中跟踪对象的历史轨迹,我们执行稳健的对象关联。我们提出了一种基于轨迹的动态特征过滤方法,该方法利用跟踪结果过滤掉属于运动物体的特征。然后进行基于因子图的优化,以优化 IMU 的偏差以及滑动窗口中本车和周围物体的姿态。在 KITTI 数据集上进行的实验表明,我们的方法比我们之前的工作 DL-SLOT 和其他 SLAM 和多目标跟踪基线方法实现了更好的姿势和跟踪精度。

3.Tracker Meets Night: A Transformer Enhancer for UAV Tracking

标题:Tracker Meets Night:无人机跟踪的变形增强器

作者:Junjie Ye, Changhong Fu, Ziang Cao, Shan An, Guangze Zheng, Bowen Li

文章链接:https://arxiv.org/abs/2303.10951v1

项目代码:https://github.com/vision4robotics/SCT

摘要:

        目标跟踪的大多数先前进展是在具有良好照明的白天场景中实现的。迄今为止,最先进的技术很难在夜间发挥其优势,从而大大阻碍了与视觉跟踪相关的无人机 (UAV) 应用的扩展。为了在夜间实现可靠的 UAV 跟踪,提出了一种基于空间通道 Transformer 的低光增强器(即 SCT),它以一种新颖的任务启发方式进行训练,并在跟踪方法之前插入。为了实现针对高级任务的语义级弱光增强,提出了一种新颖的空间通道注意模块,以在保留局部上下文的同时对全局信息进行建模。在增强过程中,SCT 通过稳健的非线性曲线投影同时对夜间图像进行去噪和照明。此外,为了提供全面的评估,我们构建了一个具有挑战性的夜间跟踪基准,即 DarkTrack2021,它包含 110 个具有挑战性的序列,总共超过 100 K 帧。对公共 UAVDark135 基准测试和新建的 DarkTrack2021 基准测试的评估表明,与其他排名靠前的低光增强器相比,受任务启发的设计使 SCT 在夜间无人机跟踪方面具有显着的性能提升。在典型无人机平台上的真实世界测试进一步验证了所提出方法的实用性。DarkTrack2021 基准测试和所提议方法的代码可在此 https URL 上公开获得。

 

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/521121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++数据封装以及定义结构的详细讲解鸭~

名字:阿玥的小东东 博客主页:阿玥的小东东的博客_CSDN博客-python&&c高级知识,过年必备,C/C知识讲解领域博主 目录 定义结构 访问结构成员 结构作为函数参数 指向结构的指针 typedef 关键字 C 数据封装 数据封装的实例 设计策略 C 类 &…

UEngine运行器2.1.0——优化UEngine安装器(Ubuntu)、修复问题

介绍 新版本Deepin/UOS发布后,可以在应用商店安装部分官方已适配的安卓应用,对爱好者来说,不能自己安装APK软件包始终差点意思,本程序可以为Deepin/UOS上的UEngine安卓运行环境安装自定义APK软件包,并能发送安装的APK包…

【GAMES101】作业1学习总结

本系列博客为记录笔者在学习GAMES101课程时遇到的问题与思考。 GAMES101:课程官网GAMES101:B站视频GAMES101:相关文件下载(百度网盘) 一、基础题 通过Assignment1.pdf可以知道基础题的任务就是填充完整两个函数 get_model_matrix()get_pro…

详解c++---array和模板

目录标题 什么是array非类型模板参数函数模板的特化为什么会有特化如何进行特化类模板的特化部分特化模板特化参数的限制 模板的匹配规则模板的分离编译模板的总结 什么是array 在c语言里面使用一个括号就能申请到一段连续的空间,比如说想要申请一段空间用于存储10…

每日学术速递5.8

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Personalize Segment Anything Model with One Shot 标题:一键个性化细分任何模型 作者:Renrui Zhang, Zhengkai Jiang, Ziyu Guo, Shilin Yan, Junting Pa…

ArcMap创建格网统计图

目录 前言 一、人口数据获取 来源一:中科院地理所公开数据集 来源二:WorldPop数据集 二、人口格网统计步骤 1.创建渔网 2.人口数据处理 2.1 栅格转点 2.2 空间插值——处理人口缺失数据 2.3 空间连接——渔网人口统计 总结 前言 在科研中&am…

南华大学编译原理----词法分析器的设计与实现、语法分析器的设计与实现

下载链接:(各位同学不需要充钱哈,这种我也没有收益,去淘宝上面找个代下,大概0.5元就能下载实验报告,用来给同学们参考,下载积分不是我设置的,是网站自己默认的) --------…

English Learning - L3 作业打卡 Lesson1 Day1 2023.5.5 周五

English Learning - L3 作业打卡 Lesson1 Day1 2023.5.5 周五 引言🍉句1: Every people has its own way of saying things , its own special expressions.成分划分弱读连读语调自身问题: 🍉句2: Many everyday American expressions are ba…

股票量价关系基础知识6----图解各阶段量价关系:价涨量平

图解各阶段量价关系:价涨量平 价涨量平是指股价上涨而成交量却变化不大,这可能是场外资金仍在观望,进场做多力量不大。 一、上涨初期的价涨量平 (一)形态分析 股价触底反弹后小幅上涨,成交量却持平&#x…

【认知提升思维篇】之向上越阶的跳圈思维(学霸的秘籍)

👨‍💻个人主页:元宇宙-秩沅 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 秩沅 原创 👨‍💻 收录于专栏:普本…

软软件设计师算法上午题概念笔记

N皇后问题 **走迷宫 ** 以上q2不行 因为不能在同一行 这条路所有的都走不通所以需要回溯回溯至上一条路,把上一个皇后位置改变下 重新放皇后三 皇后四不能放所以回溯,发现皇后三也不能放 再往上回溯,发现2也不行那就回溯皇后1 总结&…

网络安全工程师必须面对的三个坎必备十大基础知识!

前言 我一个朋友老赵,老赵在一家大型互联网公司做高级网络安全工程师,从实习生到工程师整整待了六年。去年他们公司为了缩减成本,做了裁员,他也在其中,取而代之的是一个只有三年工作经验的 “新人” … 老赵想着&…

小牟Andorid下面MD5具体实现的思路总结

Android的开发往往需要一定数目demo 从今起MD5一些加密算法提取物 看看是如何实现的 首先,我们必须明确为什么加密? 1 数据安全处理 2 防止数据窃取 3 有效的避免恶意攻击 4 保证文件完整性 5 优化搜索 作为文件(数据)索引…

【Java零基础入门篇】第 ⑦ 期 - 常用类库

博主:命运之光 专栏:Java零基础入门 学习目标 掌握Java各种常用类库的使用方法。 目录 Java类库 字符串String String 概述 创建字符串对象的2种方式 String类的特点 创建字符串对象的2种方式 总结:创建字符串对象的2种方式区别 字符…

【C++】类和对象(下篇)

C类和对象下篇 构造函数的一点补充构造函数体赋值初始化列表explicit关键字 Static成员概念特性 友元友元函数友元类 内部类概念特性 匿名对象拷贝对象时的一些编译器优化几道例题 构造函数的一点补充 构造函数体赋值 在创建对象时,编译器通过调用构造函数&#x…

股票量价关系基础知识2

内盘与外盘 外盘,是指在一个交易日获某段交易时间内,买方主动提价以委卖价成交的股数之和,也称为主动性买盘 内盘,是指在一个交易日获某段交易时间内,卖方主动降价以委买价成交的股数之和,也称主动性卖盘。…

flstudio20没有language选项,fl 21怎么也没有language选项

最新小伙伴们安装flstudio20没有language选项,是什么原因导致flstudio20没有language选项,兔八哥爱分享测试了,应该是flstudio20版本太低了,建议安装flstudio20.8以上版本,才可以flstudio20.8语言切换中文版。 flstud…

05- redis集群模式搭建(上) (包含云服务器[有坑])

目录 1. 准备环境: 2. 简介: -> 2.1 前言: -> 2.2 Redis集群架构实现了对redis的水平扩容 -> 2.3 redis cluster集群原理 3. 搭建后特别需要注意的问题 ->3.1 [重点]: 如果一个服务出现故障: 是否可以继续提供服务??? ---> 3.1.1 如果集群中故障re…

C++系列八:选择、循环与转向

选择、循环与转向 1. 选择语句2. 循环语句3. 转向语句4. 总结 1. 选择语句 选择语句使用条件来确定程序将执行哪些代码。在C编程中,选择语句有多种类型,包括if语句、switch语句和三元运算符。 (1)if语句 if语句是C编程中最常见…

Oracle EBS Interface/API(49)- AP付款取消API

快速参考 参考点内容功能导航N: AP->付款->录入->付款并发请求None基表AP.AP_CHECKS_ALLAPI参考下面介绍错误信息表None接口FormNone接口ReportNoneDebug ProfileNone详细例子参考如下实例官方文档None数据验证包None用户界面 Path:AP->付款->录入->付款-&g…