SeqTrack模型专题全面调研
SeqTrack目标跟踪算法的配置文件命名规则seqtrack模型名称指的是SeqTrackSequence Tracking一种基于序列建模的目标跟踪算法。b/l代表模型的Backbone主干网络或模型大小。b指Base使用较小的主干网络如 ResNet-50 等。l指Large使用更大的主干网络如 ResNet-101 等参数量更多精度更高但速度较慢。256/384代表输入的Search Size搜索区域尺寸。数字表示搜索区域的像素尺寸如 256x256 或 384x384。数值越大模型能看到的范围越广适合追踪快速移动的目标但计算量也越大。got代表数据集或任务配置。带_got是专门针对GOT-10k数据集Generic Object Tracking Benchmark配置的。这个数据集要求严格仅用 GOT-10k 训练集训练在测试集评估遵循 “one-shot” 协议。不带_got是通用的配置在 TrackingNet、LaSOT 等更多数据集上训练过。文件名主干网络搜索尺寸适用场景/数据集seqtrack_b256.yamlBase256x256通用跟踪速度较快seqtrack_b256_got.yamlBase256x256GOT-10k 标准评测seqtrack_b384.yamlBase384x384通用跟踪视野更广seqtrack_b384_got.yamlBase384x384GOT-10k 标准评测大视野seqtrack_l256.yamlLarge256x256高精度需求场景seqtrack_l256_got.yamlLarge256x256GOT-10k 高精度评测seqtrack_l384.yamlLarge384x384极致精度计算量最大seqtrack_l384_got.yamlLarge384x384GOT-10k 极致精度评测论文目录:SeqTrack面向视觉目标跟踪的序列到序列学习引言相关工作视觉跟踪序列学习方法3.1. 总览3.2. 图像与序列表示图像表示序列表示3.3. 模型架构编码器解码器3.4. 训练与推理训练推理3.5. 先验知识融合在线更新窗口惩罚实验4.1. 实现细节模型训练推理4.2. 与最先进方法的比较LaSOTVOT20204.3. 消融与分析自回归 vs. 双向编码器的输入解码器的输入先验知识融合交叉注意力图可视化时序序列结论致谢参考文献
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2568029.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!