面向恶劣条件的道路交通目标检测----大创自用(当然你也可以在里面学到很多东西)

news2025/5/22 6:58:04

全部内容梳理

目标检测的两个任务:

预测标签 边界框

语义分割 实力分割

一个是类别 一个是实例级别

分类任务把每个图像当作一张图片看待 所有解决方法是先生成候选区域 再进行分类

置信度:

包括对类别和边界框预测的自信程度

输出分类和IOU分数的乘积

双阶段代表R-CNN FAST R-CNN

分类 阈值判断

回归 拟合最优

锚定框是可能的候选区域

具体的

是否包含物体

判断类别

微调边界框

coco格式 json文件

YOLO格式 类别 x,y,w,h

验证集:用于验证模型效果的数据,评价模型学的好不好,选择超参数。

直接通过测试集进行检测,那么模型是以测试集为目标去优化,相当于作弊

交叉验证---为了规避掉验证集选择的bias(如验证集上的都是同一类别)

mAP:对每个类别计算AP,取所有类别AP计算平均mAP

对于每个类别,基于预测结果和真实标签,计算出一个precision-recall曲线

对于每个类别的precision-recall曲线,计算出该曲线下的面积,即AP
计算所有类别的AP的平均值。

正样本

类别 边界框损失

负样本

类别

softmax单一预测

sigmoid多预测

检测任务是遍历的分类任务

常见的优化器

Loss(w,b)容易陷入局部最优

SGD也叫mini-batch,之后的优化算法,一定是建立在SGD之上,容易震荡

模拟退火,通过随机扰动避免了局部最优

AdaGrad自适应调整学习率,缺点:学习率会一直减小,最终可能变得过小,导致训练提前停止

RMSProp是对AdaGrad改进,通过指数加权平均来调整历史梯度的影响,使学习率减小的更加平滑。

Momentum参数更新不仅取决于当前梯度,还取决于之前的更新的累计动量

Adam结合了MomentumRMSProp的优点,通过自适应学习率和动量加速收敛

主干网络

颈部:对于主干网络提取的特征信息做进一步融合,增加了鲁棒性和特征的表达能力,对多尺度目标检测和小目标检测有着重要作用

头部:卷积层或FC层进行分类和定位

anchor free

对每个像素点预测类别和边界框

每个位置预测一个框 重叠位置可能无法检测

anchor box

复杂度高

不灵活

正样本

正样本指预测框和真实框IOU大于设定阈值

负样本指预测框和真实框IOU小于设定阈值

失衡的后果:

负样本过多会淹没正样本 关注负样本

模型倾向于负样本预测 漏检正样本

最后一层换成了SPPF

模型版本

准确率

Accuracy

召回率(Recall

F1

F1 Score

每秒浮点运算次数(GFLOPs

平均精度均值(mAP

未改进版本

82.3%

78.5%

80.1%

5.6

0.468

改进点一

83.6%

82.5%

82.8%

5.7

0.479

改进点二

83.4%

81.7%

80.3%

5.6

0.468

改进点一+改进点二

85.1%

83.7%

84.1%

5.7

0.481

对于小波卷积的替换 只需要对写好小波卷积部分 然后在各个结构中进行替换

同理

标注使用LABELME YOLO格式

使用的主干网络RESNET101 使用了预训练权重

批次大小设置为24 训练轮次100 优化器为 Adam 优化器,初始学习率为0.01

召回率关注的是在所有实际为正的样本中,模型能够正确预测出多少,即模型预测正类的完整性

精确率关注的是模型预测为正的样本中有多少是 真正的正样本,即模型预测正类的准确性

map是0.5--0.95的平均map 

0.75更能反映小目标

小波变换 正交基 没有冗余信息

小波变换用于替代短时傅里叶变换 把无限长的基替换为有限长的衰减小波基

短时傅里叶处理不平稳的信号 小波变换克服了短时傅里叶的窗口不变性

小波变换卷积通过小波变换分解为不同的频率分量 关注不同的频率

进行小核卷积 进行上采样 小波基函数类似卷积核

低频对应全局 高频对应局部 通过对低频高频分别处理 更好的进行多尺度表达

小波变换卷积通过低频逐渐向高频过渡 从而实现大尺度物体向小尺度的转变 低频的信息具有全局特征 弥补了CNN局部提取的缺陷 高频特征更好的捕捉了边缘纹理等 强化了形状的识别

绝大部分噪音都是图像的高频分量,通过低通滤波器来滤除高频;  边缘也是图像的高频分量,可以通过添加高频分量来增强原始图像的边缘;

学生网络接收到的标签

一种是教师网络的输出, 一种是真实的标签。

硬标签 独热编码 软标签 概率分布

蒸馏温度 温度越高越平滑 越可以容忍学生的过失

concat 维度增加 自适应学习

add 信息量增加 残差连接

卷积如何在计算机中并行计算 转化为特征向量

深度可分离卷积 空洞卷积 扩大感受野

车道线检测

线提议单元 为了学习全局特征 类似于猫框

正标签选择 小于一个阈值 但一个车道线可以有多个提议

负标签选择 与所有车道线都大于阈值

首先是距离判断正负标签 其次看分类的分数

像目标检测一样 只有正标签 才有回归损失

回归损失 平滑L1损失 避免了过度惩罚小误差

车道线具有高级语义 也需要低级语义进行定位

高级语义检测车道线 低级语义定位

RIO聚合上下文

车到先验

背景前景概率 长度 角度和起点 N个偏移量

线IOU把车道线作为一个

在检测过程中 

计算焦点损失 类别

相似度损失 距离远近

训练时

类别损失 回归损失 LIOU损失

Lseg辅助分割损失 更好的定位

Laneiou考虑了车道角度

CLRKDNE对检测头和FPN进行简化 推理速度上升60%  保持了和CLRNET相当的精度

利用教师模型 CLRNet 的中间特征层、先验嵌入和最终检测头 logits 来提升其车道检测能力 

logits是一个向量 类似软标签

起点和角度

CLRKDNET单个检测头 固定先验参数(教师传递,不可迭代)

知识蒸馏分为三个部分

注意力图蒸馏

让学生网络也能关注关键特征

先验知识嵌入和logits蒸馏

学生网络直接使用起点和角度(RIO精炼后的)L2范数进行损失比较

Logit 蒸馏:Logit 蒸馏关注检测头的最终输出

确保学生有老师的输出逻辑 参数包括长度 类别 偏移量等

目标检测

DETR对于真实值 预测值 摒弃了NMS 使用匈牙利算法进行二分图匹配 并行预测

二分图匹配考虑 匹配损失 包括类别和回归

GIOU广义交并比 考虑了重叠区域 考虑了位置信息

D-fine

对于回归任务 概率分布 细粒度分布优化

深层向浅层的知识传递

传统的logits模仿和特征模仿在检测任务下精度低下

从固定的坐标预测变成建模概率分布(残差方式)

把四个边分为了n个bin预测每个bin的概率 取最大

首先第一层预测初步边界框 初步概率分布 

边界框作为参考框 后续层对概率分布进行优化

wn通过分段可以对小的偏差更精细调整

DEIM

解决DETR中稀疏监督的问题

增加额外的目标 提高每个图像中的正样本数量

YOLO的每个目标和多个猫框相关联 提供了密集监督

对小目标 密集监督更加重要

增加每张训练样本中的额外目标数量

提供监督

保留了020的匹配机制 避免了NMS 防止推理速度变慢

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2382159.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Java(SSM)+MySQL实现(Web)具有智能推荐功能的图书销售系统

具有智能推荐功能的图书销售系统 1.绪论 1.1 背景、目的、意义 随着互联网的不断发展,电子商务逐渐代替传统的交易方式。各种类型的电子商务网站层出不穷,但细分之下电子商务网站主要分为 B2B,B2C,C2B,C2C 这四大类…

浙大团队研发Earth Explorer系统,探索深时演化/地学剖面/科研场景,赋能深时地球科学研究

深时地球科学研究聚焦地球的漫长历史,探寻从数十亿年前到如今的地质演化过程,研究范畴广泛,涵盖了地球内部结构、物质组成、生命演化,以及地球与外部环境的相互作用等关键领域。近年来,地学可视化分析方法对多维时空交…

31-35【动手学深度学习】深度学习硬件

1. CPU和GPU 1.1 CPU CPU每秒钟计算的浮点运算数为0.15,GPU为12。GPU的显存很低,16GB(可能32G封顶),CPU可以一直插内存。 左边是GPU(只能做些很简单的游戏,视频处理),中…

SpringMVC2

一、springmvc 接收请求 类上、方法上 RequestMapping GetMapping PostMapping package com.hl.springmvc02.web; ​ import jdk.nashorn.internal.objects.annotations.Getter; import org.springframework.web.bind.annotation.*; ​ RestController RequestMapping(&qu…

【每日一题丨2025年5.12~5.18】排序相关题

个人主页:Guiat 归属专栏:每日一题 文章目录 1. 【5.12】P1068 [NOIP 2009 普及组] 分数线划定2. 【5.13】P5143 攀爬者3. 【5.14】P12366 [蓝桥杯 2022 省 Python B] 数位排序4. 【5.15】P10901 [蓝桥杯 2024 省 C] 封闭图形个数5.【5.16】P12165 [蓝桥…

Typora + PicGo + GitHub 配置图床——图片自动上传 详细教程

文章目录 一、创建 GitHub 仓库二、添加私人令牌三、下载 PicGo四、配置 PicGo五、测试 一、创建 GitHub 仓库 进入 Github 官网 注册一个属于自己的账号,点击创建仓库。 2. 创建自己的新仓库。仓库设置为公开,方便上传图片(你设置私有也可以…

QT+Visual Studio 配置开发环境教程

一、QT架构 Qt Creator 是一个轻量级、跨平台的 IDE,专为 Qt 开发量身打造,内置对 qmake/CMake 的深度支持、Kits 配置管理、原生 QML 调试器以及较低的资源占用维基百科。 而在 Windows 环境下,Visual Studio 配合 Qt VS Tools 扩展则可将 Q…

缺乏经验的 PCB 过孔建模方法

您是一名背板设计人员,被指派设计一种新的高速、多千兆位串行链路架构,从多个线卡到背板上的多个交换矩阵交换卡。这些链路必须在第一天以 6GB/s 的速度运行,并且为 10GB/s (IEEE 802.3KR) 做好产品演进的准备。时间表很紧,您需要提出一个背板架构,以允许程序的其余部分…

【漫话机器学习系列】265.普拉托变换的相关问题(Issues With Platt Scaling)

Platt Scaling 的相关问题详解 | 模型校准中的隐患分析 在机器学习模型中,模型预测的“置信度”并不一定等于真实的概率。为了提高模型预测结果的可解释性和实用性,我们通常会使用一种后处理的概率校准方法——Platt Scaling(普拉托变换&…

【Linux高级全栈开发】2.2.1 Linux服务器百万并发实现2.2.2 Posix API与网络协议栈

【Linux高级全栈开发】2.2.1 Linux服务器百万并发实现2.2.2 Posix API与网络协议栈 高性能网络学习目录 基础内容(两周完成): 2.1网络编程 2.1.1多路复用select/poll/epoll2.1.2事件驱动reactor2.1.3http服务器的实现 2.2网络原理 百万并发…

LlamaIndex

1、大语言模型开发框架的价值是什么? SDK:Software Development Kit,它是一组软件工具和资源的集合,旨在帮助开发者创建、测试、部署和维护应用程序或软件。 所有开发框架(SDK)的核心价值,都是降低开发、维护成本。 大语言模型开发框架的价值,是让开发者可以更方便地…

springboot使用xdoc-report包导出word

背景:项目需要使用xdoc-report.jar根据设置好的word模版,自动填入数据 导出word 框架使用 我的需求是我做一个模板然后往里面填充内容就导出我想要的word文件,问了下chatgpt还有百度,最后选用了xdocreport这个框架,主…

重拾GMP

目录 GMP总结 线程协程三家对比GMP调度模型 mgp过一遍流程 g 一个G的生命周期 mpschedt全局队列g0视角看看G的调度流程 四大调度类型 主动调度被动调度正常调度抢占调度 宏观的调度流程上面流程的具体细节 schedule()findRunnable()execute()gosched_m()park_m()与ready()goe…

实验分享|基于千眼狼sCMOS科学相机的流式细胞仪细胞核成像实验

实验背景 流式细胞仪与微流控技术,为细胞及细胞核成像提供新的路径。传统流式细胞仪在细胞核成像检测方面存在检测通量低,荧光信号微弱等局限,故某光学重点实验室开发一种基于高灵敏度sCMOS科学相机并集成在自组荧光显微镜的微流控细胞核成像…

【Linux笔记】——线程池项目与线程安全单例模式

🔥个人主页🔥:孤寂大仙V 🌈收录专栏🌈:Linux 🌹往期回顾🌹: 【Linux笔记】——简单实习一个日志项目 🔖流水不争,争的是滔滔不息 一、线程池设计二…

ZooKeeper 原理解析及优劣比较

大家好,这里是架构资源栈!点击上方关注,添加“星标”,一起学习大厂前沿架构! 引言 在分布式系统中,服务注册、配置管理、分布式锁、选举等场景都需要一个高可用、一致性强的协调服务。Apache ZooKeeper 凭…

是德科技 | 单通道448G未来之路:PAM4? PAM6? PAM8?

内容来源:是德科技 随着数据中心规模的不断扩大以及AI大模型等技术的兴起,市场对高速、大容量数据传输的需求日益增长。例如,AI训练集群中GPU等设备之间的互联需要更高的传输速率来提升效率。在技术升级方面,SerDes技术的不断进步…

OceanBase 开发者大会,拥抱 Data*AI 战略,构建 AI 数据底座

5 月 17 号以“当 SQL 遇见 AI”为主题的 OceanBase 开发者大会在广州举行,因为行程的原因未能现场参会,仍然通过视频直播观看了全部的演讲。总体来说,这届大会既有对未来数据库演进方向的展望,也有 OceanBase 新产品的发布&#…

STM32IIC协议基础及Cube配置

STM32IIC协议基础及Cube配置 一,IC协议简介1,核心特点2,应用场景 二,IC协议基础概念1,总线结构2,主从架构3,设备寻址4,起始和停止条件5,数据传输6,应答机制 三…

CNN vs ViT:图像世界的范式演进

一、图像建模,是不是也可以“大一统” 在前文中我们提到,多模态大模型打破“只能处理文字”的限制。 在 NLP 世界里,Transformer 已经证明自己是理解语言的王者。那么在图像世界,我们是否也能有一种“通用架构”,让模…