acjscsdbhvusfd

news2026/3/27 17:17:55

一、yolo v1是什么YOLOYou Only Look Once算法是一种目标检测算法是经典的one-stage方法。YOLO v1 开创了单阶段目标检测的先河其简洁的架构和高效的推理为后续版本奠定了基础。尽管存在小目标检测和定位精度的局限性但其“端到端”的设计思想深刻影响了目标检测领域的发展。二、核心思想将一幅图像分成SxS个网格(grid cell)如果某个object的中心落在这个网格中则这个网格就负责预测这个object。三、yolo v1的网络架构1.网络架构网络结构借鉴了 GoogLeNet 。24个卷积层2个全链接层。用1×1 reduction layers 紧跟 3×3 convolutional layers 取代Goolenet的 inception modules 从上面的网络结构中发现经历多次卷积以及两次全连接后神经元的个数为1x1470经过reshape后刚好变为7x7x30,7×7意味着7×7个grid cell30表示每个grid cell包含30个信息其中2个预测框(yolo-v1模型是有两个预测框的)每个预测框包含5个信息(x y w h c)分别为中心点位置坐标宽高以及置信度confidence剩下20个是针对数据集的20个种类的预测概率(即假设该grid cell负责预测物体那么它是某个类别的概率)。每个grid有30维这30维中8维是回归box的坐标2个B是box的confidence还有20维是类别。其中坐标的x,y相对于网格单元格边界的框的中心用对应网格的归一化到0-1之间w,h用图像的width和height归一化到0-1之间。每个预测框的中心位置坐标是不同的。2.置信度confidence置信度(confidence)类概率*IoU表示某个预测框中存在目标的可能性大小是一个介于 0 到 1 之间的数值。例如一个预测框的目标存在置信度为 0.8意味着模型有 80% 的把握认为该预测框中包含一个目标。1)类概率该网格是否包含目标0 或 12IoU预测框与真实框的交并比。四、损失函数YOLO-V1算法最后输出的检测结果为7x7x30的形式其中30个值分别包括两个候选框的位置和有无包含物体的置信度以及网格中包含20个物体类别的概率。那么YOLO的损失就包括三部分位置误差confidence误差分类误差。损失函数的设计目标就是让坐标(x,y,w,h)confidenceclassification这个三个方面达到很好的平衡。1.定位误差1中心点定位误差输入图像被划分为 S×S 个网格YOLOv1 中 S7每个网格预测 B个边界框YOLOv1 中 B2指示函数表示第 i个网格的第 j个预测框是否负责预测这个物体判断标准该预测框与真实框的 IoU 最大:真实框的中心点坐标相对于当前网格的偏移归一化到 0~1:预测框的中心点坐标:定位误差的权重系数YOLOv1 中设为 5为了加大定位误差的惩罚2)宽高定位误差:真实框的宽度和高度相对于整张图像归一化:预测框的宽度和高度为什么要用平方根为了平衡大框和小框的误差影响同样的绝对误差对小框的影响更大开方后可以减小这种偏差2.置信度误差1)包含物体的置信度误差这一项只计算负责预测物体的那个框2)不包含物体的置信度误差3.类别预测误差注意这里的求和只对包含物体的网格进行并且只对负责预测的框进行五、yolo v1中的非极大值抑制NMS非极大值抑制Non-Maximum Suppression, NMS是目标检测中用于消除冗余检测框的后处理算法其核心思想是在重叠区域中仅保留置信度最高的检测框抑制其他同类别且重叠度高的低置信度框从而避免对同一物体多次重复检测。1、核心步骤(1)按置信度排序对所有预测框按置信度confidence score从高到低排序。(2)选取最高分框将当前最高置信度的框作为保留结果。(3)抑制重叠框计算该框与剩余框的交并比IoU若IoU超过设定阈值如0.5则视为冗余框并剔除。(4)循环迭代对剩余未处理的框重复步骤2-3直到所有框被处理。2、关键作用解决重复检测模型可能对同一物体预测多个重叠框NMS保留最优结果。提升输出质量减少假阳性False Positive使检测结果更简洁、准确。平衡精度与召回率通过调整IoU阈值控制检测框的严格程度阈值越高保留框越少。六、yolo v1的优缺点1、优点速度快简单2、缺点1每个cell只预测1个类别如果重叠无法解决2小物体检测效果一般长宽比可选但单一。————————————————版权声明本文为CSDN博主「Pyeako」的原创文章遵循CC 4.0 BY-SA版权协议转载请附上原文出处链接及本声明。原文链接https://blog.csdn.net/2301_77717128/article/details/158542510

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2455118.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！