基于轻量级YOLOV5+BIFPN的苹果瑕疵检测识别分析系统

news2026/3/19 19:17:17

BIFPN是一种比较经典有效的特征融合手段，在很多检测模型中都有集成应用，实际表现也验证了BIFPN的有效性，这里并不是要探讨BIFPN的原理内容，而是想集成这项技术，提升原有模型的性能表现，在我之前的一些文章中也有使用到BIFPN这项技术，感兴趣的话可以自行移步阅读。

《基于yolov5s+bifpn实践隧道裂缝裂痕检测》

《基于融合SPD+BIFPN+CBAM改进YOLOv5的奶牛检测识别分析系统开发》

《激情绿茵,助力2022卡塔尔世界杯——基于改进的YOLO模型玩转足球检测分析系统》

本文主要是基于苹果缺陷瑕疵的数据集来构建yolov5+bifpn模型完成瑕疵缺陷的检测模型的开发，首先看下效果图：

接下来看下对应的模型yaml文件，如下：

#Parameters
nc: 1  # number of classes
depth_multiple: 1.0  # model depth multiple
width_multiple: 1.0  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32


#Backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],                    # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],                      # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],                      # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],                      # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],                     # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],                        # 9
  ]


#Head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],                      # cat backbone P4
   [-1, 3, C3, [512, False]],                      # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],                      # cat backbone P3
   [-1, 3, C3, [256, False]],                      # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14, 6], 1, Concat, [1]],                  # cat P4
   [-1, 3, C3, [512, False]],                      # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],                     # cat head P5
   [-1, 3, C3, [1024, False]],                     # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],       # Detect(P3, P4, P5)
  ]

接下来看下使用的数据集：

大部分来自于网络源数据采集获取，这里不管任何形式的虫害、皲裂、腐败等都归类为缺陷瑕疵，所以这里待检测的目标对象就只有一类了。

YOLO格式标注数据如下所示：

实例标注内容如下：

0 0.590734 0.474227 0.200772 0.319588
0 0.374317 0.630909 0.431694 0.243636
0 0.659449 0.394472 0.389764 0.396985

VOC格式标注数据如下：

实例标注内容如下：

<annotation>
    <folder>images</folder>
    <filename>0bb23687-1599-4069-a024-68e2ff0b32d2</filename>
    <path>0bb23687-1599-4069-a024-68e2ff0b32d2</path>
    <source>
        <database>Unknown</database>
    </source>
    <size>
        <width>225</width>
        <height>225</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>defect</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>16</xmin>
            <ymin>46</ymin>
            <xmax>78</xmax>
            <ymax>114</ymax>
        </bndbox>
    </object>
    <object>
        <name>defect</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>72</xmin>
            <ymin>117</ymin>
            <xmax>135</xmax>
            <ymax>200</ymax>
        </bndbox>
    </object>
    <object>
        <name>defect</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>130</xmin>
            <ymin>76</ymin>
            <xmax>215</xmax>
            <ymax>147</ymax>
        </bndbox>
    </object>
    <object>
        <name>defect</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>84</xmin>
            <ymin>35</ymin>
            <xmax>144</xmax>
            <ymax>87</ymax>
        </bndbox>
    </object>
</annotation>

因为数据量不大，这里在GPU模式下面完成训练花费的时长很短，训练完成结果文件如下：