征程 6 yolov5s-rgb-nhwc 量化指南

news2025/5/14 12:25:02

在 征程 6 平台,我们可以按照这个方式编译 input_typr_rt 为 rgb,且 layout 为 NHWC 的模型。这样做的好处是,当用户的数据输入源本身就是 NHWC 的 rgb 图像时,这么做可以避免额外的数据处理操作。这里以 yolov5s 为例进行介绍。

一、模型信息

输入节点
img

输出节点(其中一个)

img

输入输出信息总览

img

二、校准数据

seed100 文件夹存放原始图像,可借助 horizon_model_convert_sample 的脚本完成校准数据的处理。

02_preprocess.sh 脚本内容如下:

set -e -v
cd 
$(dirname $
0) || exit
python3 ../../data_preprocess.py \
  --src_dir ./seed100 \
  --dst_dir ./calibration_data_rgb_f32 \
  --pic_ext .rgb \
  --read_mode opencv \
  --saved_data_type float32

preprocess.py 脚本相关内容修改如下:

from horizon_tc_ui.data.transformer import (PadResizeTransformer,
                                            BGR2RGBTransformer,
                                            NormalizeTransformer)
def calibration_transformers():
    transformers = [
        PadResizeTransformer(target_size=(384, 2048)),
        BGR2RGBTransformer(data_format="HWC"),
        NormalizeTransformer(255.0)
    ]
    return transformers

这段代码的主要作用是创建一个由多个数据预处理步骤组成的转换器(transformers)列表。这些转换器会对输入数据进行处理,以适应深度学习模型的要求。

  • PadResizeTransformer:这个转换器的作用是对输入数据进行填充(padding)和调整大小(resize),通常是为了确保输入的图像尺寸与模型要求的输入尺寸一致。
  • BGR2RGBTransformer:这个转换器将输入图像从 BGR 格式转换为 RGB 格式。BGR 是 OpenCV 默认的颜色格式,而许多深度学习框架(如 TensorFlow 或 PyTorch)更习惯使用 RGB 格式。因此,这个转换器是为了进行格式的转换。
  • NormalizeTransformer:这个转换器用于对图像进行归一化处理,将像素值缩放到指定的范围。归一化是深度学习中常见的预处理步骤,有助于提高模型的收敛速度和性能。

这段代码的作用是定义并返回一个包含多个数据预处理步骤的转换器列表。这些预处理步骤包括:

  1. 填充和调整大小:将图像调整为目标尺寸 (384, 2048)
  2. 颜色格式转换:将图像从 BGR 格式转换为 RGB 格式。
  3. 归一化:将图像像素值缩放到 0 到 1 的范围内。

这些步骤通常用于图像数据预处理,以便将原始图像调整为模型输入所需要的格式和数值范围。

三、YAML

calibration_parameters:
  cal_data_dir: "./calibration_data_rgb_f32"
  quant_config: {
    "model_config": {
      "all_node_type": "int8",
      "activation": {
        "calibration_type": "max",
        "max_percentile": 0.99999,
      },
    },
  }  
compiler_parameters:
  compile_mode: latency
  debug: true
  jobs: 32
  optimize_level: O2
input_parameters:
  input_name: input
  input_shape: 1x384x2048x3
  input_layout_rt: NHWC
  input_layout_train: NHWC
  input_type_rt: rgb
  input_type_train: rgb
  std_value: 255.0
model_parameters:
  march: nash-m
  onnx_model: ./yolov5s.onnx
  output_model_file_prefix: yolov5s
  working_dir: ./model_output

四、模型编译

hb_compile -c ./config.yaml
+-------------+-------------------+------------------+
| TensorName  | Calibrated Cosine | Quantized Cosine |
+-------------+-------------------+------------------+
| featuremap1 | 0.999015          | 0.998999         |
| featuremap2 | 0.999408          | 0.999395         |
| featuremap3 | 0.999311          | 0.999321         |
+-------------+-------------------+------------------+

五、python 推理

import cv2
import numpy as np
from horizon_tc_ui.hb_runtime import HBRuntime
def prepare_onnx_input():
    data = cv2.imread('./seed.jpg').astype(np.float32)
    data = cv2.cvtColor(data, cv2.COLOR_BGR2RGB)
    data = data / 255.0
    data = data[np.newaxis,:,:,:]
    return data
def prepare_bc_input():
    data = cv2.imread('./seed.jpg').astype(np.uint8)
    data = cv2.cvtColor(data, cv2.COLOR_BGR2RGB)
    data = (data - 128).astype(np.int8)
    data = data[np.newaxis,:,:,:]
    return data
def infer_onnx():
    data = prepare_onnx_input()
    sess = HBRuntime("yolov5s.onnx")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_onnx==========")
    print(output[0][0][0][0])
    return 0
def infer_ori_onnx():
    data = prepare_onnx_input()
    sess = HBRuntime("./model_output/yolov5s_original_float_model.onnx")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_ori_onnx==========")
    print(output[0][0][0][0])
def infer_opt_onnx():
    data = prepare_onnx_input()
    sess = HBRuntime("./model_output/yolov5s_optimized_float_model.onnx")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_opt_onnx==========")
    print(output[0][0][0][0])
def infer_calib_onnx():
    data = prepare_onnx_input()
    sess = HBRuntime("./model_output/yolov5s_calibrated_model.onnx")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_calib_onnx==========")
    print(output[0][0][0][0])
def infer_ptq_onnx():
    data = prepare_onnx_input()
    sess = HBRuntime("./model_output/yolov5s_ptq_model.onnx")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_ptq_onnx==========")
    print(output[0][0][0][0])
def infer_quantized_bc():
    data = prepare_bc_input()
    sess = HBRuntime("./model_output/yolov5s_quantized_model.bc")
    input_names = sess.input_names
    output_names = sess.output_names
    input_feed = {input_names[0]: data}
    output = sess.run(output_names, input_feed)
    print("==========infer_quantized_bc==========")
    print(output[0][0][0][0])
if 
name
 == "
__main__
":
    infer_onnx()
    infer_ori_onnx()
    infer_opt_onnx()
    infer_calib_onnx()
    infer_ptq_onnx()
    infer_quantized_bc()

这段代码的主要作用是使用不同的模型和输入数据进行推理(inference),并输出推理结果。它通过调用 HBRuntime 来加载不同的模型进行推理。下面是对代码的详细分析:

1.导入必要的库:

  • cv2:用于图像处理,加载和转换图像。
  • numpy:用于数值计算,尤其是矩阵操作。
  • HBRuntime:从 horizon_tc_ui.hb_runtime 导入,显然是一个用于执行推理任务的接口,可能是用于调用经过优化的计算图或深度学习模型。

2.准备输入数据:

  • prepare_onnx_input():该函数读取图像文件 seed.jpg,将其转换为 RGB 格式,进行归一化处理,并为模型的输入格式添加额外的维度(np.newaxis)。数据被归一化到 [0, 1] 范围,以便于输入 ONNX 模型。
  • prepare_bc_input():此函数和 prepare_onnx_input() 类似,不过它读取的图像经过不同的处理。图像被转换为 np.uint8 类型,减去 128 后转换为 np.int8 类型,这通常是用于处理量化后的模型数据格式。

3.进行推理的不同函数:

  • 每个 infer_*_onnxinfer_quantized_bc 函数负责加载不同的模型并执行推理:
    • infer_onnx():加载 yolov5s.onnx 模型并进行推理。
    • infer_ori_onnx():加载原始浮点数版本的 yolov5s 模型 (yolov5s_original_float_model.onnx)。
    • infer_opt_onnx():加载优化过的浮点数版本的 yolov5s 模型 (yolov5s_optimized_float_model.onnx)。
    • infer_calib_onnx():加载经过校准的浮点数模型 (yolov5s_calibrated_model.onnx)。
    • infer_ptq_onnx():加载经过量化后的浮点数模型 (yolov5s_ptq_model.onnx)。
    • infer_quantized_bc():加载量化后的 BC 格式模型 (yolov5s_quantized_model.bc)。

4.推理过程:

  • 每个 infer_* 函数都会执行以下步骤:
    • 调用相应的准备输入函数(如 prepare_onnx_input()prepare_bc_input()),将图像转换为模型所需的输入格式。
    • 使用 HBRuntime 加载不同的模型。
    • 获取模型的输入和输出节点名称。
    • 将输入数据传入模型进行推理。
    • 输出推理结果的一部分(通过 output[0][0][0][0] 打印输出,可能是某个检测框的值)。

5.主函数 if name == "__main__":

  • 在主程序执行时,依次调用上述所有的推理函数进行推理,打印每个模型的推理结果。

六、总结:

这段代码主要用于进行不同版本的 YOLOv5 模型的推理,涉及到原始浮点数模型、优化后的浮点数模型、量化模型、校准模型等,并对每种模型进行推理结果输出。通过不同的输入准备函数,代码还演示了如何处理不同的数据格式(如浮点数和量化后的数据)。

输出信息如下,可以看到,数值大体相当,可以认为推理结果正确。

==========infer_onnx==========
[ -0.36140022   0.14068425  -0.12884808   0.38683856 -10.027128
  -3.727932    -2.6472187   -3.4907613   -0.8754431   -1.8876309
  -1.6180705   -2.6833398   -2.4786358   -3.0784476   -3.320454
  -4.3665814   -3.2660558   -3.767973    -4.428035    -3.4952142
  -2.8823838   -4.920804    -0.36190268   0.24379599  -0.52514255
  -0.40856832 -11.233256    -3.9329526   -2.7249336   -3.4358976
  -0.8108312   -1.852678    -1.4934196   -2.7427323   -2.4955802
  -3.2720697   -3.3685834   -4.5204425   -3.2479987   -3.8060267
  -4.4632807   -3.5123816   -2.8149266   -5.1647396   -0.35967097
   0.22670399  -0.854579    -0.18010648 -13.903754    -4.169511
  -2.4058053   -3.4251635   -0.8236269   -1.8188286   -1.6522415
  -2.8259125   -2.4029486   -3.3103113   -3.409004    -4.688325
  -3.2148345   -3.948554    -4.4465227   -3.5018692   -2.8768973  -5.213859  ]
==========infer_ori_onnx==========
[ -0.36140022   0.14068425  -0.12884808   0.38683856 -10.027128
  -3.727932    -2.6472187   -3.4907613   -0.8754431   -1.8876309
  -1.6180705   -2.6833398   -2.4786358   -3.0784476   -3.320454
  -4.3665814   -3.2660558   -3.767973    -4.428035    -3.4952142
  -2.8823838   -4.920804    -0.36190268   0.24379599  -0.52514255
  -0.40856832 -11.233256    -3.9329526   -2.7249336   -3.4358976
  -0.8108312   -1.852678    -1.4934196   -2.7427323   -2.4955802
  -3.2720697   -3.3685834   -4.5204425   -3.2479987   -3.8060267
  -4.4632807   -3.5123816   -2.8149266   -5.1647396   -0.35967097
   0.22670399  -0.854579    -0.18010648 -13.903754    -4.169511
  -2.4058053   -3.4251635   -0.8236269   -1.8188286   -1.6522415
  -2.8259125   -2.4029486   -3.3103113   -3.409004    -4.688325
  -3.2148345   -3.948554    -4.4465227   -3.5018692   -2.8768973  -5.213859  ]
==========infer_opt_onnx==========
[ -0.36140022   0.14068425  -0.12884808   0.38683856 -10.027128
  -3.727932    -2.6472187   -3.4907613   -0.8754431   -1.8876309
  -1.6180705   -2.6833398   -2.4786358   -3.0784476   -3.320454
  -4.3665814   -3.2660558   -3.767973    -4.428035    -3.4952142
  -2.8823838   -4.920804    -0.36190268   0.24379599  -0.52514255
  -0.40856832 -11.233256    -3.9329526   -2.7249336   -3.4358976
  -0.8108312   -1.852678    -1.4934196   -2.7427323   -2.4955802
  -3.2720697   -3.3685834   -4.5204425   -3.2479987   -3.8060267
  -4.4632807   -3.5123816   -2.8149266   -5.1647396   -0.35967097
   0.22670399  -0.854579    -0.18010648 -13.903754    -4.169511
  -2.4058053   -3.4251635   -0.8236269   -1.8188286   -1.6522415
  -2.8259125   -2.4029486   -3.3103113   -3.409004    -4.688325
  -3.2148345   -3.948554    -4.4465227   -3.5018692   -2.8768973  -5.213859  ]
==========infer_calib_onnx==========
[ -0.43238506   0.11002721  -0.07907629   0.40861583  -9.97794
  -3.6856174   -2.735222    -3.633584    -0.96581066  -1.6290709
  -1.5608525   -2.6134243   -2.3609822   -3.004236    -3.2058396
  -4.3830314   -3.0389607   -3.8800378   -4.4044924   -3.417421
  -2.7247229   -4.8871512   -0.41328928   0.18615645  -0.5093392
  -0.40168345 -11.165181    -3.8985913   -2.8401194   -3.6001463
  -0.93232083  -1.6206057   -1.4628205   -2.6981122   -2.3167949
  -3.2422874   -3.2519443   -4.5322804   -3.002402    -3.9381328
  -4.4415045   -3.4783902   -2.6498706   -5.107289    -0.43616575
   0.1885212   -0.8195747   -0.17303436 -13.778434    -4.1264076
  -2.5370815   -3.6029017   -0.91676974  -1.5773652   -1.6292106
  -2.8174675   -2.254434    -3.2408853   -3.2774894   -4.6843886
  -2.9586797   -4.0764017   -4.4135203   -3.4192595   -2.7116857  -5.1625004 ]
==========infer_ptq_onnx==========
[ -0.43238506   0.11002721  -0.07907629   0.40861583  -9.97794
  -3.6856174   -2.735222    -3.633584    -0.96581066  -1.6290709
  -1.5608525   -2.6134243   -2.3609822   -3.004236    -3.2058396
  -4.3830314   -3.0389607   -3.8800378   -4.4044924   -3.417421
  -2.7247229   -4.8871512   -0.41328928   0.18615645  -0.5093392
  -0.40168345 -11.165181    -3.8985913   -2.8401194   -3.6001463
  -0.93232083  -1.6206057   -1.4628205   -2.6981122   -2.3167949
  -3.2422874   -3.2519443   -4.5322804   -3.002402    -3.9381328
  -4.4415045   -3.4783902   -2.6498706   -5.107289    -0.43616575
   0.1885212   -0.8195747   -0.17303436 -13.778434    -4.1264076
  -2.5370815   -3.6029017   -0.91676974  -1.5773652   -1.6292106
  -2.8174675   -2.254434    -3.2408853   -3.2774894   -4.6843886
  -2.9586797   -4.0764017   -4.4135203   -3.4192595   -2.7116857  -5.1625004 ]
==========infer_quantized_bc==========
[ -0.37202302   0.18693314  -0.06567554   0.40963683  -9.98054
  -3.6307201   -2.703453    -3.4887328   -0.9094247   -1.7791512
  -1.54388     -2.5430217   -2.399686    -2.996389    -3.1917665
  -4.3041177   -2.9921875   -3.7818878   -4.3069286   -3.3589668
  -2.8220906   -4.8398676   -0.34859642   0.2652311   -0.50713307
  -0.40864512 -10.916675    -3.8250697   -2.8117514   -3.4346225
  -0.8636422   -1.7796087   -1.4381862   -2.6121027   -2.3534453
  -3.2200432   -3.2179508   -4.427741    -2.9437149   -3.8163087
  -4.323068    -3.4090939   -2.7401025   -5.0440025   -0.37643808
   0.2674079   -0.8191366   -0.1740098  -13.797277    -4.0533657
  -2.4911644   -3.4408677   -0.8496779   -1.7336257   -1.605081
  -2.7330828   -2.2852495   -3.2210054   -3.2354999   -4.5808883
  -2.8986108   -3.9594183   -4.282491    -3.3463652   -2.8071992  -5.093343  ]

-4.323068 -3.4090939 -2.7401025 -5.0440025 -0.37643808
0.2674079 -0.8191366 -0.1740098 -13.797277 -4.0533657
-2.4911644 -3.4408677 -0.8496779 -1.7336257 -1.605081
-2.7330828 -2.2852495 -3.2210054 -3.2354999 -4.5808883
-2.8986108 -3.9594183 -4.282491 -3.3463652 -2.8071992 -5.093343 ]


 至此,模型的量化和 python 推理验证就结束了。我们可以愉快地开始 C++推理了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2375373.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

国产化Word处理控件Spire.Doc教程:如何使用 C# 从 Word 中提取图片

通过编程方式从 Word 文档中提取图片,可以用于自动化文档处理任务。E-iceblue旗下Spire系列产品是国产文档处理领域的优秀产品,支持国产化,帮助企业高效构建文档处理的应用程序。本文将演示如何使用 C# 和 Spire.Doc for .NET 库从 Word 文件…

Telnet 类图解析

Telnet 类图(文本描述) --------------------------------------- | Telnet | --------------------------------------- | - host: str | # 目标主机 | - port: int …

PowerShell 实现 conda 懒加载

问题 执行命令conda init powershell会在 profile.ps1中添加conda初始化的命令。 即使用户不需要用到conda,也会初始化conda环境,拖慢PowerShell的启动速度。 解决方案 本文展示了如何实现conda的懒加载,默认不加载conda环境,只…

笔记项目 day02

一、用户登录接口 请求参数: 用loginDTO来封装请求参数,要加上RequestBody注解 响应参数: 由于data里内容较多,考虑将其封装到一个LoginUser的实体中,用户登陆后,需要生成jwtToken并返回给前端。 登录功…

国鑫主板bios切换显示模式为独立显卡

# 进入到Platform Miscellaneous Configuration Active Video 切换为PCIE Device保存退出! 如果之前有安装过nvidia驱动,记得卸载掉再安装一遍。

【日撸 Java 300行】Day 14(栈)

目录 Day 14:栈 一、栈的基本知识 二、栈的方法 1. 顺序表实现栈 2. 入栈 3. 出栈 三、代码及测试 拓展: 小结 Day 14:栈 Task: push 和 pop 均只能在栈顶操作.没有循环, 时间复杂度为 O(1). 一、栈的基本知识 详细的介…

2025最新出版 Microsoft Project由入门到精通(七)

目录 优化资源——在资源使用状况视图中查看资源的负荷情况 在资源图表中查看资源的负荷情况 优化资源——资源出现冲突时的原因及处理办法 资源过度分类的处理解决办法 首先检查任务工时的合理性并调整 增加资源供给 回到资源工作表中双击对应的过度分配资源 替换资…

修改(替换)文件中的指定内容并保留文件修改前的时间(即修改前后文件的最后修改时间保持不变)

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 文章目录 修改(替换)文件中的指…

应用探析|千眼狼PIV测量系统在职业病防治中的应用

1、职业病防治背景 随着《职业病防治法》及各省市“十四五”职业病防治规划的深入推进,工作场所粉尘危害监测与防控已成为疾控部门的核心任务。以矿山、建材、冶金、化工等行业为例,粉尘浓度、分布及传播特性的精准测量是评估职业病风险的关键。 传统的…

nvidia驱动更新-先卸载再安装-ubuntu

显卡驱动升级前,卸载旧版本,可采用两种方式。 1.命令行 (1)查找已安装的 NVIDIA 驱动和相关包:dpkg -l | grep nvidia (2)完全卸载 NVIDIA 驱动:sudo apt remove purge nvidia-*…

推荐算法工程化:ZKmall模板商城的B2C 商城的用户分层推荐策略

在 B2C 电商竞争激烈的市场环境中,精准推荐已成为提升用户体验、促进商品销售的关键。ZKmall 模板商城通过推荐算法工程化手段,深度挖掘用户数据价值,制定科学的用户分层推荐策略,实现 “千人千面” 的个性化推荐,帮助…

基于Java和PostGIS的AOI面数据球面面积计算实践

目录 前言 一、计算方法简介 二、球面面积计算 1、AOI数据转Polygon 2、Geotools面积计算 3、GeographicLib面积计算 4、PostGIS面积计算 三、结果分析 1、不同算法结果对比 2、与互联网AOI对比 3、与天地图测面对比 四、总结 前言 在现代地理信息系统(G…

Spring Boot之Web服务器的启动流程分析

如何判断创建哪种web容器:servlet?reactive? 我们在启动Spring Boot程序的时候,会使用SpringApplication.run方法来启动,在启动流程中首先要判断的就是需要启动什么类型的服务器,是servlet?或者…

【周输入】510周阅读推荐-1

本号一年了,有一定的成长,也有很多读者和点赞。自觉更新仍然远远不够,需要继续努力。 但是还是要坚持2点: 在当前这个时代,信息大爆炸,层次不齐,不追加多, 信息输入可以很多&#x…

基于动态规划的强化学习方法

目录 # 动态规划 # 基于动态规划的强化学习方法 # 求解过程: ## 策略评估 ## 策略提升 # 价值迭代算法 # 参考 # 动态规划 动态规划的基本思想是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到目标问题的解。…

Uniapp Android/IOS 获取手机通讯录

介绍 最近忙着开发支付宝小程序和app,下面给大家介绍一下 app 获取通讯录的全部过程吧,也是这也是我app开发中的一项需求吧。 效果图如下 勾选配置文件 使用uniapp开发的童鞋都知道有一个配置文件 manifest.json 简单的说一下,就是安卓/ios/…

2025年RIS SCI2区,改进白鲸优化算法+复杂非线性方程组求解,深度解析+性能实测

目录 1.摘要2.白鲸优化算法BWO原理3.改进策略4.结果展示5.参考文献6.代码获取7.读者交流 1.摘要 本文提出了一种改进白鲸优化算法(ABWOA)用来解决非线性方程组(SNLEs)求解问题。ABWOA引入了平衡因子和非线性自适应参数&#xff0…

Java后端开发day48--反射动态代理

(以下内容全部来自上述课程) 反射 反射允许对成员变量,成员方法和构造方法的信息进行编程访问。 就是获取里面的成员变量、构造方法和成员方法,idea中打代码跳出来的提示就是反射。 1. 获取class对象的三种方式 Class.for…

ValueError: Caught ValueError in DataLoader worker process 0.

参考链接: https://stackoverflow.com/questions/1841565/valueerror-invalid-literal-for-int-with-base-10 它提示我有个地方值错误空字符 果然因为格式处理没有传进去东西,找下原因,让它正常处理 原来是相对路径的.影响了程序运行 将v…

【数据结构】——链表OJ(下)

前面我们已经刷了几道单链表的题目,下面我们继续看几道题目。 一、相交链表 这道题题目的要求是很好理解的,就是现在我们有两个链表,然后我们就相办法进行判断,这两个链表是否是相交的,那么链表的相交其实就是有没有共…