windows 下用yolov5 训练模型 给到opencv 使用

news2025/5/29 6:50:36

windows 使用yolov5训练模型,之后opencv加载模型进行推理。

一,搭建环境

安装 Anaconda

二,创建虚拟环境并安装yolov5

conda create -n yolov5 python=3.9 -y
conda activate yolov5
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt

三,安装LabelImg 进行标注

四,准备训练配置

1,data.yaml

train: ./images/train
val: ./images/val

nc: 1
names: ['erha'] #类别名称,比如二哈

2,确保图像和标签对应

images/train/img001.jpg
labels/train/img001.txt

3,训练

python train.py --img 640 --batch 16 --epochs 50 --data  ./keiler/datasets/data.yaml --weights yolov5s.pt --name erha

输出模型路径:

runs/train/erha4/weights/best.pt

4,将模型 转成 onnx格式,这样才能给到opencv  加载

 五,opencv 推理

#include <iostream>
#include <Thread/semaphore.h>
#include <signal.h>
#include "core/Engine.h"
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>
using namespace toolkit;

using namespace cv;
using namespace dnn;
using namespace std;

int main()
{
     // 加载模型
    Net net = readNetFromONNX("best.onnx");
    net.setPreferableBackend(DNN_BACKEND_OPENCV);
    net.setPreferableTarget(DNN_TARGET_CPU); // 可改为 DNN_TARGET_CUDA
    cout << "Net is empty? " << net.empty() << endl;

    // 读取图像
    Mat image = imread("test.jpeg");
    if (image.empty())
    {
        cerr << "Image not found!" << endl;
        return -1;
    }

    // YOLOv5 输入大小
    int input_width = 640;
    int input_height = 640;
    int num_classes = 1;

    // 原图尺寸
    int original_width = image.cols;
    int original_height = image.rows;

    // 预处理
    Mat blob;
    resize(image, image, Size(input_width, input_height));
    blobFromImage(image, blob, 1.0 / 255.0, Size(input_width, input_height), Scalar(), true, false);

    // 设置输入
    net.setInput(blob);

    // 前向推理
    std::vector<Mat> outputs;
    net.forward(outputs, net.getUnconnectedOutLayersNames());

    // 后处理
    float confThreshold = 0.001;
    float nmsThreshold = 0.001;

    vector<int> classIds;
    vector<float> confidences;
    vector<Rect> boxes;

    // 输出维度 [1, N, 85]
    Mat output = outputs[0];
    const int num_detections = output.size[1];
    const int dimensions = output.size[2];

    float* data = (float*)output.data;

    float x_factor = (float)original_width / input_width;
    float y_factor = (float)original_height / input_height;

    std::cout<<"num_detections "<<num_detections<<std::endl;

    for (int i = 0; i < num_detections; ++i) {
        float obj_conf = data[i * dimensions + 4];
        std::cout<<" obj_conf"<<obj_conf<<std::endl;
        if (obj_conf < confThreshold) 
            continue;

        float* class_scores = data + i * dimensions + 5;
        Mat scores(1, num_classes, CV_32F, class_scores);
        Point classIdPoint;
        double max_class_score;
        minMaxLoc(scores, 0, &max_class_score, 0, &classIdPoint);

        float confidence = obj_conf * (float)max_class_score;
        std::cout<<" confidence"<<confidence<<std::endl;

        if (confidence > confThreshold) {
            // 解码框坐标
            float cx = data[i * dimensions + 0];
            float cy = data[i * dimensions + 1];
            float w = data[i * dimensions + 2];
            float h = data[i * dimensions + 3];

            int left = (int)((cx - w / 2) * x_factor);
            int top = (int)((cy - h / 2) * y_factor);
            int width = (int)(w * x_factor);
            int height = (int)(h * y_factor);

            boxes.push_back(Rect(left, top, width, height));
            confidences.push_back(confidence);
            classIds.push_back(classIdPoint.x);
        }
    }

    // NMS 抑制
    vector<int> indices;
    NMSBoxes(boxes, confidences, confThreshold, nmsThreshold, indices);

    for (int idx : indices) {
        Rect box = boxes[idx];
        rectangle(image, box, Scalar(0, 255, 0), 2);
        putText(image, to_string(classIds[idx]), box.tl(), FONT_HERSHEY_SIMPLEX, 0.6, Scalar(0, 0, 255), 2);
    }
    cv::imwrite("result.jpg", image);

}

失败了,没有检测出来,稍后再查查。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2387116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spark集群架构解析:核心组件与Standalone、YARN模式深度对比(AM,Container,Driver,Executor)

一、核心组件定义与关系拆解 1. ApplicationMaster&#xff08;AM&#xff09; 定义&#xff1a;YARN 框架中的应用管理器&#xff0c;每个应用程序&#xff08;如 Spark 作业&#xff09;对应一个 AM。职责&#xff1a; 向 YARN 的 ResourceManager 申请资源&#xff08;Con…

Linux Kernel调试:强大的printk(二)

前言 如果你对printk的基本用法还不熟悉&#xff0c;请先阅读&#xff1a; Linux Kernel调试&#xff1a;强大的printk&#xff08;一&#xff09; 上一篇Linux Kernel调试&#xff1a;强大的printk&#xff08;一&#xff09;我们介绍了printk的基础知识和基本用法&#xf…

Kafka Kraft模式集群 + ssl

文章目录 启用集群资源规划准备证书创建相关文件夹配置文件启动各Kafka节点 故障转移测试spring boot集成 启用集群 配置集群时关键就是提前梳理好需要的网络资源&#xff0c;完成对应server.properties文件的配置。在执行前先把这些梳理好&#xff0c;可以方便后面的配置&…

[crxjs]自己创建一个浏览器插件

参考官方 https://crxjs.dev/vite-plugin/getting-started/vue/create-project 按照流程操作会失败的原因 是因为跨域的问题, 在此处添加 server: {host: "localhost",port: 5173,cors: true,headers: {"Access-Control-Allow-Origin": "*",}…

类的设计模式——单例、工厂以及建造者模式

1.单例模式 1.1 饿汉模式 单例模式&#xff1a;一个类只能创建一个对象&#xff0c;这个设计模式可以保证系统中该类只有一个实例&#xff0c;并提供一个访问它的全局访问点&#xff0c;该实例被所有程序模块共享。 饿汉模式指在程序初始化时就创建一个唯一的实例对象。适用…

STM32之看门狗(IWDG)

一、看门狗外设的原理与应用 背景说明 随着单片机的发展&#xff0c;单片机在家用电器、工业自动化、生产过程控制、智能仪器仪表等领域的应用越来越广泛。然而处于同一电力系统中的各种电气设备通过电或磁的联系彼此紧密相连&#xff0c;相互影响&#xff0c;由于运行方式的…

跟着华为去变革 ——读《常变与长青》有感

《常变与长青》&#xff0c;是华为郭平总2024年上市的著作。走进这本书&#xff0c;我们能够清晰看到华为30多年的成长过程和伴随期间的变革历程&#xff1a;从一家设备代理商开始&#xff0c;起步蹒跚&#xff0c;砥砺前行&#xff0c;在闯过一个又一个磨难之后&#xff0c;成…

图像分割技术的实现与比较分析

引言 图像分割是计算机视觉领域中的一项基础技术&#xff0c;其目标是将数字图像划分为多个图像子区域&#xff08;像素的集合&#xff09;&#xff0c;以简化图像表示&#xff0c;便于后续分析和理解。在医学影像、遥感图像分析、自动驾驶、工业检测等众多领域&#xff0c;图…

node.js配置变量

一、下载安装包 1、官网下载 大家可以在官网下载&#xff0c;适合自己电脑以及项目的需要的版本。 二、node.js安装 1、安装 双击下载的安装包文件&#xff0c;通常为 .exe 或 .msi 格式&#xff08;Windows&#xff09;或 .dmg 格式&#xff08;Mac&#xff09;。系统会…

Ubuntu+Docker+内网穿透:保姆级教程实现安卓开发环境远程部署

文章目录 前言1. 虚拟化环境检查2. Android 模拟器部署3. Ubuntu安装Cpolar4. 配置公网地址5. 远程访问小结 6. 固定Cpolar公网地址7. 固定地址访问 前言 本文将详细介绍一种创新性的云开发架构&#xff1a;基于Ubuntu系统构建Android仿真容器环境&#xff0c;并集成安全隧道技…

计算机网络总结(物理层,链路层)

目录 第一章 概述 1.基本概念 2.- C/S模式&#xff0c;B/S模式&#xff0c;P2P模式 3.- LAN,WAN,MAN,PAN的划分 4.电路交换与分组交换&#xff0c;数据报交换和虚电路交换 第二章 物理层 1.信号编码&#xff1a;不归零编码&#xff0c;曼切斯特编码 2.几种复用技术的特…

TIGER - 一个轻量高效的语音分离模型,支持人声伴奏分离、音频说话人分离等 支持50系显卡 本地一键整合包下载

TIGER 是一种轻量级语音分离模型&#xff0c;通过频段分割、多尺度及全频帧建模有效提取关键声学特征。该项目由来自清华大学主导研发&#xff0c;通过频率带分割、多尺度以及全频率帧建模的方式&#xff0c;有效地提取关键声学特征&#xff0c;从而实现高效的语音分离。 TIGER…

无人机降落伞设计要点难点及原理!

一、设计要点 1. 伞体结构与折叠方式 伞体需采用轻量化且高强度的材料&#xff08;如抗撕裂尼龙或芳纶纤维&#xff09;&#xff0c;并通过多重折叠设计&#xff08;如三重折叠缝合&#xff09;减少展开时的阻力&#xff0c;同时增强局部承力区域的强度。 伞衣的几何参数&am…

20250526给荣品PRO-RK3566的Android13单独编译boot.img

./build.sh init ./build.sh -K ./build.sh kernel 20250526给荣品PRO-RK3566的Android13单独编译boot.img 2025/5/26 15:25 缘起&#xff1a;需要给荣品PRO-RK3566的Android13单独编译内核&#xff0c;但是不想编译整个系统。于是&#xff1a; 如果特调试某些特别的改动/文件…

构建版本没mac上传APP方法

在苹果开发者的app store connect上架Ios应用的时候&#xff0c;发现需要使用xode等软件来上传iOS的APP。 但是不管是xcode也好&#xff0c;transporter也好&#xff0c;还是命令行工具也好&#xff0c;都必须安装在mac电脑才能使用&#xff0c;。 假如没有mac电脑&#xff0…

如何解决大模型返回的JSON数据前后加上```的情况

环境说明 springboot 应用使用dashscope-sdk-java对接阿里百练 deepseek v3模型 问题表现 已经指定了输出json格式&#xff0c;但指令不明确&#xff0c;输出JSON格式的写法如下 注&#xff1a;提示词一开始是能正常功能的&#xff0c;但过了几天就出现了异常&#xff0c;原…

服务器异常数据问题解决 工具(tcpdump+wireshark+iptables)

问题&#xff1a; 某天一客户反馈&#xff0c;后台页面上显示的设备数据异常增长。现场实际只有2w台设备安装了助手(客户端)&#xff0c;但是后台显示有16w的助手设备&#xff0c;并且还在持续且快速的增长。这些数据会被加载到缓存&#xff0c;时间久了&#xff0c;服务端程序…

综合实现案例 LVS keepalived mysql 等

基于企业级高可用架构的 Linux 案例&#xff0c;整合 Nginx、HTTPS、LVS、Keepalived、MySQL 等服务&#xff0c;实现 Web 服务的负载均衡、高可用性及数据持久化。 案例场景&#xff1a;高可用 Web服务架构 目标 构建高可用 Web 集群&#xff0c;支持负载均衡和故障自动切换…

【QT】对话框dialog类封装

【QT】对话框dialog类封装 背景要点采用对输入框的信号监测实现端口和IP有效 实现 背景 在Qt 6.8.1 (MSVC 2022, x86_64)中进行编写&#xff0c;需要实现IP和端口号输入的弹窗&#xff0c;实现的方式有2种&#xff0c;其一&#xff0c;采用UI绘制&#xff0c;然后进行界面加载…

2025/5/26 学习日记 基本/扩展正则表达式 linux三剑客之grep

在 Linux 系统中&#xff0c;正则表达式&#xff08;Regular Expression可用于匹配、查找和替换符合特定模式的文本。根据语法和功能的不同&#xff0c;正则表达式可分为 基础正则表达式&#xff08;BRE&#xff09; 和 扩展正则表达式&#xff08;ERE&#xff09;。 基础正则…