【玩转全栈】----YOLO8训练自己的模型并应用

news2025/6/3 14:01:07

继上篇:

【玩转全栈】---基于YOLO8的图片、视频目标检测-CSDN博客

        相信大家已经可以训练一些图片和视频了,接下来我将为大家介绍如何训练自己的特定模型,并用其进行检测

目录

准备数据

图片数据

标识数据

配置文件

运行

测试训练结果

存在的问题

准备数据

图片数据


首先要准备一些图片数据,其中包含一些相同的要素,这里我就拿王者荣耀进行演示。

我在B站下载了个视频,对其中英雄形象比较明显的进行的截屏,截了25张:

截图:

标识数据

        然后需要这25张图片的标识数据,需要用标识工具,我用的大发YOLO标注工具,他是要收费的,如果大家需要的话,找我私,我会发给你,我博客上面不好分享,怕被告。

        使用也非常简单,先导入图片,勾出人物框,添加类型,确定类型,保存标注即可。这样,会自动创建该图片的标注文件,大家一张一张标注好即可。

配置文件

创建下图所示目录:

xun可以自己随便取

将图片数据分别复制进imgs中的train和val中,再将标记文件分别复制进labels中的train和val中。

再创建一个.yaml文件

内容如下:

path: D:\.idea\YOLO\Yolo8\yolo8_learn\xun  #数据集根目录
train: images/train  #训练集图片路径
val: images/val  #验证集图片路径
nc: 10  #类别数量
names: ['千年老茧','周瑜','梦琪','百里守约','张飞','廉颇','赵云','海月','夏洛特','公孙离']  #类别名称

按要求写即可。

创建一个py文件,文件内容如下:

# 开始训练模型

from ultralytics import YOLO

import os
os.environ['CURL_CA_BUNDLE'] = ""
# 加载预训练模型
model = YOLO('yolo8l.pt')
# 开始训练模型
model.train(
    data='data.yaml',  #训练数据集
    epochs=500,  #训练轮次
    imgsz=640,  #输入图片尺寸(会转换为该尺寸)
    batch=32,  #每次训练的批量
    device='cpu'   #GPU更快
)
print("训练结束")

训练模型中的参数都是用的官方推荐参数,大家直接抄就行,具体参数解释也在后面。

当然,用CPU训练会非常满,尤其在一些参数还比较大的时候,我们测试用可以稍微调小点,比如这样:

model.train(
    data='data.yaml',  #训练数据集
    epochs=100,  #训练轮次
    imgsz=320,  #输入图片尺寸(会转换为该尺寸)
    batch=32,  #每次训练的批量
    device='cpu'   #GPU更快
)

运行

运行.py文件,出现以下画面:

这表示正在训练,Epach是进程。

训练结束后会得到一个训练文件:

在目录下的weights文件夹中的best.pt,就是训练完的最优模型(适用于最终运用)

last.pt 是训练的最后一轮模型(适用于继续训练),即可以放在这个位置:

# 开始训练模型

from ultralytics import YOLO

import os
# import certifi
# print(certifi.where())

os.environ['CURL_CA_BUNDLE'] = ""
# 加载预训练模型
model = YOLO('last.pt')
# 开始训练模型
model.train(
    data='data.yaml',  #训练数据集
    epochs=500,  #训练轮次
    imgsz=320,  #输入图片尺寸(会转换为该尺寸)
    batch=8,  #每次训练的批量
    device='cpu'   #GPU更快
)
print("训练结束")

测试训练结果

将best.pt作为训练模型,对该视频进行训练

# 检测模型结果
from ultralytics import YOLO
# 模型训练完自动保存到D:\.idea\YOLO\Yolo8\yolo8_learn\runs\detect\train6\weights
# best.pt  训练完的最优模型(适用于最终运用)
# last.pt  训练的最后一轮模型(适用于继续训练)
# 加载自己训练好的模型
model = YOLO(r'D:\.idea\YOLO\Yolo8\yolo8_learn\runs\detect\train6\weights\best.pt')
# 开始检测
model('2.mp4',show=True,save=True)

静静等待训练结束。

训练结果:

YOLO8识别王者荣耀视频

存在的问题

可以看到训练结果很一般,主要有以下几个原因:

1、王者荣耀技能特效太花,英雄动作太多,影响检测;

2、训练图片量比较少;

3、贪图时间,一些参数调得较小。

4、(个人因素)我也是训练完才发现,我的配置文件表和标注软件上的设置标注顺序不一样,这就导致只有千年老茧和赵云是符合的,其他的英雄顺序都乱了,希望大家能注意到这点。

下篇博客将更新一些更高阶的玩法,敬请期待。

感谢您的三连!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2281389.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

简洁实用的wordpress外贸模板

简洁、实用、大气的wordpress外贸模板,适合跨境电商搭建外贸B2B产品展示型网站。 简洁实用的wordpress外贸模板 - 简站WordPress主题简洁、实用、大气的wordpress外贸模板,适合跨境电商搭建外贸B2B产品展示型网站。https://www.jianzhanpress.com/?p828…

Caesar

Caesar 打开.txt: oknqdbqmoq{kag_tmhq_xqmdzqp_omqemd_qzodkbfuaz} 根据题目判断是凯撒密码,flag前头是cyberpeace{},可以得到偏移量是12. 所以: cyberpeace{you_have_learned_caesar_encryption} 下面是我找的关于凯撒密码的解密脚本 c…

OpenEuler学习笔记(四):OpenEuler与CentOS的区别在那里?

OpenEuler与CentOS的对比 一、基本信息 起源与背景: OpenEuler:由华为发起,后捐赠给开放原子开源基金会,旨在构建一个开放、多元化的云计算和边缘计算平台,以满足华为及其他企业的硬件和软件需求。CentOS:…

纯css实现div宽度可调整

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>纯css实现div尺寸可调整</title><style…

Cesium特效——城市白模的科技动效的各种效果

最终效果图如下&#xff1a; 实现方法&#xff1a; 步骤一&#xff1a;使用cesiumlib生产白模&#xff0c;格式为3dtiles 注意事项&#xff1a;采用其他方式可能导致白模贴地&#xff0c;从而导致不能实现该效果&#xff0c;例如把步骤二的服务地址改为Cesium Sandcastle 里的…

JavaWeb 学习笔记 XML 和 Json 篇 | 020

今日推荐语 愿你遇见好天气,愿你的征途铺满了星星——圣埃克苏佩里 日期 学习内容 打卡编号2025年01月23日JavaWeb笔记 XML 和 Json 篇020 前言 哈喽&#xff0c;我是菜鸟阿康。 以下是我的学习笔记&#xff0c;既做打卡也做分享&#xff0c;希望对你也有所帮助…

【力扣:新动计划,编程入门 —— 题解 ②】

—— 25.1.23 1512. 好数对的数目 给你一个整数数组 nums 。 如果一组数字 (i,j) 满足 nums[i] nums[j] 且 i < j &#xff0c;就可以认为这是一组 好数对 。 返回好数对的数目。 示例 1&#xff1a; 输入&#xff1a;nums [1,2,3,1,1,3] 输出&#xff1a;4 解释&#xff…

如何在data.table中处理缺失值

&#x1f4ca;&#x1f4bb;【R语言进阶】轻松搞定缺失值&#xff0c;让数据清洗更高效&#xff01; &#x1f44b; 大家好呀&#xff01;今天我要和大家分享一个超实用的R语言技巧——如何在data.table中处理缺失值&#xff0c;并且提供了一个自定义函数calculate_missing_va…

《RWA全球产业白皮书》发布:向凌云教授解析全球经济转型与RWA的未来

2025年1月16日&#xff0c;旅美经济学家、全球新兴产业金融专家向凌云教授在美国发布了引人注目的《RWA全球产业白皮书》。该白皮书通过深入分析全球产业结构变化&#xff0c;尤其强调了“真实世界资产”&#xff08;Real-World Assets&#xff0c;简称RWA&#xff09;在当前及…

TOGAF之架构标准规范-信息系统架构 | 数据架构

TOGAF是工业级的企业架构标准规范&#xff0c;信息系统架构阶段是由数据架构阶段以及应用架构阶段构成&#xff0c;本文主要描述信息系统架构阶段中的数据架构阶段。 如上所示&#xff0c;信息系统架构&#xff08;Information Systems Architectures&#xff09;在TOGAF标准规…

安宝特方案 | AR在供应链管理中的应用:提升效率与透明度

随着全球化的不断深入和市场需求的快速变化&#xff0c;企业对供应链管理的要求也日益提高。如何在复杂的供应链环境中提升效率、降低成本&#xff0c;并确保信息的透明度&#xff0c;成为了各大行业亟待解决的问题。而增强现实&#xff08;AR&#xff09;技术&#xff0c;特别…

C语言数组详解:从基础到进阶的全面解析

在C语言中&#xff0c;数组是一种基本的数据结构&#xff0c;用于存储多个相同类型的数据。数组的引入使得C语言能够高效地存储和操作大量数据。在任何一个C语言程序中&#xff0c;数组都发挥着极其重要的作用。无论是在算法实现、数据存储、还是在复杂程序的设计中&#xff0c…

阴沟翻船题——Longest Substring Without Repeating Characters

一、事件概述 今天接到一个面试&#xff0c;让线上做题。面试官出了个leetcode的题。题目如图所示&#xff1a; 我没有刷过leetcode&#xff0c;上学时候我们做的hdu-acm和codeforces。咋一接到题目&#xff0c;看到是个字符串题&#xff0c;并且找最长字串&#xff0c;第一反…

ssm基于HTML5的红酒信息分享系统

SSM基于HTML5的红酒信息分享系统是一个专注于红酒领域的综合性信息平台&#xff0c;旨在为红酒爱好者、从业者以及普通消费者提供一个便捷的交流与获取红酒相关信息的空间。 一、系统背景与意义 随着人们生活水平的提高和消费观念的转变&#xff0c;红酒作为一种高雅的饮品&a…

【FFmpeg】FLV 格式分析 ③ ( Tag Body 数据块体结构 - Vedio Data 视频数据 )

文章目录 一、Tag Body 数据块体结构 - Video Data 视频数据1、Vedio Data 视频数据 类型标识2、Vedio Data 视频数据 结构分析3、Composition Time Offset 字段涉及的时间计算4、AVC Packet Type 字段说明① AVC Sequence Header 类型② AVC NALU 类型③ AVC End of Sequence …

解决docker: ‘buildx‘ is not a docker command.

简介 buildx 是 Docker 官方提供的一个构建工具&#xff0c;它可以帮助用户快速、高效地构建 Docker 镜像&#xff0c;并支持多种平台的构建。使用 buildx&#xff0c;用户可以在单个命令中构建多种架构的镜像&#xff0c;例如 x86 和 ARM 架构&#xff0c;而无需手动操作多个…

Centos类型服务器等保测评整/etc/pam.d/system-auth

修改服务器配置文件/etc/pam.d/system-auth&#xff0c;但是&#xff0c;把一下配置放在password的配置第一行才会生效 执行命令&#xff1a;配置口令要求&#xff1a;大小写字母、数字、特殊字符组合、至少8位&#xff0c;包括强制设置root口令&#xff01; sed -i 14a pas…

精准捕捉,智能训练:数据手套在机器人灵巧手领域的应用探索

数据手套是一种内置多个高精度传感器&#xff0c;能够精准捕捉手部动作数据&#xff0c;并将其转化为数字信号的高科技穿戴设备。 MHand pro动捕数据手套其内置16个高精度传感器&#xff0c;能敏锐感知手指的弯曲、伸展等动作。这些传感器通过复杂的算法&#xff0c;将手部动作…

FPGA实现任意角度视频旋转(二)视频90度/270度无裁剪旋转

本文主要介绍如何基于FPGA实现视频的90度/270度无裁剪旋转&#xff0c;关于视频180度实时旋转&#xff0c;请见本专栏前面的文章&#xff0c;旋转效果示意图如下&#xff1a; 为了实时对比旋转效果&#xff0c;采用分屏显示进行处理&#xff0c;左边代表旋转前的视频在屏幕中…

PHP如何封装项目框架达到高可用、高性能、高并发

很多初创公司为了快速上线业务&#xff0c;开发时间由本来的6个月压缩到3个月甚至2个月。开发人员只能根据时间及业务需求去git上找现有的项目二次开发或者是一个空框架根据业务一点一点的去做&#xff0c;上述两种方案虽然也可以上线但是对于业务本身存在的问题也是很大的&…