计算机视觉、YOLO算法模型训练、无人机监测人员密集自动识别

news2026/4/23 6:02:17

第一阶段准备工作1. 硬件确认你需要一台带NVIDIA 独立显卡的电脑显存 8G 以上游戏本 / 设计本都行如果没有用 CPU 也能跑但训练会很慢不建议最好找个带显卡的。2. 软件安装按顺序装1确认 Python版本打开命令行CMD输入python --version装 Ultralytics YOLO一键式 AI 工具pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple3装 LabelImg标注工具pip install labelImg -i https://pypi.tuna.tsinghua.edu.cn/simple4验证安装成功输入 yolo predict modelyolov8n.pt sourcehttps://ultralytics.com/images/bus.jpg如果能看到识别结果说明 YOLO 装好了输入 labelImg如果能打开一个画图软件说明标注工具装好了第二阶段数据采集与标注建一个规范的项目文件夹在电脑里新建一个根文件夹比如叫D:\Person_Detect_Project\然后按下面的结构建好子文件夹复制文件夹名就行别乱改二、核心第一步准备教模型的教材数据采集标注这是最关键的一步你教得越认真模型认人越准1. 采集照片拍你真实场景的无人机照片照片要求直接决定模型效果一定要按这个来数量至少 500 张起步越多越好1000 张以上效果会有质的飞跃内容必须是无人机真实拍的场景景区、园区、广场等别用网上的室内照片和你实际用的场景不匹配训了也白训多样性不同高度10 米、30 米、50 米高空拍的都要有你平时飞多高就拍多高不同密度1-2 个人、十几个人、上百人的密集人群都要有不同环境晴天、阴天、傍晚、逆光的场景都拍一点不同角度正拍、斜拍、俯拍都要有格式统一用 JPG/PNG 格式别用特殊格式照片分配拍好的照片80% 放进images/train/文件夹20% 放进images/val/文件夹。比如你拍了 500 张400 张放 train100 张放 val。2. 标注照片教模型 “这个东西是人”这一步就是给模型划重点你框得越准、越全模型以后认人越准。标注操作步骤一步一步跟着做打开 CMD输入labelImg打开标注工具关键设置一步都不能错点击左侧「Open Dir」选择你刚才建的images/train/文件夹打开要标注的照片点击左侧「Change Save Dir」选择labels/train/文件夹标注好的文件存在这里点击软件顶部的「PascalVOC」点一下切换成「YOLO」格式必须改不然模型读不了开始标注按键盘W键鼠标会变成十字把照片里的每一个人都用框完整圈起来哪怕只露一个头、半个身子也要框框完之后会弹出输入标签的框统一输入 person就写这个单词别写中文、别写错和官方模型的标签保持一致你后面的代码不用改按CtrlS保存按D键切到下一张按A键回到上一张全部标完 train 文件夹里的照片再重复上面的步骤把images/val/里的照片也标完保存路径选labels/val/。第三阶段一键训练你的专属模型电脑自动跑不用你管标注完了剩下的事电脑自动做你只需要复制粘贴代码点一下运行就行。1.写数据集配置文件在train_code/文件夹里新建一个文本文件改名叫person_drone.yaml把下面的内容复制进去路径改成你自己电脑的绝对路径写一键训练代码在train_code/文件夹里新建一个 Python 文件叫train_person.py把下面的内容复制进去开始训练1.打开 CMD用cd命令进入到train_code/文件夹比如cd D:\Person_Detect_Project\train_code运行训练代码2.python train_person.py3.然后你就可以去休息了显卡好的话1-2 小时就训完了用 CPU 的话会很慢建议找个带 NVIDIA 显卡的电脑。训的过程中电脑会自动打印进度不用管它别关窗口就行。四、核心第三步测试你的模型看认人准不准训练完成后会在runs/train/person_drone_v1/weights/文件夹里生成 2 个核心文件·best.pt这就是你自己训出来的专属模型整个流程的核心成果识别最准的版本·last.pt最后一轮训练的模型不用管用 best.pt 就行现在我们来测试一下这个模型比官方的好多少在train_code/里新建一个test_model.py复制下面的代码2.运行这个文件打开生成的结果照片看看模型是不是把所有的人都框出来了有没有漏检、误检五、核心第四步替换到你现有的 server.py 里直接用测试没问题就可以把你原来的官方模型换成你自己训的专属模型了只需要改 1 行代码1. 复制模型文件把训好的best.pt复制到你server.py所在的文件夹里改个好记的名字比如person_drone_v1.pt。2. 修改你的 server.py 代码只需要改加载模型的那一行把原来的改成你自己的模型文件其他代码完全不用动你原来的classes0、conf0.3这些参数都不用改因为我们标注的标签就是person和官方的类别序号完全兼容改完直接运行就行识别效果会比原来的官方模型好很多怎么让模型越来越准如果发现模型在某些场景认不准比如逆光、特别密集的人群就按这个流程优化把这些认错 / 漏认的照片收集起来用 LabelImg 把这些照片标注好把新的照片和标注文件加到train/文件夹里重新运行训练代码把版本名改成person_drone_v2训完用新的best.pt替换旧的模型就行。投喂的高质量场景照片越多模型对你的业务场景适配度越高识别就越准小白常见问题避坑训练的时候报错 “显存不足”把训练代码里的batch8改成batch4甚至batch2越小越省显存。标注完了训练找不到文件检查 yaml 里的路径是不是绝对路径标注格式是不是 YOLO标签名是不是person。模型识别还是不准先看是不是标注漏标、错标了再补更多对应场景的照片重新训。训好的模型拷到别的电脑能用吗完全可以把best.pt文件拷过去改一下路径就能用不用联网。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2445822.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！