《YOLOv11 实战:从入门到深度优化》002、环境搭建:从零配置YOLOv11开发与训练环境
002、环境搭建从零配置YOLOv11开发与训练环境昨天深夜调试一个边缘设备上的推理异常问题最终定位到CUDA版本和torch不匹配——这种环境配置埋下的坑往往比算法本身更难排查。今天咱们就老老实实把YOLOv11的环境从头搭一遍这份笔记里的每行命令都是实机验证过的。一、基础环境选择Ubuntu 22.04是目前最稳妥的选择对NVIDIA驱动兼容性最好。如果你用Windows建议直接上WSL2原生Linux环境能避开至少80%的依赖问题。内存建议16GB起步训练时显存占用很吃资源。二、驱动与CUDA安装先看显卡驱动nvidia-smi如果输出里CUDA Version显示12.4或更高说明驱动已经就位。没有的话去官网下载对应显卡的驱动安装时记得加上--no-opengl-files参数避免图形界面冲突。CUDA装11.8版本最稳妥这是目前多数框架的“最大公约数”wgethttps://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.runsudoshcuda_11.8.0_520.61.05_linux.run安装时只选CUDA Toolkit其他选项都取消。装完把这两行加到~/.bashrcexportPATH/usr/local/cuda-11.8/bin:$PATHexportLD_LIBRARY_PATH/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH三、Python环境配置别用系统PythonAnaconda也建议别用太臃肿。直接上Minicondawgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.shbashMiniconda3-latest-Linux-x86_64.sh创建专用环境conda create-nyolov11python3.9-yconda activate yolov11这里用Python 3.9是因为3.10有时会遇到奇怪的包兼容问题。四、PyTorch和核心依赖到PyTorch官网用pip安装conda源经常滞后pipinstalltorch2.0.1torchvision0.15.2torchaudio2.0.2 --index-url https://download.pytorch.org/whl/cu118注意后面的cu118必须和你的CUDA版本对应这里踩过坑——装成cpu版本训练时才发现一晚上白跑。接着装OpenCV别用conda版本pipinstallopencv-python4.8.1.78 pipinstallopencv-contrib-python4.8.1.78两个都要装有些扩展功能在contrib里。五、YOLOv11源码部署从官方仓库拉取代码gitclone https://github.com/ultralytics/ultralytics.gitcdultralytics pipinstall-e.这个-e参数是开发模式安装修改代码后不用重装。现在很多教程漏了这一步结果改完代码发现没生效。安装其他依赖pipinstallmatplotlib3.3.0 pipinstallseaborn0.11.0 pipinstalltqdm4.64.0 pipinstallpandas1.1.0 pipinstallpyyaml5.3.1注意版本号有些老版本会报奇怪的警告。六、环境验证写个简单的测试脚本verify_env.pyimporttorchimportcv2importultralyticsprint(fPyTorch版本:{torch.__version__})print(fCUDA可用:{torch.cuda.is_available()})print(fCUDA版本:{torch.version.cuda})print(f设备数量:{torch.cuda.device_count()})print(f当前设备:{torch.cuda.get_device_name(0)})# 测试一个简单推理modelultralytics.YOLO(yolov11n.pt)# 会自动下载模型print(环境验证通过)运行后如果看到显卡信息正确输出说明基础环境OK。七、开发工具配置强烈推荐VS Code装Python和Pylance扩展。在项目根目录创建.vscode/settings.json{python.defaultInterpreterPath:~/miniconda3/envs/yolov11/bin/python,python.linting.enabled:true,python.formatting.provider:black}这样每次打开项目都会自动切到正确的环境。八、数据集目录规划别把数据集扔得到处都是建议这样组织datasets/ ├── coco/ # COCO格式数据集 │ ├── images/ │ ├── labels/ │ └── dataset.yaml ├── custom/ # 自定义数据集 └── downloads/ # 临时下载目录在yaml文件里用相对路径这样迁移到服务器时少折腾。常见坑点显卡驱动装完后要重启不重启nvidia-smi可能能看到但torch用不了WSL2里CUDA需要额外装WSL专用的CUDA Toolkit多显卡机器注意设置CUDA_VISIBLE_DEVICES环境变量训练时如果报内存不足试试把dataloader的workers设为0个人建议环境配置文档一定要自己写一份别依赖别人的笔记。我习惯在项目根目录放个environment.md记录所有安装命令和版本号下次重装系统半小时就能恢复。另外训练环境最好和部署环境保持一致很多问题在docker里能提前暴露。模型训练开始前先用小批量数据跑一个epoch验证整个流水线是否通畅。曾经有次数据集路径写错直接训练了一整夜才发现loss根本没下降。环境配好了就尽量别动特别是CUDA版本。下次我们直接加载预训练模型看看怎么用三行代码跑起目标检测。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2490159.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!