Yolo v8目前已经支持Yolo-World,整理一下初步使用步骤。
使用步骤
1 先下载Yolo-World的pt文件,下载地址:GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection
官网应该是点这里(有个笑脸)下载,我一直刷不出来界面,所以不确定:

我自己用的是在其他网友提供的地址下载的,应该是V1版本(yolov8-world.pt),目前已经出了V2版本。
2 新建一个python脚本,叫testYolo-World.py,这里我们使用Yolo v8自带的bus.jpg进行测试。
from ultralytics import YOLOWorld
# 目标检测
# Load a model
model = YOLOWorld('data/yolov8s-world.pt') # load a pretrained model
# Define custom classes
model.set_classes(['glasses'])
#model.save("data/yolov8s-world2.pt")
# Run inference on 'bus.jpg' with arguments
results = model.predict('data/bus.jpg',save=True, imgsz=640)
运行过程中,会提示缺失CLIP库,然后等待一会,会自动安装。安装成功后,再次运行一遍,会出结果,能检测到glasses.

但是尝试了其他类别,'tree' 'window' 'clothes' 'shoes',除了'shoes',其他都检测不出来,不知道V2效果会不会好一点。

如果注释掉设置类别这句话,能检测到的类别和Yolo v8自带的pt文件检测类别基本一致,置信度很高,但是有一个错误,多检测出来一个person。




![【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 最大括号深度(100分) - 三语言AC题解(Python/Java/Cpp)](https://i-blog.csdnimg.cn/direct/4a2868463b994b1eb90a731547c5083d.png)


![[Meachines] [Easy] valentine SSL心脏滴血+SSH-RSA解密+trp00f自动化权限提升+Tmux进程劫持权限提升](https://img-blog.csdnimg.cn/img_convert/c6d8a0e061eec042d3ebf74ec432afca.jpeg)












