Yolo-World初步使用

Yolo-World初步使用

news2026/4/7 22:52:29

Yolo v8目前已经支持Yolo-World，整理一下初步使用步骤。

使用步骤

1 先下载Yolo-World的pt文件，下载地址：GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection

官网应该是点这里（有个笑脸）下载，我一直刷不出来界面，所以不确定：

我自己用的是在其他网友提供的地址下载的，应该是V1版本（yolov8-world.pt），目前已经出了V2版本。

2 新建一个python脚本，叫testYolo-World.py，这里我们使用Yolo v8自带的bus.jpg进行测试。

from ultralytics import YOLOWorld


# 目标检测
# Load a model
model = YOLOWorld('data/yolov8s-world.pt')  # load a pretrained model

# Define custom classes
model.set_classes(['glasses'])

#model.save("data/yolov8s-world2.pt")

# Run inference on 'bus.jpg' with arguments
results = model.predict('data/bus.jpg',save=True, imgsz=640)

运行过程中，会提示缺失CLIP库，然后等待一会，会自动安装。安装成功后，再次运行一遍，会出结果，能检测到glasses.

但是尝试了其他类别，'tree' 'window' 'clothes' 'shoes'，除了'shoes'，其他都检测不出来，不知道V2效果会不会好一点。

如果注释掉设置类别这句话，能检测到的类别和Yolo v8自带的pt文件检测类别基本一致，置信度很高，但是有一个错误，多检测出来一个person。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1995753.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

C++入门：C语言到C++的过渡

C++入门：C语言到C++的过渡

前言：C——为弥补C缺陷而生的语言 C起源于 1979 年，当时 Bjarne Stroustrup 在贝尔实验室工作，面对复杂软件开发任务，他感到 C 语言在表达能力、可维护性和可扩展性方面存在不足。 1983 年，Bjarne Stroustrup 在 C 语言…

阅读更多...

大数据应用型产品设计方法及行业案例介绍（可编辑110页PPT）

大数据应用型产品设计方法及行业案例介绍（可编辑110页PPT）

引言：随着信息技术的飞速发展，大数据已成为推动各行各业创新与变革的重要力量。大数据应用型产品，作为连接海量数据与实际应用需求的桥梁，其设计方法不仅要求深入理解数据特性，还需精准把握用户需求，以实现…

阅读更多...

git：安装 / 设置环境变量 / 使用

git：安装 / 设置环境变量 / 使用

一、下载 https://github.com/git-for-windows/git/releases/download/v2.45.1.windows.1/Git-2.45.1-64-bit.exe 下载成功-双击打开下一步-Next 二、添加环境变量 1、找到git安装地址 win r cmd 回车 where git 设置环境变量 C:\Program Files\Git\cmd\git.exe 此电…

阅读更多...

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 最大括号深度(100分) - 三语言AC题解(Python/Java/Cpp)

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 最大括号深度(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是春秋招笔试突围，一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试｜编程一对一辅导 👏 感谢大家的订阅➕ 和喜欢💗 🍿 最新华为OD机试D卷目录，全、新、准，题目覆盖率达 95% 以上，…

阅读更多...

分布式事务学习整理

分布式事务学习整理

一、整体背景最近在分布式事务领域这块的了解比较少，对自己来说是一个业务盲点，所以想抽空学习以及整理下关于分布式事务的相关知识。 1、分布式事务的发展总所周知，我们为什么要考虑分布式事务，从一开始发展来说&#xff0c…

阅读更多...

vscode源代码管理的传入传出更改视图如何关闭

vscode源代码管理的传入传出更改视图如何关闭

传入传出更改视图关闭： vscode源代码管理中下面显示的大量传入传出记录，不想显示的话在设置里搜索 scm.showHistoryGraph 可以关闭。

阅读更多...

[Meachines] [Easy] valentine SSL心脏滴血+SSH-RSA解密+trp00f自动化权限提升+Tmux进程劫持权限提升

[Meachines] [Easy] valentine SSL心脏滴血+SSH-RSA解密+trp00f自动化权限提升+Tmux进程劫持权限提升

信息收集 IP AddressOpening Ports10.10.10.79TCP:22,80,443 $ nmap 10.10.10.79 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 5.9p1 Debian 5ubuntu1.10 (Ubuntu Linux; protocol 2.0) | ssh-hostkey: | 1024 96:4c:51:42:…

阅读更多...

以树莓集团的视角：探索AI技术如何重塑数字媒体产业发展

以树莓集团的视角：探索AI技术如何重塑数字媒体产业发展

在科技日新月异的今天，AI技术如同一股不可阻挡的潮流，正深刻改变着我们的世界，尤其是数字媒体产业发展。作为数字产业生态链的杰出建设者，树莓集团始终站在时代前沿，积极探索AI技术如何为数字媒体产业注入新活力。在树…

阅读更多...

(ICCV-2023)使用 Transformer 的可扩展扩散模型

(ICCV-2023)使用 Transformer 的可扩展扩散模型

使用 Transformer 的可扩展扩散模型 Paper Title:Scalable Diffusion Models with Transformers Paper是UC Berkeley发表在ICCV 2023的工作 paper地址 code地址图 1：具有 transformer 主干的扩散模型实现了最先进的图像质量。我们展示了在 ImageNet 上以 512$\time…

阅读更多...

初学51单片机1602液晶时序图实例分析

初学51单片机1602液晶时序图实例分析

上篇博文笔者分享了关于液晶1602基本的工作流程，本篇主要是通过逻辑分析仪来看一下程序使能的电平时序，是否符合产品文档给出的时序逻辑。先看一下1602的时序图认识下时序图中各个标识的含义： Tc信号周期（E Cycle Time&#x…

阅读更多...

WEB应用（十六）---反序列化

WEB应用（十六）---反序列化

反序列化的概念在面向对象编程语言中，就是将对象转化为字节流，这一步是序列化，字节流中包括这个对象的数据和信息，便于传输和存储，是可以在网络中传输的。需要时，通过反序列化从字节流中恢复对象。类似于…

阅读更多...

State-Threads初识

State-Threads初识

1.项目简介协程（coroutine）不是进程或线程，其执行过程更类似于子例程，或者说不带返回值的函数调用。一个程序可以包含多个协程，可以对比与一个进程包含多个线程。我们知道多个线程相对独立，有自己的上下…

阅读更多...

Dopple Labs 选择 Zilliz Cloud 作为安全高效的向量数据库

Dopple Labs 选择 Zilliz Cloud 作为安全高效的向量数据库

一直以来，我都十分赞同采用通用的标准来评估机器学习领域的技术。向量数据库领域也是如此。Zilliz 发布的性能测试对我有着很大的帮助。 ——Sam Butler Dopple.AI 机器学习总监 01.Dopple AI简介 Dopple Labs Inc. 是 Dopple.AI 的原厂，通过提供创新…

阅读更多...

我是如何选择适合我的电脑的

我是如何选择适合我的电脑的

当前有什么可以供自己选择将从便携、性能、价格、游戏、视频剪辑、高性能、接口、屏幕、使用感受等方面考虑(超出普通人范围电脑不考虑) 非苹果： 轻薄笔记本：最便捷办公笔记本：游戏笔记本台式电脑台式游戏电脑台式高性能电脑苹果&#…

阅读更多...

ROM修改进阶教程------修改rom 内置app的几种方法与注意事项以及运行库中arm64 .rmeabi-v7a与armeabi 区别

ROM修改进阶教程------修改rom 内置app的几种方法与注意事项以及运行库中arm64 .rmeabi-v7a与armeabi 区别

在定制rom的过程中。内置app是很多rom爱好者必须的技能之一。但对于初学者来说。会遇到内置的app无效果或者出现运行有bug的情况。内置app需要根据安卓版本的不同略有变化 .在高安卓版本中还需要内置apk的运行库。通过今天的博文了解; 1-----内置APP的几种方式步骤 2-----视…

阅读更多...

OpenHarmony南向开发 SA服务SELinux权限配置一站式傻瓜式教程

OpenHarmony南向开发 SA服务SELinux权限配置一站式傻瓜式教程

Selinux权限配置 OpenHarmony中SELinux使用详解目录 SELinux简介SELinux概念SELinux模式OH中SELinux使用详解新增SA服务如何配置SELinux权限SELinux简介 SELinux是Security Enhanced Linux 的缩写，也就是安全强化的 Linux，旨在增强传统Linux操作系统的安全性，解决传统Li…

阅读更多...

关于使用webflux开发思考

关于使用webflux开发思考

1、目前终于看到有系统使用spring的webflux进行系统开发，主要原因是比如gpt、千问的大模型数据返回都支持流式方式返回，比如和用户对话，可以流式的把数据给用户展示，不用一次性把数据展示到页面上。 webflux还有一个能力就是&…

阅读更多...

MongoDB笔记1——MongoDB简介

MongoDB笔记1——MongoDB简介

MongoDB 什么是MongoDB 2007年10月，MongoDB由10gen团队所开发，2009年2月首度推出。基于分布式文件存储的数据库由C语言编写。旨在为WEB应用提供可拓展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库（NoSQL&…

阅读更多...

东芝新小黑移动硬盘数据被格式化如何恢复（2024年8月版）

东芝新小黑移动硬盘数据被格式化如何恢复（2024年8月版）

在数字化时代，数据已成为我们生活和工作中不可或缺的一部分。东芝新小黑移动硬盘，以其便携性和大容量，成为许多用户存储重要数据的首选。然而，当这些宝贵的数据因意外格式化而面临丢失的风险时，我们该如何应对&#xf…

阅读更多...

Visionpro二次开发学习笔记7-使用CogToolDisplay控件

Visionpro二次开发学习笔记7-使用CogToolDisplay控件

CogToolDisplay控件可显示与视觉工具记录相关的图像，图形和其他状态信息。它使用CogRecord和ICogTool接口将图像和图形连接到CogDisplay。图片清单控件的CogComboBox列出当前记录及其子记录中的图像和图形。您可以单击列表并选择要显示的图像或图形。如果记录层…

阅读更多...

推荐文章

最新文章