【提示学习论文】TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model

【提示学习论文】TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model

news2026/4/8 6:04:41

TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model（CVPR2024）

基于文本的类感知提示调优的VLM
KgCoOp为baseline，进行改进，把 $w_{clip}$ 进行投影，然后与Learnable prompts进行结合。

Abstract

近年来，通过可学习的域共享或图像条件的文本tokens，促进生成适用于特定任务的分类器

问题：
这些textual tokens对unseen域具有有限的泛化能力，不能动态地适应测试类的分布

解决：
提出了新的基于文本的类感知提示调优（TCP，Textual-based Class-aware Prompt）。显式地结合关于类的先验知识，增强它们的可辨别性。利用文本知识嵌入（TKE），映射高泛化性的类级文本知识，到类感知文本tokens。通过无缝地将这些类感知提示集成到Text Encoder中，可以生成一个动态的类感知分类器，以增强对不可见域的可辨别性。
推断阶段，TKE动态地生成与unseen类相关的类感知提示，可作为即插即用的模型与现有方法轻松结合。

1 Introduction

图像条件文tokens封装了每个图像的特定知识，特别是测试图像，从而更容易泛化到unseen类。

3 方法

TKE将一般类级的textual embedding转化成类感知提示，然后与Learnable tokens 结合。

3.2 基于文本的类感知提示提示调优

TKE：投影class-level embedding $W^{clip}$ ，得到class-aware prompt T
![[TCPg2.png]]

![[TCPg3.png]]

![[TCPg4.png]]

![[TCPg1.png]]

TKE包括两层

下投影层
使用权重 $W_{down}$ 将 $W^{clip}$ 其投成低维特征
上投影层
使用权重 $W_{up}$ 将 $W^{dwon}$ 其投成高维特征
得到
![[TCPg5.png]]
再重塑成
![[TCPg6.png]]
插入到文本编码器的中间层

4 实验

作者将其分为tp、vp、dtp、dvp，比较了近年来的方法
在这里插入图片描述

消融实验

Prompt长度：M=8最好
不同模板的效果：可学习prompt最好
Dmid的作用：128时效果最好
类感知prompt拼接到哪：第8层最好

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1674875.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

考研数学｜强化《660》+《880》这样刷，太丝滑了❗️

考研数学｜强化《660》+《880》这样刷，太丝滑了❗️

660题880题需要大概两个月才能做完 660题和880题都是很高质量的题集，所以做起来一点也不轻松。每年都会有学生暑假两个月只做了一本660题的情况，因为题目实在是太难，有点做不下去的感觉。不过不要担心，暑假就是刷题发现问题的…

阅读更多...

Ubuntu安装k8s集群

Ubuntu安装k8s集群

文章目录 Ubuntu安装k8s3台主机前置操作：3台主机k8s前置安装命令：k8s安装命令： 节点加入 Ubuntu安装k8s 官方文档：https://kubernetes.io/zh-cn/docs/setup/production-environment/tools/kubeadm/install-kubeadm/ 默认3台机子注…

阅读更多...

如何为域名生成证书签发请求CSR

如何为域名生成证书签发请求CSR

最近我们在Hostease购买了服务器产品，为了保障我们网站的安全，我们额外还购买了SSL证书产品。在Hostease技术客服的帮助下，我们成功签发了SSL证书。在签发证书前需要生成一个证书签名请求CSR，证书签名请求(CSR)是一个包含有关你…

阅读更多...

轻松拿下指针（5）

轻松拿下指针（5）

文章目录一、回调函数是什么二、qsort使用举例三、qsort函数的模拟实现一、回调函数是什么回调函数就是⼀个通过函数指针调⽤的函数。如果你把函数的指针（地址）作为参数传递给另⼀个函数，当这个指针被⽤来调⽤其所指向的函数时&#x…

阅读更多...

Autoware内容学习与初步探索(一)

Autoware内容学习与初步探索(一)

0. 简介之前作者主要是基于ROS2，CyberRT还有AutoSar等中间件完成搭建的。有一说一，这种从头开发当然有从头开发的好处，但是如果说绝大多数的公司还是基于现成的Apollo以及Autoware来完成的。这些现成的框架中也有很多非常好的方法。目前作者…

阅读更多...

uniapp高性能图片裁剪插件，可添加水印

uniapp高性能图片裁剪插件，可添加水印

效果图： 插件地址：高性能图片裁剪，裁剪图片后自动添加水印 - DCloud 插件市场示例： <template> <view><button click"select">选择图片</button><image mode"widthFix" :src&qu…

阅读更多...

EUCR-30S电机保护器施耐德EOCR

EUCR-30S电机保护器施耐德EOCR

EOCR主要产品有电子式电动机保护继电器，电子式过电流继电器，电子式欠电流继电器，电子式欠电压继电器，其它保护和监视装置，电流互感器。电器密集型设计 ■ 二个集成组装电流互感器 ■ 欠载保护（空转保护…

阅读更多...

解决使用Vue.js前端与Flask后端API交互时跨源资源共享问题

解决使用Vue.js前端与Flask后端API交互时跨源资源共享问题

我在使用flask以及Vue做一个项目时遇到了Vue前端与Flask后端API交互的问题就是前端获取不到后端返回的数据，报错： 上网查说是跨域问题，于是找了一些解决办法，就是可以通过设置响应头的 Access-Control-Allow-Origin 字段来允许所有…

阅读更多...

pve clusterk8s cluster重建

pve clusterk8s cluster重建

背景 dev环境新买了一块固态，插到pve主板的第二个M.2槽位不能识别，通过其他机器排查后确定是这台pve的槽位问题。同时这台pve还有一些其他的lvm历史遗留问题，具体表现是每次开机很长，因为要扫描那块机械硬盘做的lvm 所以决定将这…

阅读更多...

输入4个整数，找出其中最大的数，用一个函数来实现

输入4个整数，找出其中最大的数，用一个函数来实现

函数的嵌套调用: C不允许对函数作嵌套定义，也就是说在一个函数中不能完整地包含另一个函数。在一个程序中每一个函数的定义都是互相平行和独立的，如 void f1() {...} int f2() {...} float f3() {...} long f4()…

阅读更多...

TikTok起号的八大技巧分享

TikTok起号的八大技巧分享

国内的传统生意都是可以在抖音上做，那么也可以在TikTok 上重新做一遍。那该如何才能把握住这片巨大的蓝海，TikTok 账号的运营就成为了主要的关键了，对于TikTok账号运营的八大秘籍，大家一起看看是如何做的？ 一、固定节…

阅读更多...

克鲁斯CLOOS机器人维修知识分享

克鲁斯CLOOS机器人维修知识分享

克鲁斯工业机器人是一种高度精密的自动化设备，广泛应用于制造业、物流等领域。为了确保机器人的正常运行，了解一些基本的CLOOS工业机械手维修知识是必不可少的。【常见CLOOS机械臂故障及解决方法】 1. 机器人无法启动：检查电源是否正常&…

阅读更多...

python 对矩阵与矩阵之间对应位置的元素，做softmax操作，代码实战

python 对矩阵与矩阵之间对应位置的元素，做softmax操作，代码实战

1.对矩阵中对应位置的元素，做softmax 对于一个向量，softmax函数会对其中每一个元素进行指数运算，然后除以所有元素指数和的结果。当将其应用到多个矩阵的相应位置上时，我们实际上是在对每个位置的一组数（从各个矩阵的同…

阅读更多...

【MP C3003】理光打印机驱动下载使用

【MP C3003】理光打印机驱动下载使用

官方下载链接 https://support.ricoh.com/bb/html/dr_ut_e/apc/model/mpc3003/mpc3003.htm?langen

阅读更多...

sklearn中多分类和多标签分类评估方法总结

一、任务区分多分类分类任务：在多分类任务中，每个样本只能被分配到一个类别中。换句话说，每个样本只有一个正确的标签。例如，将图像分为不同的物体类别，如猫、狗、汽车等。多标签分类任务：在多标签分类任…

阅读更多...

商家利器！手机智能无人直播实时场景，轻松解决获客难、成本高难题

商家利器！手机智能无人直播实时场景，轻松解决获客难、成本高难题

随着互联网的飞速发展，直播行业正在成为一种新型的商业模式。然而，许多商家在进行直播带货时面临着获客困难和高成本的挑战。为了解决这些问题，本文将介绍一种名为"自动直播"的功能，并详述如何利用手机实现实时场景…

阅读更多...

使用TimeSum教你打造一套最牛的知识笔记管理系统！

使用TimeSum教你打造一套最牛的知识笔记管理系统！

从用户使用场景进行介绍软件的使用： 一、用户需求： 我需要一款软件记录我每天： 干了啥事有啥输出（文档）需要时间统计，后续会复盘记录的内容有好的逻辑关系需要有日历进行展示。二、软件使用介绍&#xf…

阅读更多...

《告别重复：Spring AOP让你的代码花园绽放》

《告别重复：Spring AOP让你的代码花园绽放》

厌倦了在代码花园中重复种植相同的植物（代码）吗？Spring AOP将是你的园艺师，帮助你修剪和优化代码，让花园更加丰富多彩！ 文章目录面向切面编程（AOP）主题文章一. 引言1.1 引入面向切面…

阅读更多...

基于 Kernel PCA 的故障检测与诊断

基于 Kernel PCA 的故障检测与诊断

基于 Kernel PCA 的故障检测与诊断在工业领域，轴承是一种常见但重要的机械元件，负责支撑旋转部件并减少摩擦。然而，由于长时间的使用和环境因素等原因，轴承可能会出现各种故障，如磨损、裂纹等，这些故障如…

阅读更多...

Vue的学习 —— ＜初识vue＞

Vue的学习 —— ＜初识vue＞

目录前言目标前端的发展历程正篇开始——Vue讲解一、Vue简介二、Vue特性 1、数据驱动视图 2、双向数据绑定 3、指令 4、插件三、vue的三大版本前言在这个快速迭代的互联网时代，前端技术的发展日新月异，Vue.js的出现无疑为前端开发领…

阅读更多...

推荐文章

最新文章