深度学习-图像分类篇二：注意力机制

深度学习-图像分类篇二：注意力机制

news2026/2/17 9:01:09

图像处理中的注意力机制

Transformer&Self-Attention

QKV原理

Self-Attention以及Multi-Head Attention

Self-Attention

在这里插入图片描述

不同任务（李宏毅的注意力机制）
- 1.输入n输出n：sequence labeling
- 2.输入n输出1：标签
  -3. 输入n输出m：seq2seq
针对sequence labeling问题可以开一个window把附近的词都考虑到，例如：I saw a saw标记词性，但这样window很大会带来很多参数和overfit，所以引入注意力self-attention
找到与自己相关的每个词的相关性，注意重要的信息
注意整个计算过程是可以并行的
矩阵的角度思考
- qkv的计算，每一个a都要产生对应的qkv，w权重是学出来的
- 计算相似度的本质是向量的内积（点乘）：
总结self-attention
- 找出qkv：使用学习的权重
- 找到相关性的得到weight
- 最后对v做加权和（weighted sum）

Multi-Head Attention

2 head举例
到这里会发现一直没有体现位置信息（a1和a2，与a1和a3的计算没有区别），所以要对位置进行编码
- hand-crafted（人为地）
应用（输入是一个很长的向量）
- nlp的bert
- 图像（图看成向量集vector set）

Transformer

seq2seq处理的问题
模型结构

Encoder

在这里插入图片描述
- self-attention的做法

- transform的做法

Decoder

Autoregressive
- Decode的作用
- Decoder的结构
- Mask self-attention
- 为什么要使用mask：因为输入是一个一个产生的b2产生前没有a3，a4（只能考虑左边）
结束标志
NAT
- 可以并行
链接Encoder和Decoder

train

在这里插入图片描述

技巧
- 复制一部分内容
  
  -Beam Search
训练和测试不一致：训练都是正确的，测试可能有错误的
- 可以给点错误的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/746525.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

渲染流程（下）：HTML、CSS和JavaScript，是如何变成页面的？

渲染流程（下）：HTML、CSS和JavaScript，是如何变成页面的？

在上篇文章中，我们介绍了渲染流水线中的 DOM 生成、样式计算和布局三个阶段，那今天我们接着讲解渲染流水线后面的阶段。这里还是先简单回顾下上节前三个阶段的主要内容：在 HTML 页面内容被提交给渲染引擎之后，渲染引擎首先将 HTML 解析为浏览器可以理解的 DOM；然后根据 …

阅读更多...

JAVA8~17新特性

JAVA8~17新特性

目录一、前言二、JAVA8 Lambda表达式 Stream API 创建方式中间操作终止操作 Optional类三、JAVA9 模块机制 JShell交互式编程接口新增集合工厂方法四、JAVA10 局部变量类型判断五、JAVA11 Lambda表达式补充 String方法的补充全新的HttpClient 使用 …

阅读更多...

前端理解的HTTP缓存（作用、缓存策略、缓存控制机制、应用）

前端理解的HTTP缓存（作用、缓存策略、缓存控制机制、应用）

一、HTTP缓存有什么作用？ 缓存是为了重复使用而被存储的，可以减少浏览器和服务器之间通信的次数、降低网络延迟、加速页面加载、提高用户体验性等。不但能使网页打开速度更快，还能减少服务器的压力。二、浏览器的缓存策略有哪些&#xff1…

阅读更多...

关于SpringBoot、Nginx 请求参数包含 [] 特殊符号返回400状态

关于SpringBoot、Nginx 请求参数包含 [] 特殊符号返回400状态

问题来源： 使用RESTful风格发送带有特殊符号(如：点、大括号等)的请求，当使用Nginx做地址映射时会返回报"HTTP Status 400-Bad Request"的错误，这个时候我们需要对Nginx的映射方式做一下调整。 Nginx调整完发现跳转后又报…

阅读更多...

Day42: 121. 买卖股票的最佳时机，122.买卖股票的最佳时机II

Day42: 121. 买卖股票的最佳时机，122.买卖股票的最佳时机II

目录 121. 买卖股票的最佳时机思路 122.买卖股票的最佳时机II 思路 121. 买卖股票的最佳时机 121. 买卖股票的最佳时机 - 力扣（LeetCode） 思路 1. 确定dp数组及其下标含义 dp[i][0] 表示第i天持有股票所得最多现金 dp[i][1] 表示第i天不持…

阅读更多...

爷孙或者更深组件间传值

爷孙或者更深组件间传值

如图写法即可父： provide() {return {errorMessage: this.refTable,}},子： inject: [errorMessage],

阅读更多...

组合模式：构建树形结构的灵活设计

组合模式：构建树形结构的灵活设计

组合模式是一种结构型设计模式，它允许我们将对象组合成树形结构，以表示“部分-整体”的层次结构。本文将深入探讨组合模式的原理、结构和使用方法，并通过详细的 Java 示例代码来说明。 1. 组合模式的定义组合模式是一种将对象组合成树形结…

阅读更多...

Maven引入Jacoco插件后无法生成jacoco.exec执行文件

Maven引入Jacoco插件后无法生成jacoco.exec执行文件

目录 jacoco.exec网上常见关于未生成jacoco.exec原因最终解决方案不生效原因解决方案完整jacoco插件配置 jacoco.exec 执行数据文件，只有生成该文件，才表示引入插件jacoco成功生效网上常见关于未生成jacoco.exec原因网上找了一下解决方式基本都是…

阅读更多...

windows下使用arp 协议

windows下使用arp 协议

/ //自动扫描局域网存活主机本程序是利用arp协议去获取局域网中的存活主机 arp协议概述地址解析协议，即ARP（Address Resolution Protocol），是根据IP地址获取物理地址的一个TCP/IP协议。主机发送信息时将包含目标IP地址的ARP请…

阅读更多...

「Paraverse平行云」入选IDC MarketScape中国实时云渲染解决方案

「Paraverse平行云」入选IDC MarketScape中国实时云渲染解决方案

近日，全球领先的IT研究与咨询顾问机构IDC发布了《IDC MarketScape：中国实时云渲染解决方案2023年厂商评估》报告。作为在实时云渲染技术领域具有代表性的技术提供商，「Paraverse平行云」成功入选报告。 IDC报告通过综合考量厂商在产品、市场…

阅读更多...

一文搞懂Goroutine之间的通信Channel

一文搞懂Goroutine之间的通信Channel

文章目录 Channel定义通道初始化通道通道的操作1、发送/接收2、关闭多返回值模式for range获取通道值单向通道selectgoroutine、channel案例道阻且长，行则将至，行而不辍，未来可期🌟。人生是一条且漫长且充满荆棘的道路&#xf…

阅读更多...

C++函数cincout的基本用法

C++函数cincout的基本用法

C的输入输出格式可比C语言的简单得多，输入函数是cin()，输出函数是cout。首先是cin的基本用法如下 (假设n 5) #include <iostream> using namespace std; int main() {int n;cin>>n;return 0; } 而它的结果则是 cin不仅可以输入int类型…

阅读更多...

从单目数据生成3D模型，Meta智能眼镜摄像头校正算法揭秘

从单目数据生成3D模型，Meta智能眼镜摄像头校正算法揭秘

众所周知，Meta下一个目标就是AR眼镜，尽管开发AR比VR面临更多复杂的难题，因此可能还要过一段时间才能看到Meta的AR眼镜。目前，该公司已推出了第一代Ray-Ban Stories智能眼镜，特点是搭载的双摄像头不仅可以拍照&#xff…

阅读更多...

Verilog基础之十五、锁存器实现

Verilog基础之十五、锁存器实现

目录一、前言二、工程设计 2.1 工程代码 2.2 综合结果 2.3 Latch实现一、前言在之前的文章中介绍过寄存器，本节介绍一个类似的逻辑单元：锁存器。在大部分的资料和文章介绍中，都是告诉读者设计中应尽量避免出现锁存器，这主…

阅读更多...

从0到1，带你深入了解react fiber

从0到1，带你深入了解react fiber

react16之后，react引入了fiber架构，那么它究竟是什么，如何实现的呢？下面就让笔者带你掰扯掰扯，如有错误，欢迎指正目录渲染过程 react15 react16 为什么要引入fiber 不可中断原因 fiber详解是什么…

阅读更多...

百度墨斗鱼文库创作中心源码分析

百度墨斗鱼文库创作中心源码分析

前言公司解散，待业中，耗时一天研究了一下百度墨斗鱼文库创作中心源码。实现了后台自动完成任务并通知。下面主要分析一下实现思路和难点一，实现思路调用接口查询未回答的题目列表合并多个tab下的题目设置黑白名单，这里…

阅读更多...

你知道为什么不用XFP光模块了吗？

你知道为什么不用XFP光模块了吗？

在光纤通信应用领域中，10G光模块凭借着较低的成本和功耗被广泛应用于学校、企业等应用场景中。XFP和SFP是10G光模块常见的两种封装类型，那为什么现在市场上XFP光模块应用比较少了呢？下面我们来简单分析一下原因。一、XFP与SFP光模块的概述 …

阅读更多...

从小白到大神之路之学习运维第58天--------Firewalld防火墙

从小白到大神之路之学习运维第58天--------Firewalld防火墙

第三阶段基础时间：2023年7月12日参加人：全班人员内容： Firewalld防火墙目录 Firewalld防火墙一、防火墙 1、netfilter和防火墙管理工具 2、防火墙配置模式 3、Firewalld数据流处理的方式 4、firewalld区域类型 1&#x…

阅读更多...

【SVN wc.db 删除不掉的问题】

【SVN wc.db 删除不掉的问题】

SVN wc.db 删除不掉的问题方案1：任务管理器 >性能 >打开资源监视器 > CPU >搜索句柄，关闭相关线程，重试删除。若删除explorer.exe导致资源管理器不显示，在任务管理器新建该任务即可“explorer.exe” 方案2&#xff1…

阅读更多...

2023-07-12：RocketMQ如何做到消息不丢失？

2023-07-12：RocketMQ如何做到消息不丢失？

2023-07-12：RocketMQ如何做到消息不丢失？ 答案2023-07-12： RocketMQ通过刷盘机制、消息拉取机制和ACK机制等多种方式来确保消息投递的可靠性，防止消息丢失。 1.刷盘机制 RocketMQ中的消息分为内存消息和磁盘消息，内…

阅读更多...

推荐文章

最新文章