Rethink LSTMGRU

Rethink LSTMGRU

news2026/2/6 6:22:16

LSTM 设计思想

在这里插入图片描述
姑且不看偏置。 $W$ 和 $U$ 是加权的矩阵，写模型的时候用 nn.Linear(in_dim, out_dim) 就成； $\sigma$ 是 Sigmoid 函数

第一条，遗忘门，定义为有多少内容需要被遗忘；
第二条：输入门，定义为有多少输入值有多少能进入到 RNN 模型里；
第三条：输出门，定义为有多少内容能够成为输出值

这三个 0 到 1 的值，是聚合当前的输入特征 $x_t$ 和上一时刻的隐藏状态 $h_{t-1}$ 所计算得到的。它们表示的意思是，聚合当前的输入信息以及记忆信息（之前的信息），来决定模型不同的位置有多少比例保留下来。

第四条：表示 “当前信息”，使用 tanh 映射到 -1到 1之间；
第五条：表示 “当前的记忆信息”，根据上一时刻的信息有多少被遗忘以及当前输入有多少能进入所聚合得到；
第六条：表示 隐藏状态，由当前的记忆信息的一定比例计算得到

从这六条式子中，一定要知道，LSTM 接收 3 个输入值分别为 $x_t$ 、 $h_{t-1}$ 和 $c_{t-1}$
根据 LSTM 由三个输入，可以设计一个 Gate Fusion Module，输入三个 Tensor 聚合得到一个 Tensor，用 tensor. Repeat(x,y,z) 来对其维度。这样做可以简单聚合不同模态的信息

GRU

在这里插入图片描述
理解起来和前者的叙述类似

最终要的地方是，可以作为 Gate Fusion，所设计的 Gate Fusion 以两个 tensor 作为输入，就用 GRU 这一套计算公式，如果以三个 tensor 作为输入，就用 LSTM 这一套公式，剩下的对齐维度跑通 forward 函数就行

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/997056.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ES8生产实践——pod日志采集（Fluentd方案）

ES8生产实践——pod日志采集（Fluentd方案）

Fluentd介绍 Fluentd是一个是一个开源的日志收集和传输工具，旨在解决日志数据的收集、传输和处理问题，它可以收集来自于各种系统或应用的日志，转化为用户指定的格式后，转发到用户所指定的日志存储系统之中。用图来说明问题的话&…

阅读更多...

【安装mysql（基础安装+主从复制）】

【安装mysql（基础安装+主从复制）】

由于我的 centos 版本是 aarch64 版本安装链接： 1、aarch64 版本 linux 系统安装 mysql 2、安装完成之后是不能用 navicat 进行直接访问的，需要如下设置： mysql -uroot -proot（明文登陆，记得 -uroot 和 -proot之间…

阅读更多...

Redis 基础总结

Redis 基础总结

1、NoSQL概述 1.1 数据库分类目前数据库分：关系型数据库与非关系型数据库常用的关系型数据库： Oracle，MySQL，SqlServer，DB2 常用的非关系数据库：Redis，MongoDB，ElasticSearch&…

阅读更多...

MIT 6.S081学习笔记（第一章）

MIT 6.S081学习笔记（第一章）

〇、前言本章主要是关于实验环境的搭建和完成 LAB UTIL。平台：阿里云 Ubuntu20.04VScode on macOS（M1 Apple Silicon）。一、环境搭建 1、QEMU QEMU（quick emulator）是一款由法布里斯贝拉（Fabrice Bel…

阅读更多...

C++中多态的底层实现

C++中多态的底层实现

1.先来看一波比较容易出错的题会打印出来什么？ 其实打印出来的是B->1;为什么呢？看我如何讲解的。 2.思考为什么只有引用或则指针才能触发多态结论：子类赋值给父类对象切片，不会拷贝虚标我听老师上面的解释是：如…

阅读更多...

敏捷工具敏捷项目管理实践管理

敏捷工具敏捷项目管理实践管理

Scrum是目前运用最为广泛的敏捷开发方法，是一个轻量级的项目管理和产品研发管理框架，旨在最短时间内交付最大价值。 Leangoo领歌是一款永久免费的专业敏捷研发管理工具，提供敏捷研发解决方案，解决研发痛点，打造成功…

阅读更多...

STM32低功耗分析

STM32低功耗分析

1.ARM发布最新内核 2023 年5 月 29 日，Arm 公司今天发布了处理器核心：Cortex-X4、Cortex-A720 和Cortex-A520。这些核心都是基于 Arm v9.2 架构，只支持 64 位指令集，不再兼容 32 位应用。Arm 公司表示，这些核心在性能…

阅读更多...

性能监控-grafana+prometheus+node_exporter

性能监控-grafana+prometheus+node_exporter

Prometheus是一个开源的系统监控和报警工具。它由SoundCloud开发并于2012年发布，后来成为了一个独立的开源项目，并得到了广泛的应用和支持。 Prometheus的主要功能包括采集和存储各种系统和应用程序的监控数据，并提供强大的查询语言PromQL来…

阅读更多...

Python 之使用Numpy库来加载Numpy（.npy）文件并检查其内容

Python 之使用Numpy库来加载Numpy（.npy）文件并检查其内容

文章目录总的介绍data.dtypedata.shapedata.ndimdata.size 总的介绍要判断一个Numpy（.npy）文件的数据集类型，你可以使用Python中的Numpy库来加载该文件并检查其内容。以下是一些常见的步骤： 导入Numpy库： 首先&…

阅读更多...

【关于存储故障的维修心得】

【关于存储故障的维修心得】

工具分享：傲梅分区助手和 DiskGenius https://www.diskgenius.cn/ https://www.disktool.cn/download.html 傲梅 1，想要不改变文件的情况下，改变某些盘的大小，如C盘，Win11有概率磁盘管理工具不能压缩卷扩展卷。…

阅读更多...

Idea中如何在一个项目中引入其他子模块？

Idea中如何在一个项目中引入其他子模块？

首先在Settings打开Project Structure，然后找到Modules，点击加号点击import module，将需要引进的module引进来。然后点击Artifacts 可以看到比如说day22…这个是我现在的项目，day16是我需要引入的。那么就在红色横线上面右键点第…

阅读更多...

第六章图五、图的深度优先遍历（DFS算法）

第六章图五、图的深度优先遍历（DFS算法）

目录一、定义深度优先遍历通常用于解决以下问题： 深度优先遍历算法具有以下优点： 深度优先遍历算法的一个缺点是： 二、代码空间复杂度： 时间复杂度： 邻接矩阵存储： 邻接表存储： 三、…

阅读更多...

[Qt]基础数据类型和信号槽

[Qt]基础数据类型和信号槽

文章目录 1. Qt基本结构1.1 Qt本有项目1.1.1 项目文件（.pro）1.1.2 main.cpp1.1.3 mainwindow.ui1.1.4 mainwindow.h1.1.5 mainwindow.cpp 1.2 Qt中的窗口类1.2.1基础窗口类1.2.2 窗口的显示 1.3 内存回收 2. Qt中的基础数据类型2.1 基础类型2.2 log输出2…

阅读更多...

用postman 推送消息到GCP的pubsub

用postman 推送消息到GCP的pubsub

创建1个Topic 和 2个 subscription 我们可以用terraform 去创建1个topic 和 2个subscriptions # topic resource "google_pubsub_topic" "topic_a" {name "TopicA"project var.project_id }# subscriptions resource "google_pubsub_s…

阅读更多...

C++环境配置（MinGW下载）

C++环境配置（MinGW下载）

天行健，君子以自强不息；地势坤，君子以厚德载物。每个人都有惰性，但不断学习是好好生活的根本，共勉！ 文章均为学习整理笔记，分享记录为主，如有错误请指正，共同学习进步。…

阅读更多...

Tomcat配置域名和端口

Tomcat配置域名和端口

Tomcat配置域名和端口 1.进入tomcat文件夹2. cd 到你的tomcat下3. 修改server.xml文件中监听端口4. 重启tomcat 1.进入tomcat文件夹 2. cd 到你的tomcat下 3. 修改server.xml文件中监听端口继续修改server.xml中Host 4. 重启tomcat 进入bin ./shutdown.sh ./startup.sh …

阅读更多...

Hilbert-Schmidt Operator

Hilbert-Schmidt Operator

Hilbert-Schmidt Operator See https://mathworld.wolfram.com/Hilbert-SchmidtOperator.html See https://people.kth.se/~laptev/FA08/l8.pdf

阅读更多...

Spring Boot集成JasperReport生成文档

Spring Boot集成JasperReport生成文档

由于工作需要，要实现后端根据模板动态填充数据生成PDF文档，通过技术选型，使用Ireport5.6来设计模板，结合JasperReports5.6工具库来调用渲染生成PDF文档。一、使用Ireport designer 5.6设计模板 ireport的使用由于时间关系不便多…

阅读更多...

php-fpm未授权访问漏洞

php-fpm未授权访问漏洞

目录一、产生原因二、利用条件三、过程原理四、复现过程一、产生原因 php-fpm配置不当，fastcgi_pass这里配置了0.0.0.0，将fastcgi接口暴露在公网，任何人都可以利用接口对php-fpm发送fastcgi协议数据，更改php.ini配置文件…

阅读更多...

Vue3-devtools开发者工具安装方法

Vue3-devtools开发者工具安装方法

因为最近在学习Vue3，但是之前找到的Vue3-Devtools失效了，那就来下载安装下下载安装 Github下载地址：Vue3-Devtools 这个链接快点:Vue3-Devtools 点击链接后页面如下点击main选项，下拉列表往下拉，找到你想要的版…

阅读更多...

推荐文章

最新文章