Dit架构 diffusion范式分类＋应用

Dit架构 diffusion范式分类＋应用

news2026/3/10 9:49:22

1.ping 网址

2.ssh nscc/l20

3.crtl+,打开vscode的setting

4.win 10修改ssh配置文件及其密钥权限为600 - 晴云孤魂 - 博客园

整体来看：

    使用transformer作为其主干网络，代替了原先的UNet
    在latent space进行训练，通过transformer处理潜在的patch
    输入的条件（timestep 和 text/label )的四种处理方法：
        In-context conditioning：将condition和input embedding合并成一个tokens（concat），不增加额外计算量
        Cross-attention block：在transformer中插入cross attention，将condition当作是K、V，input当作是Q
        Adaptive layer norm (adaLN) block：将timestep和 text/label相加，通过MLP去回归参数scale和shift，也不增加计算量。并且在每一次残差相加时，回归一个gate系数。
        adaLN-Zero block：参数初始化为0，那么在训练开始时，残差模块当于identical function。
    整体流程：patchify -> Transfomer Block -> Linear -> Unpatchify。注意最后输出的维度是原来维度的2倍，分别输出noise和方差。

由下图可见，adaLN-Zero最好。然后就是探索各种调参效果，此处略。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2193728.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Leetcode——数组：二分搜索法704.二分查找相似题目

Leetcode——数组：二分搜索法704.二分查找相似题目

知识点： 二分搜索的区间，一般分为左闭右闭或左闭右开 left0 易错点1 while(易错点2) {middle(leftright)/2if(nums[middle]>target){right易错点3}else if(nums[middle]<target){leftmiddle1}else if(nums[middle]target){return target} } retu…

阅读更多...

NRF52832

NRF52832

当我下载完NRF的芯片包后出现了一个缺失pack的问题解决方法： CMSIS缺失警告_error #541: arm::cmsis:core:4.3.0 component is m-CSDN博客引入新的型号的芯片问题总结： 一般引入新的型号的芯片都会涉及到.pack和芯片包的问题外设调用： …

阅读更多...

论文阅读：LLaVA-OneVision: Easy Visual Task Transfer

论文阅读：LLaVA-OneVision: Easy Visual Task Transfer

论文地址：https://arxiv.org/pdf/2408.03326 公开时间：2024年9月14日项目地址：https://llava-vl.github.io/blog/llava-onevision LLaVA-OneVision是一个开放的大型多模态模型（LMMs），它是通过整合在LLaVA…

阅读更多...

【星闪开发连载】SLE_UUID_Server和SLE_UUID_Client程序分析

【星闪开发连载】SLE_UUID_Server和SLE_UUID_Client程序分析

引言星闪测试已经搁置了很久了，主要是8-9月份太忙了。今天重新捡回来。想看看官方提供的星闪例子，在application\samples\bt\sle\sle_uuid_client\和sle_uuid_server目录。这两个例子是一对，一个用来广播服务，另一个去连接。对应…

阅读更多...

Mybatis-plus的基础用法

Mybatis-plus的基础用法

文章目录 1. 核心功能1.1 配置与编写规则1.2 条件构造器1.3 自定义SQL1.4 IService接口1.4.1 Lambda方法1.4.2 批量新增 1.5 分页查询 2. 拓展功能2.1 代码生成器2.2 DB静态工具2.3 逻辑删除2.4 枚举处理器参考 1. 核心功能 1.1 配置与编写规则 Maven依赖： <…

阅读更多...

Autosar EcuM配置-初始化及下电执行函数-基于ETAS软件

Autosar EcuM配置-初始化及下电执行函数-基于ETAS软件

文章目录前言EcuMCommonConfigurationEcuMDriverInitListOneEcuMModuleIDEcuMModuleParameterEcuMModuleServiceEcuMRbDriverInitCoreIdEcuMDriverInitListZeroEcuMGeneralEcuMRbOnGoOffOneCalloutEcuMRbCalloutFunctionEcuMRbModuleIDEcuMRbServiceIsNonAutosarEcuMRbOnGoOff…

阅读更多...

java控制台输出乱码

java控制台输出乱码

第一步：修改 IntelliJ IDEA 全局编码、项目编码、属性文件编码 File->Settings… Editor->File Encodings(不要忘记点击Apply然后OK) 第二步：修改当前 Web 项目 Tomcat Server 的虚拟机输出选项 Run->Edit Configurations… 复制代码->…

阅读更多...

DBMS-3.2 SQL(2)——DML的SELECT（含WHERE、聚集函数、GROUP BY、HAVING之间的关系）

DBMS-3.2 SQL(2)——DML的SELECT（含WHERE、聚集函数、GROUP BY、HAVING之间的关系）

本文章的素材与知识来自李国良老师和王珊老师。数据操纵语言DML（Data Manipulation Language） SELECT 一.SELECT的语法与构成 1.语法 2.构成二.投影投影操作可以选择表中的若干列，主要体现在SELECT子句后的列表达式。 1.列表达式 2.…

阅读更多...

【书生浦语实战】茴香豆企业级知识库问答工具-搭建Dify问答助手

【书生浦语实战】茴香豆企业级知识库问答工具-搭建Dify问答助手

快速结论 1、用茴香豆快速搭建Dify问答助手，自带拒答、rerank、切片长度判断、阈值调节功能，回答还能带出图片，顶呱呱👍 2、茴香豆git仓地址：https://github.com/internlm/huixiangdou 遇到问题去翻这里会更多解释&…

阅读更多...

如何利用免费音频剪辑软件制作出精彩音频

如何利用免费音频剪辑软件制作出精彩音频

现在有许多免费的音频剪辑软件可供选择，它们为广大用户提供了丰富的功能和便捷的操作体验，让音频编辑变得更加轻松和有趣。接下来，让我们一起走进这些免费音频剪辑软件的世界，探索它们的独特魅力和强大功能。 1.福昕音频剪辑链…

阅读更多...

李宏毅深度学习-图神经网络GNN

李宏毅深度学习-图神经网络GNN

图卷积的开源代码网站DGL 好用的还是 GAT, GIN（指出最好的卷积就是 hi 邻居特征（而且只能用 sum）） Introduction GNN 可以理解为是由 Graph（图) Nerual Networks 组合而成的，图结构应该都在数据结构与…

阅读更多...

No.12 笔记 | 网络基础：ARP DNS TCP/IP与OSI模型

No.12 笔记 | 网络基础：ARP DNS TCP/IP与OSI模型

一、计算机网络：安全的基石 1. 网络的本质：数字世界的神经系统定义：计算机的互联互通，实现资源共享和信息交换组成要素：发送者、接收者、介质、数据、协议（五大要素） 2. 网络架构&#xff1…

阅读更多...

STM32PWM应用

STM32PWM应用

一、输出比较(OC) OC（Output Compare）输出比较可以通过比较CNT与CCR寄存器值的关系，来对输出电平进行置1、置0或翻转的操作，用于输出一定频率和占空比的PWM波形每个高级定时器和通用定时器都拥有4个输出比较通道高级定时器的前…

阅读更多...

三菱FX3U定位控制接线示例（脉冲控制伺服）

三菱FX3U定位控制接线示例（脉冲控制伺服）

一、FX3u系列基本单元(DC24V输入) 二、FX3u系列基本单元(晶体管输出) 脉冲输出用端子Y000、 Y001、 Y002为高速响应输出。三、FX3UPLC链接MR-J4-A伺服连接实例 1、为了安全起见，不仅仅在可编程控制器侧，在伺服放大器侧也请设计正转限位和反转限位的限位…

阅读更多...

查缺补漏----拥塞窗口

查缺补漏----拥塞窗口

注意事项1： 首先区分超时和收到3个冗余ACK，显然超时更加严重。如下图所示： 如果网络出现超时，那么发送窗口cwnd变为1，门限值ssthresh变为原来拥塞窗口的一半如果收到3个冗余ACK，发送窗口cwnd门限值ssth…

阅读更多...

Java重修笔记第六十一天坦克大战（十一）IO 流 - 节点流和处理流、BufferedReader 和 BufferedWriter

Java重修笔记第六十一天坦克大战（十一）IO 流 - 节点流和处理流、BufferedReader 和 BufferedWriter

节点流和处理流的区别和联系 1. 节点流是底层流/低级流，直接和数据源联系 2. 处理流是经过包装过后的节点流，也叫包装流，既可以消除不同节点流的实现差异，也可以提供更方便的方法来完成输入输出 3. 处理流（包装流&…

阅读更多...

二叉树基本概念讲解

二叉树基本概念讲解

一.树的概念 1.概念树是⼀种非线性的数据结构，它是由 n（n>0）个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像⼀棵倒挂的树，也就是说它是根朝上，而叶朝下的。有⼀个特殊的结点&#xff0c…

阅读更多...

动态规划基础一＞面试题 08.01. 三步问题

动态规划基础一＞面试题 08.01. 三步问题

1.题目： 2.解析： 代码： public int waysToStep(int n) {/**1.创建dp表2.初始化3.填表4.返回值*/int MOD (int)1e9 7;//注意不能超出int范围，每做一次操作要取模//处理边界情况if(n 1 || n 2) return n;if(n 3) return 4;//1…

阅读更多...

【小沐学CAD】ParaView Web的学习笔记（Python）

【小沐学CAD】ParaView Web的学习笔记（Python）

文章目录 1、简介1.1 visualizer1.2 Divvy1.3 Lite1.4 LightViz1.5 ArcticViewer1.6 HPCCloud1.7 glance1.8 trame 结语 1、简介 https://pvw.kitware.com/ VTK/ParaView Web，用于 Web 数据处理和可视化的框架 ParaViewWeb 是一个 Web 框架，用于在 Web …

阅读更多...

[C++][第三方库][ODB]详细讲解

[C++][第三方库][ODB]详细讲解

目录 1.介绍2.安装1.安装 build22.安装 odb-compiler3.安装 ODB 运行时库4.安装MySQL和客户端开发包5.安装 boost profile 库6.总体操作7.测试样例 3.ODB 常见操作1.ODB 类型映射2.ODB 编程1.指令2.示例 4.类与接口5.使用 1.介绍 ODB框架：数据库ORM框架 --> 对象…

阅读更多...

推荐文章

最新文章