diffusion model (扩散模型）原理

diffusion model (扩散模型）原理

news2026/2/21 5:09:22

扩散模型分为正向过程和反向过程。
正向过程为一点点在图片上添加噪声的过程，反向过程为去噪声的过程。

图片的生成就是反向过程，给一张高斯噪声图片，逐步去噪生成图片。
在这里插入图片描述

扩散模型和VAE的区别，
VAE是一步到位的（通过encoder-decoder），扩散模型要分成N个step, 是一个自回归过程。

在这里插入图片描述

扩散模型的训练过程

重复1到5行的过程，直到收敛。
每次采样一张图片 $x_{0}$ ，t, 和高斯噪声图像 $\epsilon$ 。
$\bar{\alpha _{t} }$ 是事先定义好的数字，你可以定义它随时间线性变小，也可以是cosine分布。在你采样 t 的时候，t 也同时对应了一个 $\bar{\alpha _{t} }$ 。
$\epsilon$ 是高斯噪声图片，那么在这里插入图片描述就表示在图片上添加噪声。
$\epsilon_{\theta}$ 可以理解为一个noise predictor, 它可以是一个网络， $in p u t$ 是加了噪声的图片和 t , 输出是一个噪声图片 $\epsilon_{\theta}(input)$ ,
根据采样的噪声 $\epsilon$ 和预测的噪声图片 $\epsilon_{\theta}(input)$ 的误差来训练这个noise predictor,
使它能够输出尽可能接进 $\epsilon$ 的噪声。

在这里插入图片描述

上面的过程也说明了一个问题，
当你采样了 t, 是可以直接计算 t 时刻的加了噪声的图片的，在这里插入图片描述
请添加图片描述

而不是想像中的这个样子：
请添加图片描述

推理过程

前面提到了扩散模型有正向和反向过程，
在正向过程中，图片是 $x_{0}$ , 逐步加噪声，到T时刻的 $x_{T}$ 是一个噪声图片。

推理过程是反向过程，根据高斯噪声的 $x_{T}$ 的得到图片 $x_{0}$ .

$\epsilon_{\theta}$ 是前面训练过程中训练的noise predictor, 它的input为加了噪声的图片 $x_{t}$ 和 t.
$z$ 也是一个采样的噪声图片。
请添加图片描述
上面的过程是这样的：
采样N次，直到得到清晰的 $x_{0}$

在这里插入图片描述

公式推导部分待更新。

参考资料

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1494440.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

中文版国产Figma简单好上手

中文版国产Figma简单好上手

在过去的两年里，国内外协同办公室发展迅速。一方面，它是由突如其来的疫情推动的，另一方面，它是科学技术不断进步的必然结果。在市场的推动下，市场上出现了越来越多的协同办公软件，使工作场所的工作更加高效…

阅读更多...

Java开发避坑指南，手把手教你写Java项目文档

Java开发避坑指南，手把手教你写Java项目文档

前言作为一个有丰富经验的微服务系统架构师，经常有人问我，“应该选择RabbitMQ还是Kafka？” 基于某些原因， 许多开发者会把这两种技术当做等价的来看待。的确，在一些案例场景下选择RabbitMQ还是Kafka没什么差别&…

阅读更多...

2.Rust变量

2.Rust变量

变量的声明 let关键字在Rust中变量必须要先声明才能使用，let关键字用于声明变量并将一个值绑定到该变量上。如下: fn main() {let var_name:i32 123123;println!("{}",var_name) //println! 是一个宏（macros），可以…

阅读更多...

遇见未来的你——陪伴是最长情的告白

遇见未来的你——陪伴是最长情的告白

目录一、背景介绍二、思路&方案三、过程1.家庭中彼此的陪伴最长情2.事业中与合伙人与同事与朋友与产品的陪伴最长情3.人生中与计划与落实与啊哈的陪伴最长情4.肉体与灵魂分分合合的体验四、总结一、背景介绍人有时候一转身就是一辈子，所以珍惜转身的每一个…

阅读更多...

如何计算搭建光伏电站需要多少成本？

如何计算搭建光伏电站需要多少成本？

光伏电站，又称太阳能电站，是一种利用太阳能发电的电力系统。随着全球对可再生能源的需求日益增加，光伏电站的建设变得越来越普遍。然而，在投资光伏电站之前，了解其建设成本是非常重要的。本文将介绍如何计算搭建光伏电…

阅读更多...

96、C++ 性能优化一览

96、C++ 性能优化一览

在对 C++ 版本的 resnet50 经过大约 5 个版本的优化之后，性能也基本达到了预期。至少利用手写的 resnet50 在 CPU 上推理一张图片感觉不到卡顿了。下面对这几个版本的性能优化做一个总结。初始版本1 第一版本的 C++ 代码，并没有考虑性能问题，仅仅是想按照手写 resnet50 …

阅读更多...

【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

【学习】torch.nn.CrossEntropyLoss交叉熵损失函数

交叉熵损失函数torch.nn.CrossEntropyLoss 交叉熵主要是用来判定实际的输出与期望的输出的接近程度，为什么这么说呢，举个例子： 在做分类的训练的时候，如果一个样本属于第K类，那么这个类别所对应的输出节点的输出值应…

阅读更多...

腾讯云服务器99元一年是真的吗？只要61元！

腾讯云服务器99元一年是真的吗？只要61元！

腾讯云服务器99元一年是真的吗？假的，不要99，只要61元！又降价了！腾讯云服务器多少钱一年？61元一年起，2核2G3M配置，腾讯云2核4G5M轻量应用服务器165元一年、756元3年，4核16…

阅读更多...

腾讯云服务器99元一年是真的吗？又降价，现在只要61元

腾讯云服务器99元一年是真的吗？又降价，现在只要61元

腾讯云服务器99元一年是真的吗？又降价，现在只要61元。腾讯云服务器多少钱一年？61元一年起，2核2G3M配置，腾讯云2核4G5M轻量应用服务器165元一年、756元3年，4核16G12M服务器32元1个月、312元一年，…

阅读更多...

【好书推荐-第九期】Sora核心技术相关书籍《扩散模型：从原理到实战》与《GPT 图解：大模型是怎样构建的》：Sora的两大核心技术，都藏在这两本书里！

【好书推荐-第九期】Sora核心技术相关书籍《扩散模型：从原理到实战》与《GPT 图解：大模型是怎样构建的》：Sora的两大核心技术，都藏在这两本书里！

😎 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公众号：洲与AI。 🎈 本文专栏：本文收录…

阅读更多...

底层day1作业

底层day1作业

思维导图： 一.总结keil5下载代码和编译代码需要注意的事项当使用Keil5下载代码和编译代码时，有一些需要注意的事项。以下是总结： 1. 确保正确配置目标 2. 配置编译器选项。 3. 确保正确配置连接器脚本 4. 检查编译错误和警告。 5. …

阅读更多...

生成式模型实战—小小案例（python）

生成式模型实战—小小案例（python）

实战之前，环境需要已经搭建好。如果环境没有搭建好，可以参考PyTorch2.0 环境搭建详细步骤(Nvidia显卡)-CSDN博客接下来，我们今天的学习之旅~ Step1. 安装类库 transformers pip install transformers Step2. 代码敬上 from transformer…

阅读更多...

使用VS Code运行Java SpringBoot项目

使用VS Code运行Java SpringBoot项目

本文并不详细讲 Java 项目启动前需要哪些配置，本文主要受众是平时用惯了 Idea 的 Java 程序员，仅讲解如何用 VS Code 启动服务前提条件 Jdk、Maven、Nacos、Seata、TDengine等该配置的配置，该启动的启动，就你平时用 Idea 启动项…

阅读更多...

力扣hot---岛屿数量

力扣hot---岛屿数量

思路dfs： 首先通过两层for循环遍历每一个点，如果这个点为0或者2（这个2是什么呢？是在遍历该点以及该点连成的这一片区域中，因为通过深度优先搜索，遍历该点就等于遍历这一片区域，遍历这篇区域中的…

阅读更多...

Qt 类的前置声明和头文件包含

Qt 类的前置声明和头文件包含

1. 在头文件中引入另一个类经常有两种写法 1）前置声明 2）头文件包含 #ifndef FRMCOUPLE2_H #define FRMCOUPLE2_H#include <QWidget> //头文件包含namespace Ui { class frmcouple2; }//前置声明：QPushButton frmchkeyboard…

阅读更多...

java网络编程 01 IP，端口，域名，TCP/UDP, InetAddress

java网络编程 01 IP，端口，域名，TCP/UDP, InetAddress

01.IP 要想让网络中的计算机能够互相通信，必须为计算机指定一个标识号，通过这个标识号来指定要接受数据的计算机和识别发送的计算机，而IP地址就是这个标识号，也就是设备的标识。 ip地址组成： ip地址分类：…

阅读更多...

基础小白快速入门web前端开发技术------＞web概述

基础小白快速入门web前端开发技术------＞web概述

Web概述我们在编程的学习中，随着学习的深入，我们会理解到WEB这个东西，那么 web究竟是个啥，到底该咋用？ web，是网站的英文意思，又被称作“下一代Web3.0，互联网”，是在We…

阅读更多...

2024.3.6

2024.3.6

利用c语言通过sqlite3实现数据库增删改查： #include<myhead.h> int do_add(sqlite3 * ppDb) {char sql_insert[128]"insert into worker values ";char info[500]"";printf("请输入要添加的员工信息：\n");scanf(&…

阅读更多...

Android开发揭秘，我了解到的面试的一些小内幕

Android开发揭秘，我了解到的面试的一些小内幕

前言尤其是在最近一段时间内，感觉一天天的时间过得又慢又快，慢的是感觉复工了以后在公司的8.9个小时简直算是煎熬了，快的是常常感觉时间一天天，一月月的过去了，可是发现自己还在原路踏步走。看似每天忙成狗&#xff…

阅读更多...

大学四年我从非科班到互联网大厂之路

大学四年我从非科班到互联网大厂之路

文章目录一、两度高考、依然选错？二、初来乍到、陷入囹圄三、破局重生、从头再来四、找实习的坎坷之路五、提前结束实习，开始秋招六、秋招一路凯歌七、写在最后：人生是一场长久的旅途很久没来CSDN上写过文章了，上一次写已经是20…

阅读更多...

推荐文章

最新文章