StableDiffusion学习笔记——4、模型下载和学习

news2025/5/11 5:30:03

目录
  大家好,我是阿赵。
  继续学习StableDiffusion的使用。
  这次来学习一下模型的相关知识

一、 什么是模型

  之前我们了解过,在StableDiffusion里面生成图片或者视频,都需要先选择模型。模型用通俗的话来说,就是决定了生成图片或者视频的内容的大数据集合。使用不同的模型,会让生成的结果产生很大的差异。所以我们在生成内容之前,需要先了解有哪些类型的模型可以用,还有它们分别的作用是什么。

二、 模型的类别

  之前在简单的使用提示词生成模型的时候,曾经用过2种模型:
在这里插入图片描述

在这里插入图片描述

  不过实际上在Stablediffusion里面,还有很多不同类型的模型。

1、 CheckPoint(ckpt)

  ckpt是比较常见的一种模型类型,CheckPoint在游戏里面就是保存点或者存档的意思。CheckPoint模型的含义也同样是这样,它是在训练过程中保存训练的进度。因为训练过程中可能因为各种原因失败,所以训练到一定的程度,就应该保存一下。
  ckpt模型的特点是容量大,包含图片数据多。
使用方法:将其存放到 Stable Diffusion 安装目录下\models\Stable-diffusion 文件夹中

2、 safetensors

  上面介绍了ckpt模型,ckpt模型为了让我们能够从之前训练的状态回复训练,而保存了较多的训练信息,比如模型的权重、优化器和Python代码。这样,会使ckpt模型的容量变得很大,而且有包含恶意代码的风险。
  于是safetensors模型出现了,它只包含模型权重,不包含优化器和代码或者其他信息。所以safetensors 模型容量会更小,而且更安全。
使用方法:将其存放到 Stable Diffusion 安装目录下\models\Stable-diffusion 文件夹中。

3、 Embeddings

  我们可以将 Embeddings 模型简单理解为封装好的提示词文件,通过将特定目标的描述信息整合在 Embeddings 中,后续我们只需一小段代码即可调用,效果要比手动输入要方便快捷上许多。像我们平时头疼的避免错误画手、脸部变形等信息都可以通过调用 Embeddings 模型来解决,比如最出名的 EasyNegative 模型。
使用方法:只需将下载好的模型放置到 Stable Diffusion 安装目录下\embeddings 文件夹中,使用时点击对应的模型卡片,对应的关键词就会被添加到提示词输入框中。

4、 LoRA

  LoRA 是 Low-Rank Adaptation Models 的缩写,意思是低秩适应模型。
  总结成一句话就是固定目标的特征形象,这里的目标既可以是人也可以是物,可固定的特征信息就更加保罗万象了,从动作、年龄、表情、着装,到材质、视角、画风等都能复刻。因此 LoRA 模型在动漫角色还原、画风渲染、场景设计等方面都有广泛应用。
使用方法:将模型保存在\models\Lora 文件夹,在实际使用时,我们只需选中希望使用的 LoRA 模型,在提示词中就会自动加上对应的提示词组。
  需要注意的是,有些 LoRA 模型的作者会在训练时加上一些强化认知的触发词,我们在下载模型时可以在右侧看到 trigger word,建议大家在使用 LoRA 模型时加上这些触发词,可以进一步强化 LoRA 模型的效果。

5、 Hypernetwork

  它的原理是在扩散模型之外新建一个神经网络来调整模型参数,而这个神经网络也被称为超网络。
  因为 Hypernetwork 训练过程中同样没有对原模型进行全面微调,因此模型尺寸通常也在几十到几百 MB 不等。它的实际效果,我们可以将其简单理解为低配版的 LoRA,虽然超网络这名字听起来很厉害,但其实这款模型如今的风评并不出众,在国内已逐渐被 LoRA 所取代。因为它的训练难度很大且应用范围较窄,目前大多用于控制图像画风。所以除非是有特定的画风要求,否则还是建议大家优先选择 LoRA 模型来使用。
使用方法:下载模型放到\models\hypernetworks

6、 VAE

  它的工作原理是将潜空间的图像信息还原为正常图片。作为 ckpt 模型的一部分,VAE 模型并不像前面几种模型用于控制图像内容,而是对主模型的图像修复。
  比较常用的有:Anything4.5或者kl-f8-anime2等
使用方法: VAE 模型的放置位置是在\models\VAE,因为是辅助 Checkpoint 大模型来使用,所以可以将大模型对应的 VAE 修改为同样的名字,然后在选项里勾选自动,这样在切换 Checkpoint 模型时 VAE 就会自动跟随变换了。

三、 模型的获取

  说了这么多模型的作用,那么从哪里得到这些模型呢?
  如果自己有能力,自己训练模型是一个比较好的方法,毕竟想需要什么效果,可以自己去控制。不过我们不一定有能力和时间去训练自己的模型,所以也可以去找一些别人训练好的模型去使用。
比较有名的获取AI生图模型的网站,比如:
Civitai(简称C站),地址:https://civitai.com/
liblibAI(哩布哩布),地址:https://www.liblib.art/
  由于C站是需要科学上网的,所以我一般是上哩布哩布比较多一点。
在这里插入图片描述

  在筛选里面,可以选择很多条件,比如作者、模型的类型、基础底模
在这里插入图片描述

  或者选择一些已有的类别:
在这里插入图片描述

  或者直接搜索
在这里插入图片描述

  比如我想找一个写实的模型,可以直接搜索
在这里插入图片描述

  如果想找二次元的模型:
在这里插入图片描述

  可以注意一下,模型缩略图左上角会有该模型的类型:
在这里插入图片描述

  我们可以比较快速的知道,这个模型是LORA模型还是CheckPoint模型,是否XL的。

四、 学习下载模型的使用和参数

1、 阅读作者的说明

在这里插入图片描述

  一般在下载模型的页面,都会有模型作者的一些说明,比如使用怎样的采样模式,步数等一些参数的建议,或者是否需要VAE模型的说明等。
  想用好该模型,就不能忽略作者的建议。

2、 参考模型例子的参数

  在模型下载的页面,一般会带有几张范例。鼠标悬浮在感叹号图标上,会出现这个图片的参数:
在这里插入图片描述

  一般来说,下载了这个模型并使用,然后把参数设置到和范例一样,就会生成出和范例一模一样的效果。不过也有例外,比如如果生成的图片使用了LoRa模型,而你本地并没有对应的LoRa模型,那么生成出来的效果就会不一样。
  我们可以学习作者的范例,看看提示词和反向提示词怎样设置,采样和其他参数怎样设置,会出来更好的效果。

五、 在StableDiffusion里面显示模型封面

  当我们把一个模型放到StabDiffusion的指定文件夹之后,启动或者刷新WebUI,会看到对应的模型类别里面有新增的模型可以选择:
在这里插入图片描述

  但默认的模型显示是不会有缩略图显示的,这样看起来很不直观。
  如果能在模型选择上显示缩略图,会让我们选择的时候更方便。让WebUI显示缩略图的方法很简单。只需要在放置模型文件的同一个文件夹下,把需要的缩略图放进去,然后把文件名改成和模型文件的文件名一样,只有后缀名不一样。
在这里插入图片描述

  这样重启WebUI之后,就能看到模型的缩略图
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2301502.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微软宣布 Windows 11 将不再免费升级:升级需趁早

大家都知道如果你现在是Windows 10 系统,其实可以免费升级到正版 Windows 11,只要你的电脑配置满足 TPM2.0要求。 而最近微软已经公布了 Windows 10 的最后支持时间,也就是今年10月14日,在这之后微软将不再对Windows 10负责&#…

Java开发实习面试笔试题(含答案)

在广州一家中大公司面试(BOSS标注是1000-9999人,薪资2-3k),招聘上写着Java开发,基本没有标注前端要求,但是到场知道是前后端分离人不分离。开始先让你做笔试(12道问答4道SQL题)&…

解析DrugBank数据库数据|Python

一、DrugBank 数据库简介 DrugBank 是一个综合性的生物信息学和化学信息学数据库,专门收录药物和靶点的详细信息。它由加拿大阿尔伯塔大学的 Wishart 研究组 维护,提供化学、药理学、相互作用、代谢、靶点等多方面的药物数据。DrugBank 结合了实验数据和…

专题 - Java Stream API

概述 分类 数据源 任何位置。 如:集合、数组、文件、随机数、 Stream 静态工厂等。 支持的数据类型 整型、长整型、双精度浮点型基本数据类型。引用数据类型。流管道的数据处理流程 流管道必须要有终止操作。否则永不执行,只是一个静默的无操作指令。流管道是懒运算的。当执…

【前端框架】vue2和vue3的区别详细介绍

Vue 3 作为 Vue 2 的迭代版本,在性能、语法、架构设计等多个维度均有显著的变革与优化。以下详细剖析二者的区别: 响应式系统 Vue 2 实现原理:基于 Object.defineProperty() 方法实现响应式。当一个 Vue 实例创建时,Vue 会遍历…

大模型WebUI:Gradio全解11——使用transformers.agents构建Gradio UI(3)

大模型WebUI:Gradio全解11——使用transformers.agents构建Gradio UI(3) 前言本篇摘要11. 使用transformers.agents构建Gradio UI11.3 创建和使用工具Tools11.3.1 默认工具箱与load_tool11.3.2 创建新工具11.3.3 管理代理的工具箱toolbox11.3…

路由基础 | 路由引入实验 | 不同路由引入方式存在的问题

注:本文为 “路由基础 | 路由表 | 路由引入” 相关文章合辑。 未整理去重。 路由基本概念 1—— 路由表信息、路由进表以及转发流程、最长掩码匹配原则 静下心来敲木鱼已于 2023-11-26 14:06:22 修改 什么是路由 路由就是指导报文转发的路径信息,可以…

网络原理-HTTP/HTTPS

文章目录 HTTPHTTP 是什么?理解“应用层协议”理解 HTTP 协议的⼯作过程HTTP 协议格式抓包⼯具的使用抓包⼯具的原理抓包结果协议格式总结 HTTP 请求(Request)认识 URLURL 的基本格式关于URL encode 认识“⽅法”(method&#xff…

SpringBoot启动失败之application.yml缩进没写好

修改前: spring前面空格了 报错输出:Failed to configure a DataSource: ‘url’ attribute is not specified and no embedded datasource could be configured. Reason: Failed to determine a suitable driver class Action: Consider the follow…

python爬虫系列课程2:如何下载Xpath Helper

python爬虫系列课程2:如何下载Xpath Helper 一、访问极简插件官网二、点击搜索按钮三、输入xpath并点击搜索四、点击推荐下载五、将下载下来的文件解压缩六、打开扩展程序界面七、将xpath.crx文件拖入扩展程序界面一、访问极简插件官网 极简插件官网地址:https://chrome.zzz…

CentOS建立ssh免密连接(含流程剖析)

一、场景举例(为啥需要免密连接) 1.服务集群间文件复制、通信 2.执行定时触发自动化脚本 3.本地连接远程服务器操作 服务器台数有很多,以上举例都是属于服务器之间的通信,如果每次执行上面操作都要输入账号密码岂不是效率太高了,容易被开…

自由学习记录(36)

Linux Linux 是一个开源的操作系统,其内核及大部分组件都遵循自由软件许可证(如 GPL),允许用户查看、修改和分发代码。这种开放性使得开发者和企业可以根据自己的需求定制系统​。 “Linux”严格来说只是指由Linus Torvalds最初开…

【python碎碎笔记】

1.交互模式和编辑器模式 2. 保存文件格式.py (表示python文件) 3.缩进是python的命! 4.内置函数 dir(__builtins__) [ArithmeticError, AssertionError, AttributeError, BaseException, BaseExceptionGroup, BlockingIOError, Broken…

【OS安装与使用】part3-ubuntu安装Nvidia显卡驱动+CUDA 12.4

文章目录 一、待解决问题1.1 问题描述1.2 解决方法 二、方法详述2.1 必要说明2.2 应用步骤2.2.1 更改镜像源2.2.2 安装NVIDIA显卡驱动:nvidia-550(1)查询显卡ID(2)PCI ID Repository查询显卡型号(3&#xf…

python-leetcode 37.翻转二叉树

题目: 给定一颗二叉树的根节点root,翻转这棵二叉树,并返回根节点 方法一:递归 从根节点开始,递归地对树进行遍历,并从叶子节点先开始翻转。如果当前遍历到的节点root的左右两棵子树都已经翻转,那么我们只…

Vue 实现通过URL浏览器本地下载 PDF 和 图片

1、代码实现如下: 根据自己场景判断 PDF 和 图片,下载功能可按下面代码逻辑执行 const downloadFile async (item: any) > {try {let blobUrl: any;// PDF本地下载if (item.format pdf) {const response await fetch(item.url); // URL传递进入i…

android,flutter 混合开发,pigeon通信,传参

文章目录 app效果native和flutter通信的基础知识1. 编解码器 一致性和完整性,安全性,性能优化2. android代码3. dart代码 1. 创建flutter_module2.修改 Android 项目的 settings.gradle,添加 Flutter module3. 在 Android app 的 build.gradl…

unity学习47:寻路和导航,unity2022后版本如何使用 Navmesh 和 bake

目录 1 寻路和导航对移动的不同 1.1 基础的移动功能 1.1.1 基础移动 1.1.2 智能导航寻路 1.1.3 智能导航寻路还可以 2 如何实现这个效果? 2.1 通过地图网格的形式 2.1.1 警告信息 the static value has been deprecated的对应搜索 2.1.2 新的navigation ba…

跟着李沐老师学习深度学习(十二)

循环神经网络 序列模型 序列数据 实际中很多数据是有时序结构的 比如:电影的评价随时间变化而变化 拿奖后评分上升,直到奖项被忘记看了很多好电影后,人们的期望变高季节性:贺岁片、暑期档导演、演员的负面报道导致评分变低 核心思想&#…

深入解析NoSQL数据库:从文档存储到图数据库的全场景实践

title: 深入解析NoSQL数据库:从文档存储到图数据库的全场景实践 date: 2025/2/19 updated: 2025/2/19 author: cmdragon excerpt: 通过电商、社交网络、物联网等12个行业场景,结合MongoDB聚合管道、Redis Stream实时处理、Cassandra SSTable存储引擎、Neo4j路径遍历算法等42…