【AI绘图】三、stable diffussion操作界面介绍以及如何使用

news2025/5/24 2:20:11

上一篇:【AI绘图】二、stable diffusion环境准备与安装

stable diffusion操作界面介绍

在这里插入图片描述
操作界面总共分为5大块
1.模型选择区;点击跳转
2.功能区域;点击跳转
3.提示词输入;点击跳转
4.参数设置区;点击跳转
5.出图区点击跳转

1.模型选择区域介绍


在这里插入图片描述

模型选择区域分为三块

stable diffusion模型:经过训练的图片合集,被称作模型,也就是chekpoint,体积较大,一般的单个模型的大小在5GB左右,早期的CKPT后缀名是ckpt,如今新的CKPT后缀名都是safetensors

VAE模块:SD VAE是variable autoencoder的意思,在这里可以选择载入vae组分。使用vae组分可以让图片的色彩变得更好。一般大模型会自带vae,有些则需要自己配置

Clip跳过层:一般默认就好了。原理:prompt最终在模型中使用时,是分层的,对于stable diffusion模型来说,分成了12层。clip skip就是说,我不需要完整的使用这12层,而是跳过其中一些层。跳过的层越多,对细节的控制就越少。下面图可以看出跳过层的参数对图片的影响
在这里插入图片描述

比如上面的图中,我们的描述词是face,那么face会有一些细节:眼睛、鼻子、嘴巴的具体形状应该怎么样,肤色应该怎么样等等。我们对比高的clip
skip和低的clip skip,可以发现在clip skip较低时,基本都可以看到脸上的细节,而clip
skip较高时,就比较随机,经常出现类似没有眼珠的这种情况,这是因为没有对细节进行控制,所以细节的随机性会更大。

常用模型介绍:

在这里插入图片描述

获取渠道:
1)civitai:俗称C站:
https://civitai.com/models/26580/xsarchitectural-19houseplan

2)huggingface:著名的开源网站,提供模型,但是没有效果图
https://huggingface.co/

3)哩卟哩卟AI:国内的模型网站:
https://www.liblibai.com/#/index/model

2.功能区域介绍


在这里插入图片描述
在这里插入图片描述
后续教程会对以上功能一一介绍,敬请期待

3.提示语区域


在这里插入图片描述
此区域分为两个部分
正向提示:想要图片的信息,比如一只猫
负面提示:不想要的信息,比如 画质低

分享一个网站:咒语生成器

https://www.wujieai.com/tag-generator

人物通用负面提示: low quality,normal quality, worst quality,bad anatomy, extra
breasts,extra nipples,extra hands,bad legs, bad feet,extra feet, bad
fingers,confused fingers, extra fingers,breasts out,

4.参数设置区


在这里插入图片描述

1)迭代步数:

  • 此参数控制这些去噪步骤的数量。通常越高越好,但在一定程度上,我们使用的默认值是 25 个步骤。以下是不同情况下使用哪个步骤编号的指南
    • 如果您正在测试新的提示,并希望获得快速结果来调整您的输入,请使用 10-15 个步骤
    • 当您找到您喜欢的提示时,请将步骤增加到 25
    • 如果是有毛皮的动物或有纹理的主题,生成的图像缺少一些细节,尝试将其提高到 40

2)采样方法:
建议根据自己使用的 checkpoint 使用脚本跑网格图(用自己关心的参数)然后选择自己想要的结果。

  • 懒得对比:请使用 DPM++ 2M 或 DPM++ 2M Karras(二次元图)或 UniPC,想要点惊喜和变化,Euler a、DPM++ SDE、DPM++ SDE Karras(写实图)、DPM2 a Karras(注意调整对应 eta 值)
  • eta 和 sigma 都是多样性相关的,但是它们的多样性来自步数的变化,追求更大多样性的话应该关注 seed 的变化,这两项参数应该是在图片框架被选定后,再在此基础上做微调时使用的参数。

在这里插入图片描述
3)面部修复

  • 修复人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏。

4)平铺:

  • 生成一张可以平铺的图像

5)高分辨率修复:

  • 使用两个步骤的过程进行生成,以较小的分辨率创建图像,然后在不改变构图的情况下改进其中的细节。

6)长宽尺寸:主要用于生成图片的尺寸

  • 长宽尺寸并非数值越大越好,最佳的范围应在 512 至 768 像素之间,比如正方形图多是 512*512768*768
    • 人像肖像 512x768
    • 风景画 768×512,可按比例加大或减小
  • 这个值必须是 8 的倍数。如果不希望主题对象出现重复,应在此范围内选择适当的尺寸。

7)生成批次:每次生成图像的组数。

  • 一次运行生成图像的数量为生成批次 * 每批数量。

8)每批数量:同时生成多少个图像。

  • 增加这个值可以提高性能,但你也需要更多的 VRAM。图像总数是这个值乘以批次数。除 4090 等高级显卡以外通常保持为 1。

9)提示词相关性 CFG:较高的数值将提高生成结果与提示的匹配度。

  • OpenArt 上使用的默认 CFG 是 7,这在创造力和生成你想要的东西之间提供了最佳平衡。通常不建议低于 5。

  • CFG 量表可以分为不同的范围,每个范围都适合不同的提示类型和目标

  • CFG 2 – 6:有创意,但可能太扭曲,没有遵循提示。对于简短的提示来说,可以很有趣和有用

  • CFG 710:推荐用于大多数提示。创造力和引导一代之间的良好平衡

  • CFG 10-15:当您确定提示是详细且非常清晰的,您希望图像是什么样子时

  • CFG 16-20:除非提示非常详细,否则通常不推荐。可能影响一致性和质量

  • CFG >20:几乎无法使用

10)随机种子(Seed):生成每张图片时的随机种子,这个种子是用来作为确定扩散初始状态的基础。如果选用某个固定的种子序号,则会在当前基础上进行修改

5.出图区


在这里插入图片描述
1)保存:可以将生成的图片提供下载链接
2)打包下载:多张图一起下载
3)发送到图生图:将当前生成的图片,发送到图生图进行修改
4)发送到重绘:发送到蒙版重绘
5)发送到后期处理

后续会对每个模块进行单独更加细致的教学,现在我们生成一张图试试

正向提示词:((masterpiece, best quality)), 8k, modern architecture style, photo realistic, david chipperfield, urban design,hyper detailed photo,single,early morning,outdoors, building, green plants,<lora:urbanaerial15_1:1>

负面提示词:signature, soft, blurry, drawing, sketch, poor quality, ugly, text, type, word, logo, pixelated, low resolution, saturated, high contrast, oversharpened,Fuzzy structure
使用的模型:realisticVisionV13_v13
lora:urbanaerial15_1.safetensors
使用功能:图生图

原图:
在这里插入图片描述
生成的图:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608452.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机基础--->操作系统(1)

文章目录 简单说说操作系统操作系统的主要功能用户态和内核态为什么要有用户态和内核态&#xff1f;只有一个内核态不行吗&#xff1f;用户态和内核态是如何切换的系统调用系统调用过程 简单说说操作系统 操作系统是一种系统软件&#xff0c;它管理计算机硬件资源和提供服务给应…

Jenkins+Docker+SpringCloud微服务持续集成之集群部署

一、集群部署流程说明 环境配置 #环境配置 hostnamectl set-hostname web2-server && su systemctl stop firewalld systemctl disable firewalldvim /etc/selinux/config SELINUXdisabledvim /etc/resolv.conf nameserver 114.114.114.114#安装依赖包 yum install -y…

如何通过python写接口自动化脚本对一个需要调用第三方支付的报名流程进行测试?

对于需要调用第三方支付的报名流程进行接口自动化测试&#xff0c;可以通过以下步骤来编写Python代码&#xff1a; 如果你想学习自动化测试&#xff0c;我这边给你推荐一套视频&#xff0c;这个视频可以说是B站百万播放全网第一的自动化测试教程&#xff0c;同时在线人数到达1…

微信小程序开发实战 ②③(全局数据共享)

作者 : SYFStrive 博客首页 : HomePage &#x1f4dc;&#xff1a; 微信小程序 &#x1f4cc;&#xff1a;个人社区&#xff08;欢迎大佬们加入&#xff09; &#x1f449;&#xff1a;社区链接&#x1f517; &#x1f4cc;&#xff1a;觉得文章不错可以点点关注 &#x1f4…

Nginx:Nginx网站服务(一)

Nginx&#xff1a;Nginx网站服务 一、编译安装Nginx服务1.1 关闭防火墙&#xff0c;将安装nginx所需软件包传到/opt目录下1.2 安装依赖包1.3 创建运行用户、组&#xff08;Nginx 服务程序默认以 nobody 身份运行&#xff0c;建议为其创建专门的用户账号&#xff0c;以便更准确地…

【全面突击数据结构与算法001】绪论篇,数据结构的基本概念

&#x1f341;前言 &#x1f451;作者主页&#xff1a;&#x1f449;CSDN丨博客园 &#x1f3c6;学习交流&#xff1a;&#x1f449;在下周周ovoの社区 &#x1f48e;全面突击数据结构与算法系列专栏&#xff1a;&#x1f449;数据结构与算法专栏 PS&#xff1a;本篇文章主要综…

【架构基础】简单设计原则

简单设计来源于极限编程&#xff08;ExtremeProgramming&#xff0c;简称XP&#xff09;。XP是由KentBeck在1996年提出的&#xff0c;是一种软件工程方法学&#xff0c;是敏捷软件开发中最富有成效的几种方法学之一。XP存在四个核心实践&#xff1a;TDD&#xff08;Test-Driven…

Lecture 6 Sequence Tagging: Hidden Markov Models

目录 Problems with POS Tagging 词性标注的问题Probabilistic Model of HMM HMM的概率模型Two Assumptions of HMM HMM的两个假设Training HMM 训练HMMMaking Predictions using HMM (Decoding) 使用HMM进行预测&#xff08;解码&#xff09;Viterbi AlgorithmHMMs in Practic…

地震勘探基础(五)之地震资料数字处理

地震资料数字处理 地震勘探主要包括地震资料野外采集&#xff0c;地震资料数字处理和地震资料地质解释三大部分。其中地震资料数字处理需要利用高性能的超级计算机和先进的处理软件系统。地震资料的质量和成像精度直接决定了油、气勘探的成功率。 地震资料数字处理的主要目的…

快速解读GC日志

本文介绍GC日志的输出格式, 以及如何解读GC日志, 从中提取有用的信息。我们通过 -XX:UseSerialGC 选项,指定JVM使用串行垃圾收集器, 并使用下面的启动参数让 JVM 打印出详细的GC日志: -XX:PrintGCDetails -XX:PrintGCDateStamps -XX:PrintGCTimeStamps 这样配置以后&#xff…

postgreSQL/kingbase limit分页查询,结果乱序

postgres/kingbase limit分页查询&#xff0c;结果乱序 现象排查总结解决办法1.session中关闭synchronize_seqscans2.查询时带上order by 现象 我使用kingbase8&#xff0c;使用select * from xx limit 0,1000 每次查出来的结果都不一样。 排查 1.由于kingbase的文档较少&am…

Zinx框架学习 - 读写协程分离

Zinx - V0.7 读写协程分离 之前connection使用StartReader对客户端的数据接下来我们就要对Zinx做⼀个⼩⼩的改变&#xff0c;就是与客户端进修数据交互的Gouroutine由⼀个变成两个&#xff0c;⼀个专⻔负责从客户端读取数据&#xff0c;⼀个专⻔负责向客户端写数据。这么设计有…

Vue3 | Element Plus resetFields不生效

Vue3 | Element Plus resetFields不生效 1. 简介 先打开创建对话框没有问题&#xff0c;但只要先打开编辑对话框&#xff0c;后续在打开对话框就会有默认值&#xff0c;还无法使用resetFields()重置。 下面是用来复现问题的示例代码和示例GIF。 <script setup> import…

javascript基础二十一:说说你对BOM的理解,常见的BOM对象你了解哪些?

一、是什么 BOM (Browser Object Model)&#xff0c;浏览器对象模型&#xff0c;提供了独立于内容与浏览器窗口进行交互的对象 其作用就是跟浏览器做一些交互效果,比如如何进行页面的后退&#xff0c;前进&#xff0c;刷新&#xff0c;浏览器的窗口发生变化&#xff0c;滚动条…

Redis入门到实战笔记-Java客户端

这里写目录标题 哪些好用的客户端Jedis连接池 Spring Data Redis依赖修改默认序列化方式修改序列化代码&#xff1a;反序列化方式 哪些好用的客户端 Jedis 依赖&#xff1a; <dependency><groupId>redis.clients</groupId><artifactId>jedis</artif…

原来!自动化测试项目--的完整测试流程是这样的……

目录 需求分析&#xff1a; 整体流程图&#xff1a; 分析流程&#xff1a; 测试设计&#xff1a; 测试分析&#xff1a; 测试设计&#xff1a; 用例设计&#xff1a; 用例执行和回归 用例执行标准 bug回归标准 补充用例 质量分析 bug定位 前端定位&#xff1a; …

Axios后端程序员快速入门简述

axios 它的底层是用了 XMLHttpRequest&#xff08;xhr&#xff09;方式发送请求和接收响应&#xff0c;xhr 相对于之前讲过的 fetch api 来说&#xff0c;功能更强大&#xff0c;但由于是比较老的 api&#xff0c;不支持 Promise&#xff0c;axios 对 xhr 进行了封装&#xff0…

qt5.15.2 配置 android

第一步 安装jdk&#xff0c;最好安装 jdk11&#xff0c;因为他是与qt5.15.2这个能匹配上的 右击电脑&#xff0c;选择属性&#xff0c;选择高级系统设置&#xff0c;选择环境变量。 点击新建&#xff0c;变量名为JAVA_HOME,变量值为java安装的路径。我的如下图 JAVA_HOME D:\P…

Lecture 4 Text Classification

目录 Classification 分类Text Classification Tasks 文本分类任务Topic Classification 主题分类Sentiment Analysis 情感分析Native-Language Identification 母语识别Natural Language Inference 自然语言推理 Building a Text Classifier 构建文本分类器Choosing a Classif…

JDK、Tomcat、Redis、MySQL集齐,教你如何搭建高效性能测试项目!

目录 前言&#xff1a; 1. JDK 的安装 2. Tomcat 的安装 3. Redis 环境搭建 4. 数据库的安装 5. WEB 项目搭建 6. 性能测试 7. 总结 前言&#xff1a; 作为一个软件工程师&#xff0c;怎能不知道如何搭建一个性能测试项目呢&#xff1f;性能测试是一个软件工程师不可或…