ComfyUI v0.20.1 更新:SUPIR、RIFE/FILM、SAM 3.1、OpenAPI 3.1、视频与音频能力全面增强

news2026/4/29 6:39:53
ComfyUI v0.20.1 于 2026年4月28日发布这次更新覆盖模型支持、视频处理、音频处理、API、执行引擎、前端、工作流模板、文档与伙伴节点等多个方面整体升级非常密集。这个版本的核心关键词可以概括为更强的模型支持、更完善的视频音频能力、更规范的 API、更稳定的执行逻辑以及更丰富的节点生态。一、版本说明与整体特点本次版本标注为Immutable release也就是说只有发布标题和发布说明可以修改。这意味着该版本的发布内容是相对稳定和固定的适合直接作为生产环境升级参考。从更新条目来看v0.20.1 不是单点修复而是一次覆盖面很广的综合升级尤其集中在以下几个方向新增多种模型支持音频与视频相关能力增强API 与内部接口更规范工作流模板持续更新前端包持续迭代执行器稳定性和异常机制优化伙伴节点持续扩展二、模型能力新增与增强1. SUPIR 模型支持本版本加入了SUPIR model support。这项更新意味着 ComfyUI 在模型生态上的覆盖进一步扩大为相关图像处理场景带来新的支持能力。2. Ernie 推理优化本次更新对Ernie inference做了一些优化使其推理速度更快一些。虽然描述中使用的是“a bit faster”但这类优化通常意味着推理链路中有一定效率提升对实际使用体验会产生积极影响。3. LTX 音频 VAE 更原生化更新中提到Make the ltx audio vae more native说明 LTX 音频 VAE 的处理方式更加贴近原生支持逻辑这有助于提升音频相关节点的统一性和兼容性。4. 支持独立的 LTXV 音频 VAE本次新增了Support standalone LTXV audio VAEs意味着 LTXV 音频 VAE 不再完全依赖既有绑定方式而是可以作为独立对象进行支持。这对于音频处理工作流的灵活性有直接帮助。5. RIFE 与 FILM 帧插值模型支持这次版本加入了RIFE and FILM frame interpolation model support属于非常实用的能力扩展。帧插值模型支持意味着视频相关工作流在帧间补偿、平滑处理方面可以获得更多模型选择。6. SAM 3.1 支持版本新增了SAM (segment anything) 3.1 support。这表示分割能力进一步更新适用于更广泛的图像分割相关流程。7. 启用 SD2 real human 支持伙伴节点中新增了SD2 real human support为相关节点使用场景补充了新的模型能力。8. HappyHorse 模型伙伴节点中还新增了HappyHorse model继续扩展可用模型范围。三、视频相关能力强化1. ByteDance 2 节点支持自动下采样伙伴节点新增了optional auto-downscaling of videos用于 ByteDance 2 节点。这个功能允许视频在处理时根据需要自动进行降采样提升处理灵活性。2. Veo 模型支持 4K 分辨率伙伴节点中增加了4K resolution for Veo models并且还加入了Veo 3 Lite model。这说明 Veo 相关工作流在分辨率和模型版本上都更丰富了。3. 修复 Veo 3.0 模型的 4K 分辨率拒绝问题同时也修复了一个与 Veo 有关的问题reject 4K resolution for veo-3.0 models。也就是说针对 veo-3.0 模型系统会拒绝不适配的 4K 分辨率设置避免错误使用。4. Kling 节点增加 4K 分辨率伙伴节点中还为Kling nodes增加了 4K 分辨率支持使视频生成相关节点能力更进一步。5. 更好地加载高位深视频本次更新修复了Properly load higher bit depth videos让高位深视频的加载更可靠。6. 支持视频 alpha 通道版本还新增了Support loading the alpha channel of videos。这意味着视频透明通道可以被加载这在更复杂的视频合成和编辑场景中非常有用。四、音频相关能力增强1. LTX 音频 VAE 更原生前面已经提到这次更新让 LTX 音频 VAE 更加原生化这属于音频支持基础设施上的增强。2. 支持独立 LTXV 音频 VAE这一条与上面配套说明音频 VAE 的使用更灵活更适合独立部署和组合式工作流。3. 修复 LTXV Reference Audio 节点本次更新还修复了LTXV Reference Audio node提升相关音频节点的可用性。五、前端与界面包更新1. comfyui-frontend-package 多次升级本次版本中前端包经历了多次更新包括升级到1.42.12升级到1.42.14升级到1.42.15这说明前端层面在持续迭代涉及的可能是交互体验、组件修复、性能优化和兼容性调整等。2. 预览任意节点时打印更多 tensor 值更新中加入了Print more tensor values in the preview any node。这意味着在预览节点时可以看到更多 tensor 值有助于调试和分析数据流。3. 修复模糊/锐化 shader 的 texel size 计算本次修复了 shader 中的一个实现细节use textureSize instead of u_resolution for texel size in blur/sharpen shaders。这类修复通常会影响视觉效果计算的准确性。六、API、内部接口与规范性增强1. 为内部 files endpoint 增加目录类型标注本次修复了append directory type annotation to internal files endpoint。这说明内部文件接口在返回目录类型时更加规范有助于减少接口歧义。2. 添加 OpenAPI 3.1 规范版本新增了OpenAPI 3.1 specification for ComfyUI API。这是非常重要的接口升级意味着 API 文档和规范化能力更强更利于第三方接入和自动生成接口说明。3. 允许在 comfy app files 中记录日志本次更新还加入了Allow logging in comfy app files。这对于应用文件相关的调试、追踪和问题定位有帮助。4. 提高无效版本格式的日志级别更新中提到Update logging level for invalid version format说明系统在处理非法版本格式时日志提示更合理。七、执行引擎与稳定性改进1. InterruptProcessingException 继承自 BaseException本次更新将InterruptProcessingException改为继承自BaseException。这通常意味着异常处理逻辑更符合底层中断类异常的特性也可能减少一些被普通异常处理捕获的情况。2. 加入反循环验证执行层新增了anti-cycle validation。这项能力对工作流执行非常关键可以更早发现循环依赖问题提升执行安全性。3. 对 stray weights 强制类型转换本次修复了force cast stray weights on comfy layers。这类调整通常与模型权重加载和兼容性有关能减少异常权重导致的问题。4. Stable_Zero123 cc_projection 权重赋值修复更新中修复了use Parameter assignment for Stable_Zero123 cc_projection weights属于模型权重赋值方式的修正。5. EmptySD3LatentImage 节点使用中间 dtype本次还更新了Make EmptySD3LatentImage node use intermediate dtype说明该节点在中间数据类型使用上更合理能改善处理稳定性。八、嵌入文档、模板与蓝图更新1. 工作流模板持续升级本次版本对工作流模板进行了多次更新依次为v0.9.59v0.9.61v0.9.62v0.9.63这说明模板内容在持续演进便于用户使用更接近最新版本的流程结构。2. 新增 ComfyUI blueprints 并修复 subgraph 命名更新中加入了new ComfyUI blueprints同时修复了subgraph naming。这类改动有助于让工作流结构更清晰蓝图使用更友好。3. 更新嵌入文档到 v0.4.4本次版本还将embedded docs更新到了v0.4.4。这意味着内置文档内容同步到了新的版本方便用户在使用 ComfyUI 时直接参考更完整、更及时的说明信息。对于需要快速查阅节点、流程、接口或功能说明的用户来说这类更新能明显提升使用便利性。九、伙伴节点扩展内容本次更新里伙伴节点的变化非常多而且覆盖视频、图像、模型、价格展示等多个方向是 v0.20.1 的一大看点。1. ByteDance 2 节点支持自动下采样如前所述伙伴节点增加了视频自动下采样功能提升视频处理灵活性。2. Veo 模型增加 4K 分辨率与 Veo 3 Lite 模型伙伴节点继续为 Veo 系列增强支持使其更适配不同分辨率与模型版本的需求。3. Kling 节点增加 4K 分辨率这同样是视频生成场景的重要增强。4. GPTImage 增加版本选项本次更新中还为gpt-image-2增加了version option。这意味着 GPTImage 相关节点在版本选择上更灵活适配不同使用需要。5. GPTImage 修复价格徽标并添加新分辨率伙伴节点还修复了price badges并且增加了新的分辨率选项增强了展示与可选参数能力。6. Sora 节点增加即将弃用提示更新中为Sora nodes添加了upcoming-deprecation notice。这类提示能让用户提前知晓相关节点的后续变化安排便于调整工作流。十、其他细节修复与调整1. Range type本次更新中还包含了一个range type的调整。这类类型定义修正往往属于底层类型系统或参数处理上的改进虽然表述简短但对整体一致性有帮助。2. 修复 preview any node 中 tensor 值显示与前端预览相关的调试输出增强能更好地帮助用户观察节点数据状态。3. 更新日志级别与版本格式校验对无效版本格式的日志级别进行了调整说明系统在处理版本相关输入时更规范。4. 其他节点与权重处理修正包括Stable_Zero123 的 cc_projection 权重赋值修复stray weights 的强制类型转换EmptySD3LatentImage 的中间 dtype 调整LTXV Reference Audio 的修复这些内容都属于提高稳定性和可用性的基础性更新。十一、版本要点总结如果要用一句话概括 ComfyUI v0.20.1那么它不是单纯的小修小补而是一次围绕模型支持、音视频能力、API 规范、执行稳定性和生态扩展的集中强化版本。这次更新的重点可以整理为新增 SUPIR、RIFE、FILM、SAM 3.1 等模型支持强化 Ernie 推理性能音频 VAE 与 LTXV 音频链路更原生、更独立视频处理能力明显增强包括高位深、alpha 通道、4K、自动下采样等API 增加 OpenAPI 3.1 规范接口更标准执行引擎增加 anti-cycle validation稳定性更强前端包持续升级预览与 shader 细节优化工作流模板、蓝图、嵌入文档持续更新伙伴节点新增多项模型与功能支持并包含多个修复项十二、结语代码地址github.com/Comfy-Org/ComfyUIComfyUI v0.20.1 这次更新给人的直观感受就是覆盖广、改动实、节奏快。从模型到视频、从音频到 API、从前端到执行层再到工作流模板和伙伴节点几乎每个关键模块都有涉及。对于日常使用 ComfyUI 的用户来说这种版本更新意味着可用能力更丰富稳定性更高接口更规范生态也更活跃。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2564799.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…