百度开源文生图模型ERNIE-Image,小显存即可运行,生成效果媲美顶级商业模型
【导语4月15日百度文心大模型团队正式开源全新文生图模型ERNIE-Image其基于单流Diffusion Transformer架构显存要求低生成效果好在多任务测试中表现优异且已开源相关权重与代码。】低显存运行的文生图模型百度文心大模型团队此次开源的ERNIE-Image基于单流Diffusion Transformer架构参数规模仅为8B只需24GB显存的消费级显卡就能运行。这大大降低了运行文生图模型的硬件门槛。媲美顶级商业模型的生成效果经国际基准测试验证ERNIE-Image在通用图像生成、复杂指令跟随及文字渲染等任务中均取得开源模型SOTA成绩。特别是在中英日韩多语言文字渲染能力上表现突出生成效果可媲美顶级商业模型。开源举措推动行业发展目前ERNIE-Image的模型权重与推理代码已在Hugging Face开源并上线ComfyUI Workflow及GGUF量化方案。这一开源举措将为行业带来更多的研究和应用机会推动文生图技术的进一步发展。编辑观点百度开源ERNIE-Image是文生图领域的重要进展低显存要求和优异性能将吸引更多开发者参与有望加速该领域的创新与应用普及。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2525238.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!