GANSeg:通过无监督分层图像生成学习分割

news2025/9/20 10:28:46

文章目录

  • GANSeg: Learning to Segment by Unsupervised Hierarchical Image Generation
    • 摘要
    • 引言
    • 方法
      • Level 1: Point Generation and Part Scale
      • Level 2: From Points to Masks
      • Level 3: Mask-conditioned Image Generation
      • 损失函数
    • 实验结果

GANSeg: Learning to Segment by Unsupervised Hierarchical Image Generation

摘要

  1. 无监督分割
  2. 一种基于GAN的方法,该方法生成以潜在MASK为条件的图像
  3. 以层级方式在明确定义部分位置的2D潜在点上调节掩模时,可以很好的学习以MASK为条件的图像生成
  4. 不需要监视MASK或点,增加了MASK到viewpoint和目标位置变化的鲁棒性。
  5. 还可以让我们生成图像MASK对来训练分割网络,它在已建立的基准上优于最先进的无监督分割方法
    代码链接

在这里插入图片描述

引言

现有的无监督关键点检测方法主要遵循与无监督关键点检测相同的策略:仿射变换,显著图,或者假设对象始终处于居中
本文关键的问题:设计一个GAN,生成具有有意义的部分分割掩码的图像

方法

在这里插入图片描述
第1层级(红色):点生成器将两个高斯噪声向量转换为部分位置和外型嵌入。
第2层级(橙色):掩码生成器将部件位置和嵌入转换为定义部件支持的掩码。
第3层级(绿色和蓝色):前景生成器使用前一层的数量来生成前景图像,最终与独立生成的背景混合。

Level 1: Point Generation and Part Scale

在这里插入图片描述
利用独立的噪声向量来生成K parts的位置和外观。
part的位置和尺度由相应点的均值和标准差计算
在这里插入图片描述在这里插入图片描述
详细可以看论文

Level 2: From Points to Masks

在这里插入图片描述
使用高斯热图来建模局部独立性
位置编码来生成相对于预测part位置的掩码
点与图像像素之间的相对位置编码而不是绝对位置编码
在这里插入图片描述
生成的嵌入映射Wmask随后将用于生成MASK
初始MASK
在这里插入图片描述
随后的MASK,采用SPADE ResBlocks整合
在这里插入图片描述

Level 3: Mask-conditioned Image Generation

在这里插入图片描述
在第三层,分别生成前景和背景,并通过重用前一层的MASK线性混合它们,前景生成和第二部分类似
在这里插入图片描述
背景生成:可以回到总览图看看
在这里插入图片描述
背景特征图:AdaIN ConvBlocks
在这里插入图片描述
前景和背景进行结合:M代表MASK
在这里插入图片描述

损失函数

生成器和辨别器总损失
在这里插入图片描述
在这里插入图片描述
区域面积损失:
在这里插入图片描述
强制MASK位于其中心周围的区域,具有几何连接损失
在这里插入图片描述
GAN损失:
在这里插入图片描述

实验结果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/411485.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

挖掘潜在用户:2023年海外社交电商网红营销策略解析

近年来,随着社交媒体的不断发展和电商行业的崛起,海外社交电商平台已经成为了一个飞速发展的领域。然而,随着市场竞争的加剧,越来越多的海外社交电商平台开始采用网红营销策略来提升品牌知名度和销售业绩。本文Nox聚星将和大家探讨…

D. Rating Compression(双指针 + 思维)

Problem - D - Codeforces 在竞争编程平台CodeCook上,每个人都有一个由长度为n的整数数组a描述的评分图。现在你正在更新基础设施,所以你已经创建了一个程序来压缩这些图。程序的工作原理如下。给定一个整数参数k,程序取in中每个长度为k的连续…

给您的 MongoDB 定期做个体检:MongoDB 诊断

新钛云服已累计为您分享739篇技术干货接下来的一些列文章会为大家介绍日常工作中常用的 NoSQL 产品 MongoDB。主要涉及到:MongoDB 的安装及基本使用 MongoDB 文档查询 MongoDB 复制集 MongoDB 分片集群的介绍及搭建 MongoDB 安全加密 MongoDB 诊断我们会用…

适合销售使用的CRM系统特点

销售人员抱怨CRM系统太复杂,这是一个很重要的问题。毕竟,如果系统太难使用,会导致CRM实用率和效率下降,最终影响公司的运作。在这篇文章中,我们来探讨当销售抱怨crm客户系统太复杂了,企业该如何解决。 缺少…

能自动翻译的软件-最精准的翻译软件

批量翻译软件是一种利用自然语言处理技术和机器学习算法,可以快速翻译大量文本内容的工具。批量翻译软件可以处理多种格式的文本,包括文档、网页、邮件、PDF等等,更符合掌握多语言的计算机化需求。 147CGPT翻译软件特点: 1.批量任…

机器学习入门实例-加州房价预测-1(数据准备与可视化)

问题描述 数据来源:California Housing Prices dataset from the StatLib repository,1990年加州的统计数据。 要求:预测任意一个街区的房价中位数 缩小问题:superwised multiple regressiong(用到人口、收入等特征) univariat…

Springboot实现优雅的参数校验(Spring Validation)和 if else说再见

文章目录一、概述二、注解2.1 空和非空检查2.2 数值检查2.3 Boolean 值检查2.4 长度检查2.5 日期检查2.6 其它检查2.7 Hibernate Validator 附加的约束注解2.8 Valid 和 Validated三、快速入门3.1 引入依赖3.2 创建基本的类3.3 启动程序,进行测试3.3 一些疑问3.3.1 …

抽烟行为识别预警系统 yolov5

抽烟行为识别预警系统基于yolov5网络模型智能分析技术,抽烟行为识别预警算法通过监测现场人员抽烟行为自动存档进行报警提示。我们选择当下YOLO卷积神经网络YOLOv5来进行抽烟识别检测。6月9日,Ultralytics公司开源了YOLOv5,离上一次YOLOv4发布…

该不该放弃嵌入式,单片机这条路?

本文几乎浓缩了我从业10几年的精华,内容涵盖我转行、打工、创业的经历。 建议从头到尾不要错过一字一句,因为字里行间的经验之谈,或许能成为你人生重要转折点。 全文3700多字,写了6个多小时,如果你赶时间,建…

MATLAB——多元函数的极值

目录 计算多元函数的自由极值 计算二元函数在区域D内的最大值和最小值 函数求偏导数的MATLAB命令 例题如下 计算多元函数的自由极值 定义多元函数 Zf(x,x)求解正规方程fx(x,y)0,fy(x,y)0 得到驻点对于每一个驻点(x0,y0),求二阶偏导 A B …

系统复杂度之【高性能】

系统复杂度之【高性能】 今天我们来谈一谈系统复杂度的根源之【高性能】 对性能的不懈追求一直是人类科技持续发展的核心动力。例如计算机,从电子管计算机到晶体管计算机,再到集成电路计算机,运算性能从每秒几次提高到每秒几亿次。然而&#…

Java开发 - 读写分离初体验

前言 上一篇中,我们介绍了主从复制,相信学过的小伙伴已经能够很好的掌握主从复制的技术,实际上也并没有那么难,虽然没有讲一主多从,多主多从的配置,但是从一主一从的配置中也很容易联想到该怎么配置&#…

2023年顶级编程语言趋势

对于开发人员和软件工程师来说,选择更优秀的编程语言使编写可以在任何地方运行的软件变得更加容易,工作效率更高。从 Java 的缓慢衰落到 MATLAB 的惊人流行,对当今最流行的编程语言的分析,可以帮助你了解最新趋势并响应最新趋势。…

4.5、协议

4.5、协议1.简介2.常见协议3.UDP协议4.TCP协议5.IP协议6.以太网帧协议7.ARP协议1.简介 协议,网络协议的简称,网络协议是通信计算机双方必须共同遵从的一组约定。如怎么样建立连接、怎么样互相识别等。只有遵守这个约定,计算机之间才能相互通信…

JAVA NIO简解

1. 了解NIO 1.1.什么是NIO? Java nio是Java的一个新的输入输出(NewInput/Output)API,它提供了一些高效的数据处理方式,如缓冲区(buffers)、字符集(charsets)、通道&#…

No.036<软考>《(高项)备考大全》【第20章】项目集管理

【第20章】项目集管理1 考试相关2项目集合项目组合的区别2.1 项目组合、项目集、项目管理之间的关系:2.3 举例说三者的关系3 项目集管理3.1 项目集管理与项目管理区别3.2 项目集指导委员会3.3 项目集生命周期4 练习题参考答案1 考试相关 选择1分必考 案例概率低&am…

Ubuntu 23.04 新特性一览

Ubuntu 23.04 “Lunar Lobster” 计划于 2023 年 4 月 20 日星期四发布,这是 Ubuntu 桌面的第 38 个版本。作为一个短期版本,Ubuntu 23.04 共获得了 9 个月的持续更新、安全补丁和关键修复。 在正式发布之前,OMG! Ubuntu! 汇总整理了一些 Ub…

京东产发奔赴港股上市,分拆上市或成互联网大厂的共同选择?

‍数据智能产业创新服务媒体——聚焦数智 改变商业3月30日晚间,京东集团(9618.HK)相继发布2则公告称,拟分拆京东智能产发股份有限公司(以下简称“京东产发”)、京东工业股份有限公司(以下简称“…

基于改进多目标灰狼优化算法的考虑V2G技术的风、光、荷、储微网多目标日前优化调度研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

( “树” 之 DFS) 404. 左叶子之和 ——【Leetcode每日一题】

404. 左叶子之和 给定二叉树的根节点 root ,返回所有左叶子之和。 示例 1: 输入: root [3,9,20,null,null,15,7] 输出: 24 解释: 在这个二叉树中,有两个左叶子,分别是 9 和 15,所以返回 24 示例 2: 输入: root [1]…