深度聚类方法之对比聚类(Contrastive Clustering,CC)

深度聚类方法之对比聚类(Contrastive Clustering,CC)

news2026/5/16 7:02:36

1.参考文献

《Contrastive Clustering》

2.深度聚类方法

深度聚类方法大致分为以下几类：

①分阶段：使用深度网络进行对比学习or自动编码器完成表征学习(目的：把同类样本集中到一起，拉开不同类样本的聚类)，然后使用聚类模型把不同簇的样本进行归类，并且使用后续赋值对深度网络进行更新。

这种交替学习方法在表征学习和聚类的交替阶段中存在累积的误差，会导致聚类性能次优。

②端到端：即在完成表征学习的同时，同样完成聚类。

根据数据集使用情况，又可分为：

①离线学习：要使用整个数据集才能进行聚类；

②在线学习：使用数据集的部分就能进行聚类；

3.对比聚类(Contrastive Clustering,CC)

对比聚类该方法是既可以分阶段，也可以端到端，同时也是在线学习的。

总的来讲是在对比学习基础上，拓展为对比聚类，其思路如下图

通过将特征矩阵的行视为实例的软标签(即 $P\left ( c_{j}|x_{i} \right )$ 表示样本 $i$ 属于簇 $j$ 的概率)，可以据此将列解释为分布在数据集上的聚类表示。

因此，可以在特征矩阵的行空间和列空间中分别进行表征学习和聚类的对比学习。

详细流程如下图

使用两个数据扩充来构造数据对。给定数据对，一个共享的深度神经网络被用来从不同的增强中提取特征。使用两个独立的MLPs(σ表示ReLU激活，∼表示Softmax操作以产生软标签)将特征投影到行和列空间，其中分别进行表征学习和聚类的对比学习。

①Pair Construction Backbone

主要使用了ResNet34做为主干网络

②Instance-level Contrastive Head

首先是计算数据增强样本向量 $z^a,z^b$ 的余弦相似度

损失函数如下

由于希望识别数据集上的所有正对，因此在每个增强样本上计算实例级的对比损失，即，

这里跟对比学习是一样的。

③Cluster-level Contrastive Head

使用余弦距离来衡量聚类对之间的相似性，即

采用以下损失函数来区分簇 $y^a$ 与除簇 $y^b$ 外的所有其他簇

最后计算了簇级对比损失

其中，

这个有助于避免了大多数实例被分配给同一个集群的琐碎解决方案。

④目标函数

具体算法流程如下图

4.应用

迁移学习或者半监督学习

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/154021.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【6】SCI易中期刊推荐——人工智能神经科学机器人学（中科院3区）

【6】SCI易中期刊推荐——人工智能神经科学机器人学（中科院3区）

🚀🚀🚀NEW！！！SCI易中期刊推荐栏目来啦 ~ 📚🍀 SCI即《科学引文索引》（Science Citation Index, SCI），是1961年由美国科学信息研究所（Institute for Scientific Information, ISI）创办的文献检索工具，创始人是美国著名情报专家尤金加菲尔德（Eugene Garfield…

阅读更多...

头条某星图登录协议解析2023/1/9

头条某星图登录协议解析2023/1/9

文章目录文章目录文章目录前言网址加密字段请求逻辑生成s_v_web_id账号密码的加密方式fp滑块登录成功前言可以关注我哟，一起学习，主页有更多练习例子如果哪个练习我没有写清楚，可以留言我会补充如果有加密的网站可以留言发给我，一起学习共享学习路程如侵权，联系我删…

阅读更多...

【JavaGuide面试总结】Java高级特性基础篇·下

【JavaGuide面试总结】Java高级特性基础篇·下

【JavaGuide面试总结】Java高级特性基础篇下1.什么是序列化?什么是反序列化?2.序列化协议对应于 TCP/IP 4 层模型的哪一层？3.常见序列化协议有哪些？4.为什么不推荐使用 JDK 自带的序列化？5.如果有些字段不想进行序列化怎么办？6.…

阅读更多...

梦幻西游H5私服服务端超详细图文架设教程

梦幻西游H5私服服务端超详细图文架设教程

想体验经典Q版西游霸服高兴吗？想体验满级VIP的尊贵吗？想体验一招秒杀的痛快吗？各种极品配备、翅膀、宠物统统给你，就在梦幻西游！本文解说梦幻西游H5游戏的架设教程，想钻研H5游戏如何实现，体验游…

阅读更多...

基于Python实现的车辆检测计数+车牌定位+车牌识别的融合技术，使用pytorch深度学习框架

基于Python实现的车辆检测计数+车牌定位+车牌识别的融合技术，使用pytorch深度学习框架

车辆检测计数车牌检测与车牌识别介绍基于pytorch深度学习框架，实用开源模型yolov4实现模板检测与yolov5实现车牌检测与LPRNet实现车牌检测完整代码下载地址：基于Python实现的车辆检测计数车牌定位车牌识别的融合技术基于win10系统，实用…

阅读更多...

JSP SSM加班管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

JSP SSM加班管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 JSP SSM加班管理系统是一套完善的web设计系统（系统采用SSM框架进行设计开发，springspringMVCmybatis），对理解JSP java编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/…

阅读更多...

python数据分析及可视化（十九）Power BI中M函数的使用、数据建模、度量值、DAX

python数据分析及可视化（十九）Power BI中M函数的使用、数据建模、度量值、DAX

M函数用鼠标操作的步骤背后的逻辑都是M函数，在编辑器里都会有体现出来，选中左侧的表名称，点击右键，选择高级编辑器，就会进入到高级编辑器界面，里面会显示每一步的操作步骤。 M函数基本规范 M函数对大小写…

阅读更多...

常用JavaScript库

常用JavaScript库

1、前端工具类库 jQuery是一个快速、小型且功能丰富的 JavaScript 库，它使HTML文档遍历和操作、事件处理、动画和 AJAX 之类的事情变得更加简单。当时jQuery库不但简化了代码，而且提供出色的跨浏览器支持，其极大的提高了 Web 开发人员的工作效…

阅读更多...

sqlserver连接时报错 [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序

sqlserver连接时报错 [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序

电脑重新安装系统了，当我再次链接数据库时 ，发现报错 [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序很明显是少了驱动，只要安装了Microsoft ODBC Driver 11 for SQL Server这个驱动就可以了。没安装驱动…

阅读更多...

实时性升至秒级！飞桨PaddleSpeech赋能金融双录业务走向智能化

实时性升至秒级！飞桨PaddleSpeech赋能金融双录业务走向智能化

听说IT圈十个人里有九个是男性开发者，女生并不多，陈雪儿可以算是这个群体中独特的存在。作为杭州谐云科技有限公司（简称谐云）智能边缘团队的AI技术专家，陈雪儿带领团队历经一年半研发的“金融双录智能质检系统”&…

阅读更多...

功率放大器怎么选择型号的（功率放大器选购技巧）

功率放大器怎么选择型号的（功率放大器选购技巧）

很多电子工程师虽然频繁使用功率放大器，但是对于功率放大器的选择和选购技巧还是不清楚，下面就来为大家介绍一下如何挑选合适的功率放大器型号。一般情况下，功率放大器购买决策的主要考虑因素是输出功率、线性度、频率范围和VSWR失配容限。放…

阅读更多...

网络和VPC简单介绍

网络和VPC简单介绍

网络和VPC 传统网络传统网络从一开始就是一个分布式的网络，没有中心的控制节点，网路中的各个设备之间通过口口相传的方式学习网络的可达信息，由每台设备自己决定要如何转发，这直接导致了没有整体观念，不能从整个网络…

阅读更多...

免费PDF转换器软件有哪些？不妨试试这几款

免费PDF转换器软件有哪些？不妨试试这几款

在工作中和学习中很多小伙伴都有转换文件的需求，例如将PDF文件转换为word、excel、PPT、图片等类型的文件，这时候我们就需要一款专业且高效率的PDF转换器来帮助我们处理文件，那么转换器的性价比也是我们需要考虑的，那么免费PDF转换…

阅读更多...

内存管理系统

内存管理系统

文章目录前言前置知识makefile位图内存池规划实验操作实验一实验二实验三实验四实验五前言博客记录《操作系统真象还原》第八章实验的操作~ 实验环境：ubuntu18.04VMware ， Bochs下载安装实验内容： 实现 assert 断言。实现字符串操作函数…

阅读更多...

合并表记录 C语言实现

合并表记录 C语言实现

合并表记录描述数据表记录包含表索引index和数值value（int范围的正整数），请对表索引相同的记录进行合并，即将相同索引的数值进行求和运算，输出按照index值升序进行输出。提示: 0 < index < 11111111 1 <…

阅读更多...

产品经理的技术脑：产品是如何工作的？

产品经理的技术脑：产品是如何工作的？

产品在web中的工作流程如图： 浏览器工作流程（客户端）： 用户访问网站时输入的URL，浏览器是无法根据输入的URL找到web服务器的，需要通过IP地址找到web服务器，因此，浏览器对用户URL的处…

阅读更多...

6.5 工具-ElasticSearch

6.5 工具-ElasticSearch

目录 6.5.1 ElasticSearch概述 6.5.1.1 什么是ElasticSearch 6.5.1.2 Lucene 6.5.1.3 Elastic Stack 6.5.1.4 Solr与ES 6.5.1.4.1 背景 6.5.1.4.2 区别 6.5.1.5 正向索引与倒排索引 6.5.1.5.1 正向索引 6.5.1.5.2 倒排索引 6.5.2 Elasticsearch安装 6.5.3 Elastics…

阅读更多...

机器视觉硬件篇--线激光3d相机介绍及编程

机器视觉硬件篇--线激光3d相机介绍及编程

一、3D相机简介常见的三维视觉技术，包含双目、ToF、激光三角、结构光等毫米级：双目、ToF、结构光(散斑)的精度为 mm 级，多见于消费领域，如：导航避障，VR/AR，刷脸支付等微米级：线激光、…

阅读更多...

08-什么是类加载器，类加载器有哪些，双亲委派模型机制?

08-什么是类加载器，类加载器有哪些，双亲委派模型机制?

1.类加载器 1.实现通过类的权限定名获取该类的二进制字节流的代码块叫做类加载器。 2.虚拟机设计团队把加载动作放到 JVM 外部实现，以便让应用程序决定如何获取所需的类。 3.类加载器虽然只用于实现类的加载动作，但是对于任意一个类，都需要…

阅读更多...

ES索引规划方案

ES索引规划方案

ES索引规划方案 1.引言《ES索引规划方案》是研发部门针对审计系统需求，对海量日志数据进行实时存储和查询的解决方案，经过不断完善整理成册，以供后续相关开发人员学习使用 1.1.术语序号用语说明1时序索引以时间为轴，数据只有…

阅读更多...

推荐文章

最新文章