手撕 K-Means

手撕 K-Means

news2026/4/16 11:48:11

1. K-means 的原理

K-means 是一种经典的无监督学习算法，用于将数据集划分为 kk 个簇（cluster）。其核心思想是通过迭代优化，将数据点分配到最近的簇中心，并更新簇中心，直到簇中心不再变化或达到最大迭代次数。

算法步骤：

初始化： 随机选择 kk 个数据点作为初始簇中心（centroids）。
分配步骤（Assignment Step）： 将每个数据点分配到距离最近的簇中心。
更新步骤（Update Step）： 重新计算每个簇的中心（即簇内所有数据点的均值）。
迭代： 重复步骤 2 和 3，直到簇中心不再变化或达到最大迭代次数。

2. K-means 的公式推导

目标函数

K-means 的目标是最小化所有数据点到其所属簇中心的距离平方和（即误差平方和，SSE）：

其中：

k：簇的数量。
Ci：第 i 个簇。
x：数据点。
μi：第 i 个簇的中心。

分配步骤

将每个数据点 x 分配到距离最近的簇中心：

更新步骤

重新计算每个簇的中心 μi，即簇内所有数据点的均值：

其中 ∣Ci∣ 是第 i 个簇中数据点的数量。

3. 手撕代码实现

下面是用 Python 实现 K-means 算法的代码：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2403478.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案

🧭 TL;DR 今天，我们希望向大家介绍一个新的模型: SmolVLA，这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型，专为机器人领域设计，并且可以在消费级硬件上运行。 SmolVLAhttps://hf.co/lerobot/smolvla…

阅读更多...

day45python打卡

day45python打卡

知识点回顾： tensorboard的发展历史和原理tensorboard的常见操作tensorboard在cifar上的实战：MLP和CNN模型效果展示如下，很适合拿去组会汇报撑页数： 作业：对resnet18在cifar10上采用微调策略下，用tensorbo…

阅读更多...

AIGC赋能前端开发

AIGC赋能前端开发

一、引言：AIGC对前端开发的影响 1. AIGC与前端开发的关系从“写代码”到“生成代码”传统开发痛点：重复性编码工作、UI 设计稿还原、问题定位与调试...核心场景的AI化：需求转代码（P2C）、设计稿转代码（D2…

阅读更多...

Web 3D协作平台开发案例：构建制造业远程设计与可视化协作

Web 3D协作平台开发案例：构建制造业远程设计与可视化协作

HOOPS Communicator为开发者提供了丰富的定制化能力，助力他们在实现强大 Web 3D 可视化功能的同时，灵活构建符合特定业务需求的工程应用。对于希望构建在线协同设计工具的企业而言，如何在保障性能与用户体验的前提下实现高效开发，…

阅读更多...

AI Agent开发第78课-大模型结合Flink构建政务类长公文、长文件、OA应用Agent

AI Agent开发第78课-大模型结合Flink构建政务类长公文、长文件、OA应用Agent

开篇 AI Agent2025确定是进入了爆发期，到处都在冒出各种各样的实用AI Agent。很多人、组织都投身于开发AI Agent。但是从3月份开始业界开始出现了一种这样的声音： AI开发入门并不难，一旦开发完后没法用！经历过至少一个AI Agent从开发到上线的小伙伴们其实都听到过这种…

阅读更多...

第三方测试机构进行科技成果鉴定测试有什么价值

第三方测试机构进行科技成果鉴定测试有什么价值

在当今科技创新的浪潮中，科技成果的鉴定测试至关重要，而第三方测试机构凭借其独特优势，在这一领域发挥着不可替代的作用。那么，第三方测试机构进行科技成果鉴定测试究竟有什么价值呢？ 一、第三方测试机构能提供独立、公…

阅读更多...

华为云Flexus+DeepSeek征文｜基于华为云Flexus X和DeepSeek-R1打造个人知识库问答系统

华为云Flexus+DeepSeek征文｜基于华为云Flexus X和DeepSeek-R1打造个人知识库问答系统

目录前言 1 快速部署：一键搭建Dify平台 1.1 部署流程详解 1.2 初始配置与登录 2 构建专属知识库 2.1 进入知识库模块并创建新库 2.2 选择数据源导入内容 2.3 上传并识别多种文档格式 2.4 文本处理与索引构建 2.5 保存并完成知识库创建 3接入ModelArts S…

阅读更多...

【数据结构】_排序

【数据结构】_排序

【本节目标】排序的概念及其运用常见排序算法的实现排序算法复杂度及稳定性分析 1.排序的概念及其运用 1.1排序的概念排序：所谓排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。 1.2特性…

阅读更多...

PPT转图片拼贴工具 v4.3

PPT转图片拼贴工具 v4.3

软件介绍这个软件就是将PPT文件转换为图片并且拼接起来。效果展示支持导入文件和支持导入文件夹，也支持手动输入文件/文件夹路径软件界面这一次提供了源码和开箱即用版本，exe就是直接用就可以了。软件源码 import os import re import sys …

阅读更多...

Chrome安装代理插件ZeroOmega（保姆级别）

Chrome安装代理插件ZeroOmega（保姆级别）

目录本文直接讲解一下怎么本地安装ZeroOmega一、下载文件在GitHub直接下ZeroOmega 的文件（下最新版即可） 二、安装插件打开 Chrome 浏览器，访问 chrome://extensions/ 页面（扩展程序管理页面），并打开开发者…

阅读更多...

Transformer-BiGRU多变量时序预测（Matlab完整源码和数据）

Transformer-BiGRU多变量时序预测（Matlab完整源码和数据）

Transformer-BiGRU多变量时序预测（Matlab完整源码和数据） 目录 Transformer-BiGRU多变量时序预测（Matlab完整源码和数据）效果一览基本介绍程序设计参考资料效果一览基本介绍 1.Matlab实现Transformer-BiGRU多变量时间序列预测&…

阅读更多...

新华三H3CNE网络工程师认证—Easy IP

新华三H3CNE网络工程师认证—Easy IP

Easy IP 就是“用路由器自己的公网IP，给全家所有设备当共享门牌号”的技术！（省掉额外公网IP，省钱又省配置！） 生活场景对比，想象你住在一个小区：普通动态NAT：物业申请了 …

阅读更多...

Excel 模拟分析之单变量求解简单应用

Excel 模拟分析之单变量求解简单应用

正向求解利用公式根据贷款总额、还款期限、贷款利率，求每月还款金额反向求解根据每月还款能力，求最大能承受贷款金额参数： 目标单元格：求的值所在的单元格目标值：想要达到的预期值可变单元格：变…

阅读更多...

装备制造项目管理具备什么特征？如何选择适配的项目管理软件系统进行项目管控？

装备制造项目管理具备什么特征？如何选择适配的项目管理软件系统进行项目管控？

国内某大型半导体装备制造企业与奥博思软件达成战略合作，全面引入奥博思 PowerProject 打造企业专属项目管理平台，进一步提升智能制造领域的项目管理效率与协同能力。该项目管理平台聚焦半导体装备研发与制造的业务特性，实现了从项目立项、…

阅读更多...

FPGA 动态重构配置流程

FPGA 动态重构配置流程

触发FPGA 进行配置的方式有两种，一种是断电后上电，另一种是在FPGA运行过程中，将PROGRAM 管脚拉低。将PROGRAM 管脚拉低500ns 以上就可以触发FPGA 进行重构。 FPGA 的配置过程大致可以分为：配置的触发和建立阶段、加载配置文件和建…

阅读更多...

网络安全逆向分析之rust逆向技巧

网络安全逆向分析之rust逆向技巧

rust逆向技巧 rust逆向三板斧： 快速定位关键函数 (真正的main函数)：观察输出、输入，字符串搜索，断点等方法。定位关键加密区 ：根据输入的flag，打硬件断点，快速捕获程序中对flag访问的位置&am…

阅读更多...

Leetcode 2494. 合并在同一个大厅重叠的活动

Leetcode 2494. 合并在同一个大厅重叠的活动

1.题目基本信息 1.1.题目描述表: HallEvents ----------------- | Column Name | Type | ----------------- | hall_id | int | | start_day | date | | end_day | date | ----------------- 该表可能包含重复字段。该表的每一行表示活动的开始日期和结束日期&…

阅读更多...

vue+elementui 网站首页顶部菜单上下布局

vue+elementui 网站首页顶部菜单上下布局

菜单集合后台接口动态获取，保存到store vuex状态管理器 <template><div id"app"><el-menu:default-active"activeIndex2"class"el-menu-demo"mode"horizontal"select"handleSelect"background-…

阅读更多...

网络安全-等级保护(等保) 3-3-1 GB/T 36627-2018 附录A (资料性附录) 测评后活动、附录 B (资料性附录)渗透测试的有关概念说明

网络安全-等级保护(等保) 3-3-1 GB/T 36627-2018 附录A (资料性附录) 测评后活动、附录 B (资料性附录)渗透测试的有关概念说明

################################################################################ GB/T 36627-2018 《信息安全技术网络安全等级保护测试评估技术指南》对网络安全等级保护测评中的相关测评技术进行明确的分类和定义,系统地归纳并阐述测评的技术方法,概述技术性安全测试和…

阅读更多...

pytorch3d+pytorch1.10+MinkowskiEngine安装

pytorch3d+pytorch1.10+MinkowskiEngine安装

1、配置pytorch1.10cuda11.0 pip install torch1.10.1cu111 torchvision0.11.2cu111 torchaudio0.10.1 -f https://download.pytorch.org/whl/cu111/torch_stable.html 2、配置 MinkowskiEngine库不按下面步骤，出现错误 1、下载MinkowskiEngine0.5.4到本地 2、查看…

阅读更多...

推荐文章

最新文章