根据到给点样本的距离,来聚类。
1.曼哈顿距离、

2.欧几里得距离
直线距离
3.切比雪夫距离

4.闵氏距离

5.余弦相似度

对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离

二、密度聚类 DBSCAN

前提是样本是根据紧密程度分布的。


先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。




四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结

六、性能度量
1.利用真实值

2.不利用外部真实值

根据到给点样本的距离,来聚类。
1.曼哈顿距离、

2.欧几里得距离
直线距离
3.切比雪夫距离

4.闵氏距离

5.余弦相似度

对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离

二、密度聚类 DBSCAN

前提是样本是根据紧密程度分布的。


先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。




四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结

六、性能度量
1.利用真实值

2.不利用外部真实值

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2121334.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!