Matlab讨论区 - 声振论坛 - 振动,动力学,声学,信号处理,故障诊断

Edinburgh 发表于 2016-5-6 09:41

Matlab函数kmeans：K-均值聚类

K-means聚类算法采用的是将N*P的矩阵X划分为K个类，使得类内对象之间的距离最大,而类之间的距离最小。
使用方法：Idx=Kmeans(X,K)=Kmeans(X,K) =Kmeans(X,K) =Kmeans(X,K) […]=Kmeans(…,’Param1’,Val1,’Param2’,Val2,…)
各输入输出参数介绍：
X N*P的数据矩阵K 表示将X划分为几类，为整数Idx N*1的向量，存储的是每个点的聚类标号C K*P的矩阵，存储的是K个聚类质心位置sumD 1*K的和向量，存储的是类间所有点与该类质心点距离之和D N*K的矩阵，存储的是每个点与所有质心的距离
[…]=Kmeans(…,'Param1',Val1,'Param2',Val2,…)这其中的参数Param1、Param2等，主要可以设置为如下：
1. ‘Distance’(距离测度)‘sqEuclidean’ 欧式距离（默认时，采用此距离方式）‘cityblock’ 绝度误差和，又称：L1‘cosine’ 针对向量‘correlation’ 针对有时序关系的值‘Hamming’ 只针对二进制数据
2. ‘Start’（初始质心位置选择方法）‘sample’ 从X中随机选取K个质心点‘uniform’ 根据X的分布范围均匀的随机生成K个质心‘cluster’ 初始聚类阶段随机选择10%的X的子样本（此方法初始使用’sample’方法）matrix 提供一K*P的矩阵，作为初始质心位置集合
3. ‘Replicates’（聚类重复次数）整数
使用案例：
data= 5.0 3.5 1.3 0.3 -15.5 2.6 4.4 1.2 06.7 3.1 5.6 2.4 15.0 3.3 1.4 0.2 -15.9 3.0 5.1 1.8 15.8 2.6 4.0 1.2 0
=Kmeans(data,3,'dist','sqEuclidean','rep',4)

运行结果：Idx = 1 2 3 1 3 2
C =5.0000 3.4000 1.3500 0.2500 -1.00005.6500 2.6000 4.2000 1.2000 06.3000 3.0500 5.3500 2.1000 1.0000
sumD =0.03000.12500.6300
D =0.0150 11.4525 25.535012.0950 0.0625 3.555029.6650 5.7525 0.31500.0150 10.7525 24.965021.4350 2.3925 0.315010.2050 0.0625 4.0850转自：http://blog.sina.com.cn/s/blog_6163bdeb0102eb8d.html

页: [1]

声振论坛's Archiver

Matlab函数kmeans：K-均值聚类