分析:聚类-kmean聚类[statistics/kcluster]
kmeans聚类大致过程
1.假定对N个样本观测做聚类,要求聚为K类,首先选择K个点作为初始中心点;
2.按照距离初始中心点最小的原则,把所有观测分到各中心点所在的类中;
3.每类中有若干个观测,计算K个类中所有样本点的均值,作为第二次迭代的K个中心点;
4.然后根据这个中心重复第2、3步,直到收敛(中心点不再改变或达到指定的迭代次数),聚类过程结束
采用的程序是python的sklearn.cluster.KMeans
详见:
http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html