傳統K-means的計算過程;
1.從D中隨機選擇K個元素作為K個簇的各自中心。
2.計算剩余元素到每個中心點的相異度(壹般根據歐氏距離的距離),並將這些元素匯總到相異度最低的聚類中。
3.根據聚類結果,通過取聚類中所有元素的算術平均值(通常是聚類中所有元素到聚類中心的距離之和的平均值)來重新計算k個聚類各自的中心。
4.根據新的中心重新聚類D中的所有元素。
5.重復步驟4,直到聚類結果沒有變化。
6.輸出結果。
K-means是壹個簡單的聚類問題。所謂聚類問題就是給定壹個元素集合D,其中每個元素具有n個可觀測屬性,並利用某種算法將D劃分為k個子集,這就要求每個子集中元素之間的相異度盡可能小,而不同子集中元素之間的相異度盡可能大。每個子集稱為壹個簇。