K-means法クラスター分析は最小二乗和を利用して観測グループに分類します。
欠損値がある観測データはK-means法クラスター分析を行う前に除外されます。
変数pでn個の観測点を持つ行列Xの場合、初期のクラスター中心はKxp行列により特定されるか、行列Xから既に定義されていたクラスター数より選ばれます。
のように修正されます。また、その観測点とほかのクラスターとの距離は、
と
がそれぞれk番目とj 番目のクラスターの観測数である場合、
のように修正されます。もし観測点とi 番目のクラスター間の修正距離が最小でかつ
である場合、その観測点はk番目のクラスターではなくi 番目のクラスターにおかれます。/math-d70a8fe7cc57982f3b8f0d400ab1c27e.png)
はk番目のクラスター内の観測点で、
はk番目のクラスターにあるクラスター中心のj 番目の変数に当たります。/math-f8290cc4abbfcc45ce670e3143067d20.png)