K-means法クラスター分析の結果を解釈するには

内容

  1. 1 K-means結果レポート
    1. 1.1 初期のクラスター中心
    2. 1.2 最終クラスター中心
    3. 1.3 クラスターサマリー
    4. 1.4 最終クラスター中心間の距離
    5. 1.5 ANOVA
  2. 2 K-Means法 クラスターメンバーシップと距離

K-means法結果レポート

初期のクラスター中心

K-meansクラスター分析での最初のステップはクラスター中心を見つけることです。階層的クラスター分析を小さなサンプルサイズで行い、適当な初期のクラスター中心を求めてください。または、クラスター数を指定してOriginが自動で十分に離れている値を初期のクラスター中心として設定します。この自動解析は外れ値に敏感にできています。ですので、分析を始める前に外れ値の有無を確認してください。

最終クラスター中心

最終クラスター中心表は最終クラスター中心値を提供します。

クラスターサマリー

クラスターサマリー表は各クラスターの統計値を表示します。

最終クラスター中心間の距離

全ての0では無い値が相対的に大きければクラスター結果は良いと判断できます。

ANOVA

ANOVA表(分散分析表)ではすべての値がクラスター分析に使用されるべきか判断を付ける事ができます。ANOVA表で、4つの変数すべてのp値が0.05よりも大きい場合、その値をこの分析から除外したほうがいいかもしれません。

K-Means 法クラスターメンバーシップと距離

メンバーシップ列を見ることでどのように観測データがクラスターにまとめられたのか分かります。距離列を見ることでそのグループ内のクラスター中心からどれだけ離れているかが分かります。

Note:距離の長い観測結果は外れ値である可能性があります。気を付けて確認を行い、必要に応じて分析から取り除いてください。