階層的クラスター分析の結果を解釈

階層クラスターレポートシート

記述統計

記述統計表は、変数が異なる尺度で測定されているか明らかにするために、変数の平均および標準偏差を観察するのに役立ちます。この場合、平均と標準偏差は非常に異なるので、分析の際に変数を標準化することをお勧めします。

距離行列

距離行列は実際の距離を提供し、観測値と変数の任意のペアに対して計算された類似性を示します。

クラスターステージ

クラスターステージ表は、観測値と変数がどのようにクラスター化されているかを詳しく示しています。変数と観測値が少ない場合に使用できます。サンプルサイズが大きい場合は、クラスターステージを可視化した樹形図を使うことをお勧めします。

樹形図

樹形図はクラスター分析の結果では最も重要です。これはすべてのサンプルをリストし、どの2つのクラスターがどのレベルの類似度で結合されたかを示します。スケール上の線の位置は、クラスターが結合した距離を示します。樹形図は、クラスター数を決定する便利なツールでもあります。考慮すべきクラスター数が適切であることを示すため、隣接するステップ間の差が急激に増加することに注意してください。詳細はこのチュートリアルを参照してください。

階層的スラスター分析ダイアログ(hcluster)を使って、ショートカットメニューから操作できる選択可能なノードを持つ系統樹を出力できるように設定できます。

Phylogenetic tree select node.png
  • サブツリーの入れ替えを使って現在選択したノード以下でクラスターの入れ替えが可能です。
  • このノードでリルートは、hclusterダイアログの出力では無効にされています。
  • ツリーをリセットは、すべての入れ替え操作をやり直し、元のツリー構造に戻します。
  • 新しいウィンドウにブランチを複製は、選択中のクラスターを新しいグラフウィンドウに出力します。

クラスターメンバーシップ

クラスターメンバーシップは分類後の詳細なグループ構造を提供します。