hcluster(Pro)

メニュー情報

統計:多変量解析:階層的クラスター分析

概要

階層的クラスター分析を実行します

追加の情報

これはOrigin Proのみの機能です。

必要なOriginのバージョン: Origin 8.6

コマンドラインでの使用法

  1. hcluster irng:=2:5 label:=1 number:=2;
  2. hcluster irng:=4:15 obj:=1 number:=3;

Xファンクションの実行オプション

スクリプトからXファンクションにアクセスする場合、追加のオプションスイッチについてのページを参照してください。

変数

表示
変数
I/O

データ型
デフォルト
説明
変数 irng

入力

Range

<active>
階層的クラスター分析のためのデータ範囲を選択します。Origin 2020b以降、[Book]Sheet!(N1:N2) 形式の短縮構文を使用できます。ここで、N1は列の連続した範囲の開始の列番号、N2は終了の列番号です。[Book]Sheet!([Book]Sheet!N1:N2,[Book]Sheet!N3:N4) の形式の非連続データも使用できます。
観測値ラベル label

入力

Range

<optional>
観測値のラベルを選択します。ラベルが選ばれた場合、X軸目盛りとして樹形図に表示されます。このオプションは、クラスター観測値 を選択したときのみ表示されます。
クラスター obj

入力

int

0
オブジェクトの種類を指定します。

オプションリスト

  • 観測値
    クラスターの観測値です。
  • 変数
    クラスターの変数です。
クラスター法 link

入力

int

2
クラスターと新規のクラスター間の距離を計算するリンク法を選びます。0から開始する値ですが、明瞭さのために文字列値 (near のような)をお勧めします。

オプションリスト

  • near:最短距離
    基準のクラスターからの距離が最も短い2つのクラスターが統合されて新しいクラスターになります。または単連結法とも呼ばれています。
  • furth:最長距離
    基準のクラスターからの距離が最も長い2つのクラスターが統合されて新しいクラスターになります。または完全連結法とも呼ばれています。
  • group:郡平均
    2つの距離の平均で2つのクラスターが統合されて新しいクラスターになります。
  • centroid:重心
    重心はクラスター中心間の距離が最大になるように生成されます。
  • median: 中央値
    1つのクラスター内にある物ともう1つのクラスター内にある物の中央値になります。
  • ward:Ward
    クラスター内分散が最小になるようにクラスターが統合されます。

結合法の詳細については結合法のアルゴリズムをご覧ください。

距離のタイプ dist1

入力

int

0
obj が観測値のときに階層的クラスター分析での距離のタイプを選択します。0から開始する値ですが、明瞭さのために文字列値 (euc のような)をお勧めします。

オプションリスト:

  • euc:ユークリッド距離
    2つの観測値間の差の二乗和の平方根を取った値です。
  • squ:平方ユークリッド距離
    2つの観測値間の差の二乗和を取った値です。
  • city:City block距離
    2つの観測値間の絶対差を取った値です。またはマンハッタン距離とも呼ばれています。
距離のタイプ dist2

入力

int

0
obj変数 のときに階層的クラスター分析での距離のタイプを選択します。0から開始する値ですが、明瞭さのために文字列値 (corr のような)をお勧めします。

オプションリスト

  • corr:相関
    1と相関した2つの変数の違いをもとにしています。
  • abs:絶対相関
    1と絶対相関した2つの変数の違いをもとにしています。
標準化変数 std

入力

int

0
変数を標準化する方法を指定します。このオプションは、obj観測値 を選択したときのみ表示されます。0から開始する値ですが、明瞭さのために文字列値 (snd のような)をお勧めします。

オプションリスト

  • none:なし
    変数は標準化されません。
  • snd:Z スコア (N(0, 1) で正規化)
    標準正規分布に変数を変換します。
  • range: (0, 1) に正規化
    変数は0から1の範囲で変換されます。
クラスターの数 number

入力

int

1
クラスターの数を指定します。
クラストロイド検索 stat

入力

int

0
クラストロイド(最大/最小代理変数/観測値)を検索する手法を指定します。

オプションリスト

  • sd:Sum of distances(距離の和)
    クラスター内の全ての観測値/変数から測った距離の和を使用して、クラストロイドを検索します。
  • md:Maximum distance(最大距離)
    クラスター内の全ての観測値/変数から測った距離の中で最大のものを使用してクラストロイドを検索します。
  • ssd:Sum of squares of distances(距離の二乗和)
    クラスター内の全ての観測値/変数から測った距離の二乗和を使用して、クラストロイドを検索します。
相違行列 dissimilarity

入力

int

0
距離行列を出力するかどうかを指定します。オブジェクト数が大きい場合、この距離行列はレポート内ではなく個別のワークシートに表示されます。1 = する, 0 = しない
クラスターステージ stage

入力

int

1
クラスターステージを出力するかどうかを指定します。1 = する, 0 = しない
クラスター中心 center

入力

int

0
クラスター中心を計算するかどうかを指定できます。このオプションは、obj観測値 を選択したときのみ表示されます。1 = する, 0 = しない
クラスター中心間の距離 distc2c

入力

int

0
クラスター中心間の距離を計算するかどうかを指定できます。このオプションは、obj観測値 を選択したときのみ表示されます。1 = する, 0 = しない
観測とクラスター間の距離 disto2c

入力

int

0
各観測値とクラスター中心間の距離を計算するかどうかを指定できます。このオプションは、obj観測値 を選択したときのみ表示されます。1 = する, 0 = しない
樹形図 dendrogram

入力

int

1
樹形図を表示するかどうかを指定できます。1 = する, 0 = しない
樹形図を表示 ngraph

入力

int

0
樹形図を1つのグラフで表示するかクラスターごとに別々に表示するかを指定します。これは樹形図が1のときのみ利用できます。0から始まる値です。

オプションリスト

  • 樹形図を1つのグラフ内に表示します。別々のクラスターは色分けされています。
  • クラスターの樹形図を別々のグラフとして表示します。各クラスターごとに1つのグラフになります。
方向 orient

入力

int

0
樹形図の向きを指定します。これは樹形図にチェックがついている時のみ利用できます。

オプションリスト

  • 0: 垂直
    樹形図を垂直にプロットします。
  • 1: 水平
    樹形図を水平にプロットします。
  • 2: 円
    円形の樹形図をプロットします。
クラスターレポート rt

出力

ReportTree

<new>
階層的クラスター分析レポートのシートを指定します。
クラスターメンバーシップ rd

出力

ReportData

<新規>
クラスターメンバーシップと観測値とクラスター間の距離を表示するシートを指定します。
距離行列 rddist

出力

ReportData

<新規>
クラスターのためのオブジェクトの数が大きすぎるときに距離行列のためのシートを指定します。これはダイアログでは表示されません。
プロットデータ rdplot

出力

ReportData

<new>
プロットデータのためのシートを指定します。これはダイアログでは表示されません。
クラストロイド情報 clustroid

入力

int

1
クラストロイド(最大/最小代理変数/観測値)情報を検索する手法を指定します。

説明

この関数は、範囲データに対して階層的クラスター分析を実行します。詳細情報は、 クラスター分析をご覧下さい。

サンプル

  1. \Samples\Graphing\US Mean Temperature.datファイルをインポートします。
  2. 次のスクリプトを実行します。
hcluster irng:=4[1]:15[100] number:=5 rd:=[<input>]<input> -r 2;

アルゴリズム

階層的クラスター分析のアルゴリズムをご覧ください。

参考文献

階層的クラスター分析の参考文献をご覧ください。

関連 X ファンクション

pca, kmeans, discrim