分布フィット (Proのみ)
Distribution-Fit
分布フィットは、データをパラメトリックな分布でフィットします。これは、ユーザの手元にあるデータの分布を確認し、分布のパラメータを推定します。
手順の流れ
分布/モデルの選択
離散データまたは連続データ
データが連続か離散か選択し、分布の種類を選択します。データに小数点が含まれる場合、連続分布からのデータです。データがすべて整数の場合、連続または離散分布の双方を選択できます。
適切なモデルの選択
データの平均値、標準偏差、歪度といった統計値や、ヒストグラム、CDFプロット等の統計グラフを確認して、データに適切な分布を決定します。モデルを特定できない場合、複数のモデルを選択することもできます。
出力結果を選択
記述統計
- 分位数:
- 分位数は、分位数表に出力され、変数がどのように分布しているかを明らかにします。これは、最小値、第1四分位数(Q1)、中央値、第3四分位数(Q3)、最大値、四分位範囲(Q3 - Q1)、範囲(最大 - 最小)を含みます。
- モーメントとその他のモーメント:
- 基本統計値は、記述統計表に出力されます。これには、平均値、標準偏差(SD)、平均のSE、平均の下位/上位95%CIとその他のモーメントで指定した値が含まれます。
プロット
- ボックスチャート:
- ボックスチャートは、簡易統計の重要な値をグラフフィカルに表現します。
- ヒストグラム:
- ヒストグラムは、データの歪度や、すその状態、複数モデルの存在、データの外れ値といったプロパティを表示します。PDF曲線を重ね合わせたヒストグラムは、異なる分布のPDF曲線の形状と比較し、根本的な分布を識別するのを助けます。
- 累積分布関数プロット:
- 累積分布関数(CDF)グラフは、分布がデータを良くフィットしているか決定するために便利です。
- 確率プロット:
- データセットが与えられた分布に従うかどうか検定するために確率プロットを使用します。これは、X軸上に観測した累積パーセント、Y軸上に期待累積パーセントを持つグラフを表示します。すべての散布データが参照線に近ければ、そのデータセットは与えられた分布に従うということができます。
Notes:異なる変数を比較したい場合、同じグラフ中に同じタイプのプロットを配置チェックボックスを選択してください。これにより、比較のために1つのグラフに変数を配置します。ヒストグラムの場合、積上げ形式で同じビンサイズになります。 |
フィットの良さ
- Kolmogorov-Smirnov:
- 簡単かつ直感的な一般的な検定方法です。
- Kolmogorov-Smirnov(修正):
- 修正Kolmogorov-Smirnov手法は、D’Agostino と Stephens (1986)によるものです。Kolmogorov-Smirnov (KS) 検定よりも統計的に強力です。
- Anderson-Darling:
- Kolmogorov-Smirnov 検定よりも、すそにより重みを置いています。外れ値があるデータの場合にK-Sよりも強力です。
平均値または分散の検定
基本の検定の項目を使用して、データの平均や分散が指定した値と等しいかどうか、検定することができます。
標準偏差がわかる場合はz検定、平均の場合はt検定を選択します。