アルゴリズム (正規性の検定)

内容

  1. 1 シャピロ・ウイルク検定
  2. 2 コルモゴルフ・スミルノフ検定
  3. 3 リリーフォースの正規性の検定
  4. 4 Anderson-Darling検定
  5. 5 D'Agostino-K 二乗
  6. 6 Chen-Shapiro検定

シャピロ・ウイルク検定

昇順または降順のどちらかでソートされた観測データ  X\{x_1,x_2,\ldots x_n\}  が与えられる場合、シャピロ・ウィルクのW統計量は次のように定義されます。

w=\frac{\left (\sum_{i=1}^n a_ix_i\right)^2}{\sum_{i=1}^n (x_i-\bar{x})^2}

ここで

\bar{x}=\frac{1}{n}\sum_{1}^n x_i

上記は標本の平均で、 aiのi=1, 2, …, n は数学的な重みであり、その値は、サンプルサイズnだけに依存します。

Originで使われるアルゴリズムは、Patrick Royston (1995)による Applied Statistics Algorithm R94 を利用しています。関数はサンプルサイズ3をサポートしています。

自由度(DF)は、サンプルサイズと同じです。

コルモゴルフ・スミルノフ検定

Originは、この統計量を計算するのに、NAG関数nag_1_sample_ks_test (g08cbc) を呼び出します。アルゴリズムについての詳細は、関連のNAG文書を参照して下さい。

リリーフォースの正規性の検定

リリフォース検定は、コルモゴルフ-スミルノフ検定を改良したもので、統計値はコルモゴルフ-スミルノフ検定と同じ方法で計算されます。しかし、p値はリリーフォース検定がデータの平均と分散を考慮しないので、コルモゴルフ-スミルノフ検定のp値とは異なります。DallalとWilkinson (1986)の方法がp値の計算に使われます。

Anderson-Darling 検定

昇順または降順のどちらかでソートされた観測データ  X\{x_1,x_2,\ldots x_n\}  が与えられる場合、Anderson Darling統計量は次のように定義されます。

A2 = - n - S

ここで

S=\sum_{i=1}^n \frac{2i-1}{n}[lnF(x_i)+ln(1-F(x_n+1-i))]

FF 分布の累積分布関数を表しています。

D'Agostino-K 二乗

Chen-Shapiro検定

昇順または降順のどちらかでソートされた観測データ  X\{x_1,x_2,\ldots x_n\}  が与えられる場合、Chen-Shapiro 統計量は次のように定義されます。

QH =\sqrt{N}(1-\frac{1}{(n-1)S}\sum_{i=1}^{n-1}\frac{x_{i+1}-x_i}{H_{i+1}-H_i})

ここで

H_i = \Phi^{-1} ((i-3/8)/(n+1/4)) \Phi^{-1}  は標準正規分布の逆になります。