アルゴリズム (Moodのメディアン検定)


以下の説明は、NAGのアルゴリズムから引用したものです。

メディアン検定は、K\,\!サンプルサイズ n_1,n_2,...,n_k\,\!を持つ次のように表される2つ以上の独立した標本間の差を調べるものです。

x_1,x_2,....x_{n_1};x_{n_1+1},x_{n_1+2},...,x_{n_1+n_2};...;x_{n_1+n_2+...+n_{i-1}+1},...x_{n_1+n_2+...+n_i}

メディアンの値はユーザが与えるのではなく、すべてのグループを組み合わせたデータが保存され、そこからメディアンが次式を使って計算されます。

nが偶数の場合、md=(x_{(n/2)}+x_{(n/2+1)})/2\,\!;nが奇数の場合、md=x_{((n+1)/2)}\,\!

ここで n= \sum_{i=1}^k n_iとなり、x_{(1)},...,x_{(n)}\,\! は、すべての観測データを小さい方から大きい方に並べたデータです。

検定は、プールドサンプルのメディアンの上下にいける各標本の度数表を作成します。

  標本1 標本2 …… 標本K 合計
Score \le md n_{11}\,\! n_{12}\,\!   n_{1k}\,\! R_{1}\,\!
Score > md\,\! n_{21}\,\! n_{22}\,\!   n_{2k}\,\! R_{2}\,\!
合計 n_{1}\,\! n_{2}\,\!   n_{k}\,\! n\,\!

すべての非空の標本に対するx^2\,\! の統計量は次の式で計算されます。

x^2=\sum_{j=1}^k\sum_{i=1}^2(n_{ij}-e_{ij})^2/e_{ij}\,\!となり、e_{ij}=R_in_j/n\,\!です。

有意水準は、 x^2\,\!分布(自由度k-1\,\! )からのもので、k-1\,\! は非空の標本の数です。セルが1より小さい期待値を持つ場合、または20%以上のセルが5より小さい期待値を持つ場合、メッセージが出力されます。