アルゴリズム (Mann-Whitney検定)

2つの独立した標本F(x)\,G(y)\,について、サンプルサイズが n_1\,\! および n_2\,\! であると考えます。サンプルデータはそれぞれ x_1,x_2,\ldots ,x_{n_1}\,\! および y_1,y_2,\ldots ,y_{n_1}\,\! と表します。

帰無仮説 :H_0: F(x) = G(y)\,と表し、2つの分布は同じです。これは対立仮説H_1\, に対して検定が実行されます。内容としては、

H_1: F(x) \neq G(y)\,;または
x\,の傾向がy\,よりも大きくなる場合、H_1: F(x) < G(y)\,\!;または
x\,の傾向がy\,よりも小さくなる場合、H_1: F(x) > G(y)\,\!

検定手順は以下のステップのようになります。

  •  x_i \,\! y_i\,\! を1つのグループに組み合わせます。
  • それらを昇順で順位付けします。同順位のものは、それらの順位の平均を受け取ります。r_{1i}\,\! x_i \,\!に割り当てられる順位( i=1,2,\ldots ,n_1 において)と、  y_i\,\!に割り当てられる順位(  j=1,2,\ldots ,n_2において)とします。
  • 順位の合計を計算します。
     S_1=\sum_{I=1}^{n_1}r_{1i}\,\!, および  S_2=\sum_{I=1}^{n_2}r_{2j}\,\!です。
  • 検定する統計量 U\, は次のように表すことができます。
     U=S_1-\frac{n_1(n_1+1)}2\,
  • おおよその一般検定統計量 z\,は次のように計算されます。
    z=\frac{U-M(U)\pm \frac 12}{\sqrt{Var(U)}} \,
    ここで
    M(U)=\frac{n_1n_2}2 \,
    および
    Var(U)=\frac{n_1n_2(n_1+n_2+1)}{12}-\frac{n_1n_2}{(n_1+n_2)(n_1+n_2-1)}\times TS \,
    ここで
    TS=\sum_{j=1}^\tau \frac{(t_j)(t_j-1)(t_j+1)}{12}\,.

     \tau \, は、標本内で同順位の数で、 t_j\, は、j 番目のグループの同順位数です。
    同順位が存在しない場合、 U \, の分散は\frac{n_1n_2(n_1+n_2+1)}{12}\,のようになります。

 

このアルゴリズムの詳細は、nag_mann_whitney (g08amc)をご覧下さい。