Algorithmus (median)


Die Vorgehensweise unten basiert auf NAG-Algorithmen.

Der Mediantest untersucht die Differenz zwischen K\,\! Stichproben der Größen n_1,n_2,...,n_k\,\!, die bezeichnet werden mit

x_1,x_2,....x_{n_1};x_{n_1+1},x_{n_1+2},...,x_{n_1+n_2};...;x_{n_1+n_2+...+n_{i-1}+1},...x_{n_1+n_2+...+n_i}

Wenn der Medianwert nicht vom Anwender gegeben ist, werden die kombinierten Daten aus allen Gruppen sortiert und der Median berechnet:

md=(x_{(n/2)}+x_{(n/2+1)})/2\,\! , wenn n gerade ist;md=x_{((n+1)/2)}\,\!, wenn n ungerade ist.

Wobei n= \sum_{i=1}^k n_i, x_{(1)},...,x_{(n)}\,\! die geordneten Daten aller Beoachtungen von klein zu groß sind.

Der Test fährt fort, indem er eine Häufigkeitentabelle erstellt und die Anzahl der Werte in jeder Stichprobe über und unter dem Median der gemeinsamen Stichprobe angibt:

Stichprobe 1 Stichprobe 2 ?? Stichprobe K Gesamtsumme
Score \le md n_{11}\,\! n_{12}\,\! n_{1k}\,\! R_{1}\,\!
Score > md\,\! n_{21}\,\!…… n_{22}\,\!…… n_{2k}\,\!…… R_{2}\,\!……
Gesamtsumme n_{1}\,\!…… n_{2}\,\! n_{k}\,\! n\,\!

Die x^2\,\!Statistik für alle nicht leeren Stichproben wird berechnet mit:

x^2=\sum_{j=1}^k\sum_{i=1}^2(n_{ij}-e_{ij})^2/e_{ij}\,\! wobei e_{ij}=R_in_j/n\,\!

Das Signifikanzniveau stammt aus der Verteilung x^2\,\! mit k-1\,\!Freiheitsgraden, wobei k-1\,\! die Anzahl der nicht leeren Stichproben ist. Es wird eine Meldung gedruckt, wenn eine Zelle einen erwarteten Wert, der kleiner als 1 ist, besitzt oder mehr als 20% der Zellen erwartete Werte besitzen, die kleiner als 5 sind.