Algorithmen (Kolmogorov-Smirnov-Test bei zwei Stichproben)
KS-Test-Algorithm
Die Vorgehensweise unten basiert auf NAG-Algorithmen.
Es werden zwei unabhängige Stichproben betrachtet, X und Y, mit der Größe und . Sie werden als bzw. bezeichnet. Angenommen, F(x) und G(x) stellen ihre jeweiligen unbekannten Verteilungsfunktionen dar. Weiterhin wird angenommen, dass und die Stichprobenwerte der empirischen Verteilungsfunktionen bezeichnen.
Die Nullhypothese: F(x)=G(x)
Die Alternativhypothese ist :F(x)<>G(x), der zugehörige p-Wert ist eine beidseitige Wahrscheinlichkeit;
oder :F(x)>G(x), der zugehörige p-Wert ist eine obere Wahrscheinlichkeit,
oder : F(x)<G(x), der zugehörige p-Wert ist eine untere Wahrscheinlichkeit.
Im ersten Fall von stellt die Statistik die größte absolute Abweichung der zwei empirischen Verteilungsfunktionen dar.
Im zweiten Fall von stellt die Statistik die größte positive Abweichung zwischen der empirischen Verteilungsfunktion der ersten Stichprobe und der empirischen Verteilungsfunktion der zweiten Stichprobe dar, das heißt .
Im dritten Fall von stellt die Statistik die größte positive Abweichung zwischen der empirischen Verteilungsfunktion der zweiten Stichprobe und der empirischen Verteilungsfunktion der ersten Stichprobe dar, das heißt .
KS-test2 gibt auch die Standardstatistik zurück,
wobei vielleicht ,, abhängig von der Wahl der Alternativhypothese.
Die Verteilung der Statistik konvergiert asymptotisch zu einer Verteilung nach Smirnov, wenn und steigen. Es wird die Wahrscheinlichkeit berechnet, unter der Nullhypothese einen Wert der Teststatistik zu erhalten, der so extrem ist, wie der beobachtete Wert.
Bei und steht eine genaue Methode nach Kim und Jinrich zur Verfügung. Ansonsten wird berechnet mit Hilfe der von Kim and Jenrich (1973) vorschlagenenen Approximationen.
Beachten Sie, dass die verwendete Methode nur für kontinuierliche theoretische Verteilungen verwendet wird.
Diese Methode berechnet die beidseitige Wahrscheinlichkeit. Die einseitigen Wahrscheinlichkeiten werden mit Hilfe der beidseitigen Wahrscheinlichkeit geschätzt. Dies ist eine gute Schätzung für kleine , das heißt , wird aber schwächer für größere .
Weitere Einzelheiten zum dem Algorithmus finden Sie unter nag_2_sample_ks_test (g08cdc).
|