Übersicht Nicht-parametrische Statistik

Inhalt

Zusammenfassung

Nicht-parametrische Tests werden verwendet, wenn Sie nicht wissen, ob Ihre Daten einer Normalverteilung folgen, oder Sie bestätigt haben, dass Ihre Daten keiner Normalverteilung folgen.

Origin-Version mind. erforderlich: Origin 8.0 SR6

Was Sie lernen werden

Dieses Tutorial zeigt Ihnen:

  • Eine Einführung in nicht-parametrische Tests in Origin
  • Das Ausführen von nicht-parametrischen Tests für unterschiedliche praktische Situationen
  • Das Berechnen des Korrelationskoeffizienten in nicht-parametrischen Statistiken

Einführung: Nicht-parametrische Tests in Origin

Nicht-parametrische Tests erfordern keine Annahme einer Normalverteilung. Sie werden gemeinhin in den folgenden Situationen verwendet:

  • Kleiner Stichprobenumfang
  • Kategoriale/Binäre/Ordinale Daten
  • Normalverteilung kann nicht angenommen werden.
Nichtparametrisch Parametrisch
Daten aus einer beliebigen Verteilung Daten aus einer Normalverteilung
Kleine Stichprobe Große Stichprobe
Eine Stichprobe Wilcoxon-Rangtest mit Vorzeichen t-Test bei einer Stichprobe
Zwei Stichproben Unabhängige Stichproben
  • Mann-Whitney-Test
  • Kolmogorov-Smirnov-Test
t-Test bei zwei Stichproben
Verbundene Stichproben
  • Wilcoxon-Rang-Test mit Vorzeichen
  • Vorzeichentest
t-Test bei verbundenen Stichproben
Mehrere Stichproben Unabhängige Stichproben
  • Kruskal-Wallis-ANOVA
  • Mood-Median-Test
Einfache ANOVA
Verwandte Stichproben Friedman-ANOVA Einfache ANOVA mit wiederholten Messungen
Korrelation in Stichproben
  • Spearman
  • Kendall
Pearson

Beispiele

Tests bei einer unabhängigen Stichprobe

Der Wilcoxon-Rangtest mit Vorzeichen bei einer Stichprobe wurde entwickelt, um den Median einer Grundgesamtheit im Verhältnis zu einem festgelegten Wert zu untersuchen. Sie können dazu einen ein- oder beidseitigen Test wählen. Die Hypothesen des Wilcoxon-Rangtests mit Vorzeichen sind H0: Median = hypothetischer Median vs. H1: Median ≠ hypothetischer Median.
In diesem Beispiel interessiert sich ein Qualitätsingenieur in einem Betrieb dafür, ob der Median (oder Durchschnitt) des Produktgewichts gleich 166 ist. Zunächst werden zufällig 10 Produkte ausgewählt und ihr Gewicht gemessen. Die gemessenen Daten lauten:
151,5 152,4 153,2 156,3 179,1 180,2 160,5 180,8 149,2 188,0
Der Ingenieur führt einen Test auf Normalverteilung durch, um zu bestimmen, ob die Daten einer Normalverteilung folgen

  1. Öffnen Sie ein neues Arbeitsblatt und geben Sie die oben stehende Daten in Spalte A ein. Wählen Sie Statistik: Deskriptive Statistik: Test auf Normalverteilung... , um den Dialog Test auf Normalverteilung zu öffnen.
  2. Wählen Sie die Spalte A(X) als Datenbereich.
    Normality test.PNG
  3. Klicken Sie auf die OK, um die Ergebnisse zu erzeugen.
    Normailty test result.PNG


Von dem Ergebnis ausgehend, das den p-Wert = 0,03814 ausgibt, ist die Verteilung der Daten nicht normalverteilt bei einem Niveau von 0,05. Um einen Wilcoxon-Rang-Test mit Vorzeichen bei einer Stichprobe durchzuführen:

  1. Wählen Sie Statistik: Nicht-parametrische Tests: Wilcoxon-Rangtest mit Vorzeichen bei einer Stichprobe.
  2. Legen Sie Spalte A als Datenbereich fest.
  3. Geben Sie 166 im Textfeld Testmedian ein.
    Nonprarmetric test w1.PNG
  4. Klicken Sie auf die OK, um die Ergebnisse zu erzeugen.
    Nonprarmetric test w1 result.PNG

Gemäß dem Ergebnis wird die Nullhypothese bei einem Niveau von 0,05 zurückwiesen und geschlussfolgert, dass der Median gleich 166 ist.

Tests bei zwei unabhängigen Stichproben

Origin bietet zwei Tests für nicht-parametrische Statistiken von zwei unabhängigen Stichprobensystemen: den Mann-Whitney-Test und den Kolmogorov-Smirnov-Test bei zwei Stichproben.

Dieses folgende Beispiel zeigt die praktische Verwendung des Mann-Whitney-Tests. Die Abriebfestigkeit (in mg) wird für zwei Reifentypen (A und B) gemessen, wobei 8 Versuche für jeden Reifentypen durchgeführt werden. Die Daten sind indiziert und werden in der Datei abrasion_indexed.dat gespeichert.

  1. Importieren Sie die Datei abrasion_indexed.dat aus \Samples\Statistics\.
  2. Wählen Sie Statistik: Nicht-parametrische Tests: Mann-Whitney-Test, um das Dialogfeld zu öffnen.
  3. Behalten Sie als Form der Eingabedaten die Option Indiziert bei.
  4. Legen Sie Spalte A als Gruppenbereich fest und die Spalte B als Datenbereich.
  5. Aktivieren Sie das Kontrollkästchen Genauer p-Wert.
    Mwtest dlg.png
  6. Klicken Sie auf die Schaltfläche OK, um Ergebnisse zu erzeugen, die sich im Blatt MannWhitney1 befinden.
    Mwtest result.png
    • U: Die U-Statistik kann einfach aus dem Rang der zwei Gruppen berechnet werden. Es handelt sich hier um die Anzahl der Male, die ein Score in der 2. Gruppe größer ist als ein Score in der 1. Gruppe.
    • Z: Die approximative Statistik des Tests auf Normalverteilung. Sie bietet eine hervorragende Approximation mit wachsender Stichprobengröße.
    • Genaue Wahrsch: Der genaue P-Wert, der nur verfügbar ist, wenn Genauer p-Wert im Dialog aktiviert ist. Er kann jedoch sehr viel CPU-Zeit in Anspruch nehmen, wenn große Stichprobenumfänge bearbeitet werden.
    • Asymp. Wahrsch.: Der asymptotische p-Wert wird aus der approximativen Statistik des Tests der Normalverteilung Z berechnet.

Nicht-parametrische Messungen der Korrelation

Der Korrelationskoeffizient wird zur Messung der Beziehung zwischen zwei Variablen verwendet. Es ist möglich, den Korrelationskoeffizienten für eine nicht-parametrische Statistik zu verwenden.

Origin bietet zwei nicht-parametrische Methoden zum Messen der Korrelationen zwischen Variablen:

  • Spearman: Häufige verwendete Alternative zu Pearsons Korrelationskoeffizient. Spearmans Koeffizient kann verwendet werden, wenn sowohl die abhängige als auch die unabhängige Variable ordinal ist oder wenn eine Variable ordinal und die andere kontiniuerlich ist. Spearmans Koeffizient kann jedoch auch geeignet sein, wenn beide Variablen kontinuierlich sind.
  • Kendall: Wird mit ordinalen Variablen zum Auswerten von Übereinstimmungen unter Prüfern verwendet.

Das folgende Beispiel zeigt, wie der Korrelationskoeffizient für nicht-parametrische Situationen berechnet wird.

  1. Importieren Sie die Datei abrasion_raw.dat aus \Samples\Statistics\.
  2. Markieren Sie Spalte A und Spalte B. Wählen Sie Statistik: Deskriptive Statistik: Korrelationskoeffizient, um den Dialog corrcoef zu öffnen.
  3. Aktivieren Sie Spearman und deaktivieren Sie Pearson.
    Corrcoef nonpara.png
  4. Klicken Sie auf die Schaltfläche OK, um die Ergebnisse in dem Blatt CorrCoef1 zu erzeugen.

Aus dem Wert von Spearman Corr. kann geschlussfolgert werden, dass der Abrieb zwischen Reifen A und Reifen B stark miteinander korreliert.
Corrcoef nonpara result.png

Wilcoxon-Vorzeichen-Rang-Test bei verbundenen Stichproben

Nun werden die zwei Mediane von Reifen A und Reifen B aus dem obenstehenden Beispiel verglichen.

  1. Arbeiten Sie weiterhin mit der Datei abrasion_raw.dat aus \Samples\Statistics\.
  2. Wählen Sie Statistik: Nicht-parametrische Tests: Wilcoxon-Rangtest mit Vorzeichen bei verbundenen Stichproben.
  3. Legen Sie Spalte A als Ersten Datenbereich fest und Spalte B als Zweiten Datenbereich.
    Nonpara w2 test.PNG
  4. Klicken Sie auf die Schaltfläche OK, um die Ergebnisse zu erzeugen.
    Nonpara w2 test result.PNG

Sie können schlussfolgern, dass die zwei Mediane signifikant unterschiedlich sind. Der Median von Gruppe A ist größer als der Median von Gruppe B.

Test bei mehreren unabhängigen Stichproben

In diesem Beispiel wird der Kraftstoffverbrauch von vier Autoherstellern gemessen. Es werden mehrere Versuche für jeden Autohersteller durchgeführt. Die Ergebnisse werden in der Beispieldatentabelle aufgeführt.

GMC/mpg Infinity/mpg Saab/mpg Kia/mpg
26,1 32,2 24,5 28,4
28,4 34,3 23,5 34,2
24,3 29,5 26,4 29,5
26,2 35,6 27,1 32,2
27,8 32,5 29,9
30,6 30,2
28,1

Um auszuwerten, ob der Kraftstoffverbrauch von vier Autoherstellern gleich ist und welche Marke die effektivste, wird die Kruskal-Wallis-ANOVA als nicht parametrische Testmethode ausgewählt.

  1. Erstellen Sie eine neue Arbeitsmappe in Origin, kopieren Sie die Beispieldaten und fügen Sie sie ein.
  2. Wählen Sie Statistik: Nicht-parametrische Tests: Kruskal-Wallis-ANOVA, um das Dialogfeld kwanova zu öffnen.
  3. Wählen Sie Roh als Form der Eingabedaten.
  4. Klicken Sie auf die dreieckige Schaltfläche Button Select Data Right Triangle.png neben Eingabe und klicken Sie dann auf Alle Spalten im Kontextmenü.
    Tutorial Nonparametric Test 001.png
  5. Klicken Sie auf OK, um Ergebnisse zu erzeugen. Die Ergebnisse werden in einem neuen Arbeitsblatt KWANOVA1 gespeichert.

Der P-Wert lässt uns schlussfolgern, dass der Kraftstoffverbrauch der vier Autohersteller sich signifikant voneinander unterscheidet.
Tutorial Nonparametric Test 002.png



Aus der Rangtabelle lässt sich ersehen, dass Infinity der effizienteste Marke ist.
Tutorial Nonparametric Test 003.png


Test bei mehreren verwandten Stichproben

Augenärzte untersuchen, ob eine Helium-Neon-Laser-Therapie bei Kindern angewendet werden kann. Sie haben Daten von 2 Gruppen, 6-10 Jahre und 11-16 Jahre. Jeder Datensatz enthält die Untersuchungsergebnisse von 5 Personen und den Differenzen in ihrer Sehkraft nach drei Therapiezyklen. Die Ergebnisse werden in der Datei eyesight.dat gespeichert.

Aufgrund des kleinen Stichprobenumfangs ist eine nicht-parametrische Statistik in der Analyse erforderlich. Befolgen Sie bitte die untenstehenden Schritte:

  1. Importieren Sie die Datei eyesight.dat aus \Samples\Statistics\.
  2. Wählen Sie Statistik: Nicht parametrische Tests: Friedman-ANOVA, um das Dialogfeld friedman zu öffnen.
  3. Wählen Sie Spalte A als Datenbereich, Spalte C als Faktorbereich und Spalte D als Subjektbereich.
    Tutorial Nonparametric Statistics 004.png
  4. Klicken Sie auf die OK, um die Ergebnisse zu erzeugen.

Der p-Wert von Origin Analysis Case 10.png ist 0,0067379, also weniger als 0,05. Die Grundgesamtheiten sind signifikant unterschiedlich und weisen damit darauf hin, dass die Therapie für die Altersgruppe 6-10 wirksam ist.
Tutorial Nonparametric Statistics 005.png

Auf ähnliche Weise wählen Sie Spalte B als Datenbereich. Die verbleibenden Einstellungen der Eingabe entsprechen denen aus Schritt 3 oben.

Tutorial Nonparametric Statistics 006.png


Überprüfen Sie das Ergebnis. Es ist zu sehen, dass der p-Wert von Origin Analysis Case 16.png 0,02599 beträgt, weniger als 0,05 oder 0,10. Daher können Sie schlussfolgern, dass die Sehkraft von 11-16-jährigen Personen nach drei Therapiezyklen besser ist.

Tutorial Nonparametric Statistics 007.png

Außerdem ist zu sehen, dass Origin Analysis Case 10.png>Origin Analysis Case 16.png, d.h., die He-Ne-Laser-Therapie funktioniert besser bei Kindern im Alter von 6 bis 10. Je früher Kinder mit der Therapie beginnen, desto mehr kann sich ihre Sehkraft verbessern.