Algorithmen (ROC-Kurve)
ROCCurve-Algorithm
In diesen Teil werden die folgenden Schreibweisen verwendet.
: Testergebnis Score für Fall
: Anzahl der wahren positiven Entscheidungen
: Anzahl der falschen negativen Entscheidungen
: Anzahl der wahren negativen Entscheidungen
: Anzahl der falschen positiven Entscheidungen
: Anzahl der Fälle mit negativem tatsächlichen Zustand
: Anzahl der Fälle mit positivem tatsächlichen Zustand
: Anzahl der wahren negativen Fälle mit Testergebnissen, die gleich sind mit
: : Anzahl der wahren positiven Fälle mit Testergebnissen größer als
: : Anzahl der wahren positiven Fälle mit Testergebnissen, die gleich sind mit
: : Anzahl der wahren negativen Fälle mit Testergebnissen kleiner als
ROC-Werte
1- Spezifizität (X): /math-0c5a60aa9d534a69c504fac187790c07.png)
Sensitivität (Y): /math-0760bde0cf79e5793835075ee3d2bcdd.png)
Der Bereich unter der ROC-Kurve
Angenommen, ist die Skalierung der Testergebnisvariable. Bezeichnen Sie mit den Werten für Fälle mit negativem tatsächlichen Zustand und mit den Werten für Fälle mit positivem tatsächlichen Zustand. Die nichtparametrische Approximation der "wahren” Fläche unter der ROC-Kurve ist
/math-5f79866cf3c0dc05169d11fdd67fd6d7.png) /math-569223521931231c409785c91f0084b2.png)
wobei der Stichprobenumfang von + ist, der Stichprobenumfang von - ist und
/math-3fd91dcf034941370a5ed5d855390a84.png)
Beachten Sie, dass der beobachtete Bereich unter der ROC-Kurve ist, der aufeinander folgende Punte mit einer geraden Linie verbindet. d.h. durch die Trapezregel.
Eine alternative Berechnungsmöglichkeit für ist folgende:
/math-1ea8d817ad6b5f332af7ec49c30dc22d.png)
Der SE des Bereichs unter der Statistik der ROC-Kurve
Die Standardabweichung von wird geschätzt mit:
/math-fde8eb47f42d8792fdc2e76131a46863.png)
wobei
![Q_{1=\frac 1{n_{-}n_{+}^2}}\sum n\__{=j}[n_{+>j}^2+n_{+>j}n_{+=j}+\frac{n_{+>j}^2}3] \,\! Q_{1=\frac 1{n_{-}n_{+}^2}}\sum n\__{=j}[n_{+>j}^2+n_{+>j}n_{+=j}+\frac{n_{+>j}^2}3] \,\!](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm_(ROCCurve)/math-99adafc3fccb24a1cf7264ad44e4e60a.png)
und
![Q_{2=\frac 1{n_{-}^2n_{+}}}\sum n_{+=j}[n_{->j}^2+n_{->j}n_{-=j}+\frac{n_{-=j}^2}3] \,\! Q_{2=\frac 1{n_{-}^2n_{+}}}\sum n_{+=j}[n_{->j}^2+n_{->j}n_{-=j}+\frac{n_{-=j}^2}3] \,\!](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm_(ROCCurve)/math-aafdd6330c76e9cd18c4af812cd53052.png)
Das asymptotische Konfidenzintervall des Bereichs unter der ROC-Kurve
Ein 2-seitiges asymptotisches Konfidenzintervall für den wahren Bereich unter der ROC-Kurve ist
/math-235de6eb21ed53705c7979a6ce5fb929.png)
Der asymptotische P-Wert unter der Nullhypothese, dass , vs. die Alternativhypothese, dass /math-8d97b516153b32dc87de1d6354170e6f.png)
Da asymptotisch normal unter der Nullhypothese ist, dass , können wir den asymptotischen P-Wert unter der Nullhypothese berechnen, dass vs. die Alternativhypothese, dass /math-8d97b516153b32dc87de1d6354170e6f.png)
/math-d39e6085797aa9607fe719b7472fb2e7.png)
Im nichtparametrischen Fall
/math-72938a409015c7ed5745f164b9c6bd99.png)
/math-bc5a5645b9c414917dd8c39d32c961c6.png)
Optimaler Grenzpunktwert
Der Grenzpunktwert wird durch die Gleichheitsmaximierung dieser zwei Größen (SpEqualSe) definiert. Das ist min( abs(1-x-y) ) für die ROC-Kurve.
|