Algorithmen (Kreuztabelle)CrossTabs-Algorithm
Kreuztabellen werden auch als Kontingenztabellen bezeichnet. Dieses Hilfsmittel wird verwendet, um das Vorhandensein bzw. die Stärke der Assoziation zwischen Variablen zu untersuchen.
Kreuztabellenmethode
- Häufigkeitszählung
- Rand und Zelle
- Tabelle der Chi-Quadrat-Tests
- Tabelle von Fishers Exaktem Test (nur 2 x 2)
- Assoziationsmaße
- Übereinstimmungsmaße
- Quotenverhältnis und Relatives Risiko (nur 2 x 2)
- Cochran-Mantel-Haenszel
Häufigkeitszählung
Definieren
-
sind eindeutige Werte der Zeilenvariable in aufsteigender Reihenfolge, d.h. /math-afa34668ee4178285b425ccef9790f80.png) -
sind eindeutige Werte der Spaltenvariable in aufsteigender Reihenfolge, d.h. /math-443ff437c68afb202ac14bf0d0046751.png) -
ist die Häufigkeit in Bezug zur Zelle /math-5270ae675fac24f97e172dcd9b18fa92.png) -
ist die Teilsumme der ten Zeile -
ist die Teilsumme der ten Spalte -
ist die Gesamtanzahl.
Rand und Zelle
Statistik |
Formel und Erklärung |
Anzahl |
/math-e5896e2e0b803ed74e0a3ee9ec61d795.png) |
Erwartete Anzahl |
/math-f30a2b0e3370f0814c959957a224dd89.png) |
Prozent Zeile |
/math-19639d8682c50097fbde98f448d6a16a.png) |
Prozent Spalte |
/math-589eb80e404ec249dc486616aaf78822.png) |
Prozent gesamt |
/math-3357da1c1efa26e265b977d3b0670c1c.png) |
Residuum |
/math-56959063ec3204d0aeeae97829b457f3.png) |
Std. Residuum |
/math-c48259c9651c2f6503d9960937e6533e.png) |
Kor. Residuum |
/math-c0843832a859ffc34d11d9099f6428b0.png) |
Chi-Quadrat-Statistik
Statistik |
Formel und Erklärung |
Freiheitsgrade |
Pearsons Chi-Quadrat |
/math-16abb82ca7492ebc6d92c48f3cb57156.png) |
/math-457e064382dbfc17fa5acc98b7037504.png) |
Likelihood-Verhältnis |
/math-5711c9b4ed36c6b98d89fb52d062fc0a.png) |
/math-457e064382dbfc17fa5acc98b7037504.png) |
Lineare Assoziation |
, wobei der Korrelationskoeffizient nach Pearson ist. |
/math-c4ca4238a0b923820dcc509a6f75849b.png) |
Kontinuitätskorrektur |
, das nur für 2 x 2-Tabellen berechnet wird. |
/math-c4ca4238a0b923820dcc509a6f75849b.png) |
Fishers Exakter Test
Dieser Test ist nützlich, wenn eine erwartete Zellenanzahl gering ist (weniger als 5). Er wird nur für 2 x 2-Tabellen berechnet. Angenommen, Sie haben folgende Tabelle:
|
/math-0d5fa3f335333b23d4aaf795d1336587.png) |
/math-e209e24a3d42a840c21481572570342f.png) |
Teilsumme/Summe |
/math-c772000136f6d3ba6dec3c7c5a35458b.png) |
/math-6c773b2b7798e5713845e475d0c4b4c7.png) |
/math-5967eff521c650a997f82f083abf639a.png) |
/math-6657a6c206f3e5e31275783a3668e5de.png) |
/math-b5825a6794db70d759fd6fa7eb747fd7.png) |
/math-e501ae2ad90dc374410a774da21c5739.png) |
/math-43c5783d36b015e36edeecd60da73206.png) |
/math-4d19d3c0c698ba1ab821a9d391ae4fac.png) |
Teilsumme/Summe |
/math-f16c4024084f71bae29d858ad345502b.png) |
/math-7f53026eedc310e75b8bfbaafcc98e9d.png) |
/math-8d9c307cb7f3c4a32822a51922d1ceaa.png) |
Unter der Nullhypothese (Unabhängigkeit) ist die Anzahl der ersten Zelle eine hypergeometrische Verteilung mit einer Wahrscheinlichkeit gegeben mit , .
Einseitiger Test
Das Signifikanzniveau des einseitigen Tests wird berechnet mit
- p(left-sided test) =
/math-86e6e38543be7730a5d275879331853b.png) - p(right-sided test) =
/math-a0da9ea8cfd87134a3bc676fc188f06e.png)
Zweiseitiger Test
Die zweiseitige Signifikanz ist /math-26774c9dfcd5e97bc46f921e5d961bc3.png)
wobei
, wenn /math-ad6e799464206e320a500025fbb12f7f.png)
, wenn /math-dff4b325fc0edc3fc4cf9134afe80cd6.png)
/math-fb4549dbe0388469b28f1e469e8dbccc.png)
Assoziationsmaße
Definieren
-
/math-e1447424a87a72997354115e74f780d2.png) -
/math-9a63691fc5e41c8da93b03ae0e8fc436.png) -
/math-0bf9a641a2a2f9570c4874c60e4ff055.png) -
/math-abe49e571496aef0ee9284532118e575.png) -
/math-ae03d6a4fc3d6bde417a7352ed6c0d76.png) -
/math-1306db1d8aedf83c64c23134dc6f6cce.png) -
ist die Teilsumme der ten Zeile -
ist die Teilsumme der ten Spalte -
ist die Gesamtanzahl.
Statistik |
Formel und Erklärung |
Standardfehler |
Phi-Koeffizient |
, das nicht für 2 x 2-Tabellen berechnet wird. Für eine 2 x 2-Tabelle ist er gleich /math-4b43b0aee35624cd95b910189b3dc231.png) Der Wert reicht von , wobei ,
|
|
Cramérs V |
/math-32808fbdf779579250ced07a3b57f092.png) |
|
Kontingenzkoeffizient |
/math-0512a20370c1a32d02c46e82c38d5767.png) |
|
Gamma |
/math-ca54853c333dece226fd892c1471fca6.png) |
/math-ceeab2bf0dfc9669dc3af396bdf3b9f0.png) |
Kendall |
Tau-b |
/math-d483a07e25f428eae9e524345b1f6097.png) |
![2\sqrt{\frac{1}{D_rD_c}\left[\sum_{ij}f_{ij}(C_{ij}-D_{ij})^2-\frac{1}{N}(P-Q)^2\right]} 2\sqrt{\frac{1}{D_rD_c}\left[\sum_{ij}f_{ij}(C_{ij}-D_{ij})^2-\frac{1}{N}(P-Q)^2\right]}](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-e06a2ae207bc0f4367248d2f7795410b.png) |
Tau-c |
, wobei /math-0d910548fc627e702b2e9d398eeed3bc.png) |
/math-423d45130bb7e6a7741ed999591467b1.png) |
Somers D |
C R |
/math-a55cc67126812452ebb989878123e1d1.png) |
/math-e1b49506418c36946f11b0273a1ff255.png) |
R C |
/math-95c75be2de7e1e529a221f1b6ff2c0ae.png) |
/math-08de37f7d4b6824a6f734bab201f8682.png) |
Symmetrisch |
/math-7b2342cd106f701a2394591454e27dc3.png) |
/math-13b710204e1ae878fb90eee4ce577ed8.png) |
Lambda |
C R |
, wobei die größte Anzahl in der i-ten Zeile ist und die größte Spaltenteilsumme. |
,
wobei der Spaltenindex von ist und der Index der Spaltenteilsumme für .
|
R C |
,wobei die größte Anzahl in der j-ten Spalte ist und die größte Zeilenteilsumme.
|
,
wobei der Zeilenindex von ist und der Index der Zeilenteilsumme für .
|
Symmetrisch |
/math-e1eba21c82a1b082d636a63187cb00a7.png) |
/math-19a542d5e209aac0810776eadb8cedef.png)
wobei , , und .
|
Unsicherheit |
C R |
, wobei und und /math-ea444840a2b4f491836ac96f310228fc.png) |
, wobei /math-bed50ae560cb148d344cf16dcd5a0108.png) |
R C |
/math-2f741623b6366e540eaba9c97d083e7b.png) |
/math-eed562bf2445e78c73aa3c344fb75249.png) |
Symmetrisch |
/math-1b42c23d992439355e27425484c6fe29.png) |
/math-16431aabee7e70358843ece1fbd3d1c7.png) |
Übereinstimmungsmaße
Diese Tabelle wird nur berechnet, wenn zwei Bedingungen erfüllt sind: (1) quadratische Tabelle, d.h. , und (2) die Zeilenvariable und die Spaltenvariable die gleichen Werte haben. Die Kappa-Statistik wird berechnet mit:
/math-5254a7c3d0d060337a3cbbbdf6875b25.png)
Der Standardfehler wird geschätzt mit:
.
wobei , , und . Der entsprechende asymptotische Standardfehler unter der Nullhypothese ist gegeben mit
![SE_0 = \sqrt{\frac{1}{N\left(N^2 - \sum_{i=1}^{R}r_ic_i\right)^2} \left[N^2\sum_{i=1}^{R}r_ic_i + \left(\sum_{i=1}^{R}r_ic_i\right)^2 - N \sum_{i=1}^{R}r_ic_i(r_i+c_i)\right]} SE_0 = \sqrt{\frac{1}{N\left(N^2 - \sum_{i=1}^{R}r_ic_i\right)^2} \left[N^2\sum_{i=1}^{R}r_ic_i + \left(\sum_{i=1}^{R}r_ic_i\right)^2 - N \sum_{i=1}^{R}r_ic_i(r_i+c_i)\right]}](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-2fb11a39b32089a9fb7b374c23a68abc.png)
Eine weitere verwandte Statistik ist Bowker, die verwendet wird, um für alle Paare zu testen. Wenn , wird die Statistik berechnet als
/math-d430e26fecf56fc1e12fb1c885b0977d.png)
Für größere Samples ist die asymptotische Chi-Quadrat-Verteilung mit dem Freiheitsgrad . Beachten Sie, dass Bowkers Test für 2 x 2-Tabellen gleich McNemars Test ist. Daher wird hier nur Bowkers Test gezeigt.
Quotenverhältnis und Relatives Risiko
Diese Statistik wird nur für 2 x 2-Tabellen berechnet.
Quotenverhältnis
Das Quotenverhältnis wird berechnet mit /math-3fa39a72468c2793e5b60fc04aa0aef1.png)
Relatives Risiko
Die relativen Risiken sind gegeben mit
-
/math-ddef868fb9aede240998288fda3c3aa7.png) -
/math-d2ceb3919433fdc636aaa24dbf97eff3.png) -
/math-beb356acfebcc913c83cc436c4c1a294.png) -
/math-dccda1547a25ca3e806a9ca71e7f18b8.png)
Cochran-Mantel-Haenszel
Definieren
-
ist die Anzahl der Layer -
ist die Häufigkeit in der i-ten Zeile, j-ten Spalte und im k-ten Layer -
ist die j-te Spalte, Teilsumme des k-ten Layers -
ist die i-te Zeile, Teilsumme des k-ten Layers -
ist die Teilsumme des k-ten Layers -
ist die erwartete Häufigkeit in der i-ten Zeile, j-ten Spalte und im k-ten Layerzelle -
/math-5f5f9e9f589b49daa28976461688df13.png)
Mantel-Haenszel-Statistik
Die Mantel-Haenszel-Statistik ist gegeben mit /math-a19d6f25b272775d916bf03f49c392a7.png)
wobei sgn die Vorzeichenfunktion ist.
Breslow-Day-Statistik
Die Breslow-Day-Statistik ist ![BD = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2 BD = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-9e373b8a5825fcf21df5156eec3131d9.png)
wobei .
Tarones Statistik
Tarones Statistik ist
![T = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2- \frac{\sum_{k=1}^{K}\left[f_{11k}-\hat{f}_{11k}\right]^2}{\sum_{k=1}^{K}\frac {1}{V_k} } T = \sum_{k=1}^{K} V_k \left[f_{11k}-\hat{f}_{11k}\right]^2- \frac{\sum_{k=1}^{K}\left[f_{11k}-\hat{f}_{11k}\right]^2}{\sum_{k=1}^{K}\frac {1}{V_k} }](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-2d5715c073380230f9458c06eed9823c.png)
wobei .
Allgemeines Quotenverhältnis
Für eine 2×2×K-Tabelle ist das Quotenverhältnis beim k-ten Layer . Angenommen, dass das wahre allgemeine Quotenverhältnis existiert, das lautet, dann ist Mantel-Haenszels Schätzer des allgemeinen Quotenverhältnisses
/math-488db329f6cab4e8b965215f34861f44.png)
Die asymptotische Varianz für ist:
![\hat Var[ln(\hat OR_{MH})]=\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{12k} f_{21k}+(f_{12k}+f_{21k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{12k}+f_{21k})f_{12k} f_{21k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}} \hat Var[ln(\hat OR_{MH})]=\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{11k}+f_{22k})f_{12k} f_{21k}+(f_{12k}+f_{21k})f_{11k} f_{22k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{11k} f_{22k}}{n_{k}}\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}+\frac{\sum_{k=1}^{K}\frac{(f_{12k}+f_{21k})f_{12k} f_{21k}}{n_{k}^2}}{2\sum_{k=1}^{K}\frac{f_{12k} f_{21k}}{n_{k}}}](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-fe6d99fcba77f28d2e62c52d30d014f4.png)
Die untere Konfidenzgrenze (UEG) und obere Konfidenzgrenze (OEG) für sind:
und ![ln(\hat OR_{MH})+z(alpha/2)\sqrt{\hat Var[ln(\hat OR_{MH})]} ln(\hat OR_{MH})+z(alpha/2)\sqrt{\hat Var[ln(\hat OR_{MH})]}](//d2mvzyuse3lwjc.cloudfront.net/doc/de/UserGuide/images/Algorithm(CrossTabs)/math-e8dcfecb9336a5c778bcff6588b5c278.png)
|