Algorithmen (Test von Anteilen bei zwei Stichproben)


n_{1}\! sei der Umfang von Stichprobe 1 und x_{1}\! die Anzahl der Ereignisse bzw. Erfolge. Dann kann der Stichprobenanteil \tilde{p_{1}}\! ausgedrückt werden mit: \tilde{p_{1}}=\frac{x_{1}}{n_{1}}.

Entsprechend ist der Umfang für eine andere Stichprobe n_{2}\! und x_{2}\! ist die Anzahl der Ereignisse. Dann ist der Stichprobenanteil: \tilde{p_{2}}=\frac{x_{2}}{n_{2}}

Inhalt

Hypothesen

p_{1}\! und p_{1}\! seien die wahren Anteile der Grundgesamtheit für Stichprobe 1 und 2, und d_{0}\! sei die hypothetische Differenz zwischen den Anteilen der Grundgesamtheit.

H_0:p_{1}-p_{2}=d_{0}\! für beidseitigen Test

H_0:p_{1}-p_{2}\ge d_{0}\! für einseitigen Test

H_0:p_{1}-p_{2}\le d_{0}\! für einseitigen Test

Normal-Approximation

p-Wert

Sie können einen Test auf Normal-Approximation durchführen mit den Annahmen: x_{1}\ge10\! und n_{1}-x_{1}\ge10\!, x_{2}\ge10\! und n_{2}-x_{2}\ge10\!.

Um den Test durchzuführen, berechnen Sie den Wert für z\! und  p_{value}\!:

z=\frac{\tilde{p_{1}}-\tilde{p_{2}} -d_{0}}{\sqrt{\frac{\tilde{p_{1}}(1-\tilde{p_{1}})}{n_{1}}}+\frac{\tilde{p_{2}}(1-\tilde{p_{2}})}{n_{2}}}
\! .

Ein besonderer Fall ist, wenn d_{0} gleich Null ist. Origin kann eine gepoolte Schätzung von p für den Test verwenden, wenn Sie das Kontrollkästchen "gepoolt" aktivieren, um Folgendes zu tun:

z=\frac{\tilde{p_{1}}-\tilde{p_{2}}}{\sqrt{\tilde{p_{0}}(1-\tilde{p_{0}})({\frac{1}{n_{1}}+ \frac{1}{n_{2}}}})}\! , wobeip_{0}=\frac{x_{1}+x_{2}}{n_{1}+n_{2}}

Die p-Werte für jede Hypothese sind gegeben durch:

H_0:p_{1}-p_{2}=d_{0}\! , p_{value}=2P(Z_{1}\ge|z|)\! für den beidseitigen Test

H_0:p_{1}-p_{2}\ge d_{0}\!, p_{value}=P(Z_{1}\le z)\! für den oberen Test

H_0:p_{1}-p_{2}\le d_{0}\! , p_{value}=P(Z_{1}\ge z)\! für den unteren Test

Konfidenzintervall

Für ein gegebenes Konfidenzniveau 1-\alpha kann das Konfidenzintervall für den Stichprobenanteil erzeugt werden durch:

Nullhypothese Konfidenzintervall
H_0:p_{1}-p_{2}=d_{0}\! \left[(\tilde{p_{1}}-\tilde{p_{2}})- Z_{\frac{\alpha}{2}}\sqrt{\frac{\tilde{p_{1}}(1-\tilde{p_{1}})}{n_{1}}+ \frac{\tilde{p_{2}}(1-\tilde{p_{2}})}{n_{2}}}, (\tilde{p_{1}}-\tilde{p_{2}})+ Z_{\frac{\alpha}{2}}\sqrt{\frac{\tilde{p_{1}}(1-\tilde{p_{1}})}{n_{1}}+ \frac{\tilde{p_{2}}(1-\tilde{p_{2}})}{n_{2}}}\right]
H_0:p_{1}-p_{2}\ge d_{0}\! \left[(\tilde{p_{1}}-\tilde{p_{2}})- Z_{\frac{\alpha}{2}}\sqrt{\frac{\tilde{p_{1}}(1-\tilde{p_{1}})}{n_{1}}+ \frac{\tilde{p_{2}}(1-\tilde{p_{2}})}{n_{2}}}, 1\right]
H_0:p_{1}-p_{2}\le d_{0}\! \left[-1, (\tilde{p_{1}}-\tilde{p_{2}})+ Z_{\frac{\alpha}{2}}\sqrt{\frac{\tilde{p_{1}}(1-\tilde{p_{1}})}{n_{1}}+ \frac{\tilde{p_{2}}(1-\tilde{p_{2}})}{n_{2}}}\right]

Fishers Exakter Test

Exakter p-Wert

Fishers Exakter Test kann für alle Stichprobenumfänge verwendet werden, wenn d_{0} \! null ist. p(x) bezeichne die Wahrscheinlichkeit der hypergeometrischen Verteilung, wenn X=x.

P(X=x)=\frac{\begin{pmatrix}x_{1}+x_{2} \\{x}\end{pmatrix}\begin{pmatrix}{n_{1}+n_{2}-x_{1}-x_{2}}\\{n_{1}-x}\end{pmatrix}}{\begin{pmatrix}{n_{1}+n_{2}}\\{n_{1}}\end{pmatrix}}

M bezeichne den Modus der hypergeometrischen Verteilung: M=\left \lfloor \frac{(n_1+1)(x_1+x_2+1)}{n_1+n_2+2}\right \rfloor

Die p-Werte für jede Hypothese sind gegeben durch:

H_0:p_{1}\ge p_{2}\!, p_{value}=P(x\le x_{1})\!

H_0:p_{1}\le p_{2}\!, p_{value}=P(x\ge x_{1})\!

Wenn H_0:p_{1}= p_{2}\!:

a:x_{1} < M\!: p_{value} = P(X\le x_{1}) + P(X\ge y)

wobei y die kleinste ganze Zahl \ge M ist, so dass p(y) \le p(x_1)\!.

b:x_{1} = M\!

p_{value} = 1.0\!

c: x_1 > M\!

p_{value} = P(X\ge x_{1}) + P(X\le y)

wobei y die größte ganze Zahl \le M ist, so dass p(y) \le p(x_1)\!.