Einseitiger Test
Aus MM*Stat
Inhaltsverzeichnis
Grundbegriffe
Einseitige Tests
Bei einseitigen Tests gibt es einen Ablehnungsbereich, da zu große Abweichungen der Teststatistik vom hypothetischen Wert
nur in eine Richtung gegen die Nullhypothese
sprechen.
Der kritische Wert wird mit symbolisiert.
Linksseitiger Test
- Null- und Alternativhypothese:
- Der Ablehnungsbereich der
besteht aus allen Realisationen
der Teststatistik
, die kleiner als der kritische Wert
sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau
:
- Der Nichtablehnungsbereich der
besteht aus allen Realisationen
der Teststatistik
, die größer bzw. gleich dem kritischen Wert
sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens
:
<R output="display"> pdf(rpdf,width=7,height=7)
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (Links. Test)") abline(v=-2, col="black", lwd=2) abline(v=0.0, col="black", lwd=4, lty=2) text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5) text(-2.3, 0.01, expression(paste(alpha)), col = "black", cex=1.2) axis( side=1, at=c(-2, 0, 4), labels=c(expression(C), expression(theta[0]), "V"), tick=FALSE) axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
</R>
Rechtsseitiger Test
- Null- und Alternativhypothese:
- Der Ablehnungsbereich der
besteht aus allen Realisationen
der Teststatistik
, die größer als der kritische Wert
sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau
:
- Der Nichtablehnungsbereich der
besteht aus allen Realisationen
der Teststatistik
, die kleiner bzw. gleich dem kritischen Wert
sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens
:
<R output="display"> pdf(rpdf, width=7,height=7)
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 2: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (rechts. Test)") abline(v=2, col="black", lwd=2) abline(v=0.0, col="black", lwd=4, lty=2) text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5) text(2.3, 0.01, expression(alpha), col = "black", cex=1.2) axis( side=1, at=c(0, 2, 4), c(expression(theta[0]), expression(C), "V"), tick=FALSE) axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
</R>
Beispiele
Testentscheidungen bei einem rechtsseitigen Test
Zur Veranschaulichung sei angenommen, dass
- ein rechtsseitiger Test für einen Parameter
durchgeführt wird:
und
- die Teststatistik
bei Gültigkeit der Nullhypothese standardnormalverteilt ist.
Der Ablehnungsbereich der wird dann durch alle Werte der Teststatistik
gebildet, für die
gilt.
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau
und ist in der folgenden Abb. 3 durch die grüne Fläche gekennzeichnet.
|
Die Testentscheidung ist wie folgt: Ist der aus der Stichprobe berechnete Prüfwert ein
Element des Ablehnungsbereiches der , so wird die Nullhypothese auf dem vorgegebenen Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang
verworfen.
Andernfalls besteht keine Veranlassung, abzulehnen. Die Testentscheidung basiert somit auf einem Vergleich des Prüfwertes
mit den Entscheidungsbereichen.
Bei Verwendung statistischer Software (z.B. R, STATA, SPSS, Matlab) wird ebenfalls der Prüfwert auf der Grundlage der Stichprobe berechnet und im Output ausgewiesen.
Zusätzlich wird die Überschreitungswahrscheinlichkeit dieses Prüfwertes ausgegeben, d.h. die Wahrscheinlichkeit
, dass die Teststatistik
einen Wert annimmt, der größer als dieser berechnete Prüfwert
ist (bei Gültigkeit der Nullhypothese
).
Diese Überschreitungswahrscheinlichkeit wird im Output statistischer Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim zweiseitigen Test).
Hier sei das Symbol verwendet, so dass
gilt. Abb. 4 veranschaulicht diese Überschreitungswahrscheinlichkeit durch die himmelblaue Fläche.
<R output="display">
pdf(rpdf,width=7,height=7) curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 4: \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") par(new=TRUE) xx1 <-c(20:40, 40:20) yy1 <-c(c(dnorm(c(20:40), mean=0, sd=10)),c(rep(0,21))) polygon(xx1, yy1, col="aquamarine", border=NA) par(new=TRUE) curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") abline(v=20, col="black", lwd=3, lty=2) text(22.5, 0.0014, expression(P), col = "black", cex=1.5) axis( side=1, at=c(20), labels=c("v"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
|
Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden Verteilung der Teststatistik greifen, um den bzw. die kritischen Werte und damit die Entscheidungsbereiche des Tests zu ermitteln.
Im Output sind alle notwendigen Informationen für die Testentscheidung enthalten, die nunmehr auf dem Vergleich des vorgegebenen Signifikanzniveaus und der Überschreitungswahrscheinlichkeit
beruht.
Das sei wie folgt gezeigt.
- Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert
, der weit von
entfernt liegt, dann ist die Überschreitungswahrscheinlichkeit
unter der Verteilung von
sehr klein.
ist ein für die Gültigkeit der Nullhypothese extremer Wert und die Nullhypothese erscheint unplausibel.
- Ein solcher Wert
kommt eher unter der Alternativhypothese zustande, so dass auf einen signifikanten Unterschied zwischen
und
geschlossen wird, d.h. die Nullhypothese abgelehnt wird.
- Entscheidungsregel:
- Erhält man im Output der Software eine Überschreitungswahrscheinlichkeit, für die
gilt, impliziert dies, dass der Prüfwert
ein Element des Ablehnungsbereiches der
zum vorgegebenen Signifikanzniveau
ist. Die Nullhypothese wird abgelehnt.
- Bei dem hier demonstrierten rechtsseitigen Test wird diese Entscheidungsregel in der Abb. 5 deutlich.
<R output="display"> pdf(rpdf, width=7,height=7)
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 5: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") abline(v=22, col="black", lwd=3, lty=2) text(23.75, 0.0012, expression(P), col = "black", cex=1.2) abline(v=18, col="black", lwd=3) text(20, 0.0018, expression(alpha), col = "black", cex=1.7) axis( side=1, at=c(22, 18), labels=c("v", "c"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
</R>
- Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert
, der relativ nahe bei
liegt, dann ist die Überschreitungswahrscheinlichkeit
unter der Verteilung von
groß.
ist ein für die Gültigkeit der Nullhypothese plausibler Wert, die Abweichung zwischen
und
kann als zufällig angesehen werden. Die Nullhypothese wird in diesem Fall nicht abgelehnt.
- Entscheidungsregel:
- Ist
, impliziert dies, dass der Prüfwert
ein Element des Nichtablehnungsbereiches der
ist. Die Nullhypothese wird nicht abgelehnt.
<R output="display"> pdf(rpdf,width=7,height=7)
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 6: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") abline(v=17, col="black", lwd=3, lty=2) text(18.5, 0.0018, expression(P), col = "black", cex=1.2) abline(v=21, col="black", lwd=3) text(23, 0.0014, expression(alpha), col = "black", cex=1.7) axis( side=1, at=c(17, 21), labels=c("v", "c"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
</R>
- Nichtablehnungsbereich der
| Ablehnungsbereich der
- Mit den gleichen Regeln sind die Testentscheidungen bei einem linksseitigen Test bzw. einem zweiseitigen Test zu treffen.