Einseitiger Test
Aus MM*Stat
Grundbegriffe
Einseitige Tests
Bei einseitigen Tests gibt es einen Ablehnungsbereich, da zu große Abweichungen der Teststatistik vom hypothetischen Wert nur in eine Richtung gegen die Nullhypothese sprechen.
Der kritische Wert wird mit symbolisiert.
Linksseitiger Test
- Null- und Alternativhypothese:
- Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner als der kritische Wert sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
- Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer bzw. gleich dem kritischen Wert sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :
<R output="display"> pdf(rpdf,width=7,height=7)
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (Links. Test)") abline(v=-2, col="black", lwd=2) abline(v=0.0, col="black", lwd=4, lty=2) text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5) text(-2.3, 0.01, expression(paste(alpha)), col = "black", cex=1.2) axis( side=1, at=c(-2, 0, 4), labels=c(expression(C), expression(theta[0]), "V"), tick=FALSE) axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
</R>
Rechtsseitiger Test
- Null- und Alternativhypothese:
- Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer als der kritische Wert sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
- Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner bzw. gleich dem kritischen Wert sind:
- Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :
<R output="display"> pdf(rpdf, width=7,height=7)
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 2: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (rechts. Test)") abline(v=2, col="black", lwd=2) abline(v=0.0, col="black", lwd=4, lty=2) text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5) text(2.3, 0.01, expression(alpha), col = "black", cex=1.2) axis( side=1, at=c(0, 2, 4), c(expression(theta[0]), expression(C), "V"), tick=FALSE) axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
</R>
Beispiele
Testentscheidungen bei einem rechtsseitigen Test
Zur Veranschaulichung sei angenommen, dass
- ein rechtsseitiger Test für einen Parameter durchgeführt wird: und
- die Teststatistik bei Gültigkeit der Nullhypothese standardnormalverteilt ist.
Der Ablehnungsbereich der wird dann durch alle Werte der Teststatistik gebildet, für die gilt.
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau und ist in der folgenden Abb. 3 durch die grüne Fläche gekennzeichnet.
|
Die Testentscheidung ist wie folgt: Ist der aus der Stichprobe berechnete Prüfwert ein Element des Ablehnungsbereiches der , so wird die Nullhypothese auf dem vorgegebenen Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang verworfen.
Andernfalls besteht keine Veranlassung, abzulehnen. Die Testentscheidung basiert somit auf einem Vergleich des Prüfwertes mit den Entscheidungsbereichen.
Bei Verwendung statistischer Software (z.B. R, STATA, SPSS, Matlab) wird ebenfalls der Prüfwert auf der Grundlage der Stichprobe berechnet und im Output ausgewiesen.
Zusätzlich wird die Überschreitungswahrscheinlichkeit dieses Prüfwertes ausgegeben, d.h. die Wahrscheinlichkeit , dass die Teststatistik einen Wert annimmt, der größer als dieser berechnete Prüfwert ist (bei Gültigkeit der Nullhypothese ).
Diese Überschreitungswahrscheinlichkeit wird im Output statistischer Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim zweiseitigen Test).
Hier sei das Symbol verwendet, so dass gilt. Abb. 4 veranschaulicht diese Überschreitungswahrscheinlichkeit durch die himmelblaue Fläche.
<R output="display">
pdf(rpdf,width=7,height=7) curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 4: \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") par(new=TRUE) xx1 <-c(20:40, 40:20) yy1 <-c(c(dnorm(c(20:40), mean=0, sd=10)),c(rep(0,21))) polygon(xx1, yy1, col="aquamarine", border=NA) par(new=TRUE) curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") abline(v=20, col="black", lwd=3, lty=2) text(22.5, 0.0014, expression(P), col = "black", cex=1.5) axis( side=1, at=c(20), labels=c("v"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
|
Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden Verteilung der Teststatistik greifen, um den bzw. die kritischen Werte und damit die Entscheidungsbereiche des Tests zu ermitteln.
Im Output sind alle notwendigen Informationen für die Testentscheidung enthalten, die nunmehr auf dem Vergleich des vorgegebenen Signifikanzniveaus und der Überschreitungswahrscheinlichkeit beruht.
Das sei wie folgt gezeigt.
- Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der weit von entfernt liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von sehr klein.
- ist ein für die Gültigkeit der Nullhypothese extremer Wert und die Nullhypothese erscheint unplausibel.
- Ein solcher Wert kommt eher unter der Alternativhypothese zustande, so dass auf einen signifikanten Unterschied zwischen und geschlossen wird, d.h. die Nullhypothese abgelehnt wird.
- Entscheidungsregel:
- Erhält man im Output der Software eine Überschreitungswahrscheinlichkeit, für die gilt, impliziert dies, dass der Prüfwert ein Element des Ablehnungsbereiches der zum vorgegebenen Signifikanzniveau ist. Die Nullhypothese wird abgelehnt.
- Bei dem hier demonstrierten rechtsseitigen Test wird diese Entscheidungsregel in der Abb. 5 deutlich.
<R output="display"> pdf(rpdf, width=7,height=7)
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 5: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") abline(v=22, col="black", lwd=3, lty=2) text(23.75, 0.0012, expression(P), col = "black", cex=1.2) abline(v=18, col="black", lwd=3) text(20, 0.0018, expression(alpha), col = "black", cex=1.7) axis( side=1, at=c(22, 18), labels=c("v", "c"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
</R>
- Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der relativ nahe bei liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von groß.
- ist ein für die Gültigkeit der Nullhypothese plausibler Wert, die Abweichung zwischen und kann als zufällig angesehen werden. Die Nullhypothese wird in diesem Fall nicht abgelehnt.
- Entscheidungsregel:
- Ist , impliziert dies, dass der Prüfwert ein Element des Nichtablehnungsbereiches der ist. Die Nullhypothese wird nicht abgelehnt.
<R output="display"> pdf(rpdf,width=7,height=7)
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 6: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0") abline(v=17, col="black", lwd=3, lty=2) text(18.5, 0.0018, expression(P), col = "black", cex=1.2) abline(v=21, col="black", lwd=3) text(23, 0.0014, expression(alpha), col = "black", cex=1.7) axis( side=1, at=c(17, 21), labels=c("v", "c"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
</R>
- Nichtablehnungsbereich der | Ablehnungsbereich der
- Mit den gleichen Regeln sind die Testentscheidungen bei einem linksseitigen Test bzw. einem zweiseitigen Test zu treffen.