Einseitiger Test: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
 
(9 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 36: Zeile 36:
: <math>P\left\{V\geq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha</math>
: <math>P\left\{V\geq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha</math>


:{|
{{iframewiwi|
|<R output="display">
<iframe k="wiwi" p="examples/stat_EinseitigerTest_EinseitigerTest_R00480004800000000000000_plot.html" />
pdf(rpdf,width=7,height=7)
| Abb. 1: Verteilung der Teststatistik <math>V</math> unter <math>H_0</math> und Entscheidungsbereiche
 
}}
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (Links. Test)")
abline(v=-2, col="black", lwd=2)
abline(v=0.0, col="black", lwd=4, lty=2)
text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5)
text(-2.3, 0.01, expression(paste(alpha)), col = "black", cex=1.2)
axis( side=1, at=c(-2, 0, 4), labels=c(expression(C), expression(theta[0]), "V"), tick=FALSE)
axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
 
</R>
|}
: [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] | [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]]


===Rechtsseitiger Test===
===Rechtsseitiger Test===
Zeile 77: Zeile 66:


: <math>P\left\{V\leq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha</math>
: <math>P\left\{V\leq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha</math>
:{|
|<R output="display">
pdf(rpdf, width=7,height=7)
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 2: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche (rechts. Test)")
abline(v=2, col="black", lwd=2)
abline(v=0.0, col="black", lwd=4, lty=2)
text(0, 0.15, expression(paste("1-" , alpha)), col = "black", cex=2.5)
text(2.3, 0.01, expression(alpha), col = "black", cex=1.2)
axis( side=1, at=c(0, 2, 4), c(expression(theta[0]), expression(C), "V"), tick=FALSE)
axis( side=2, at=c(0.39), labels=c("f(V)"), tick=FALSE)
</R>
|}
: [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] | [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]


=={{Vorlage:Beispiele}}==
=={{Vorlage:Beispiele}}==
Zeile 105: Zeile 78:
Der [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] wird dann durch alle Werte der [[Teststatistik]] <math>V\;</math> gebildet, für die <math>\{v|v>c\}</math> gilt.  
Der [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] wird dann durch alle Werte der [[Teststatistik]] <math>V\;</math> gebildet, für die <math>\{v|v>c\}</math> gilt.  


Die [[Wahrscheinlichkeit]], eine [[Realisation]] aus dem [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] zu erhalten, entspricht dem vorgegebenen [[Signifikanzniveau]] <math>\alpha = P(V > c |\vartheta_{0})</math> und ist in der folgenden Abb. 3 durch die grüne Fläche gekennzeichnet.
Die [[Wahrscheinlichkeit]], eine [[Realisation]] aus dem [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] zu erhalten, entspricht dem vorgegebenen [[Signifikanzniveau]] <math>\alpha = P(V > c |\vartheta_{0})</math> und ist in der folgenden Abb. 2 (oben) durch die grüne Fläche gekennzeichnet.


{{iframewiwi|
{{iframewiwi|
<iframe k="wiwi" p="examples?P=stat/EinseitigerTest/EinseitigerTestLinks.R&V=P&W=700&H=400" H="500"/>  
<iframe k="wiwi" p="examples/stat_EinseitigerTest_EinseitigerTestUeberschreitung_R00480004800000000000000_plot.html" />
| Abb. 1: Verteilung der Teststatistik <math>V</math> unter <math>H_0</math> und Entscheidungsbereiche (Linkseitiger Test)
| Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test
}}
}}


Zeile 123: Zeile 96:
Diese [[Überschreitungswahrscheinlichkeit]] wird im Output [[Statistik|statistischer]] Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim [[zweiseitiger Test|zweiseitigen Test]]).  
Diese [[Überschreitungswahrscheinlichkeit]] wird im Output [[Statistik|statistischer]] Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim [[zweiseitiger Test|zweiseitigen Test]]).  


Hier sei das Symbol <math>P</math> verwendet, so dass <math>P = P(V > v | \vartheta_{0})</math> gilt. Abb. 4 veranschaulicht diese [[Überschreitungswahrscheinlichkeit]] durch die himmelblaue Fläche.
Hier sei das Symbol <math>P</math> verwendet, so dass <math>P = P(V > v | \vartheta_{0})</math> gilt. Abb. 2 (unten) veranschaulicht diese [[Überschreitungswahrscheinlichkeit]] durch die himmelblaue Fläche.
 
{|
|<R output="display">
pdf(rpdf,width=7,height=7)
 
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 4: \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0")
 
par(new=TRUE)
xx1 <-c(20:40, 40:20)
yy1 <-c(c(dnorm(c(20:40), mean=0, sd=10)),c(rep(0,21)))
polygon(xx1, yy1, col="aquamarine", border=NA)
 
par(new=TRUE)
 
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
 
abline(v=20, col="black", lwd=3, lty=2)
text(22.5, 0.0014, expression(P), col = "black", cex=1.5)
axis( side=1, at=c(20), labels=c("v"), tick=FALSE)
axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
 
 
</R>
|}


Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden [[Verteilung (stochastisch)|Verteilung]] der [[Teststatistik]] <math>V\;</math> greifen, um den bzw. die [[Kritischer Wert|kritischen Werte]] und damit die [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu ermitteln.  
Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden [[Verteilung (stochastisch)|Verteilung]] der [[Teststatistik]] <math>V\;</math> greifen, um den bzw. die [[Kritischer Wert|kritischen Werte]] und damit die [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu ermitteln.  
Zeile 167: Zeile 116:
: Erhält man im Output der Software eine [[Überschreitungswahrscheinlichkeit]], für die <math>P\leq\alpha</math> gilt, impliziert dies, dass der [[Prüfwert]] <math>v</math> ein Element des [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereiches der <math>H_{0}</math>]] zum vorgegebenen [[Signifikanzniveau]] <math>\alpha</math> ist. Die [[Nullhypothese]] wird abgelehnt.
: Erhält man im Output der Software eine [[Überschreitungswahrscheinlichkeit]], für die <math>P\leq\alpha</math> gilt, impliziert dies, dass der [[Prüfwert]] <math>v</math> ein Element des [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereiches der <math>H_{0}</math>]] zum vorgegebenen [[Signifikanzniveau]] <math>\alpha</math> ist. Die [[Nullhypothese]] wird abgelehnt.


: Bei dem hier demonstrierten [[Rechtsseitiger Test|rechtsseitigen Test]] wird diese Entscheidungsregel in der Abb. 5 deutlich.
: Bei dem hier demonstrierten [[Rechtsseitiger Test|rechtsseitigen Test]] wird diese Entscheidungsregel in der Abb. 3 deutlich.


:{|
{{iframewiwi|
|<R output="display">
<iframe k="wiwi" p="examples/stat_EinseitigerTest_EinseitigerTestEntscheidung_R00480004800000000000000_plot.html" />
pdf(rpdf, width=7,height=7)
|Abb. 3: Signifikanzniveau und Überschreitungswahrscheinlichkeit bei Gültigkeit der <math>H_0</math>
 
}}
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 5: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0")
abline(v=22, col="black", lwd=3, lty=2)
text(23.75, 0.0012, expression(P), col = "black", cex=1.2)
abline(v=18, col="black", lwd=3)
text(20, 0.0018, expression(alpha), col = "black", cex=1.7)
axis( side=1, at=c(22, 18), labels=c("v", "c"), tick=FALSE)
axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
 
</R>
|}
 
: [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] | [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]


* b) [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnung der Nullhypothese]]
* b) [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnung der Nullhypothese]]
Zeile 195: Zeile 132:


: Ist <math>P > \alpha</math>, impliziert dies, dass der [[Prüfwert]] <math>v</math> ein Element des [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereiches der <math>H_{0}</math>]] ist. Die [[Nullhypothese]] wird nicht abgelehnt.
: Ist <math>P > \alpha</math>, impliziert dies, dass der [[Prüfwert]] <math>v</math> ein Element des [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereiches der <math>H_{0}</math>]] ist. Die [[Nullhypothese]] wird nicht abgelehnt.
:{| width="40%"
|<R output="display">
pdf(rpdf,width=7,height=7)
curve(from=-40, to=40, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 6: Signifikanzniveau und \u00DCberschreitungswahrscheinlichkeit bei G\u00FCltigkeit der H_0")
abline(v=17, col="black", lwd=3, lty=2)
text(18.5, 0.0018, expression(P), col = "black", cex=1.2)
abline(v=21, col="black", lwd=3)
text(23, 0.0014, expression(alpha), col = "black", cex=1.7)
axis( side=1, at=c(17, 21), labels=c("v", "c"), tick=FALSE)
axis( side=2, at=c(0.039), labels=c("f(v)"), tick=FALSE)
</R>
|}
:[[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] | Ablehnungsbereich der <math>H_{0}</math>


: Mit den gleichen Regeln sind die [[Statistischer Test|Test]]entscheidungen bei einem [[Linksseitiger Test|linksseitigen Test]] bzw. einem [[zweiseitiger Test|zweiseitigen Test]] zu treffen.
: Mit den gleichen Regeln sind die [[Statistischer Test|Test]]entscheidungen bei einem [[Linksseitiger Test|linksseitigen Test]] bzw. einem [[zweiseitiger Test|zweiseitigen Test]] zu treffen.

Aktuelle Version vom 29. Mai 2018, 13:33 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Einseitige Tests

Bei einseitigen Tests gibt es einen Ablehnungsbereich, da zu große Abweichungen der Teststatistik vom hypothetischen Wert nur in eine Richtung gegen die Nullhypothese sprechen.

Der kritische Wert wird mit symbolisiert.

Linksseitiger Test

Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner als der kritische Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer bzw. gleich dem kritischen Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :

Abb. 1: Verteilung der Teststatistik unter und Entscheidungsbereiche

Rechtsseitiger Test

Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer als der kritische Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner bzw. gleich dem kritischen Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :

Beispiele

Testentscheidungen bei einem rechtsseitigen Test

Zur Veranschaulichung sei angenommen, dass

Der Ablehnungsbereich der wird dann durch alle Werte der Teststatistik gebildet, für die gilt.

Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau und ist in der folgenden Abb. 2 (oben) durch die grüne Fläche gekennzeichnet.

Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test

Die Testentscheidung ist wie folgt: Ist der aus der Stichprobe berechnete Prüfwert ein Element des Ablehnungsbereiches der , so wird die Nullhypothese auf dem vorgegebenen Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang verworfen.

Andernfalls besteht keine Veranlassung, abzulehnen. Die Testentscheidung basiert somit auf einem Vergleich des Prüfwertes mit den Entscheidungsbereichen.

Bei Verwendung statistischer Software (z.B. R, STATA, SPSS, Matlab) wird ebenfalls der Prüfwert auf der Grundlage der Stichprobe berechnet und im Output ausgewiesen.

Zusätzlich wird die Überschreitungswahrscheinlichkeit dieses Prüfwertes ausgegeben, d.h. die Wahrscheinlichkeit , dass die Teststatistik einen Wert annimmt, der größer als dieser berechnete Prüfwert ist (bei Gültigkeit der Nullhypothese ).

Diese Überschreitungswahrscheinlichkeit wird im Output statistischer Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim zweiseitigen Test).

Hier sei das Symbol verwendet, so dass gilt. Abb. 2 (unten) veranschaulicht diese Überschreitungswahrscheinlichkeit durch die himmelblaue Fläche.

Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden Verteilung der Teststatistik greifen, um den bzw. die kritischen Werte und damit die Entscheidungsbereiche des Tests zu ermitteln.

Im Output sind alle notwendigen Informationen für die Testentscheidung enthalten, die nunmehr auf dem Vergleich des vorgegebenen Signifikanzniveaus und der Überschreitungswahrscheinlichkeit beruht.

Das sei wie folgt gezeigt.

Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der weit von entfernt liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von sehr klein.
ist ein für die Gültigkeit der Nullhypothese extremer Wert und die Nullhypothese erscheint unplausibel.
Ein solcher Wert kommt eher unter der Alternativhypothese zustande, so dass auf einen signifikanten Unterschied zwischen und geschlossen wird, d.h. die Nullhypothese abgelehnt wird.
Entscheidungsregel:
Erhält man im Output der Software eine Überschreitungswahrscheinlichkeit, für die gilt, impliziert dies, dass der Prüfwert ein Element des Ablehnungsbereiches der zum vorgegebenen Signifikanzniveau ist. Die Nullhypothese wird abgelehnt.
Bei dem hier demonstrierten rechtsseitigen Test wird diese Entscheidungsregel in der Abb. 3 deutlich.

Abb. 3: Signifikanzniveau und Überschreitungswahrscheinlichkeit bei Gültigkeit der
Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der relativ nahe bei liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von groß.
ist ein für die Gültigkeit der Nullhypothese plausibler Wert, die Abweichung zwischen und kann als zufällig angesehen werden. Die Nullhypothese wird in diesem Fall nicht abgelehnt.
Entscheidungsregel:
Ist , impliziert dies, dass der Prüfwert ein Element des Nichtablehnungsbereiches der ist. Die Nullhypothese wird nicht abgelehnt.
Mit den gleichen Regeln sind die Testentscheidungen bei einem linksseitigen Test bzw. einem zweiseitigen Test zu treffen.