Entscheidungssituationen: Unterschied zwischen den Versionen

Version vom 12. Februar 2018, 12:28 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen

Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Entscheidungssituationen

Da statistische Tests auf Stichprobenergebnissen basieren, können Fehlentscheidungen nicht ausgeschlossen werden.

Je nachdem, welches konkrete Ergebnis die Stichprobe liefert, wird man im Ergebnis des Tests die Nullhypothese entweder nicht ablehnen oder ablehnen.

Dies sei wie folgt symbolisiert:

${\mbox{''}}H_{0}{\mbox{''}}$ : Nichtablehnung der Nullhypothese aufgrund der Testdurchführung

${\mbox{''}}H_{1}{\mbox{''}}$ : Ablehnung der Nullhypothese (Annahme der Alternativhypothese) aufgrund der Testdurchführung

Ebenso gibt es 2 Möglichkeiten für den wahren Zustand in der Grundgesamtheit:

${\mbox{''}}H_{0}{\mbox{''}}$ : die Nullhypothese gilt in Wirklichkeit

${\mbox{''}}H_{1}{\mbox{''}}$ : die Alternativhypothese gilt in Wirklichkeit.

Daraus ergeben sich 4 Entscheidungssituationen, wobei jede mit einer bestimmten Wahrscheinlichkeit behaftet ist.

Entscheidung im Ergebnis des Tests	Wahrer Zustand in der Grundgesamtheit
Entscheidung im Ergebnis des Tests	$H_{0}$ trifft zu	$H_{0}$ trifft nicht zu ( $H_{1}$ trifft zu)
$H_{0}$ wird nicht abgelehnt: ${\mbox{''}}H_{0}{\mbox{''}}$	Richtige Entscheidung ${\mbox{''}}H_{0}{\mbox{''}}\|H_{0}:P({\mbox{''}}H_{0}{\mbox{''}}\|H_{0})=1-\alpha$	Fehler 2. Art ${\mbox{''}}H_{0}{\mbox{''}}\|H_{1}:P({\mbox{''}}H_{0}{\mbox{''}}\|H_{1})=\beta$
$H_{0}$ wird abgelehnt: ${\mbox{''}}H_{1}{\mbox{''}}$	Fehler 1. Art ${\mbox{''}}H_{1}{\mbox{''}}\|H_{0}:P({\mbox{''}}H_{1}{\mbox{''}}\|H_{0})=\alpha$	Richtige Entscheidung ${\mbox{''}}H_{1}{\mbox{''}}\|H_{1}:P({\mbox{''}}H_{1}{\mbox{''}}\|H_{1})=1-\beta$

Fehler 1. Art bzw. α-Fehler

Es sei die Nullhypothese $H_{0}$ der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe eine große Abweichung zwischen dem Prüfwert $v$ der Teststatistik $V\;$ und dem hypothetischen Wert $\vartheta _{0}$ auftritt (d.h. $v$ in den Ablehnungsbereich von $H_{0}$ fällt), wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt $({\mbox{''}}H_{1}{\mbox{''}})$ .

Da jedoch in Wirklichkeit $H_{0}$ gilt, hat man einen Fehler begangen $({\mbox{''}}H_{1}{\mbox{''}}|H_{0})$ , der als Fehler 1. Art oder $\alpha$ -Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung nicht ausgeschlossen werden, denn eine Realisation der Teststatistik $V\;$ mit einer großen Abweichung zu $\vartheta _{0}$ ist bei Gültigkeit der $H_{0}$ zwar relativ unwahrscheinlich, jedoch nicht unmöglich.

Der Fehler soll jedoch lediglich mit einer vor der Testdurchführung vorgegebenen kleinen Wahrscheinlichkeit vorkommen.

Da die Wahrscheinlichkeit, bei Gültigkeit der Nullhypothese eine Realisation der Teststatistik $V\;$ im Ablehnungsbereich der $H_{0}$ zu erhalten, mit dem Signifikanzniveau $\alpha$ vorgegeben wird, ist das auch die Wahrscheinlichkeit für einen Fehler 1. Art.

Es gilt also:

$P\left({\mbox{''}}H_{1}{\mbox{''}}|H_{0}\right)=\alpha$

Fehler 2. Art bzw. β-Fehler

Es sei die Alternativhypothese $H_{1}$ der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe die Abweichung der Realisation $v$ der Teststatistik $V\;$ vom hypothetischen Wert $\vartheta _{0}$ relativ klein ist (d.h. $v$ fällt in den Nichtablehnungsbereich von $H_{0}$ ), spricht dies für die Nullhypothese und man wird sie nicht ablehnen $({\mbox{''}}H_{0}{\mbox{''}})$ .

Da jedoch in Wirklichkeit $H_{1}$ gilt, hat man einen Fehler begangen $({\mbox{''}}H_{0}{\mbox{''}}|H_{1})$ , der als Fehler 2. Art oder $\beta$ -Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung ebenfalls nicht ausgeschlossen werden, denn eine Realisation der Teststatistik $V\;$ mit einer kleinen Abweichung zu $\vartheta _{0}$ ist zwar in der Regel unwahrscheinlich, wenn $H_{1}$ gilt, aber nicht unmöglich.

Der Fehler 2. Art beinhaltet die fälschliche Beibehaltung der Nullhypothese, d.h. die Nichtablehnung der Nullhypothese, obwohl sie falsch ist.

$\beta (\vartheta _{1})$ bezeichne die Wahrscheinlichkeit dafür, einen Fehler 2. Art zu begehen, wenn $\vartheta _{1}$ der wahre Parameterwert in der Grundgesamtheit ist:

$P\left(H_{0}|H_{1}\right)=\beta \left(\vartheta _{1}\right)$

Man sieht bereits aus dieser Formulierung, dass diese Wahrscheinlichkeit unbekannt ist, da der wahre Parameterwert $\vartheta _{1}$ nicht bekannt ist.

Wenn aufgrund der konkreten Stichprobe der Prüfwert $v$ der Teststatistik $V\;$ in den Ablehnungsbereich von $H_{0}$ fällt, wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt $({\mbox{''}}H_{1}{\mbox{''}})$ .

Da auch in Wirklichkeit $H_{1}$ gilt, hat man eine richtige Entscheidung getroffen $({\mbox{''}}H_{1}{\mbox{''}}|H_{1})$ .

Die Wahrscheinlichkeit für diese richtige Entscheidung ist durch

$P\left(H_{1}|H_{1}\right)=1-\beta \left(\vartheta _{1}\right)$

gegeben.

Die Wahrscheinlichkeit $\beta (\vartheta _{1})$ eines Fehlers 2. Art hängt von dem vorgegebenen Signifikanzniveau $\alpha$ ab.

Zusatzinformationen

Zusammenhang zwischen Fehler 1. Art und Fehler 2. Art

Verringert man bei konstantem Stichprobenumfang $n$ das Signifikanzniveau $\alpha$ , vergrößert sich die Wahrscheinlichkeit $\beta (\vartheta _{1})$ eines Fehlers 2. Art und umgekehrt.

Es ist somit nicht möglich, gleichzeitig beide Fehlerwahrscheinlichkeiten beliebig zu verringern.

Grafisch sei dieser Zusammenhang für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik $V\;$ gezeigt.

Abb. 1: Verteilung der Teststatistik $V\;$ unter $H_{0}$ und unter $H_{1}$ : Zusammenhang zwischen Signifikanzniveau und Wahrscheinlichkeit eines Fehlers 2. Art.

<R output="display"> pdf(rpdf, width=14, height=7)

par(mfrow=c(1,2),cex.axis=2)

curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=20, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")

par(new=TRUE) xx1 <-c(-15:15, 15:-15) yy1 <-c(c(dnorm(c(-15:15), mean=20, sd=10)),c(rep(0,31))) polygon(xx1, yy1, col="lightblue", border=NA) par(new=TRUE) xx2 <-c(15:60, 60:15) yy2 <-c(c(dnorm(c(15:60), mean=0, sd=10)),c(rep(0,46))) polygon(xx2, yy2, col="pink", border=NA)

par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=20, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0")

abline(v=0,col="black", lwd=1, lty=2) abline(v=20,col="black", lwd=1, lty=2) abline(v=15, col="black", lwd=2, lty=1)

text(7.5, 0.008, expression(beta), col = "black", cex=2) text(17.5, 0.004, expression(alpha), col = "black", cex=2)

axis( side=1, at=c(0, 15, 20, 60), labels=c(expression(theta[0]), "C", expression(theta[1]), "V"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(V)"), tick=FALSE)

legend("topright", lwd=4, col=c("red","blue"),c("Verteilung unter H0", "Verteilung unter H1"), bty="n")

curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=20, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")

par(new=TRUE) xx1 <-c(-15:20, 20:-15) yy1 <-c(c(dnorm(c(-15:20), mean=20, sd=10)),c(rep(0,36))) polygon(xx1, yy1, col="lightblue", border=NA) par(new=TRUE) xx2 <-c(20:60, 60:20) yy2 <-c(c(dnorm(c(20:60), mean=0, sd=10)),c(rep(0,41))) polygon(xx2, yy2, col="pink", border=NA)

par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=20, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0")

abline(v=0,col="black", lwd=1, lty=2) abline(v=20,col="black", lwd=1, lty=2) abline(v=19.8, col="black", lwd=2, lty=1)

text(10, 0.005, expression(beta), col = "black", cex=2) text(22.5, 0.0015, expression(alpha), col = "black", cex=2)

axis( side=1, at=c(0, 18, 23, 60), labels=c(expression(theta[0]), "C", expression(theta[1]), "V"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(V)"), tick=FALSE)

legend("topright", lwd=4, col=c("red","blue"),c("Verteilung unter H0", "Verteilung unter H1"), bty="n")

</R>

Die Wahrscheinlichkeit eines Fehlers 2. Art hängt (bei vorgegebenem Signifikanzniveau $\alpha$ und Stichprobenumfang $n$ ) weiterhin von der Lage des wahren Parameterwertes $\vartheta _{1}$ gegenüber dem hypothetischen Wert $\vartheta _{0}$ unter $H_{0}$ ab.

Ist der Abstand groß, ist $\beta (\vartheta _{1})$ klein. Die Wahrscheinlichkeit eines Fehlers 2. Art wird jedoch immer größer, je kleiner der Abstand zwischen dem wahren Parameterwert $\vartheta _{1}$ und dem hypothetischen Wert $\vartheta _{0}$ unter $H_{0}$ wird.

Grafisch sei das wiederum für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik $V\;$ gezeigt.

Abb. 2: Verteilung der Teststatistik $V\;$ unter $H_{0}$ und unter $H_{1}$ : Zusammenhang zwischen Signifikanzniveau und Wahrscheinlichkeit eines Fehlers 2. Art

<R output="display"> pdf(rpdf, width=14, height=7)

par(mfrow=c(1,2),cex.axis=2)

curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=-10, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")

par(new=TRUE) xx1 <-c(-35:5, 5:-35) yy1 <-c(c(dnorm(c(-35:5), mean=0, sd=10)),c(rep(0,41))) polygon(xx1, yy1, col="lightblue", border=NA)

par(new=TRUE) xx2 <-c(5:60, 60:5) yy2 <-c(c(dnorm(c(5:60), mean=-10, sd=10)),c(rep(0,56))) polygon(xx2, yy2, col="pink", border=NA)

par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=0, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=-10, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0")

abline(v=-10,col="black", lwd=1, lty=2) abline(v=0,col="black", lwd=1, lty=2) abline(v=5, col="black", lwd=2, lty=1)

text(-6.5, 0.008, expression(beta), col = "black", cex=2) text(8.5, 0.003, expression(alpha), col = "black", cex=2)

axis( side=1, at=c(-10, 0, 5, 60), labels=c(expression(theta[0]), expression(theta[1]), "C", "V"), cex=1, tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(V)"), tick=FALSE)

legend("topright", lwd=4, col=c("red","blue"),c("Verteilung unter H0", "Verteilung unter H1"), bty="n")

curve(from=-40, to=60, dnorm(x, mean=-10, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=25, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0")

par(new=TRUE) xx1 <-c(-15:5, 5:-15) yy1 <-c(c(dnorm(c(-15:5), mean=25, sd=10)),c(rep(0,21))) polygon(xx1, yy1, col="lightblue", border=NA) par(new=TRUE) xx2 <-c(5:60, 60:5) yy2 <-c(c(dnorm(c(5:60), mean=-10, sd=10)),c(rep(0,56))) polygon(xx2, yy2, col="pink", border=NA)

par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=-10, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0") par(new=TRUE) curve(from=-40, to=60, dnorm(x, mean=25, sd=10), xaxt="n", yaxt="n",ylab="", xlab="", col="blue", ylim=c(0.0,0.04), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", main= "Nichtablehnungsbereich der H0 |Ablehnungsbereich der H0")

abline(v=-10,col="black", lwd=1, lty=2) abline(v=5, col="black", lwd=2, lty=1) abline(v=25,col="black", lwd=1, lty=2)

text(3, 0.001, expression(beta), col = "black", cex=2) text(8, 0.0025, expression(alpha), col = "black", cex=2)

axis( side=1, at=c(-10, 5, 25, 60), labels=c(expression(theta[0]), "C", expression(theta[1]), "V"), tick=FALSE) axis( side=2, at=c(0.039), labels=c("f(V)"), tick=FALSE)

legend("topright", lwd=4, col=c("red","blue"),c("Verteilung unter H0", "Verteilung unter H1"), bty="n")

</R>

Interpretation von Testergebnissen

Da bei allen Testdurchführungen die Wirklichkeit unbekannt ist und die Entscheidung nur auf einem Stichprobenergebnis basiert, muss man sich stets bewusst sein, dass man mit der Testentscheidung einen Fehler begehen kann.

Daher bedeutet die Beibehaltung der Nullhypothese noch lange nicht, dass ihre Richtigkeit bewiesen ist! Man hat lediglich ein Stichprobenergebnis beobachtet, dass ihr nicht widerspricht.

Ablehnung bzw. Nichtablehnung der Nullhypothese haben eine unterschiedliche Aussagekraft.

Bei einer Ablehnung der Nullhypothese ist die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, mit dem vorgegebenen Signifikanzniveau auf einen kleinen Wert beschränkt.

Die Nichtablehnung von $H_{0}$ ist dagegen wesentlich unsicherer und statistisch nicht abgesichert, da die Wahrscheinlichkeit eines Fehlers 2. Art im Allgemeinen nicht bekannt ist und sehr groß sein kann.

Aus diesem Grund wird in der Regel diejenige Annahme als Alternativhypothese $H_{1}$ formuliert, die "statistisch bestätigt" werden soll oder deren fälschliche Annahme mit den schwerwiegenderen Folgen verbunden ist.

Dies ist vor allem bei einseitigen Tests zu beachten.

@@ Zeile 93: / Zeile 93: @@
 Die [[Wahrscheinlichkeit]] <math>\beta(\vartheta_{1})</math> eines Fehlers 2. Art hängt von dem vorgegebenen [[Signifikanzniveau]] <math>\alpha</math> ab.
-=={{Vorlage:Überschrift_2}}==
+==Zusatzinformationen==
 ===Zusammenhang zwischen Fehler 1. Art und Fehler 2. Art===

Entscheidungssituationen: Unterschied zwischen den Versionen

Aus MM*Stat

Version vom 12. Februar 2018, 12:28 Uhr

Inhaltsverzeichnis

Grundbegriffe

Entscheidungssituationen

Fehler 1. Art bzw. α-Fehler

Fehler 2. Art bzw. β-Fehler

Zusatzinformationen

Zusammenhang zwischen Fehler 1. Art und Fehler 2. Art

Interpretation von Testergebnissen