Gütefunktion des Gauß-Tests: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
 
(16 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
 
{{Testtheorie}}
 
{{Testtheorie}}
 +
{{SubpageToc|Beispiele}}
  
 
==Grundbegriffe==
 
==Grundbegriffe==
  
===Gütefunktion des Gauß-Tests===
+
=== Gütefunktion des Gauß-Tests ===  
  
 
Für die Beurteilung der Güte eines [[Statistischer Test|Tests]] ist entscheidend, dass vorhandene Abweichungen des wahren [[Parameter]]wertes <math>\mu</math> vom hypothetischen Wert <math>\mu _{0}</math> möglichst zuverlässig aufgedeckt werden.  
 
Für die Beurteilung der Güte eines [[Statistischer Test|Tests]] ist entscheidend, dass vorhandene Abweichungen des wahren [[Parameter]]wertes <math>\mu</math> vom hypothetischen Wert <math>\mu _{0}</math> möglichst zuverlässig aufgedeckt werden.  
Zeile 19: Zeile 20:
 
<math>G(\mu)=P(V \in \mbox{Ablehnungsbereich der } H_{0}|\mu)=P(\mbox{''}H_{1}\mbox{''}|\mu)\;</math>
 
<math>G(\mu)=P(V \in \mbox{Ablehnungsbereich der } H_{0}|\mu)=P(\mbox{''}H_{1}\mbox{''}|\mu)\;</math>
  
====Zweiseitiger Test====
+
====Zweiseitiger Test====  
  
 
Bei einem [[zweiseitiger Test|zweiseitigen Test]] ist die [[Nullhypothese]] in Wirklichkeit nur wahr, wenn <math>\mu =\mu_{0}</math> gilt,
 
Bei einem [[zweiseitiger Test|zweiseitigen Test]] ist die [[Nullhypothese]] in Wirklichkeit nur wahr, wenn <math>\mu =\mu_{0}</math> gilt,
Zeile 55: Zeile 56:
 
Das charakteristische Bild der [[Gütefunktion]] beim [[zweiseitiger Test|zweiseitigen Test]] zeigt die folgende Abbildung.
 
Das charakteristische Bild der [[Gütefunktion]] beim [[zweiseitiger Test|zweiseitigen Test]] zeigt die folgende Abbildung.
  
<iframe k="wiwi" p="examples?P=stat/Guetefunktion/GF_zweiseitig.R&V=P" />
+
 
 +
<iframe k="wiwi" p="examples/stat_GuetefunktionGaustest_GF_zweiseitig_R00480004801536916699947_plot.html" />
  
 
In dieser Abbildung sind zwei mögliche Alternativwerte <math>\mu_{1}</math> und <math>\mu _{2}</math> eingetragen.  
 
In dieser Abbildung sind zwei mögliche Alternativwerte <math>\mu_{1}</math> und <math>\mu _{2}</math> eingetragen.  
Zeile 95: Zeile 97:
 
Das charakteristische Bild der [[Gütefunktion]] beim [[Rechtsseitiger Test|rechtsseitigen Test]] zeigt die folgende Abbildung.
 
Das charakteristische Bild der [[Gütefunktion]] beim [[Rechtsseitiger Test|rechtsseitigen Test]] zeigt die folgende Abbildung.
  
<iframe k="wiwi" p="examples?P=stat/Guetefunktion/GF_rechtsseitig.R&V=P" />
 
  
 +
<iframe k="wiwi" p="examples/stat_Guetefunktion_GF_rechtsseitig_R00480004800000000000000_plot.html" />
 
Für alle gültigen Werte der [[Alternativhypothese]], d.h. <math>\mu >\mu_{0}</math>, wächst die [[Gütefunktion]] und nimmt schließlich den Wert
 
Für alle gültigen Werte der [[Alternativhypothese]], d.h. <math>\mu >\mu_{0}</math>, wächst die [[Gütefunktion]] und nimmt schließlich den Wert
 
Eins an.  
 
Eins an.  
Zeile 108: Zeile 110:
 
Je größer dabei die Differenz <math>\mu -\mu_{0}</math> wird, desto kleiner wird die [[Wahrscheinlichkeit]] <math>\alpha</math>, einen [[Fehler 1. Art]] zu begehen.
 
Je größer dabei die Differenz <math>\mu -\mu_{0}</math> wird, desto kleiner wird die [[Wahrscheinlichkeit]] <math>\alpha</math>, einen [[Fehler 1. Art]] zu begehen.
  
====Linksseitiger Test====
+
====Linksseitiger Test====  
  
 
Im Fall eines [[Linksseitiger Test|linksseitigen Test]]s gilt die [[Nullhypothese]] in Wirklichkeit für alle zulässigen Werte des [[Parameter]]s <math>\mu</math>, für die <math>\mu \geq \mu _{0}</math> ist.  
 
Im Fall eines [[Linksseitiger Test|linksseitigen Test]]s gilt die [[Nullhypothese]] in Wirklichkeit für alle zulässigen Werte des [[Parameter]]s <math>\mu</math>, für die <math>\mu \geq \mu _{0}</math> ist.  
Zeile 132: Zeile 134:
 
Das charakteristische Bild der [[Gütefunktion]] beim [[Linksseitiger Test|linksseitigen Test]] zeigt die folgende Abbildung.
 
Das charakteristische Bild der [[Gütefunktion]] beim [[Linksseitiger Test|linksseitigen Test]] zeigt die folgende Abbildung.
  
<iframe k="wiwi" p="examples?P=stat/Guetefunktion/GF_linksseitig.R&V=P" />
+
 
 +
<iframe k="wiwi" p="examples/stat_Guetefunktion_GF_linksseitig_R00480004800000000000000_plot.html" />
  
 
Hier gelten analoge Interpretationen wie für die [[Gütefunktion]] eines [[Rechtsseitiger Test|rechtsseitigen Test]]s.
 
Hier gelten analoge Interpretationen wie für die [[Gütefunktion]] eines [[Rechtsseitiger Test|rechtsseitigen Test]]s.
Zeile 138: Zeile 141:
 
==Zusatzinformationen==
 
==Zusatzinformationen==
  
===Herleitung der Gütefunktion===
+
===Herleitung der Gütefunktion===  
  
 
Für einen [[Rechtsseitiger Test|rechtsseitigen Test]] wird die Formel für die Berechnung der [[Gütefunktion]] hergeleitet.
 
Für einen [[Rechtsseitiger Test|rechtsseitigen Test]] wird die Formel für die Berechnung der [[Gütefunktion]] hergeleitet.
Zeile 182: Zeile 185:
 
Analog können die Formeln für die Berechnung der [[Gütefunktion]] bei [[Einseitiger Test|einseitigen Tests]] hergeleitet werden.
 
Analog können die Formeln für die Berechnung der [[Gütefunktion]] bei [[Einseitiger Test|einseitigen Tests]] hergeleitet werden.
  
===Eigenschaften der Gütefunktion===
+
 
 +
===Eigenschaften der Gütefunktion===  
  
 
Für die Güte eines [[Statistischer Test|Tests]] ist es von Vorteil, wenn die [[Wahrscheinlichkeit]], sich richtigerweise für <math>H_{1}</math> zu entscheiden, mit wachsendem Abstand des wahren [[Parameter]]wertes <math>\mu</math> vom hypothetischen Wert <math>\mu_{0}</math> schnell anwächst, d.h. wenn die [[Gütefunktion]] recht steil verläuft.  
 
Für die Güte eines [[Statistischer Test|Tests]] ist es von Vorteil, wenn die [[Wahrscheinlichkeit]], sich richtigerweise für <math>H_{1}</math> zu entscheiden, mit wachsendem Abstand des wahren [[Parameter]]wertes <math>\mu</math> vom hypothetischen Wert <math>\mu_{0}</math> schnell anwächst, d.h. wenn die [[Gütefunktion]] recht steil verläuft.  
Zeile 192: Zeile 196:
 
* über das [[Signifikanzniveau]] <math>\alpha</math>
 
* über das [[Signifikanzniveau]] <math>\alpha</math>
  
====Stichprobenumfang====
+
 
 +
====Stichprobenumfang====  
  
 
Wie aus den Formeln für die Berechnung der [[Gütefunktion]] ersichtlich ist, hängt <math>G\left(\mu\right)</math> außer an der Stelle <math>\mu = \mu_{0}</math> vom [[Stichprobenumfang]] <math>n</math> ab.  
 
Wie aus den Formeln für die Berechnung der [[Gütefunktion]] ersichtlich ist, hängt <math>G\left(\mu\right)</math> außer an der Stelle <math>\mu = \mu_{0}</math> vom [[Stichprobenumfang]] <math>n</math> ab.  
Zeile 205: Zeile 210:
 
Die nachstehende Abbildung zeigt für einen [[zweiseitiger Test|zweiseitigen Test]] bei vorgegebenem [[Signifikanzniveau]] <math>\alpha</math> die [[Gütefunktion]]en für 4 verschiedene [[Stichprobenumfang|Stichprobenumfänge]], wobei  <math>n_{1}<n_{2}<n_{3}<n_{4}</math> gilt.
 
Die nachstehende Abbildung zeigt für einen [[zweiseitiger Test|zweiseitigen Test]] bei vorgegebenem [[Signifikanzniveau]] <math>\alpha</math> die [[Gütefunktion]]en für 4 verschiedene [[Stichprobenumfang|Stichprobenumfänge]], wobei  <math>n_{1}<n_{2}<n_{3}<n_{4}</math> gilt.
  
{| width="40%"
 
|<R output="display">
 
pdf(rpdf)
 
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1)
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(5)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(5)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="black", lwd=4, lty=1)
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(10)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(10)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1)
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(15)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(15)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="darkgreen", lwd=4, lty=1)
 
 
abline(v=0, col="black", lwd=2, lty=2)
 
  
axis( side=1, at=c(0), labels=c(expression(mu[0])), tick=FALSE, cex.axis=1.5, font.axis=2)
+
<iframe k="wiwi" p="examples/stat_Guetefunktion_GF_mu0_1000_4SP_R00480004801536916513313_plot.html" />
legend("bottomright", lwd=4, col=c("red","black","blue","darkgreen"),c(expression("n"[1]),expression("n"[2]),expression("n"[3]),expression("n"[4])), bty="n", cex=1.5)
 
 
</R>
 
|}
 
  
====Signifikanzniveau====
+
====Signifikanzniveau====  
  
 
Je größer unter sonst gleichen Bedingungen das [[Signifikanzniveau]] <math>\alpha</math> (die [[Wahrscheinlichkeit]] für einen [[Fehler 1. Art]]) ist, desto höher verläuft der Graf der [[Gütefunktion]].  
 
Je größer unter sonst gleichen Bedingungen das [[Signifikanzniveau]] <math>\alpha</math> (die [[Wahrscheinlichkeit]] für einen [[Fehler 1. Art]]) ist, desto höher verläuft der Graf der [[Gütefunktion]].  
Zeile 237: Zeile 225:
 
die rote Linie repräsentiert <math>G(\mu)</math> für <math>\alpha = 0,05</math> und die blaue Linie <math>G(\mu)</math> für <math>\alpha = 0,10</math>.
 
die rote Linie repräsentiert <math>G(\mu)</math> für <math>\alpha = 0,05</math> und die blaue Linie <math>G(\mu)</math> für <math>\alpha = 0,10</math>.
  
{| width="40%"
 
|<R output="display">
 
pdf(rpdf)
 
 
curve(from=-2, to=2, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1)
 
par(new=TRUE)
 
curve(from=-2, to=2, expr=1-(pnorm((1.64-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.64-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1)
 
 
abline(v=0, col="black", lwd=2, lty=2)
 
 
axis( side=1, at=c(0), labels=c(expression(mu[0])), tick=FALSE, cex.axis=1.5, font.axis=2)
 
legend("bottomright", lwd=4, col=c("red","blue"),c(expression(paste("G(", mu, "), ", alpha, " = 0,05")),expression(paste("G(", mu, "), ", alpha, " = 0,10"))), bty="n", cex=1.5)
 
</R>
 
|}
 
  
 +
<iframe k="wiwi" p="examples/stat_Guetefunktion_GF_zweiseitig_2Alpha_R00480004800000000000000_plot.html" />
 
<!--
 
<!--
 
[[Bild:STAT-Gütefunktionzweis5.gif]]
 
[[Bild:STAT-Gütefunktionzweis5.gif]]
 
-->
 
-->
 
=={{Vorlage:Beispiele}}==
 
 
===Mehl===
 
 
In einem Unternehmen wird Mehl maschinell in Tüten abgefüllt. Das Sollgewicht beträgt 1000 g, auf das die Maschine justiert wurde.
 
 
Das Ist-Gewicht der Mehltüten weist gewisse Schwankungen auf, die im Produktionsprozess nicht vermieden werden können.
 
 
Damit ist das Ist-Gewicht eine [[Zufallsvariable]]: <math>X =\;</math>"Ist-Gewicht der Mehltüten".
 
 
Der [[Erwartungswert]] des Ist-Gewichts <math>E[X] = \mu</math>, mit dem die Maschine derzeit arbeitet, ist unbekannt. Er soll jedoch dem Sollgewicht entsprechen, d.h. <math>E[X] = \mu_{0} = 1000 \mbox{g}</math>.
 
 
Die Konsequenz ist, dass nach einer gewissen Laufzeit der Maschine überprüft werden muss, ob die ursprüngliche Justierung der Maschine noch eingehalten wird oder ob schon erhebliche Abweichungen auftreten.
 
 
Dazu wird in gewissen Abständen eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> aus der Produktion entnommen, für die [[Stichprobe]] das durchschnittliche Ist-Gewicht ermittelt und das Ergebnis mit dem Sollwert verglichen.
 
 
Bei
 
erheblichen (signifikanten) Abweichungen muss eine neue Justierung der Maschine vorgenommen
 
werden.
 
 
Aus der Sicht des Unternehmers sind Abweichungen nach beiden Seiten vom Sollwert <math>\mu_{0}= 1000\mbox{g}</math> relevant.
 
 
Wird im Mittel zu wenig abgefüllt, würde dieser Umstand über kurz oder lang bei Überprüfungen (z.B. durch Verbraucherorganisationen) bekannt und der Reputation des Unternehmens erheblichen Schaden zufügen.
 
 
Wird im Mittel zu viel abgefüllt, schmälert dies den Gewinn des Unternehmers. Es ist somit ein [[zweiseitiger Test]] durchzuführen:
 
 
<math>H_{0}:\mu =1000\quad H_{1}:\mu \neq 1000</math>
 
 
Der [[Statistischer Test|Test]] soll auf einem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> durchgeführt werden.
 
 
Es wird eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> gezogen. Aufgrund des großen [[Umfang der Grundgesamtheit|Umfangs der Grundgesamtheit]] (Gesamtproduktion) kann dabei von einer [[Einfache Zufallsstichprobe|einfachen Zufallsstichprobe]] ausgegangen werden.
 
 
====Teststatistik und Entscheidungsbereiche====
 
 
Als [[Schätzfunktion]] für den unbekannten [[Erwartungswert der Grundgesamtheit|Erwartungswert <math>E[X] = \mu</math> der Grundgesamtheit]] wird der [[Stichprobenmittelwert]] <math>\bar{X}</math> verwendet.
 
 
Es sei aufgrund der langjährigen Nutzung der Maschine bekannt, dass das Ist-Gewicht eine [[Normalverteilung|normalverteilte]] [[Zufallsvariable]] mit der [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma = 10\mbox{g}</math> ist.
 
 
Dann folgt für die [[Schätzfunktion]] <math>\bar{X}</math>, dass sie ebenfalls [[Normalverteilung|normalverteilt]] ist und eine [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\sigma\left(\bar{X}\right) = 2\mbox{g}</math> aufweist.
 
 
Bei Gültigkeit der [[Nullhypothese]], d.h. wenn die Maschine im Mittel tatsächlich das Sollgewicht von 1000 g einhält, gilt:
 
 
<math>\bar{X}\mbox{ ist unter } H_{0}\sim N(1000;\;2)</math>.
 
 
Für die [[Teststatistik]]
 
 
<math>V=\frac{\bar{X}-\mu_{0}}{\sigma}\cdot\sqrt{n}</math>
 
 
folgt:
 
 
<math>V \mbox{ ist unter }H_{0}\sim N(0;\;1)</math>.
 
 
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] findet man für <math>P(V \leq c_{o})=1-\frac{\alpha}{2} = 0,975</math> den oberen [[Kritischer Wert|kritischen Wert]] <math>c_{o} = z_{0,975}= 1,96</math>.
 
 
Wegen der Symmetrie der [[Normalverteilung]] gilt <math>c_{u}=-z_{1-\frac{\alpha}{2}}=-1,96</math>.
 
 
Damit ergeben sich die [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu:
 
 
[[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]]<math>:\;\left\{v|-1,96\leq v\leq 1,96\right\}</math>
 
 
[[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]<math>:\;\left\{v|v<-1,96 \mbox{ oder }v>1,96\right\}</math>
 
 
{|
 
|<R output="display">
 
pdf(rpdf,width=7,height=7)
 
 
curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche")
 
abline(v=-2, col="black", lwd=2)
 
abline(v=2, col="black", lwd=2)
 
abline(v=0.0, col="black", lwd=4, lty=2)
 
text(0, 0.15, expression(paste("1-" , alpha,"=0,95")), col = "black", cex=1.7)
 
text(-2.7, 0.01, expression(paste(alpha, "/2=0,025")), col = "black", cex=1.2)
 
text(2.7, 0.01, expression(paste(alpha, "/2=0,025")), col = "black", cex=1.2)
 
axis( side=1, at=c(-2, 0, 2, 4), labels=c("-1,96", "0", "1,96", "v"), tick=FALSE, cex.axis=1.5)
 
axis( side=2, at=c(0.39), labels=c("f(v)"), tick=FALSE, cex.axis=1.5)
 
 
</R>
 
|}
 
[[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}| </math>]][[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}| </math>]][[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]
 
 
====Prüfwert====
 
 
Es werden nunmehr die 25 Mehltüten zufällig ausgewählt, ihr Ist-Gewicht festgestellt und das [[Arithmetisches Mittel|arithmetische Mittel]] dieser Gewichte berechnet, für das sich <math>\bar{x} = 996,4 \mbox{ g}</math>  ergeben habe.
 
 
Als [[Prüfwert]] erhält man
 
 
<math>v=\frac{996,4-1000}{2}=-1,8</math>
 
 
====Entscheidungssituationen====
 
 
Da <math>v = - 1,8 </math> in den [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] fällt, wird die [[Nullhypothese]] nicht abgelehnt.
 
 
Basierend auf der [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> konnte statistisch nicht gezeigt werden, dass der wahre [[Erwartungswert der Grundgesamtheit|Erwartungswert <math>E[X] = \mu</math> in der Grundgesamtheit]] verschieden vom hypothetischen Wert <math>\mu_{0} = 1000\mbox{g}</math> ist, d.h. dass die Maschine den Sollwert von 1000 g nicht einhält.
 
 
====Gütefunktion====
 
 
Bei dieser Testentscheidung besteht die Möglichkeit, einen [[Fehler 2. Art]] <math>(\mbox{''}H_{0}\mbox{''}|H_{1})</math> zu begehen, wenn in Wirklichkeit die [[Alternativhypothese]] richtig ist.
 
 
Die [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnung der <math>H_{0}</math>]] kann daher nur angemessen beurteilt werden, wenn die [[Wahrscheinlichkeit]] für einen derartigen Fehler berücksichtigt wird.
 
 
Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] ist jedoch unbekannt, da der wahre [[Erwartungswert der Grundgesamtheit|Erwartungswert <math>E[X] = \mu</math> in der Grundgesamtheit]] unbekannt ist.
 
 
Man kann aber für verschiedene mögliche Alternativwerte <math>\mu</math> die [[Gütefunktion]] und über <math>1 - G(\mu)</math> die [[Wahrscheinlichkeit]] für den [[Fehler 2. Art]] in Abhängigkeit von <math>\mu</math> ermitteln.
 
 
Es sei z.B. angenommen, dass <math>\mu = 1002\mbox{g}</math> das tatsächliche mittlere Ist-Gewicht ist, mit dem die Maschine arbeitet.
 
 
Da für <math>\mu = 1002\mbox{g}</math> in Wirklichkeit die [[Alternativhypothese]] <math>H_{1}</math> stimmt, gibt die [[Gütefunktion]] <math>G(\mu = 1002)</math> an dieser Stelle die [[Wahrscheinlichkeit]] einer richtigen Entscheidung für <math>H_{1}</math> an:
 
 
<math>P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)= 1-\beta</math>
 
 
Mit <math>\mu_{0} = 1000,\; \alpha =0,05,\; \sigma =10</math> und <math>n = 25</math> erhält man:
 
{|
 
|<math>G\left(\mu = 1002\right)</math>
 
|<math>=1-\left[P\left( V\leq 1,96-\frac{1002-1000}{2}\right)-P\left(V\leq -1,96-\frac{1002-1000}{2}\right) \right]</math>
 
|-
 
|
 
|<math>=1-\left[P\left(V\leq 0,96\right)-P\left(V\leq -2,96\right)\right]</math>
 
|-
 
|
 
|<math>=1-\left[P\left( V\leq 0,96\right) -\left( 1-P\left( V\leq 2,96\right) \right) \right]</math>
 
|-
 
|
 
|<math> =1-\left[ 0,831472-\left( 1-0,998462\right) \right]</math>
 
|-
 
|
 
|<math>=1-0,829934\;</math>
 
|-
 
|
 
|<math> =0,17=1-\beta\;</math>
 
|}
 
 
Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] an der Stelle <math>\mu = 1002</math> ist:
 
 
<math>P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right) =\beta \left(\mu = 1002\right) =1-G\left(\mu=  1002\right)=0,83</math>
 
 
Wenn das tatsächliche durchschnittliche Ist-Gewicht <math>\mu = 1002\mbox{g}</math> beträgt, wird in rund 83% aller [[Stichprobe]]n vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> die Abweichung vom Sollgewicht 1000 g durch den Test nicht aufgedeckt.
 
 
Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] ist sehr hoch, da die Differenz <math>\mu -\mu_{0} = 1002 - 1000</math> relativ klein ist.
 
 
Wenn dagegen z.B. <math>\mu = 989</math> g der wahre [[Parameter]]wert in der [[Grundgesamtheit]] ist, dann gibt <math>G(\mu = 989)</math> ebenfalls die [[Wahrscheinlichkeit]] einer richtigen Entscheidung für <math>H_{1}</math> an:
 
 
<math>P\left(\mbox{''}H_{1}\mbox{''}|H_{1} \right)=1-\beta</math>, da in Wirklichkeit die [[Alternativhypothese]] <math>H_{1}</math> stimmt.
 
 
Man erhält durch analoge Berechnungen:
 
 
<math>G\left(\mu= 989 \right) = 1-\beta = 0,9998</math> und <math> \beta\left(\mu =989\right)=0,0002</math>
 
 
In nur rund 0,02% aller [[Stichprobe]]n vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> wird in diesem Fall die Abweichung vom Sollgewicht <math>1000\mbox{g}</math> durch den [[Statistischer Test|Test]] nicht aufgedeckt.
 
 
Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] ist sehr klein, da die Differenz <math>\mu - \mu_{0} = 989 - 1000</math> groß ist.
 
 
Für die gegebenen Werte von <math>\mu_{0},\; \alpha,\; \sigma</math> und <math>n</math> sind in der folgenden Tabelle <math>G(\mu)</math> und <math>1 - G(\mu)</math> für weitere zulässige Werte von <math>\mu</math> enthalten.
 
 
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
 
|align="center"|<math>\mu</math>
 
|align="center"|Gültigkeit von
 
|align="center"|<math>G\left( \mu \right)</math>
 
|align="center"|<math>1-G\left( \mu \right)</math>
 
|-
 
|align="center"|<math>988,00</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,999973=1-\beta</math>
 
|align="center"|<math>0,000027=\beta</math>
 
|-
 
|align="center"|<math>990,40</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,997744=1-\beta </math>
 
|align="center"|<math>0,002256=\beta</math>
 
|-
 
|align="center"|<math>992,80</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,949497=1-\beta</math>
 
|align="center"|<math>0,050503=\beta</math>
 
|-
 
|align="center"|<math>995,20</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,670038=1-\beta</math>
 
|align="center"|<math>0,329962=\beta</math>
 
|-
 
|align="center"|<math>997,60</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,224416=1-\beta</math>
 
|align="center"|<math>0,775584=\beta</math>
 
|-
 
|align="center"|<math>1000,00</math>
 
|align="center"|<math>H_{0}</math>
 
|align="center"|<math>0,05=\alpha</math>
 
|align="center"|<math>0,95=1-\alpha</math>
 
|-
 
|align="center"|<math>1002,40</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,224416=1-\beta</math>
 
|align="center"|<math>0,775584=\beta</math>
 
|-
 
|align="center"|<math>1004,80</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,670038=1-\beta</math>
 
|align="center"|<math>0,329962=\beta</math>
 
|-
 
|align="center"|<math>1007,20</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,949497=1-\beta</math>
 
|align="center"|<math>0,050503=\beta </math>
 
|-
 
|align="center"|<math>1009,60</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,997744=1-\beta</math>
 
|align="center"|<math>0,002256=\beta </math>
 
|-
 
|align="center"|<math>1012,00</math>
 
|align="center"|<math>H_{1}</math>
 
|align="center"|<math>0,999973=1-\beta</math>
 
|align="center"|<math>0,000027=\beta</math>
 
|}
 
 
Die grafische Darstellung der [[Gütefunktion]] enthält die Abb. 2.
 
 
{|
 
|<R output="display">
 
pdf(rpdf,width=7,height=7)
 
 
curve(from=-3, to=3, expr=1-(pnorm((1.96-x), mean=x, sd=1))+(pnorm((-1.96-x), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab="", ylim=c(0,1), col="red", lwd=4, lty=1, cex.lab=1.2, sub="Abb. 2: G\u00FCtefunktion mit mu_0=1000, alpha=0,05, sigma=10 und n=25")
 
 
abline(v=0, col="grey", lwd=2, lty=2)
 
 
axis( side=1, at=c( 0, 3), labels=c(expression(paste(mu[0], "=1000")), expression(mu)), tick=FALSE, cex.axis=1.5, font.axis=1.2)
 
 
</R>
 
|}
 
 
Eine Möglichkeit, die [[Gütefunktion]] bei festem [[Signifikanzniveau]] <math>\alpha= 0,05</math> zu beeinflussen, ist die Erhöhung des [[Stichprobenumfang]]s <math>n</math>.
 
 
Das soll exemplarisch unter den Annahmen gezeigt werden, dass <math>\mu = 1002\mbox{g}</math> bzw. <math>\mu = 989\mbox{g}</math> der wahre [[Parameter]]wert in der [[Grundgesamtheit]] ist, wobei weiterhin <math>\alpha=0,05,\; \mu_{0} = 1000</math> und <math>\sigma = 10</math> gelten.
 
 
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
 
|
 
|align="center"|<math>n=9</math>
 
|align="center"|<math>n=16</math>
 
|align="center"|<math>n=25</math>
 
|align="center"|<math>n=36</math>
 
|-
 
|align="center"|<math>G\left(1002\right)=1-\beta</math>
 
|align="center"|<math>0,0921</math>
 
|align="center"|<math>0,126</math>
 
|align="center"|<math>0,17</math>
 
|align="center"|<math>0,224</math>
 
|-
 
|align="center"|<math>\beta \left(\mu = 1002\right)</math>
 
|align="center"|<math>0,9079</math>
 
|align="center"|<math>0,874</math>
 
|align="center"|<math>0,83</math>
 
|align="center"|<math>0,776</math>
 
|-
 
|align="center"|<math>G\left(\mu = 989\right) =1-\beta</math>
 
|align="center"|<math>0,91</math>
 
|align="center"|<math>0,993</math>
 
|align="center"|<math>0,9998</math>
 
|align="center"|<math>0,999998</math>
 
|-
 
|align="center"|<math>\beta \left(\mu =  989\right)</math>
 
|align="center"|<math>0,09</math>
 
|align="center"|<math>0,007</math>
 
|align="center"|<math>0,0002</math>
 
|align="center"|<math>0,000002</math>
 
|}
 
 
Abb. 3 zeigt die [[Gütefunktion]]en für die 4 verschiedenen [[Stichprobenumfang|Stichprobenumfänge]].
 
 
 
===BEARBEITUNG===
 
 
{|
 
|<R output="display">
 
pdf(rpdf,width=7,height=7)
 
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1, cex.lab=1.2, sub="Abb. 3: G\u00FCtefunktion mit mu_0=1000, alpha=0,05, sigma=10 und vier verschiedenen n")
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(5)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(5)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="black", lwd=4, lty=1, cex.lab=1.2)
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(10)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(10)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1, cex.lab=1.2)
 
par(new=TRUE)
 
curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(15)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(15)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="darkgreen", lwd=4, lty=1, cex.lab=1.2)
 
 
abline(v=0, col="black", lwd=2, lty=2)
 
 
axis( side=1, at=c(-1.5, -0.75, 0, 0.75, 1.5), labels=c("988","994","1000","1006","1012"), tick=FALSE, cex.axis=1.5, font.axis=1.5)
 
legend("bottomright", lwd=4, col=c("red","black","blue","darkgreen"),c(expression("n=9"),expression("n=16"),expression("n=25"),expression("n=36")), bty="n", cex=1.5)
 
 
</R>
 
|}
 
 
Wird z.B. vermutet, dass die Maschine nur mit einer geringfügigen Abweichung vom Sollwert <math>\mu_{0}</math> arbeitet, so ist ein größerer [[Stichprobenumfang]] empfehlenswert, um vorhandene Abweichungen zuverlässiger aufzudecken und bei [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnung der <math>H_{0}</math>]] die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] zu verringern, auch wenn dadurch die Kosten für die Überprüfung der Maschine höher werden.
 

Aktuelle Version vom 22. November 2018, 15:25 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Gütefunktion des Gauß-Tests

Für die Beurteilung der Güte eines Tests ist entscheidend, dass vorhandene Abweichungen des wahren Parameterwertes vom hypothetischen Wert möglichst zuverlässig aufgedeckt werden.

Es interessiert daher die Wahrscheinlichkeit, sich im Ergebnis des Tests für zu entscheiden, wenn der wahre Parameterwert vom hypothetischen Wert verschieden ist.

Diese Wahrscheinlichkeit kann mittels der Gütefunktion gewonnen werden.

Wenn bekannt ist und der hypothetische Wert , das Signifikanzniveau und der Stichprobenumfang vorgegeben sind, können die Werte der Gütefunktion berechnet werden, indem nacheinander alle zulässigen Werte für eingesetzt werden.

Die Gütefunktion kann bereits vor der Stichprobenerhebung ermittelt werden, da sie sich nicht auf konkrete Realisationen der Teststatistik bezieht.

Die Gütefunktion gibt die Wahrscheinlichkeit der Ablehnung von in Abhängigkeit vom Parameterwert an:

Zweiseitiger Test

Bei einem zweiseitigen Test ist die Nullhypothese in Wirklichkeit nur wahr, wenn gilt, so dass in diesem Fall mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen wird und

ist.

Für alle anderen zulässigen Werte von gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wird eine richtige Entscheidung getroffen.

Es ist

Die Gütefunktion kann beim zweiseitigen Test für vorgegebene Werte von wie folgt berechnet werden:

Die Wahrscheinlichkeit für einen Fehler 2. Art lässt sich leicht über die Gütefunktion ermitteln:

Charakteristika der Gütefunktion beim zweiseitigen Test

  • An der Stelle nimmt sie ihr Minimum mit dem vorgegebenen Signifikanzniveau an.
  • Sie ist symmetrisch zum hypothetischen Wert
  • Sie wächst mit zunehmenden Abstand des wahren Parameterwertes vom hypothetischen Wert und nimmt schließlich den Wert Eins an.

Das charakteristische Bild der Gütefunktion beim zweiseitigen Test zeigt die folgende Abbildung.


In dieser Abbildung sind zwei mögliche Alternativwerte und eingetragen.

Wenn in Wirklichkeit der wahre Parameterwert in der Grundgesamtheit ist, so existiert eine relativ große Abweichung .

Die Wahrscheinlichkeit einer richtigen Entscheidung für die Alternativhypothese ist groß und damit die Wahrscheinlichkeit eines Fehlers 2. Art klein.

Wenn in Wirklichkeit der wahre Parameterwert in der Grundgesamtheit ist, so existiert eine relativ kleine Abweichung .

Die Wahrscheinlichkeit einer richtigen Entscheidung für die Alternativhypothese ist klein und damit die Wahrscheinlichkeit eines Fehlers 2. Art groß.

Dies ist intuitiv plausibel, denn kleine Abweichungen sind schwieriger zu entdecken.

Rechtsseitiger Test

Im Fall eines rechtsseitigen Tests gilt die Nullhypothese in Wirklichkeit für alle zulässigen Werte des Parameters , für die ist.

Für diese Fälle wird mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen, dessen Wahrscheinlichkeit höchstens gleich dem Signifikanzniveau ist:

Für alle zulässigen Werte von gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wird eine richtige Entscheidung getroffen.

Es ist

Die Gütefunktion beim rechtsseitigen Test wird für vorgegebene Werte von nach folgender Formel berechnet:

Das charakteristische Bild der Gütefunktion beim rechtsseitigen Test zeigt die folgende Abbildung.


Für alle gültigen Werte der Alternativhypothese, d.h. , wächst die Gütefunktion und nimmt schließlich den Wert Eins an.

Je größer dabei die Differenz wird, desto größer wird die Wahrscheinlichkeit einer richtigen Entscheidung für die Alternativhypothese und desto kleiner wird die Wahrscheinlichkeit eines Fehlers 2. Art.

Für entspricht der Wert der Gütefunktion dem vorgegebenen Signifikanzniveau .

Für alle anderen gültigen Werte der Nullhypothese, d.h. , ist die Gütefunktion kleiner als .

Je größer dabei die Differenz wird, desto kleiner wird die Wahrscheinlichkeit , einen Fehler 1. Art zu begehen.

Linksseitiger Test

Im Fall eines linksseitigen Tests gilt die Nullhypothese in Wirklichkeit für alle zulässigen Werte des Parameters , für die ist.

Für diese Fälle wurde mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen, dessen Wahrscheinlichkeit höchstens gleich dem Signifikanzniveau ist:

Für alle zulässigen Werte von gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wurde eine richtige Entscheidung getroffen.

Es ist

Die Gütefunktion beim linksseitigen Test wird für vorgegebene Werte von nach folgender Formel berechnet:

Das charakteristische Bild der Gütefunktion beim linksseitigen Test zeigt die folgende Abbildung.


Hier gelten analoge Interpretationen wie für die Gütefunktion eines rechtsseitigen Tests.

Zusatzinformationen

Herleitung der Gütefunktion

Für einen rechtsseitigen Test wird die Formel für die Berechnung der Gütefunktion hergeleitet.

Es ist:

Wenn der wahre Parameterwert in der Grundgesamtheit ist, ergibt sich ausgehend von der letzten Bestimmungsgleichung für die Gütefunktion:

Der mittlere Term der Ungleichung im Wahrscheinlichkeitsausdruck wird mit erweitert und weiter umgeformt:

Analog können die Formeln für die Berechnung der Gütefunktion bei einseitigen Tests hergeleitet werden.


Eigenschaften der Gütefunktion

Für die Güte eines Tests ist es von Vorteil, wenn die Wahrscheinlichkeit, sich richtigerweise für zu entscheiden, mit wachsendem Abstand des wahren Parameterwertes vom hypothetischen Wert schnell anwächst, d.h. wenn die Gütefunktion recht steil verläuft.

Es gibt zwei grundsätzliche Möglichkeiten, die Gütefunktion zu beeinflussen:


Stichprobenumfang

Wie aus den Formeln für die Berechnung der Gütefunktion ersichtlich ist, hängt außer an der Stelle vom Stichprobenumfang ab.

Unter sonst gleichen Bedingungen wird die Gütefunktion mit wachsendem Stichprobenumfang steiler, was für jeden Wert (mit beim zweiseitigen Test, beim rechtsseitigen Test bzw. beim linksseitigen Test) eine höhere Wahrscheinlichkeit für die Ablehnung der und eine kleinere Wahrscheinlichkeit für einen Fehler 2. Art impliziert.

Die Wahrscheinlichkeit, vorhandene Unterschiede zwischen dem wahren Parameterwert und dem hypothetischen Wert zu erkennen, wächst mit dem Stichprobenumfang.

Bei festem Signifikanzniveau lässt sich die Wahrscheinlichkeit für einen Fehler 2. Art über die Erhöhung des Stichprobenumfangs verringern.

Die nachstehende Abbildung zeigt für einen zweiseitigen Test bei vorgegebenem Signifikanzniveau die Gütefunktionen für 4 verschiedene Stichprobenumfänge, wobei gilt.


Signifikanzniveau

Je größer unter sonst gleichen Bedingungen das Signifikanzniveau (die Wahrscheinlichkeit für einen Fehler 1. Art) ist, desto höher verläuft der Graf der Gütefunktion.

Dies impliziert, dass mit einer Vergrößerung von für jeden Wert (mit beim zweiseitigen Test, beim rechtsseitigen Test bzw. beim linksseitigen Test) die Wahrscheinlichkeit für die Ablehnung der größer und die Wahrscheinlichkeit für einen Fehler 2. Art kleiner wird.

Bei festem Stichprobenumfang können also die beiden Fehlerwahrscheinlichkeiten nicht gleichzeitig niedrig gehalten werden.

Die folgende Abbildung zeigt für einen zweiseitigen Test bei gegebenem Stichprobenumfang die Gütefunktionen für 2 verschiedene Signifikanzniveaus:

die rote Linie repräsentiert für und die blaue Linie für .