Gütefunktion des Gauß-Tests

Aus MM*Stat

Version vom 12. Februar 2018, 11:21 Uhr von H0130wij (Diskussion | Beiträge) ({{Vorlage:Überschrift_2}})
Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Gütefunktion des Gauß-Tests

Für die Beurteilung der Güte eines Tests ist entscheidend, dass vorhandene Abweichungen des wahren Parameterwertes \mu vom hypothetischen Wert \mu _{0} möglichst zuverlässig aufgedeckt werden.

Es interessiert daher die Wahrscheinlichkeit, sich im Ergebnis des Tests für H_1 zu entscheiden, wenn der wahre Parameterwert \mu vom hypothetischen Wert \mu _{0} verschieden ist.

Diese Wahrscheinlichkeit kann mittels der Gütefunktion G(\mu) gewonnen werden.

Wenn \sigma bekannt ist und der hypothetische Wert \mu_{0}, das Signifikanzniveau \alpha und der Stichprobenumfang n vorgegeben sind, können die Werte der Gütefunktion berechnet werden, indem nacheinander alle zulässigen Werte für \mu eingesetzt werden.

Die Gütefunktion kann bereits vor der Stichprobenerhebung ermittelt werden, da sie sich nicht auf konkrete Realisationen der Teststatistik V\; bezieht.

Die Gütefunktion G\left(\mu\right) gibt die Wahrscheinlichkeit der Ablehnung von H_{0} in Abhängigkeit vom Parameterwert \mu an:

G(\mu)=P(V \in \mbox{Ablehnungsbereich der } H_{0}|\mu)=P(\mbox{''}H_{1}\mbox{''}|\mu)\;

Zweiseitiger Test

Bei einem zweiseitigen Test ist die Nullhypothese in Wirklichkeit nur wahr, wenn \mu =\mu_{0} gilt, so dass in diesem Fall mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen wird und

P( V \in \mbox{Ablehnungsbereich der } H_{0} | \mu =\mu_{0} ) = P(\mbox{''}H_{1}\mbox{''} | H_{0})= \alpha\;

ist.

Für alle anderen zulässigen Werte von \mu gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wird eine richtige Entscheidung getroffen.

Es ist

P( V \in \mbox{Ablehnungsbereich der } H_{0}|\mu \neq \mu_{0})=P(\mbox{''}H_{0}\mbox{''}|H_{1})=1-\beta\;

G(\mu)=\begin{cases} P(\mbox{''}H_{1}\mbox{''}|H_{0})=\alpha, & \mbox{, wenn } \mu = \mu_{0} \\
P(\mbox{''}H_{1}\mbox{''}|H_{1})=1-\beta & \mbox{, wenn } \mu \neq \mu_{0}\end{cases}

Die Gütefunktion G(\mu) kann beim zweiseitigen Test für vorgegebene Werte von \mu wie folgt berechnet werden:

G\left(\mu \right) =1-\left[P\left(V\leq z_{1-\frac{\alpha}{2}}-\frac{\mu-\mu _{0}}{\sigma /\sqrt{n}}\right) -P\left(V\leq-z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu _{0}}{\sigma /\sqrt{n}}\right) \right]

Die Wahrscheinlichkeit für einen Fehler 2. Art lässt sich leicht über die Gütefunktion ermitteln:

P(\mbox{''}H_{0}\mbox{''}|H_{1})=1-G\left(\mu \right)=\beta

Charakteristika der Gütefunktion beim zweiseitigen Test

  • Sie ist symmetrisch zum hypothetischen Wert \mu_{0}
  • Sie wächst mit zunehmenden Abstand des wahren Parameterwertes \mu vom hypothetischen Wert \mu _{0} und nimmt schließlich den Wert Eins an.

Das charakteristische Bild der Gütefunktion beim zweiseitigen Test zeigt die folgende Abbildung.

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=-3, to=3, expr=1-(pnorm((1.96-x), mean=x, sd=1))+(pnorm((-1.96-x), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab="", ylim=c(0,1), col="red", lwd=4, lty=1)

abline(v=-1.3, col="black", lwd=2, lty=2) abline(v=0.7, col="black", lwd=2, lty=2) abline(v=0, col="black", lwd=2, lty=2)

text(-0.4, 0.6, expression(paste("1-" , alpha)), col = "black", cex=2) text(-1.1, 0.9, expression(beta), col = "black", cex=2) text(0.9, 0.7, expression(beta), col = "black", cex=2) text(-0.2, 0.02, expression(alpha), col = "black", cex=2) text(1.1, 0.05, expression(paste("1-" , beta)), col = "black", cex=2) text(-1.8, 0.25, expression(paste("1-" , beta)), col = "black", cex=2)

axis( side=1, at=c(-1.3, 0, 0.7, 3), labels=c(expression(mu[1]), expression(mu[0]), expression(mu[2]), expression(mu)), tick=FALSE, cex.axis=1.5, font.axis=2)

</R>

In dieser Abbildung sind zwei mögliche Alternativwerte \mu_{1} und \mu _{2} eingetragen.

Wenn in Wirklichkeit \mu_{1} der wahre Parameterwert in der Grundgesamtheit ist, so existiert eine relativ große Abweichung \mu_{1} - \mu_{0}.

Die Wahrscheinlichkeit 1 - \beta einer richtigen Entscheidung für die Alternativhypothese H_{1} ist groß und damit die Wahrscheinlichkeit \beta eines Fehlers 2. Art klein.

Wenn in Wirklichkeit \mu _{2} der wahre Parameterwert in der Grundgesamtheit ist, so existiert eine relativ kleine Abweichung \mu_{2} - \mu_{0}.

Die Wahrscheinlichkeit 1 - \beta einer richtigen Entscheidung für die Alternativhypothese H_{1} ist klein und damit die Wahrscheinlichkeit \beta eines Fehlers 2. Art groß.

Dies ist intuitiv plausibel, denn kleine Abweichungen sind schwieriger zu entdecken.

Rechtsseitiger Test

Im Fall eines rechtsseitigen Tests gilt die Nullhypothese in Wirklichkeit für alle zulässigen Werte des Parameters \mu, für die \mu \leq \mu_{0} ist.

Für diese Fälle wird mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen, dessen Wahrscheinlichkeit höchstens gleich dem Signifikanzniveau \alpha ist:

P(V\in \mbox{ Ablehnungsbereich der }H_{0}|\mu \leq \mu_{0})=P(\mbox{''}H_{1}\mbox{''}|H_{0}) \leq \alpha

Für alle zulässigen Werte von \mu>\mu_{0} gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wird eine richtige Entscheidung getroffen.

Es ist

P\left( V\in \mbox{Ablehnungsbereich der }H_{0}|\mu \geq \mu _{0}\right)P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)=1-\beta

G\left(\mu\right)=\begin{cases}
P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)\leq\alpha, & \mbox{, wenn } \mu \leq \mu_{0}\\
P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)=1-\beta, & \mbox{, wenn }\mu > \mu_{0}\end{cases}

Die Gütefunktion G(\mu) beim rechtsseitigen Test wird für vorgegebene Werte von \mu nach folgender Formel berechnet:

G(\mu ) =1-P\left( V\leq z_{1-\alpha }-\frac{\mu -\mu _{0}}{\frac{\sigma}{\sqrt{n}}}\right)

Das charakteristische Bild der Gütefunktion beim rechtsseitigen Test zeigt die folgende Abbildung.

<R output="display">

pdf(rpdf,height=7,width=7)

curve(from=-3, to=3, expr=1-(pnorm((1.96-x), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab="", ylim=c(0,1), col="red", lwd=4, lty=1)

abline(v=1.3, col="grey", lwd=2, lty=2) abline(v=0, col="black", lwd=2, lty=2)

text(-0.5, 0.7, expression(paste("1-" , alpha)), col = "black", cex=2) text(0.3, 0.03, expression(alpha), col = "black", cex=2) text(1, 0.85, expression(beta), col = "black", cex=2) text(1.75, 0.25, expression(paste("1-" , beta)), col = "black", cex=2)

axis( side=1, at=c( 0, 1.3, 3), labels=c(expression(mu[0]), expression(mu[1]), expression(mu)), tick=FALSE, cex.axis=1.5, font.axis=2)

</R>

Für alle gültigen Werte der Alternativhypothese, d.h. \mu >\mu_{0}, wächst die Gütefunktion und nimmt schließlich den Wert Eins an.

Je größer dabei die Differenz \mu -\mu_{0} wird, desto größer wird die Wahrscheinlichkeit 1 - \beta einer richtigen Entscheidung für die Alternativhypothese H_{1} und desto kleiner wird die Wahrscheinlichkeit \beta eines Fehlers 2. Art.

Für \mu =\mu _{0} entspricht der Wert der Gütefunktion dem vorgegebenen Signifikanzniveau \alpha.

Für alle anderen gültigen Werte der Nullhypothese, d.h. \mu <\mu_{0}, ist die Gütefunktion kleiner als \alpha.

Je größer dabei die Differenz \mu -\mu_{0} wird, desto kleiner wird die Wahrscheinlichkeit \alpha, einen Fehler 1. Art zu begehen.

Linksseitiger Test

Im Fall eines linksseitigen Tests gilt die Nullhypothese in Wirklichkeit für alle zulässigen Werte des Parameters \mu, für die \mu \geq \mu _{0} ist.

Für diese Fälle wurde mit der Ablehnung der Nullhypothese ein Fehler 1. Art begangen, dessen Wahrscheinlichkeit höchstens gleich dem Signifikanzniveau \alpha ist:

P\left(V\in \mbox{ Ablehnungsbereich der }H_{0}|\mu \geq \mu_{0}\right)=P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)\leq\alpha

Für alle zulässigen Werte von \mu <\mu_{0} gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wurde eine richtige Entscheidung getroffen.

Es ist

P\left(V\in \mbox{ Ablehnungsbereich der }H_{0}|\mu \leq \mu _{0}\right) =P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right) =1-\beta

G\left(\mu \right)=\begin{cases} P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)\leq\alpha, & \mbox{, wenn } \mu \geq \mu_{0} \\
P\left(\mbox{''}H_{1}\mbox{''}| H_{1}\right)=1-\beta, & \mbox{, wenn } \mu < \mu_{0}\end{cases}

Die Gütefunktion G(\mu) beim linksseitigen Test wird für vorgegebene Werte von \mu nach folgender Formel berechnet:

G(\mu ) =P\left( V\leq -z_{1-\alpha }-\frac{\mu -\mu _{0}}{\frac{\sigma}{\sqrt{n}}}\right)

Das charakteristische Bild der Gütefunktion beim linksseitigen Test zeigt die folgende Abbildung.

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=-3, to=0.5, expr=(pnorm((-1.96-x), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab="", ylim=c(0,1), col="red", lwd=4, lty=1)

abline(v=-1, col="grey", lwd=2, lty=2) abline(v=0, col="black", lwd=2, lty=2)

text(0.2, 0.7, expression(paste("1-" , alpha)), col = "black", cex=2) text(-0.2, 0.03, expression(alpha), col = "black", cex=2) text(-0.9, 0.85, expression(beta), col = "black", cex=2) text(-1.2, 0.25, expression(paste("1-" , beta)), col = "black", cex=2)

axis( side=1, at=c( -1, 0, 0.5), labels=c(expression(mu[1]), expression(mu[0]), expression(mu)), tick=FALSE, cex.axis=1.5, font.axis=2)

</R>

Hier gelten analoge Interpretationen wie für die Gütefunktion eines rechtsseitigen Tests.

Zusatzinformationen

Herleitung der Gütefunktion

Für einen rechtsseitigen Test wird die Formel für die Berechnung der Gütefunktion hergeleitet.

Es ist:

G\left( \mu \right) =P\left( V\in \mbox{Ablehnungsbereich der }H_{0}|\mu \right)
=1-P\left( V\in \mbox{ Nichtablehnungsbereich der }H_{0}|\mu \right)

Wenn \mu der wahre Parameterwert in der Grundgesamtheit ist, ergibt sich ausgehend von der letzten Bestimmungsgleichung für die Gütefunktion:

G\left( \mu \right) =1-P\left(-z_{1-\frac{\alpha}{2}}\leq V\leq z_{1-\frac{\alpha}{2}}|\mu \right)
 =1-P\left(-z_{1-\frac{\alpha}{2}}\leq \frac{\overline{X}-\mu_{0}}{\sigma\cdot\sqrt{n}}\leq z_{1-\frac{\alpha}{2}}|\mu \right)

Der mittlere Term der Ungleichung im Wahrscheinlichkeitsausdruck wird mit \mu -\mu erweitert und weiter umgeformt:

G\left( \mu \right)  =1-P\left( -z_{1-\frac{\alpha}{2}}\leq \frac{\overline{X}-\mu_{0}+\mu -\mu }{\sigma\cdot \sqrt{n}}\leq z_{1-\frac{\alpha}{2}}|\mu \right)
=1-P\left(-z_{1-\frac{\alpha}{2}}\leq \frac{\overline{X}-\mu }{\sigma\cdot\sqrt{n}}+\frac{\mu -\mu_{0}}{\sigma\cdot \sqrt{n}}\leq z_{1-\frac{\alpha}{2}}|\mu \right)
 =1-P\left(-z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma\cdot\sqrt{n}}\leq \frac{\overline{X}-\mu }{\sigma\cdot \sqrt{n}}\leq z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma\sqrt{n}}|\mu \right)
 =1-P\left(-z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma\cdot\sqrt{n}}\leq V\leq z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma \cdot \sqrt{n}}|\mu\right)
 =1-\left[P\left( V\leq z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma\cdot\sqrt{n}}|\mu \right)-P\left(V\leq-z_{1-\frac{\alpha}{2}}-\frac{\mu -\mu_{0}}{\sigma\cdot\sqrt{n}}|\mu \right) \right]

Analog können die Formeln für die Berechnung der Gütefunktion bei einseitigen Tests hergeleitet werden.

Eigenschaften der Gütefunktion

Für die Güte eines Tests ist es von Vorteil, wenn die Wahrscheinlichkeit, sich richtigerweise für H_{1} zu entscheiden, mit wachsendem Abstand des wahren Parameterwertes \mu vom hypothetischen Wert \mu_{0} schnell anwächst, d.h. wenn die Gütefunktion recht steil verläuft.

Es gibt zwei grundsätzliche Möglichkeiten, die Gütefunktion zu beeinflussen:

Stichprobenumfang

Wie aus den Formeln für die Berechnung der Gütefunktion ersichtlich ist, hängt G\left(\mu\right) außer an der Stelle \mu = \mu_{0} vom Stichprobenumfang n ab.

Unter sonst gleichen Bedingungen wird die Gütefunktion mit wachsendem Stichprobenumfang n steiler, was für jeden Wert \mu (mit \mu \neq \mu_{0} beim zweiseitigen Test, \mu > \mu_{0} beim rechtsseitigen Test bzw. \mu < \mu_{0} beim linksseitigen Test) eine höhere Wahrscheinlichkeit 1 - \beta für die Ablehnung der H_{0} und eine kleinere Wahrscheinlichkeit \beta für einen Fehler 2. Art impliziert.

Die Wahrscheinlichkeit, vorhandene Unterschiede zwischen dem wahren Parameterwert \mu und dem hypothetischen Wert \mu_{0} zu erkennen, wächst mit dem Stichprobenumfang.

Bei festem Signifikanzniveau \alpha lässt sich die Wahrscheinlichkeit \beta für einen Fehler 2. Art über die Erhöhung des Stichprobenumfangs verringern.

Die nachstehende Abbildung zeigt für einen zweiseitigen Test bei vorgegebenem Signifikanzniveau \alpha die Gütefunktionen für 4 verschiedene Stichprobenumfänge, wobei n_{1}<n_{2}<n_{3}<n_{4} gilt.

<R output="display">

pdf(rpdf)

curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1) par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(5)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(5)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="black", lwd=4, lty=1) par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(10)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(10)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1) par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(15)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(15)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="darkgreen", lwd=4, lty=1)

abline(v=0, col="black", lwd=2, lty=2)

axis( side=1, at=c(0), labels=c(expression(mu[0])), tick=FALSE, cex.axis=1.5, font.axis=2) legend("bottomright", lwd=4, col=c("red","black","blue","darkgreen"),c(expression("n"[1]),expression("n"[2]),expression("n"[3]),expression("n"[4])), bty="n", cex=1.5)

</R>

Signifikanzniveau

Je größer unter sonst gleichen Bedingungen das Signifikanzniveau \alpha (die Wahrscheinlichkeit für einen Fehler 1. Art) ist, desto höher verläuft der Graf der Gütefunktion.

Dies impliziert, dass mit einer Vergrößerung von \alpha für jeden Wert \mu (mit \mu \neq \mu_{0} beim zweiseitigen Test, \mu > \mu_{0} beim rechtsseitigen Test bzw. \mu < \mu_{0} beim linksseitigen Test) die Wahrscheinlichkeit 1 -\beta für die Ablehnung der H_{0} größer und die Wahrscheinlichkeit \beta für einen Fehler 2. Art kleiner wird.

Bei festem Stichprobenumfang n können also die beiden Fehlerwahrscheinlichkeiten nicht gleichzeitig niedrig gehalten werden.

Die folgende Abbildung zeigt für einen zweiseitigen Test bei gegebenem Stichprobenumfang n die Gütefunktionen für 2 verschiedene Signifikanzniveaus:

die rote Linie repräsentiert G(\mu) für \alpha = 0,05 und die blaue Linie G(\mu) für \alpha = 0,10.

<R output="display">

pdf(rpdf)

curve(from=-2, to=2, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1) par(new=TRUE) curve(from=-2, to=2, expr=1-(pnorm((1.64-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.64-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1)

abline(v=0, col="black", lwd=2, lty=2)

axis( side=1, at=c(0), labels=c(expression(mu[0])), tick=FALSE, cex.axis=1.5, font.axis=2) legend("bottomright", lwd=4, col=c("red","blue"),c(expression(paste("G(", mu, "), ", alpha, " = 0,05")),expression(paste("G(", mu, "), ", alpha, " = 0,10"))), bty="n", cex=1.5) </R>


Beispiele

Mehl

In einem Unternehmen wird Mehl maschinell in Tüten abgefüllt. Das Sollgewicht beträgt 1000 g, auf das die Maschine justiert wurde.

Das Ist-Gewicht der Mehltüten weist gewisse Schwankungen auf, die im Produktionsprozess nicht vermieden werden können.

Damit ist das Ist-Gewicht eine Zufallsvariable: X =\;"Ist-Gewicht der Mehltüten".

Der Erwartungswert des Ist-Gewichts E[X] = \mu, mit dem die Maschine derzeit arbeitet, ist unbekannt. Er soll jedoch dem Sollgewicht entsprechen, d.h. E[X] = \mu_{0} = 1000 \mbox{g}.

Die Konsequenz ist, dass nach einer gewissen Laufzeit der Maschine überprüft werden muss, ob die ursprüngliche Justierung der Maschine noch eingehalten wird oder ob schon erhebliche Abweichungen auftreten.

Dazu wird in gewissen Abständen eine Zufallsstichprobe vom Umfang n aus der Produktion entnommen, für die Stichprobe das durchschnittliche Ist-Gewicht ermittelt und das Ergebnis mit dem Sollwert verglichen.

Bei erheblichen (signifikanten) Abweichungen muss eine neue Justierung der Maschine vorgenommen werden.

Aus der Sicht des Unternehmers sind Abweichungen nach beiden Seiten vom Sollwert \mu_{0}= 1000\mbox{g} relevant.

Wird im Mittel zu wenig abgefüllt, würde dieser Umstand über kurz oder lang bei Überprüfungen (z.B. durch Verbraucherorganisationen) bekannt und der Reputation des Unternehmens erheblichen Schaden zufügen.

Wird im Mittel zu viel abgefüllt, schmälert dies den Gewinn des Unternehmers. Es ist somit ein zweiseitiger Test durchzuführen:

H_{0}:\mu =1000\quad H_{1}:\mu \neq 1000

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 durchgeführt werden.

Es wird eine Zufallsstichprobe vom Umfang n = 25 gezogen. Aufgrund des großen Umfangs der Grundgesamtheit (Gesamtproduktion) kann dabei von einer einfachen Zufallsstichprobe ausgegangen werden.

Teststatistik und Entscheidungsbereiche

Als Schätzfunktion für den unbekannten Erwartungswert E[X] = \mu der Grundgesamtheit wird der Stichprobenmittelwert \bar{X} verwendet.

Es sei aufgrund der langjährigen Nutzung der Maschine bekannt, dass das Ist-Gewicht eine normalverteilte Zufallsvariable mit der Standardabweichung \sigma = 10\mbox{g} ist.

Dann folgt für die Schätzfunktion \bar{X}, dass sie ebenfalls normalverteilt ist und eine Standardabweichung von \sigma\left(\bar{X}\right) = 2\mbox{g} aufweist.

Bei Gültigkeit der Nullhypothese, d.h. wenn die Maschine im Mittel tatsächlich das Sollgewicht von 1000 g einhält, gilt:

\bar{X}\mbox{ ist unter } H_{0}\sim N(1000;\;2).

Für die Teststatistik

V=\frac{\bar{X}-\mu_{0}}{\sigma}\cdot\sqrt{n}

folgt:

V \mbox{ ist unter }H_{0}\sim N(0;\;1).

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für P(V \leq c_{o})=1-\frac{\alpha}{2} = 0,975 den oberen kritischen Wert c_{o} = z_{0,975}= 1,96.

Wegen der Symmetrie der Normalverteilung gilt c_{u}=-z_{1-\frac{\alpha}{2}}=-1,96.

Damit ergeben sich die Entscheidungsbereiche des Tests zu:

Nichtablehnungsbereich der H_{0}:\;\left\{v|-1,96\leq v\leq 1,96\right\}

Ablehnungsbereich der H_{0}:\;\left\{v|v<-1,96 \mbox{ oder }v>1,96\right\}

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=-4, to=4, dnorm(x, mean=0, sd=1), xaxt="n", yaxt="n",ylab="", xlab="", col="red", ylim=c(0.0,0.4), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l", sub="Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche") abline(v=-2, col="black", lwd=2) abline(v=2, col="black", lwd=2) abline(v=0.0, col="black", lwd=4, lty=2) text(0, 0.15, expression(paste("1-" , alpha,"=0,95")), col = "black", cex=1.7) text(-2.7, 0.01, expression(paste(alpha, "/2=0,025")), col = "black", cex=1.2) text(2.7, 0.01, expression(paste(alpha, "/2=0,025")), col = "black", cex=1.2) axis( side=1, at=c(-2, 0, 2, 4), labels=c("-1,96", "0", "1,96", "v"), tick=FALSE, cex.axis=1.5) axis( side=2, at=c(0.39), labels=c("f(v)"), tick=FALSE, cex.axis=1.5)

</R>

Ablehnungsbereich der H_{0}| Nichtablehnungsbereich der H_{0}| Ablehnungsbereich der H_{0}

Prüfwert

Es werden nunmehr die 25 Mehltüten zufällig ausgewählt, ihr Ist-Gewicht festgestellt und das arithmetische Mittel dieser Gewichte berechnet, für das sich \bar{x} = 996,4 \mbox{ g} ergeben habe.

Als Prüfwert erhält man

v=\frac{996,4-1000}{2}=-1,8

Entscheidungssituationen

Da v = - 1,8 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf der Zufallsstichprobe vom Umfang n = 25 konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert E[X] = \mu in der Grundgesamtheit verschieden vom hypothetischen Wert \mu_{0} = 1000\mbox{g} ist, d.h. dass die Maschine den Sollwert von 1000 g nicht einhält.

Gütefunktion

Bei dieser Testentscheidung besteht die Möglichkeit, einen Fehler 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}) zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Die Nichtablehnung der H_{0} kann daher nur angemessen beurteilt werden, wenn die Wahrscheinlichkeit für einen derartigen Fehler berücksichtigt wird.

Die Wahrscheinlichkeit für einen Fehler 2. Art ist jedoch unbekannt, da der wahre Erwartungswert E[X] = \mu in der Grundgesamtheit unbekannt ist.

Man kann aber für verschiedene mögliche Alternativwerte \mu die Gütefunktion und über 1 - G(\mu) die Wahrscheinlichkeit für den Fehler 2. Art in Abhängigkeit von \mu ermitteln.

Es sei z.B. angenommen, dass \mu = 1002\mbox{g} das tatsächliche mittlere Ist-Gewicht ist, mit dem die Maschine arbeitet.

Da für \mu = 1002\mbox{g} in Wirklichkeit die Alternativhypothese H_{1} stimmt, gibt die Gütefunktion G(\mu = 1002) an dieser Stelle die Wahrscheinlichkeit einer richtigen Entscheidung für H_{1} an:

P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)= 1-\beta

Mit \mu_{0} = 1000,\; \alpha =0,05,\; \sigma =10 und n = 25 erhält man:

G\left(\mu = 1002\right) =1-\left[P\left( V\leq 1,96-\frac{1002-1000}{2}\right)-P\left(V\leq -1,96-\frac{1002-1000}{2}\right) \right]
=1-\left[P\left(V\leq 0,96\right)-P\left(V\leq -2,96\right)\right]
=1-\left[P\left( V\leq 0,96\right) -\left( 1-P\left( V\leq 2,96\right) \right) \right]
 =1-\left[ 0,831472-\left( 1-0,998462\right) \right]
=1-0,829934\;
 =0,17=1-\beta\;

Die Wahrscheinlichkeit für einen Fehler 2. Art an der Stelle \mu = 1002 ist:

P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right) =\beta \left(\mu = 1002\right) =1-G\left(\mu=  1002\right)=0,83

Wenn das tatsächliche durchschnittliche Ist-Gewicht \mu = 1002\mbox{g} beträgt, wird in rund 83% aller Stichproben vom Umfang n = 25 die Abweichung vom Sollgewicht 1000 g durch den Test nicht aufgedeckt.

Die Wahrscheinlichkeit für einen Fehler 2. Art ist sehr hoch, da die Differenz \mu -\mu_{0} = 1002 - 1000 relativ klein ist.

Wenn dagegen z.B. \mu = 989 g der wahre Parameterwert in der Grundgesamtheit ist, dann gibt G(\mu = 989) ebenfalls die Wahrscheinlichkeit einer richtigen Entscheidung für H_{1} an:

P\left(\mbox{''}H_{1}\mbox{''}|H_{1} \right)=1-\beta, da in Wirklichkeit die Alternativhypothese H_{1} stimmt.

Man erhält durch analoge Berechnungen:

G\left(\mu= 989 \right) = 1-\beta = 0,9998 und  \beta\left(\mu =989\right)=0,0002

In nur rund 0,02% aller Stichproben vom Umfang n = 25 wird in diesem Fall die Abweichung vom Sollgewicht 1000\mbox{g} durch den Test nicht aufgedeckt.

Die Wahrscheinlichkeit für einen Fehler 2. Art ist sehr klein, da die Differenz \mu - \mu_{0} = 989 - 1000 groß ist.

Für die gegebenen Werte von \mu_{0},\; \alpha,\; \sigma und n sind in der folgenden Tabelle G(\mu) und 1 - G(\mu) für weitere zulässige Werte von \mu enthalten.

\mu Gültigkeit von G\left( \mu \right) 1-G\left( \mu \right)
988,00 H_{1} 0,999973=1-\beta 0,000027=\beta
990,40 H_{1} 0,997744=1-\beta 0,002256=\beta
992,80 H_{1} 0,949497=1-\beta 0,050503=\beta
995,20 H_{1} 0,670038=1-\beta 0,329962=\beta
997,60 H_{1} 0,224416=1-\beta 0,775584=\beta
1000,00 H_{0} 0,05=\alpha 0,95=1-\alpha
1002,40 H_{1} 0,224416=1-\beta 0,775584=\beta
1004,80 H_{1} 0,670038=1-\beta 0,329962=\beta
1007,20 H_{1} 0,949497=1-\beta 0,050503=\beta
1009,60 H_{1} 0,997744=1-\beta 0,002256=\beta
1012,00 H_{1} 0,999973=1-\beta 0,000027=\beta

Die grafische Darstellung der Gütefunktion enthält die Abb. 2.

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=-3, to=3, expr=1-(pnorm((1.96-x), mean=x, sd=1))+(pnorm((-1.96-x), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab="", ylim=c(0,1), col="red", lwd=4, lty=1, cex.lab=1.2, sub="Abb. 2: G\u00FCtefunktion mit mu_0=1000, alpha=0,05, sigma=10 und n=25")

abline(v=0, col="grey", lwd=2, lty=2)

axis( side=1, at=c( 0, 3), labels=c(expression(paste(mu[0], "=1000")), expression(mu)), tick=FALSE, cex.axis=1.5, font.axis=1.2)

</R>

Eine Möglichkeit, die Gütefunktion bei festem Signifikanzniveau \alpha= 0,05 zu beeinflussen, ist die Erhöhung des Stichprobenumfangs n.

Das soll exemplarisch unter den Annahmen gezeigt werden, dass \mu = 1002\mbox{g} bzw. \mu = 989\mbox{g} der wahre Parameterwert in der Grundgesamtheit ist, wobei weiterhin \alpha=0,05,\; \mu_{0} = 1000 und \sigma = 10 gelten.

n=9 n=16 n=25 n=36
G\left(1002\right)=1-\beta 0,0921 0,126 0,17 0,224
\beta \left(\mu = 1002\right) 0,9079 0,874 0,83 0,776
G\left(\mu = 989\right) =1-\beta 0,91 0,993 0,9998 0,999998
\beta \left(\mu =  989\right) 0,09 0,007 0,0002 0,000002

Abb. 3 zeigt die Gütefunktionen für die 4 verschiedenen Stichprobenumfänge.


BEARBEITUNG

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(2)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(2)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="red", lwd=4, lty=1, cex.lab=1.2, sub="Abb. 3: G\u00FCtefunktion mit mu_0=1000, alpha=0,05, sigma=10 und vier verschiedenen n") par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(5)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(5)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="black", lwd=4, lty=1, cex.lab=1.2) par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(10)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(10)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="blue", lwd=4, lty=1, cex.lab=1.2) par(new=TRUE) curve(from=-1.5, to=1.5, expr=1-(pnorm((1.96-x*sqrt(15)), mean=x, sd=1))+(pnorm((-1.96-x*sqrt(15)), mean=x, sd=1)), ylab=expression(paste("G(", mu, ")")), xaxt="n", "xaxs"="i", yaxs="i", bty="l", xlab=expression(mu), ylim=c(0,1), col="darkgreen", lwd=4, lty=1, cex.lab=1.2)

abline(v=0, col="black", lwd=2, lty=2)

axis( side=1, at=c(-1.5, -0.75, 0, 0.75, 1.5), labels=c("988","994","1000","1006","1012"), tick=FALSE, cex.axis=1.5, font.axis=1.5) legend("bottomright", lwd=4, col=c("red","black","blue","darkgreen"),c(expression("n=9"),expression("n=16"),expression("n=25"),expression("n=36")), bty="n", cex=1.5)

</R>

Wird z.B. vermutet, dass die Maschine nur mit einer geringfügigen Abweichung vom Sollwert \mu_{0} arbeitet, so ist ein größerer Stichprobenumfang empfehlenswert, um vorhandene Abweichungen zuverlässiger aufzudecken und bei Nichtablehnung der H_{0} die Wahrscheinlichkeit für einen Fehler 2. Art zu verringern, auch wenn dadurch die Kosten für die Überprüfung der Maschine höher werden.