Gauß-Test/Beispiele

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Problematik der Hypothesenformulierung

Ein Beispiel soll die Problematik der Wahl von Null- und Alternativhypothese verdeutlichen.

Ein Unternehmen stellt Autoreifen her. Zur Erhöhung der Lebensdauer eines bestimmten Typs von Autoreifen wurden Materialänderungen vorgenommen.

Die Konkurrenz behauptet nun, dass durch die Materialänderung keine Erhöhung gegenüber der ursprünglichen mittleren Lebensdauer dieses Reifentyps von 38000 km erreicht wurde.

Der Reifenhersteller lässt deshalb eine Prüfung vornehmen, womit ein statistischer Test verbunden ist.

Die Zufallsvariable X\; ist die Lebensdauer des betrachteten Reifentyps.

Vor der Materialänderung betrug die mittlere Lebensdauer des Reifentyps E[X] = \mu_{0} = 38000 km. Nach der Materialänderung ist \mu unbekannt, soll jedoch gemäß der Behauptung des Reifenherstellers größer als \mu_{0} sein, d.h. \mu > \mu_{0} = 38000 km.

Wie soll der statistische Test formuliert werden?

  • Zunächst ist eindeutig, dass ein zweiseitiger Test nicht in Frage kommt, da aufgrund der Behauptung des Reifenherstellers nur die Abweichungen in eine Richtung relevant sind. Es ist noch zwischen rechts- und linksseitigem Test zu wählen.
Die Intention des Reifenherstellers ist, seine Behauptung "statistisch möglichst gesichert zu beweisen". Dabei will er das Risiko einer Fehlentscheidung möglichst klein halten.
Daraus folgt, dass die Behauptung des Reifenherstellers als Alternativhypothese zu formulieren ist, woraus sich ein rechtsseitiger Test ergibt:
H_{0}:\mu \leq \mu_{0}\quad (= 38000 \mbox{ km})
H_{1}:\mu > \mu_{0}\quad (= 38000 \mbox{ km})
Der sich aus der Problemstellung ergebende Inhalt des Fehlers 1. Art ist:
\mbox{''}H_{1}\mbox{''}|H_{0}= "Die Lebensdauer hat sich durch die Materialänderung erhöht" | In Wirklichkeit hat sich die Lebensdauer nicht erhöht.
Man kann einen Fehler 2. Art begehen, d.h. die H_{0} beizubehalten, obwohl sie falsch ist. Der Inhalt des Fehlers 2. Art ist:
\mbox{''}H_{0}\mbox{''}|H_{1} = "Die Lebensdauer hat sich nicht erhöht" | In Wirklichkeit hat sich die Lebensdauer durch die Materialänderung erhöht.

Ein Vergleich der beiden Fehler zeigt, dass der Fehler 1. Art für den Reifenhersteller der schwerwiegendere Fehler ist, denn

  • die Konkurrenz schläft nicht und würde für diesen Reifentyp ebenfalls Prüfungen vornehmen (die Konkurrenz würde jedoch einen linksseitigen Test verwenden).
  • die dauerhafte Verwendung des veränderten Reifens würde bald zeigen, dass die Lebensdauer durch die Materialänderung tatsächlich nicht größer wurde, was dem Ansehen des Reifenherstellers bei seinen Kunden erheblichen Schaden zufügen würde.

Das Risiko, d.h. die Wahrscheinlichkeit P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right) für diesen Fehler 1. Art, muss der Reifenhersteller deshalb klein halten, was durch die Vorgabe des Signifikanzniveaus \alpha (z.B. \alpha = 0,05) erreicht werden kann.

Mehl

In einem Unternehmen wird Mehl maschinell in Tüten abgefüllt. Das Sollgewicht beträgt 1000 g, auf das die Maschine justiert wurde.

Das Ist-Gewicht der Mehltüten weist gewisse Schwankungen auf, die im Produktionsprozess nicht vermieden werden können.

Damit ist das Ist-Gewicht eine Zufallsvariable: X =\;"Ist-Gewicht der Mehltüten".

Der Erwartungswert des Ist-Gewichts E[X] = \mu, mit dem die Maschine derzeit arbeitet, ist unbekannt. Er soll jedoch dem Sollgewicht entsprechen, d.h. E[X] = \mu_{0} = 1000 \mbox{g}.

Die Konsequenz ist, dass nach einer gewissen Laufzeit der Maschine überprüft werden muss, ob die ursprüngliche Justierung der Maschine noch eingehalten wird oder ob schon erhebliche Abweichungen auftreten.

Dazu wird in gewissen Abständen eine Zufallsstichprobe vom Umfang n aus der Produktion entnommen, für die Stichprobe das durchschnittliche Ist-Gewicht ermittelt und das Ergebnis mit dem Sollwert verglichen.

Bei erheblichen (signifikanten) Abweichungen muss eine neue Justierung der Maschine vorgenommen werden.

Aus der Sicht des Unternehmers sind Abweichungen nach beiden Seiten vom Sollwert \mu_{0}= 1000\mbox{g} relevant.

Wird im Mittel zu wenig abgefüllt, würde dieser Umstand über kurz oder lang bei Überprüfungen (z.B. durch Verbraucherorganisationen) bekannt und der Reputation des Unternehmens erheblichen Schaden zufügen.

Wird im Mittel zu viel abgefüllt, schmälert dies den Gewinn des Unternehmers. Es ist somit ein zweiseitiger Test durchzuführen:

H_{0}:\mu =1000\quad H_{1}:\mu \neq 1000

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 durchgeführt werden.

Es wird eine Zufallsstichprobe vom Umfang n = 25 gezogen. Aufgrund des großen Umfangs der Grundgesamtheit (Gesamtproduktion) kann dabei von einer einfachen Zufallsstichprobe ausgegangen werden.

Teststatistik und Entscheidungsbereiche

Als Schätzfunktion für den unbekannten Erwartungswert E[X] = \mu der Grundgesamtheit wird der Stichprobenmittelwert \bar{X} verwendet.

Es sei aufgrund der langjährigen Nutzung der Maschine bekannt, dass das Ist-Gewicht eine normalverteilte Zufallsvariable mit der Standardabweichung \sigma = 10\mbox{g} ist.

Dann folgt für die Schätzfunktion \bar{X}, dass sie ebenfalls normalverteilt ist und eine Standardabweichung von \sigma\left(\bar{X}\right) = 2\mbox{g} aufweist.

Bei Gültigkeit der Nullhypothese, d.h. wenn die Maschine im Mittel tatsächlich das Sollgewicht von 1000 g einhält, gilt:

\bar{X}\mbox{ ist unter } H_{0}\sim N(1000;\;2).

Für die Teststatistik

V=\frac{\bar{X}-\mu_{0}}{\sigma}\cdot\sqrt{n}

folgt:

V \mbox{ ist unter }H_{0}\sim N(0;\;1).

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für P(V \leq c_{o})=1-\frac{\alpha}{2} = 0,975 den oberen kritischen Wert c_{o} = z_{0,975}= 1,96.

Wegen der Symmetrie der Normalverteilung gilt c_{u}=-z_{1-\frac{\alpha}{2}}=-1,96.

Damit ergeben sich die Entscheidungsbereiche des Tests zu:

Nichtablehnungsbereich der H_{0}:\;\left\{v|-1,96\leq v\leq 1,96\right\}

Ablehnungsbereich der H_{0}:\;\left\{v|v<-1,96 \mbox{ oder }v>1,96\right\}

Ablehnungsbereich der H_{0}|Nichtablehnungsbereich der H_{0}|Ablehnungsbereich der H_{0}

Prüfwert

Es werden nunmehr die 25 Mehltüten zufällig ausgewählt, ihr Ist-Gewicht festgestellt und das arithmetische Mittel dieser Gewichte berechnet, für das sich \bar{x} = 996,4 \mbox{ g} ergeben habe.

Als Prüfwert erhält man

v=\frac{996,4-1000}{2}=-1,8

Entscheidungssituationen

Da v = - 1,8 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf der Zufallsstichprobe vom Umfang n = 25 konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert E[X] = \mu in der Grundgesamtheit verschieden vom hypothetischen Wert \mu_{0} = 1000\mbox{g} ist, d.h. dass die Maschine den Sollwert von 1000 g nicht einhält.