Beispiele
Mehl
In einem Unternehmen wird Mehl maschinell in Tüten abgefüllt. Das Sollgewicht beträgt 1000 g, auf das die Maschine justiert wurde.
Das Ist-Gewicht der Mehltüten weist gewisse Schwankungen auf, die im Produktionsprozess nicht vermieden werden können.
Damit ist das Ist-Gewicht eine Zufallsvariable: "Ist-Gewicht der Mehltüten".
Der Erwartungswert des Ist-Gewichts , mit dem die Maschine derzeit arbeitet, ist unbekannt. Er soll jedoch dem Sollgewicht entsprechen, d.h. .
Die Konsequenz ist, dass nach einer gewissen Laufzeit der Maschine überprüft werden muss, ob die ursprüngliche Justierung der Maschine noch eingehalten wird oder ob schon erhebliche Abweichungen auftreten.
Dazu wird in gewissen Abständen eine Zufallsstichprobe vom Umfang aus der Produktion entnommen, für die Stichprobe das durchschnittliche Ist-Gewicht ermittelt und das Ergebnis mit dem Sollwert verglichen.
Bei
erheblichen (signifikanten) Abweichungen muss eine neue Justierung der Maschine vorgenommen
werden.
Aus der Sicht des Unternehmers sind Abweichungen nach beiden Seiten vom Sollwert relevant.
Wird im Mittel zu wenig abgefüllt, würde dieser Umstand über kurz oder lang bei Überprüfungen (z.B. durch Verbraucherorganisationen) bekannt und der Reputation des Unternehmens erheblichen Schaden zufügen.
Wird im Mittel zu viel abgefüllt, schmälert dies den Gewinn des Unternehmers. Es ist somit ein zweiseitiger Test durchzuführen:
Der Test soll auf einem Signifikanzniveau von durchgeführt werden.
Es wird eine Zufallsstichprobe vom Umfang gezogen. Aufgrund des großen Umfangs der Grundgesamtheit (Gesamtproduktion) kann dabei von einer einfachen Zufallsstichprobe ausgegangen werden.
Teststatistik und Entscheidungsbereiche
Als Schätzfunktion für den unbekannten Erwartungswert der Grundgesamtheit wird der Stichprobenmittelwert verwendet.
Es sei aufgrund der langjährigen Nutzung der Maschine bekannt, dass das Ist-Gewicht eine normalverteilte Zufallsvariable mit der Standardabweichung ist.
Dann folgt für die Schätzfunktion , dass sie ebenfalls normalverteilt ist und eine Standardabweichung von aufweist.
Bei Gültigkeit der Nullhypothese, d.h. wenn die Maschine im Mittel tatsächlich das Sollgewicht von 1000 g einhält, gilt:
.
Für die Teststatistik
folgt:
.
Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für den oberen kritischen Wert .
Wegen der Symmetrie der Normalverteilung gilt .
Damit ergeben sich die Entscheidungsbereiche des Tests zu:
Nichtablehnungsbereich der
Ablehnungsbereich der
| Abb. 1: Verteilung der Teststatistik unter und Entscheidungsbereiche}}
Prüfwert
Es werden nunmehr die 25 Mehltüten zufällig ausgewählt, ihr Ist-Gewicht festgestellt und das arithmetische Mittel dieser Gewichte berechnet, für das sich ergeben habe.
Als Prüfwert erhält man
Entscheidungssituationen
Da in den Nichtablehnungsbereich der fällt, wird die Nullhypothese nicht abgelehnt.
Basierend auf der Zufallsstichprobe vom Umfang konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert in der Grundgesamtheit verschieden vom hypothetischen Wert ist, d.h. dass die Maschine den Sollwert von 1000 g nicht einhält.
Gütefunktion
Gütefunktion
Bei dieser Testentscheidung besteht die Möglichkeit, einen Fehler 2. Art zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.
Die Nichtablehnung der kann daher nur angemessen beurteilt werden, wenn die Wahrscheinlichkeit für einen derartigen Fehler berücksichtigt wird.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist jedoch unbekannt, da der wahre Erwartungswert in der Grundgesamtheit unbekannt ist.
Man kann aber für verschiedene mögliche Alternativwerte die Gütefunktion und über die Wahrscheinlichkeit für den Fehler 2. Art in Abhängigkeit von ermitteln.
Es sei z.B. angenommen, dass das tatsächliche mittlere Ist-Gewicht ist, mit dem die Maschine arbeitet.
Da für in Wirklichkeit die Alternativhypothese stimmt, gibt die Gütefunktion an dieser Stelle die Wahrscheinlichkeit einer richtigen Entscheidung für an:
Mit und erhält man:
|
|
|
|
|
|
|
|
|
|
|
|
Die Wahrscheinlichkeit für einen Fehler 2. Art an der Stelle ist:
Wenn das tatsächliche durchschnittliche Ist-Gewicht beträgt, wird in rund 83% aller Stichproben vom Umfang die Abweichung vom Sollgewicht 1000 g durch den Test nicht aufgedeckt.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist sehr hoch, da die Differenz relativ klein ist.
Wenn dagegen z.B. g der wahre Parameterwert in der Grundgesamtheit ist, dann gibt ebenfalls die Wahrscheinlichkeit einer richtigen Entscheidung für an:
, da in Wirklichkeit die Alternativhypothese stimmt.
Man erhält durch analoge Berechnungen:
und
In nur rund 0,02% aller Stichproben vom Umfang wird in diesem Fall die Abweichung vom Sollgewicht durch den Test nicht aufgedeckt.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist sehr klein, da die Differenz groß ist.
Für die gegebenen Werte von und sind in der folgenden Tabelle und für weitere zulässige Werte von enthalten.
|
Gültigkeit von
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Die grafische Darstellung der Gütefunktion enthält die Abb. 2.
| Abb. 2: Gütefunktion mit , , und }}
Eine Möglichkeit, die Gütefunktion bei festem Signifikanzniveau zu beeinflussen, ist die Erhöhung des Stichprobenumfangs .
Das soll exemplarisch unter den Annahmen gezeigt werden, dass bzw. der wahre Parameterwert in der Grundgesamtheit ist, wobei weiterhin und gelten.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Abb. 3 zeigt die Gütefunktionen für die 4 verschiedenen Stichprobenumfänge.
BEARBEITUNG
Wird z.B. vermutet, dass die Maschine nur mit einer geringfügigen Abweichung vom Sollwert arbeitet, so ist ein größerer Stichprobenumfang empfehlenswert, um vorhandene Abweichungen zuverlässiger aufzudecken und bei Nichtablehnung der die Wahrscheinlichkeit für einen Fehler 2. Art zu verringern, auch wenn dadurch die Kosten für die Überprüfung der Maschine höher werden.