Zweistichproben-t-Test/Beispiel: Hühnereier
Aus MM*Stat
Beispiele
Hühnereier
Studentin Sabine kauft Eier auf 2 Hühnerfarmen, die sich durch die gehaltene Hühnerrasse unterscheiden. Nach dem Zufallsprinzip wählt sie auf der ersten Farm 10 Eier und auf der zweiten Farm 15 Eier aus.
Zu Hause angekommen, hat sie den Eindruck, dass die Eier der einen Hühnerrasse schwerer sind als die der anderen.
Um ihre Vermutung zu überprüfen, führt sie einen statistischen Test auf dem Signifikanzniveau durch.
Da die beiden Durchschnittsgewichte gegenüber gestellt werden, handelt es sich um einen Test auf Differenz zweier Mittelwerte .
Da ihre Vermutung einen gerichteten Gewichtsunterschied beinhaltet, ist ein einseitiger Test durchzuführen.
Da Studentin Sabine statistisch "beweisen" will, dass die Eier der Hühnerrasse 1 schwerer sind als die der Hühnerrasse 2, formuliert sie diese Annahme als .
Im Fall der Ablehnung der ist ihr dann mit dem Signifikanzniveau die Wahrscheinlichkeit eines Fehlers 1. Art bekannt. Über die Größe des Gewichtsunterschiedes hat Studentin Sabine allerdings keine Vorstellungen, so dass sie den hypothetischen Wert der Differenz der beiden Erwartungswerte setzt.
Das Hypothesenpaar lautet somit:
bzw. äquivalent
Teststatistik und Entscheidungsbereiche
Die Zufallsauswahl wurde von der Studentin eingehalten, allerdings wurde ein Zufallsauswahlmodell ohne Zurücklegen realisiert.
Die Umfänge der beiden Grundgesamtheiten sind jedoch genügend groß, so dass von der Realisierung einfacher Zufallsstichproben ausgegangen werden kann.
Die beiden Zufallsstichproben sind unabhängig voneinander, da die Eier auf zwei verschiedenen Hühnerfarmen mit verschiedenen Hühnerrassen gekauft wurden.
Studentin Sabine geht davon aus, dass die Zufallsvariablen "Gewicht der Eier der 1. Hühnerrasse" und "Gewicht der Eier der zweiten Hühnerrasse" in den Grundgesamtheiten normalverteilt sind, d.h. und .
Die Erwartungswerte und sowie die Varianzen und sind unbekannt.
Desweiteren nimmt sie an, dass mit einer Vergrößerung des mittleren Gewichts der Eier nicht zwangsläufig eine Veränderung der Streuung einhergeht, d.h. sie unterstellt Varianzhomogenität in den Grundgesamtheiten.
Damit sind die Voraussetzungen für die Anwendung der Teststatistik
gegeben, wobei und die Stichprobenumfänge, und die beiden Stichprobenmittelwerte und und die Schätzfunktionen für und sind. Weiterhin folgt unter einer t-Verteilung mit der Anzahl der Freiheitsgrade .
Aus der Tabelle der Verteilungsfunktion der t-Verteilung findet man für und den kritischen Wert .
Damit ergeben sich die Entscheidungsbereiche des Tests zu:
Prüfwert und Testentscheidung
Studentin Sabine wiegt die Eier und berechnet je Hühnerrasse das arithmetische Mittel und die Varianz des Gewichts.
Es habe sich ergeben:
1. Hühnerrasse:
2. Hühnerrasse:
Unter Berücksichtigung von errechnet sie daraus den Prüfwert .
Da in den Ablehnungsbereich der fällt, wird die Nullhypothese abgelehnt.
Auf einem Signifikanzniveau von und basierend auf den beiden Zufallsstichproben mit den Umfängen und konnte statistisch gezeigt werden, dass eine signifikant positive Differenz zwischen den Erwartungswerten der beiden Grundgesamtheiten besteht, d.h. das mittlere Gewicht der Eier der 1. Hühnerrasse ist signifikant größer als das mittlere Gewicht der Eier der 2. Hühnerrasse.
Die Wahrscheinlichkeit eines Fehlers 1. Art bei dieser Testentscheidung entspricht dem Signifikanzniveau .