Zweistichproben-t-Test: Unterschied zwischen den Versionen

Version vom 22. November 2018, 15:21 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen

Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Unterseiten

Hühnereier • Alter

Grundbegriffe

Zweistichproben-t-Test

Der Zweistichproben-t-Test ist ein Test auf Differenz zweier Mittelwerte, wobei die Standardabweichung $\sigma$ als unbekannt vorrausgesetzt wird.

Im Folgenden gelten alle Voraussetzungen wie unter "Test auf Differenz zweier Mittelwerte" diskutiert.

Teststatistik des Zweistichproben-t-Tests

Im Fall eines Zweistichproben-t-Tests werden $\sigma _{1}$ und $\sigma _{2}$ mittels der Schätzfunktionen

$S_{1}^{2}={\frac {1}{n_{1}-1}}\cdot \;\sum _{i=1}^{n_{1}}\left(X_{1i}-{\overline {X}}_{1}\right)^{2},\quad S_{2}^{2}={\frac {1}{n_{2}-1}}\cdot \;\sum _{i=1}^{n_{2}}\left(X_{2i}-{\overline {X}}_{2}\right)^{2}$

aus den Stichproben geschätzt.

Annahme der Varianzhomogenität

Unter der Annahme der Varianzhomogenität, d.h. beide Grundgesamtheiten haben gleiche Varianz $\sigma _{1}^{2}=\sigma _{2}^{2}$ , ergibt sich eine Schätzung $S^{2}\;$ für die gemeinsame Varianz $\sigma ^{2}$ als gewogenes arithmetisches Mittel aus den beiden Stichprobenvarianzen

$S^{2}={\frac {\left(n_{1}-1\right)\cdot S_{1}^{2}+\left(n_{2}-1\right)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}}$

und als Schätzfunktion $S_{D}^{2}$ für $\sigma _{D}^{2}$

$S_{D}^{2}=S^{2}\cdot \left({\cfrac {1}{n_{1}}}+{\cfrac {1}{n_{2}}}\right)={\cfrac {n_{1}+n_{2}}{n_{1}\;n_{2}}}\cdot {\cfrac {\left(n_{1}-1\right)\cdot S_{1}^{2}+\left(n_{2}-1\right)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}}$

Damit resultiert für die Teststatistik $V\;$ :

$V={\frac {D-\omega _{0}}{S_{D}}}={\cfrac {\left({\overline {X}}_{1}-{\overline {X}}_{2}\right)-\omega _{0}}{\sqrt {{\cfrac {n_{1}+n_{2}}{n_{1}\;n_{2}}}\cdot {\cfrac {\left(n_{1}-1\right)\cdot S_{1}^{2}+\left(n_{2}-1\right)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}}}}}$

die unter $H_{0}$ approximativ einer t-Verteilung mit der Anzahl der Freiheitsgrade $f=n_{1}+n_{2}-2$ folgt.

Annahme der Varianzheterogenität

Unter der Annahme der Varianzheterogenität, d.h. beide Grundgesamtheiten haben ungleiche Varianzen $\sigma _{1}^{2}\neq \sigma _{2}^{2}$ , kann nur eine Näherungslösung angegeben werden (Test von Welch).

Als Schätzfunktion $S_{D}^{2}$ für $\sigma _{D}^{2}$ ergibt sich:

$S_{D}^{2}={\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}$

Die Teststatistik lautet dann:

$V={\frac {D-\omega _{0}}{S_{D}}}={\frac {\left({\overline {X}}_{1}-{\overline {X}}_{2}\right)-\omega _{0}}{\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}$

die unter $H_{0}$ approximativ einer t-Verteilung folgt mit der Anzahl der Freiheitsgrade (gerundet zur ganzen Zahl)

$f={\frac {\left({\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}\right)^{2}}{{\frac {1}{n_{1}-1}}\cdot \left({\frac {S_{1}^{2}}{n_{1}}}\right)^{2}+{\frac {1}{n_{2}-1}}\cdot \left({\frac {S_{2}^{2}}{n_{2}}}\right)^{2}}}$

Entscheidungsbereiche des Zweistichproben-t-Tests

Für das vorgegebene Signifikanzniveau $\alpha$ findet man in beiden Fällen die kritischen Werte aus der Tabelle der Verteilungsfunktion der t-Verteilung.

Für die einzelnen Testvarianten erhält man die nachstehenden Entscheidungsbereiche bei Gültigkeit der Nullhypothese $H_{0}$ und vorgegebenem Signifikanzniveau $\alpha$

Testvariante	Ablehnungsbereich der $H_{0}$	Nichtablehnungsbereich der $H_{0}$
zweiseitig	$\left\{v\|v<-t_{1-{\frac {\alpha }{2}};n_{1}+n_{2}-2}{\mbox{ oder }}v>t_{1-{\frac {\alpha }{2}};n_{1}+n_{2}-2}\right\}$	$\left\{v\|-t_{1-{\frac {\alpha }{2}};n_{1}+n_{2}-2}\leq v\leq t_{1-{\frac {\alpha }{2}};n_{1}+n_{2}-2}\right\}$
rechtsseitig	$\left\{v\|v>t_{1-\alpha ;n_{1}+n_{2}-2}\right\}$	$\left\{v\|v\leq t_{1-\alpha ;n_{1}+n_{2}-2}\right\}$
linksseitig	$\left\{v\|v<-t_{1-\alpha ;n_{1}+n_{2}-2}\right\}$	$\left\{v\|v\geq -t_{1-\alpha ;n_{1}+n_{2}-2}\right\}$

Prüfwert des Zweistichproben-t-Tests

Aufgrund der konkreten Zufallsstichproben können die Schätzwerte ${\overline {x}}_{1}$ und ${\overline {x}}_{2}$ für die Stichprobenmittelwerte und gegebenenfalls die Schätzwerte $s_{1}$ und $s_{2}$ für die Standardabweichungen berechnet werden.

Einsetzen in die entsprechende Teststatistik führt zu einem Prüfwert $v$ .

Entscheidungssituationen des Zweistichproben-t-Tests

Testentscheidung und Interpretation erfolgen in analoger Weise wie beim Einstichproben-t-Test.

Zusatzinformationen

Approximation durch Zweistichproben-Gauß-Test

Bei genügend großen Stichprobenumfängen $(n_{1}>30$ und $n_{2}>30)$ ist aufgrund der Wirksamkeit des zentralen Grenzwertsatzes die jeweilige Teststatistik $V\;$ unter $H_{0}$ approximativ $N(0;1)$ -verteilt.

Es können dann die kritischen Werte aus der Standardnormalverteilung entnommen und näherungsweise die entsprechenden Entscheidungsbereiche des Zweistichproben-Gauß-Tests ( $\sigma _{1}$ und $\sigma _{2}$ sind bekannt) verwendet werden.

Beispiele

Hühnereier

Studentin Sabine kauft Eier auf 2 Hühnerfarmen, die sich durch die gehaltene Hühnerrasse unterscheiden. Nach dem Zufallsprinzip wählt sie auf der ersten Farm 10 Eier und auf der zweiten Farm 15 Eier aus.

Zu Hause angekommen, hat sie den Eindruck, dass die Eier der einen Hühnerrasse schwerer sind als die der anderen.

Um ihre Vermutung zu überprüfen, führt sie einen statistischen Test auf dem Signifikanzniveau $\alpha =0,05$ durch.

Da die beiden Durchschnittsgewichte gegenüber gestellt werden, handelt es sich um einen Test auf Differenz zweier Mittelwerte $\mu _{1}-\mu _{2}$ .

Da ihre Vermutung einen gerichteten Gewichtsunterschied beinhaltet, ist ein einseitiger Test durchzuführen.

Da Studentin Sabine statistisch "beweisen" will, dass die Eier der Hühnerrasse 1 schwerer sind als die der Hühnerrasse 2, formuliert sie diese Annahme als $H_{1}$ .

Im Fall der Ablehnung der $H_{0}$ ist ihr dann mit dem Signifikanzniveau $\alpha$ die Wahrscheinlichkeit eines Fehlers 1. Art bekannt. Über die Größe des Gewichtsunterschiedes hat Studentin Sabine allerdings keine Vorstellungen, so dass sie den hypothetischen Wert der Differenz der beiden Erwartungswerte $\mu _{1}-\mu _{2}=\omega _{0}=0$ setzt.

Das Hypothesenpaar lautet somit:

$H_{0}:\;\mu _{1}-\mu _{2}\leq 0\quad H_{1}:\;\mu _{1}-\mu _{2}>0$

bzw. äquivalent

$H_{0}:\;\mu _{1}\leq \mu _{2}\quad H_{1}:\;\mu _{1}>\mu _{2}$

Teststatistik und Entscheidungsbereiche

Die Zufallsauswahl wurde von der Studentin eingehalten, allerdings wurde ein Zufallsauswahlmodell ohne Zurücklegen realisiert.

Die Umfänge der beiden Grundgesamtheiten sind jedoch genügend groß, so dass von der Realisierung einfacher Zufallsstichproben ausgegangen werden kann.

Die beiden Zufallsstichproben sind unabhängig voneinander, da die Eier auf zwei verschiedenen Hühnerfarmen mit verschiedenen Hühnerrassen gekauft wurden.

Studentin Sabine geht davon aus, dass die Zufallsvariablen $X_{1}:\;$ "Gewicht der Eier der 1. Hühnerrasse" und $X_{2}:\;$ "Gewicht der Eier der zweiten Hühnerrasse" in den Grundgesamtheiten normalverteilt sind, d.h. $X_{1}\sim N\left(\mu _{1};\;\sigma _{1}\right)$ und $X_{2}\sim N\left(\mu _{2};\;\sigma _{2}\right)$ .

Die Erwartungswerte $E\left[X_{1}\right]=\mu _{1}$ und $E\left[X_{2}\right]=\mu _{2}$ sowie die Varianzen $Var\left(X_{1}\right)=\sigma _{1}^{2}$ und $Var\left(X_{2}\right)=\sigma _{2}^{2}$ sind unbekannt.

Desweiteren nimmt sie an, dass mit einer Vergrößerung des mittleren Gewichts der Eier nicht zwangsläufig eine Veränderung der Streuung einhergeht, d.h. sie unterstellt Varianzhomogenität $\sigma _{1}^{2}=\sigma _{2}^{2}$ in den Grundgesamtheiten.

Damit sind die Voraussetzungen für die Anwendung der Teststatistik

$V={\cfrac {\left({\overline {X}}_{1}-{\overline {X}}_{2}\right)-\omega _{0}}{\sqrt {{\cfrac {n_{1}+n_{2}}{n_{1}\,n_{2}}}\;{\cfrac {\left(n_{1}-1\right)\cdot S_{1}^{2}+\left(n_{2}-1\right)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}}}}}$

gegeben, wobei $n_{1}=10$ und $n_{2}=15$ die Stichprobenumfänge, ${\overline {X}}_{1}$ und ${\overline {X}}_{2}$ die beiden Stichprobenmittelwerte und $S_{1}^{1}$ und $S_{1}^{2}$ die Schätzfunktionen für $\sigma _{1}^{2}$ und $\sigma _{2}^{2}$ sind. Weiterhin folgt $V\;$ unter $H_{0}$ einer t-Verteilung mit der Anzahl der Freiheitsgrade $f=n_{1}+n_{2}-2=10+15-2=23$ .

Aus der Tabelle der Verteilungsfunktion der t-Verteilung findet man für $P\left(V\leq c\right)=1-\alpha =0,95$ und $f=23$ den kritischen Wert $c=t_{0,95;23}=1,714$ .

Damit ergeben sich die Entscheidungsbereiche des Tests zu:

Nichtablehnungsbereich der $H_{0}:\;\left\{v|v\leq 1,714\right\}$

Ablehnungsbereich der $H_{0}:\;\left\{v|v>1,714\right\}$ .

Prüfwert und Testentscheidung

Studentin Sabine wiegt die Eier und berechnet je Hühnerrasse das arithmetische Mittel und die Varianz des Gewichts.

Es habe sich ergeben:

1. Hühnerrasse: ${\overline {x}}_{1}=65,700\quad s_{1}^{2}=50,35$

2. Hühnerrasse: ${\overline {x}}_{2}=60,433\quad s_{1}^{2}=42,46$

Unter Berücksichtigung von $\omega _{0}=0$ errechnet sie daraus den Prüfwert $v=1,91$ .

Da $v=1,91$ in den Ablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von $\alpha =0,05$ und basierend auf den beiden Zufallsstichproben mit den Umfängen $n_{1}=10$ und $n_{2}=15$ konnte statistisch gezeigt werden, dass eine signifikant positive Differenz $\mu _{1}-\mu _{2}$ zwischen den Erwartungswerten der beiden Grundgesamtheiten besteht, d.h. das mittlere Gewicht der Eier der 1. Hühnerrasse ist signifikant größer als das mittlere Gewicht der Eier der 2. Hühnerrasse.

Die Wahrscheinlichkeit $P\left({\mbox{''}}H_{1}{\mbox{''}}|H_{0}\right)$ eines Fehlers 1. Art bei dieser Testentscheidung entspricht dem Signifikanzniveau $\alpha =0,05$ .