Zweistichproben-t-Test/Beispiel: Alter

Beispiele

Alter

Zwei leitende Mitarbeiter einer großen Bank, Herr Schmidt und Herr Maier, geraten während der Mittagspause in einen Disput über das Alter der Bankangestellten.

1. Variante:

Herr Schmidt behauptet, dass es einen Unterschied im Durchschnittsalter der männlichen und weiblichen Bankangestellten gibt, während Herr Maier die gegenteilige Auffassung vertritt.

2. Variante:

Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt älter sind, Herr Maier widerspricht dem.

3. Variante:

Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt mehr als 5 Jahre älter sind. Herr Maier räumt zwar ein, dass das Durchschnittsalter der männlichen Bankangestellten unter dem der weiblichen Bankangestellten liegen könnte, aber nicht in dieser Größenordnung.

Da sie sich nicht einigen können, beschließen sie, einen statistischen Test auf dem Signifikanzniveau von $\alpha =0,05$ durchzuführen, wobei es sich um einen Test auf Differenz zweier Mittelwerte $\mu _{1}-\mu _{2}$ handelt.

Die Zufallsvariable $X_{1}\;$ bezeichne das Alter der weiblichen Bankangestellten und die Zufallsvariable $X_{2}\;$ das Alter der männlichen Bankangestellten. Die Erwartungswerte $E[X_{1}]=\mu _{1}$ und $E[X_{2}]=\mu _{2}$ sowie die Varianzen $Var(X_{1})=\sigma _{1}^{2}$ und $Var(X_{2})=\sigma _{2}^{2}$ sind unbekannt.

Herr Schmidt und Herr Maier stimmen darin überein, dass nicht von einer Gleichheit der Varianzen in den Grundgesamtheiten ausgegangen werden kann (Annahme der Varianzheterogenität).

Über die Verteilungen der Zufallsvariablen $X_{1}\;$ und $X_{2}\;$ haben sie keine Erkenntnisse vorliegen, so dass sie beide Stichprobenumfänge $n_{1}$ und $n_{2}$ genügend groß wählen, damit der Zentrale Grenzwertsatz wirksam wird.

Da ihnen bekannt ist, dass in der Bank die Gesamtzahl der weiblichen und männlichen Bankangestellten etwa gleich ist, wählen sie auch die Stichprobenumfänge gleich groß, und zwar: $n_{1}=n_{2}=50$ .

Sie bitten die Personalabteilung um Unterstützung bei der Stichprobenziehung. Dort werden aus der Gesamtheit der Personalunterlagen der männlichen bzw. der weiblichen Bankangestellten jeweils 50 zufällig und nach dem Modell mit Zurücklegen (Realisierung einer einfachen Zufallsstichprobe) ausgewählt und das Alter registriert.

Durch die Problemstellung und die Ziehungsmodalitäten ist gewährleistet, dass die beiden Zufallsstichproben unabhängig voneinander sind.

Für jede Stichprobe wird das Durchschnittsalter und die Varianz berechnet. Aufgrund dieser für jede Variante gleichen Voraussetzungen kann auch die gleiche Teststatistik verwendet werden.

Da $\sigma _{1}$ und $\sigma _{2}$ unbekannt sind und Varianzheterogenität unterstellt wird, kommt die Teststatistik

$V={\frac {\left({\overline {X}}_{1}-{\overline {X}}_{2}\right)-\omega _{0}}{\sqrt {{\frac {S_{1}^{2}}{n_{1}}}+{\frac {S_{2}^{2}}{n_{2}}}}}}$

zur Anwendung, wobei

${\overline {X}}_{1}={\frac {1}{n_{1}}}\cdot \sum _{i=1}^{n_{1}}\;X_{1i},\quad {\overline {X}}_{2}={\frac {1}{n_{2}}}\cdot \sum _{i=1}^{n_{2}}\;X_{2i}$

die beiden Stichprobenmittelwerte sind und $\sigma _{1}$ und $\sigma _{2}$ mittels der Schätzfunktionen

$S_{1}^{2}={\frac {1}{n_{1}-1}}\cdot \sum _{i=1}^{n_{1}}\left(X_{1i}-{\overline {X}}_{1}\right)^{2},\quad S_{2}^{2}={\frac {1}{n_{2}-1}}\cdot \sum _{i=1}^{n_{2}}\left(X_{2i}-{\overline {X}}_{2}\right)^{2}$

aus den Zufallsstichproben geschätzt werden.

Da für beide Stichprobenumfänge $n_{1}>30$ und $n_{2}>30$ gilt, ist aufgrund der Wirksamkeit des Zentralen Grenzwertsatzes die Teststatistik $V\;$ unter $H_{0}$ approximativ $N(0;1)$ -verteilt (Approximation durch Zweistichproben-Gauß-Test - siehe oben).

1. Variante

Da Herr Schmidt mit seiner Behauptung eines Unterschiedes im Durchschnittsalter sehr allgemein in dem Sinne geblieben ist, dass er weder eine Richtung noch eine Größe des Altersunterschiedes angegeben hat, wird ein zweiseitiger Test mit dem hypothetischen Wert $\omega _{0}=0$ durchgeführt:

$H_{0}:\;\mu _{1}-\mu _{2}=\omega _{0}=0\quad H_{1}:\mu _{1}-\mu _{2}\neq \omega _{0}=0$

Eine äquivalente Hypothesenformulierung ist:

$H_{0}:\mu _{1}=\mu _{2}\quad H_{1}:\mu _{1}\neq \mu _{2}$

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für $P\left(V\geq c_{o}\right)=1-{\frac {\alpha }{2}}=0,975$ den oberen kritischen Wert $c_{o}=z_{1-{\frac {\alpha }{2}}}=z_{0,975}=1,96$ .

Wegen der Symmetrie der Normalverteilung gilt $c_{u}=-z_{1-{\frac {\alpha }{2}}}=-z_{0,975}=-1,96$ und $P\left(V\leq c_{u}\right)={\frac {\alpha }{2}}=0,025$ .

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

approximativer Nichtablehnungsbereich der $H_{0}:\;\left\{v|-1,96\leq v\leq 1,96\right\}$

approximativer Ablehnungsbereich der $H_{0}:\;\left\{v|v<-1,96{\mbox{ oder }}v>1,96\right\}$

Die Personalabteilung teilt den beiden leitenden Mitarbeitern folgende Schätzergebnisse aus den konkreten Zufallsstichproben mit:

weibliche Bankangestellte: ${\overline {x}}_{1}=47,71,\quad s_{1}^{2}=260,875$

männliche Bankangestellte: ${\overline {x}}_{2}=41,80,\quad s_{2}^{2}=237,681$

Unter Berücksichtigung von $\omega _{0}=0$ errechnen sie daraus den Prüfwert $v=1,87$ .

Da $v=1,87$ in den Nichtablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf den beiden Zufallsstichproben mit den Umfängen $n_{1}=50$ und $n_{2}=50$ konnte statistisch nicht gezeigt werden, dass eine signifikante Differenz zwischen den Erwartungswerten $\mu _{1}$ und $\mu _{2}$ der beiden Grundgesamtheiten, d.h. im mittleren Alter der männlichen und weiblichen Bankangestellten besteht.

Allerdings besteht bei dieser Testentscheidung die Möglichkeit eines Fehlers 2. Art ( ${\mbox{''}}H_{0}{\mbox{''}}|H_{1}$ ), wenn in Wirklichkeit die Alternativhypothese gilt.

Die Wahrscheinlichkeit dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird, d.h. die Bereichsalternative in eine Punktalternative umgewandelt wird

2. Variante

Da Herr Schmidt im Verlauf des Disputs starke sachliche Argumente für seine Auffassung ins Feld geführt hat, besteht er darauf, dass seine Annahme als Alternativhypothese $H_{1}$ formuliert wird.

Grund: Im Falle einer Entscheidung für $H_{1}$ kennt er mit dem Signifikanzniveau $\alpha$ die Wahrscheinlichkeit eines Fehlers 1. Art $P({\mbox{''}}H_{1}{\mbox{''}}|H_{0})$ .

Es resultiert ein rechtsseitiger Test.

Mit seiner Behauptung ist jedoch keine Größe des Altersunterschiedes verbunden, weshalb der hypothetische Wert $\omega _{0}=0$ gesetzt wird.

Das Hypothesenpaar lautet:

$H_{0}:\mu _{1}-\mu _{2}\leq \omega _{0}=0\quad H_{1}:\mu _{1}-\mu _{2}>\omega _{0}=0$ bzw. äquivalent

$H_{0}:\mu _{1}\leq \mu _{2}\quad H_{1}:\mu _{1}>\mu _{2}$

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für $P\left(V\leq c\right)=1-\alpha =0,95$ den kritischen Wert $c=z_{0,95}=1,645$ .

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

approximativer Nichtablehnungsbereich der $H_{0}:\;\left\{v|v\leq 1,645\right\}$

approximativer Ablehnungsbereich der $H_{0}:\;\left\{v|v>1,645\right\}$

Die Personalabteilung zieht die beiden Zufallsstichproben und übermittelt Herrn Schmidt und Herrn Maier folgende Schätzergebnisse:

weibliche Bankangestellte: ${\overline {x}}_{1}=51,71,\quad s_{1}^{2}=385,509$

männliche Bankangestellte: ${\overline {x}}_{2}=45,16,\quad s_{2}^{2}=283,985$

Unter Berücksichtigung von $\omega _{0}=0$ , errechnen sie daraus den Prüfwert $v=1,79$ .

Da $v=1,79$ in den Ablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von $\alpha =0,05$ und basierend auf den beiden Zufallsstichproben mit den Umfängen $n_{1}=50$ und $n_{2}=50$ konnte statistisch gezeigt werden, dass eine signifikant positive Differenz $\mu _{1}-\mu _{2}$ zwischen den Erwartungswerten der beiden Grundgesamtheiten besteht, d.h. das mittlere Alter der weiblichen Bankangestellten ist signifikant größer als das mittlere Alter der männlichen Bankangestellten.

Die Wahrscheinlichkeit eines Irrtums bei dieser Testentscheidung, d.h. die Wahrscheinlichkeit eines Fehlers 1. Art $P\left({\mbox{''}}H_{1}{\mbox{''}}|H_{0}\right)$ , entspricht dem Signifikanzniveau $\alpha =0,05$ .

Im Vergleich zu einem zweiseitigen Test besteht der Ablehnungsbereich der $H_{0}$ nicht mehr aus zwei Segmenten, sondern liegt insgesamt rechts von $E[V]=0$ .

Da die Fläche unter der Standardnormalverteilung über diesem Ablehnungsbereich der $H_{0}$ dem gesamten vorgegebenen Signifikanzniveau $\alpha$ entspricht, ist der kritische Wert kleiner im Vergleich zum zweiseitigen Test.

Damit wird die $H_{0}$ bei dem rechtsseitigen Test eher abgelehnt als bei einem zweiseitigen Test (bei gleichem Signifikanzniveau $\alpha$ und gleichen Stichprobenumfängen $n_{1}$ und $n_{2}$ ).

3. Variante

Mit seiner Behauptung hat Herr Schmidt neben der Richtung auch die Größe des Altersunterschiedes mit mehr als 5 Jahren fixiert, so dass der hypothetische Wert $\omega _{0}=5$ gesetzt wird.

Herr Maier willigt ein, dass die Annahme von Herrn Schmidt als Alternativhypothese $H_{1}$ formuliert wird. Es resultiert ein rechtsseitiger Test.

Das Hypothesenpaar lautet:

$H_{0}:\;\mu _{1}-\mu _{2}\leq 5\quad H_{1}:\mu _{1}-\mu _{2}>5$

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für $P(V\leq c)=1-\alpha =0,95$ den kritischen Wert $c=z_{0,95}=1,645$ .

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

approximativer Nichtablehnungsbereich der $H_{0}:\;\left\{v|v\leq 1,645\right\}$

approximativer Ablehnungsbereich der $H_{0}:\;\left\{v|v>1,645\right\}$ .

Als Schätzergebnisse aus den beiden Zufallsstichproben habe sich ergeben:

weibliche Bankangestellte: ${\overline {x}}_{1}=52,22,\quad s_{1}^{2}=321,914$

männliche Bankangestellte: ${\overline {x}}_{2}=43,13,\quad s_{2}^{2}=306,527$

Unter Berücksichtigung von $\omega _{0}=5$ errechnen sie daraus den Prüfwert $v=1,154$ .

Da $v=1,154$ in den Nichtablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf den beiden Zufallsstichproben mit den Umfängen $n_{1}=50$ und $n_{2}=50$ konnte statistisch nicht gezeigt werden, dass die Differenz $\mu _{1}-\mu _{2}$ zwischen den Erwartungswerten der beiden Grundgesamtheiten größer als 5 ist, d.h. dass das Durchschnittsalter der weiblichen Bankangestellten um mehr als 5 Jahre über dem der männlichen Bankangestellten liegt.

Mit dieser Testentscheidung wird jedoch nicht verworfen, dass die weiblichen Bankangestellten im Mittel älter als die männlichen Bankangestellten sind, sondern lediglich dass Herr Schmidt die Größe dieses Unterschiedes offensichtlich zu hoch veranschlagt hat.

Allerdings besteht bei dieser Testentscheidung die Möglichkeit eines Fehlers 2. Art $({\mbox{''}}H_{0}{\mbox{''}}|H_{1})$ , wenn in Wirklichkeit die Alternativhypothese gilt.

Die Wahrscheinlichkeit dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird.

Zweistichproben-t-Test/Beispiel: Alter

Aus MM*Stat

Inhaltsverzeichnis

Beispiele

Alter

1. Variante

2. Variante

3. Variante