Zweistichproben-t-Test: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
K (Änderungen von Siskosth (Diskussion) wurden auf die letzte Version von H0130wij zurückgesetzt)
Zeile 1: Zeile 1:
 
{{Testtheorie}}
 
{{Testtheorie}}
{{SubpageToc|Beispiel: Hühnereier|Beispiel: Alter}}
 
  
 
==Grundbegriffe==
 
==Grundbegriffe==
Zeile 165: Zeile 164:
  
 
Die [[Wahrscheinlichkeit]] <math>P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)</math> eines [[Fehler 1. Art|Fehlers 1. Art]] bei dieser [[Statistischer Test|Test]]entscheidung entspricht dem [[Signifikanzniveau]] <math>\alpha =0,05</math>.
 
Die [[Wahrscheinlichkeit]] <math>P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)</math> eines [[Fehler 1. Art|Fehlers 1. Art]] bei dieser [[Statistischer Test|Test]]entscheidung entspricht dem [[Signifikanzniveau]] <math>\alpha =0,05</math>.
 +
 +
===Alter===
 +
 +
Zwei leitende Mitarbeiter einer großen Bank, Herr Schmidt und Herr Maier, geraten während der Mittagspause in einen Disput über das Alter der Bankangestellten.
 +
 +
* 1. Variante:
 +
 +
: Herr Schmidt behauptet, dass es einen Unterschied im Durchschnittsalter der männlichen und weiblichen Bankangestellten gibt, während Herr Maier die gegenteilige Auffassung vertritt.
 +
 +
* 2. Variante:
 +
 +
: Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt älter sind, Herr Maier widerspricht dem.
 +
 +
* 3. Variante:
 +
 +
: Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt mehr als 5 Jahre älter sind. Herr Maier räumt zwar ein, dass das Durchschnittsalter der männlichen Bankangestellten unter dem der weiblichen Bankangestellten liegen könnte, aber nicht in dieser Größenordnung.
 +
 +
Da sie sich nicht einigen können, beschließen sie, einen [[Statistischer Test|statistischen Test]] auf dem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> durchzuführen, wobei es sich um einen [[Test auf Differenz zweier Mittelwerte]] <math>\mu_{1}-\mu_{2}</math> handelt.
 +
 +
Die [[Zufallsvariable]] <math>X_{1}\;</math> bezeichne das Alter der weiblichen Bankangestellten und die [[Zufallsvariable]] <math>X_{2}\;</math> das Alter der männlichen Bankangestellten. Die [[Erwartungswert]]e <math>E[X_{1}]=\mu_{1}</math> und <math>E[X_{2}]=\mu_{2}</math> sowie die [[Varianz (stochastisch)|Varianzen]] <math>Var(X_{1}) = \sigma_{1}^{2}</math> und <math>Var(X_{2})=\sigma_{2}^{2}</math> sind unbekannt.
 +
 +
Herr Schmidt und Herr Maier stimmen darin überein, dass nicht von einer Gleichheit der [[Varianz (stochastisch)|Varianzen]] in den [[Grundgesamtheit]]en ausgegangen werden kann (Annahme der [[Varianzheterogenität]]).
 +
 +
Über die [[Verteilung (stochastisch)|Verteilungen]] der [[Zufallsvariable]]n <math>X_{1}\;</math> und <math>X_{2}\;</math> haben sie keine Erkenntnisse vorliegen, so dass sie beide [[Stichprobenumfang|Stichprobenumfänge]] <math>n_{1}</math> und <math>n_{2}</math> genügend groß wählen, damit der [[Zentraler Grenzwertsatz|Zentrale Grenzwertsatz]] wirksam wird.
 +
 +
Da ihnen bekannt ist, dass in der Bank die Gesamtzahl der weiblichen und männlichen Bankangestellten etwa gleich ist, wählen sie auch die [[Stichprobenumfang|Stichprobenumfänge]] gleich groß, und zwar: <math>n_{1}  = n_{2}  = 50</math>.
 +
 +
Sie bitten die Personalabteilung um Unterstützung bei der [[Stichprobe]]nziehung. Dort werden aus der [[Grundgesamtheit|Gesamtheit]] der Personalunterlagen der männlichen bzw. der weiblichen Bankangestellten jeweils 50 zufällig und nach dem [[Zufallsauswahlmodell mit Zurücklegen|Modell mit Zurücklegen]] ([[Realisation|Realisierung]] einer [[Einfache Zufallsstichprobe|einfachen Zufallsstichprobe]]) ausgewählt und das Alter registriert.
 +
 +
Durch die Problemstellung und die Ziehungsmodalitäten ist gewährleistet, dass die beiden [[Zufallsstichprobe]]n [[Unabhängigkeit (stochastisch)|unabhängig]] voneinander sind.
 +
 +
Für jede [[Stichprobe]] wird das Durchschnittsalter und die [[Varianz (stochastisch)|Varianz]] berechnet. Aufgrund dieser für jede Variante gleichen Voraussetzungen kann auch die gleiche [[Teststatistik]] verwendet werden.
 +
 +
Da <math>\sigma_{1}</math> und <math>\sigma_{2}</math> unbekannt sind und [[Varianzheterogenität]] unterstellt wird, kommt die [[Teststatistik]]
 +
 +
<math>V=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\omega_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}</math>
 +
 +
zur Anwendung, wobei
 +
 +
<math>\overline{X}_{1}=\frac{1}{n_{1}}\cdot\sum_{i=1}^{n_{1}}\;X_{1i},\quad \overline{X}_{2}=\frac{1}{n_{2}}\cdot\sum_{i=1}^{n_{2}}\;X_{2i}</math>
 +
 +
die beiden [[Stichprobenmittelwert]]e sind und <math>\sigma_{1}</math> und <math>\sigma_{2}</math> mittels der [[Schätzfunktion]]en
 +
 +
<math>S_{1}^{2}=\frac{1}{n_{1}-1}\cdot \sum_{i=1}^{n_{1}}\left( X_{1i}-\overline{X}_{1}\right)^{2},\quad S_{2}^{2}=\frac{1}{n_{2}-1}\cdot\sum_{i=1}^{n_{2}}\left(X_{2i}-\overline{X}_{2}\right)^{2}</math>
 +
 +
aus den [[Zufallsstichprobe]]n [[Schätzung|geschätzt]] werden.
 +
 +
Da für beide [[Stichprobenumfang|Stichprobenumfänge]] <math>n_{1}>30</math> und <math>n_{2}>30</math> gilt, ist aufgrund der Wirksamkeit des [[Zentraler Grenzwertsatz|Zentralen Grenzwertsatzes]] die [[Teststatistik]] <math>V\;</math> unter <math>H_{0}</math> [[Approximation|approximativ]] <math>N(0; 1)</math>-[[Verteilung (stochastisch)|verteilt]] ([[Approximation]] durch [[Zweistichproben-Gauß-Test]] - siehe oben).
 +
 +
====1. Variante====
 +
 +
Da Herr Schmidt mit seiner Behauptung eines Unterschiedes im Durchschnittsalter sehr allgemein in dem Sinne geblieben ist, dass er weder eine Richtung noch eine Größe des Altersunterschiedes angegeben hat, wird ein [[zweiseitiger Test]] mit dem hypothetischen Wert <math>\omega_{0}=0</math> durchgeführt:
 +
 +
<math>H_{0}:\;\mu_{1}-\mu_{2}=\omega_{0}=0\quad H_{1}:\mu_{1}-\mu_{2}\neq \omega_{0}=0</math>
 +
 +
Eine äquivalente Hypothesenformulierung ist:
 +
 +
<math>H_{0}:\mu_{1}=\mu_{2}\quad H_{1}:\mu_{1}\neq \mu _{2}</math>
 +
 +
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] findet man für <math>P\left(V\geq c_{o}\right)=1-\frac{\alpha}{2}=0,975</math> den oberen [[Kritischer Wert|kritischen Wert]] <math>c_{o}=z_{1-\frac{\alpha}{2}}=z_{0,975}=1,96</math>.
 +
 +
Wegen der Symmetrie der [[Normalverteilung]] gilt <math>c_{u}=-z_{1-\frac{\alpha}{2}}=-z_{0,975}=-1,96</math> und <math>P\left( V\leq c_{u}\right)=\frac{\alpha}{2}=0,025</math>.
 +
 +
Damit ergeben sich die [[Approximation|approximativen]] [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu:
 +
 +
* [[Approximation|approximativer]] [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der]] <math>H_{0}:\; \left\{ v|-1,96\leq v\leq 1,96\right\}</math>
 +
 +
* [[Approximation|approximativer]] [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der]] <math>H_{0}:\; \left\{ v|v<-1,96\mbox{ oder }v>1,96\right\}</math>
 +
 +
Die Personalabteilung teilt den beiden leitenden Mitarbeitern folgende Schätzergebnisse aus den konkreten [[Zufallsstichprobe]]n mit:
 +
 +
weibliche Bankangestellte: <math>\overline{x}_{1}=47,71, \quad s_{1}^{2}=260,875</math>
 +
 +
männliche Bankangestellte: <math>\overline{x}_{2}=41,80, \quad s_{2}^{2}=237,681</math>
 +
 +
Unter Berücksichtigung von <math>\omega_{0}=0</math> errechnen sie daraus den [[Prüfwert]] <math>v = 1,87</math>.
 +
 +
Da <math>v = 1,87</math> in den [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] fällt, wird die [[Nullhypothese]] nicht abgelehnt.
 +
 +
Basierend auf den beiden [[Zufallsstichprobe]]n mit den [[Stichprobenumfang|Umfängen]] <math>n_{1} = 50</math> und <math>n_{2} = 50</math> konnte [[Statistik|statistisch]] nicht gezeigt werden, dass eine signifikante Differenz zwischen den [[Erwartungswert]]en <math>\mu_{1}</math> und <math>\mu_{2}</math> der beiden [[Grundgesamtheit]]en, d.h. im mittleren Alter der männlichen und weiblichen Bankangestellten besteht.
 +
 +
Allerdings besteht bei dieser [[Statistischer Test|Test]]entscheidung die Möglichkeit eines [[Fehler 2. Art|Fehlers 2. Art]] (<math>\mbox{''}H_{0}\mbox{''}|H_{1}</math>), wenn in Wirklichkeit die [[Alternativhypothese]] gilt.
 +
 +
Die [[Wahrscheinlichkeit]] dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird, d.h. die
 +
Bereichsalternative in eine Punktalternative umgewandelt wird
 +
 +
====2. Variante====
 +
 +
Da Herr Schmidt im Verlauf des Disputs starke sachliche Argumente für seine Auffassung ins Feld geführt hat, besteht er darauf, dass seine
 +
Annahme als [[Alternativhypothese]] <math>H_{1}</math> formuliert wird.
 +
 +
Grund: Im Falle einer Entscheidung für <math>H_{1}</math> kennt er mit dem [[Signifikanzniveau]] <math>\alpha</math> die [[Wahrscheinlichkeit]] eines [[Fehler 1. Art|Fehlers 1. Art]] <math>P(\mbox{''}H_{1}\mbox{''}|H_{0})</math>.
 +
 +
Es resultiert ein [[rechtsseitiger Test]].
 +
 +
Mit seiner Behauptung ist jedoch keine Größe des Altersunterschiedes verbunden, weshalb der hypothetische Wert <math>\omega_{0}=0</math> gesetzt wird.
 +
 +
Das [[Hypothese]]npaar lautet:
 +
 +
<math>H_{0}:\mu_{1}-\mu_{2}\leq \omega_{0}=0\quad H_{1}:\mu_{1}-\mu_{2}>\omega_{0}=0</math> bzw. äquivalent
 +
 +
<math>H_{0}:\mu_{1}\leq \mu_{2}\quad H_{1}:\mu_{1}>\mu_{2}</math>
 +
 +
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] findet man für <math>P\left(V\leq c\right) = 1 - \alpha = 0,95</math> den [[Kritischer Wert|kritischen Wert]] <math>c = z_{0,95} = 1,645</math>.
 +
 +
Damit ergeben sich die [[Approximation|approximativen]] [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu:
 +
 +
* [[Approximation|approximativer]] [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der]] <math>H_{0}:\;\left\{v|v\leq 1,645\right\}</math>
 +
 +
* [[Approximation|approximativer]] [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der]] <math>H_{0}:\;\left\{v|v>1,645\right\}</math>
 +
 +
Die Personalabteilung zieht die beiden [[Zufallsstichprobe]]n und übermittelt Herrn Schmidt und Herrn Maier folgende Schätzergebnisse:
 +
 +
weibliche Bankangestellte: <math>\overline{x}_{1}=51,71, \quad s_{1}^{2}=385,509</math>
 +
 +
männliche Bankangestellte: <math>\overline{x}_{2}=45,16, \quad s_{2}^{2}=283,985</math>
 +
 +
Unter Berücksichtigung von <math>\omega_{0}=0</math>, errechnen sie daraus den [[Prüfwert]] <math>v = 1,79</math>.
 +
 +
Da <math>v = 1,79</math> in den [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] fällt, wird die [[Nullhypothese]] abgelehnt.
 +
 +
Auf einem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> und basierend auf den beiden [[Zufallsstichprobe]]n mit den [[Stichprobenumfang|Umfängen]] <math>n_{1} = 50</math> und <math>n_{2} = 50</math> konnte [[Statistik|statistisch]] gezeigt
 +
werden, dass eine signifikant positive Differenz <math>\mu_{1} - \mu_{2}</math> zwischen den [[Erwartungswert der Grundgesamtheit|Erwartungswerten der beiden Grundgesamtheiten]] besteht, d.h. das mittlere Alter der weiblichen Bankangestellten ist signifikant größer als das mittlere Alter der männlichen Bankangestellten.
 +
 +
Die [[Wahrscheinlichkeit]] eines Irrtums bei dieser [[Statistischer Test|Test]]entscheidung, d.h. die [[Wahrscheinlichkeit]] eines [[Fehler 1. Art|Fehlers 1. Art]] <math>P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)</math>, entspricht dem [[Signifikanzniveau]] <math>\alpha =0,05</math>.
 +
 +
Im Vergleich zu einem [[zweiseitiger Test|zweiseitigen Test]] besteht der [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] nicht mehr aus zwei Segmenten, sondern liegt insgesamt rechts von <math>E[V] = 0</math>.
 +
 +
Da die Fläche unter der [[Standardnormalverteilung]] über diesem [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]] dem gesamten vorgegebenen [[Signifikanzniveau]] <math>\alpha</math> entspricht, ist der [[Kritischer Wert|kritische Wert]] kleiner im Vergleich zum [[zweiseitiger Test|zweiseitigen Test]].
 +
 +
Damit wird die <math>H_{0}</math> bei dem [[Rechtsseitiger Test|rechtsseitigen Test]] eher abgelehnt als bei einem [[zweiseitiger Test|zweiseitigen Test]] (bei gleichem [[Signifikanzniveau]] <math>\alpha</math> und gleichen [[Stichprobenumfang|Stichprobenumfängen]] <math>n_{1}</math> und <math>n_{2}</math>).
 +
 +
====3. Variante====
 +
 +
Mit seiner Behauptung hat Herr Schmidt neben der Richtung auch die Größe des Altersunterschiedes mit mehr als 5 Jahren fixiert, so dass der
 +
hypothetische Wert <math>\omega_{0}=5</math> gesetzt wird.
 +
 +
Herr Maier willigt ein, dass die Annahme von Herrn Schmidt als [[Alternativhypothese]] <math>H_{1}</math> formuliert wird. Es resultiert ein [[rechtsseitiger Test]].
 +
 +
Das [[Hypothese]]npaar lautet:
 +
 +
<math>H_{0}:\;\mu_{1}-\mu_{2}\leq 5 \quad H_{1}:\mu_{1}-\mu_{2}> 5</math>
 +
 +
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] findet man für <math>P(V \leq c) = 1 - \alpha = 0,95</math> den [[Kritischer Wert|kritischen Wert]] <math>c = z_{0,95} = 1,645</math>.
 +
 +
Damit ergeben sich die [[Approximation|approximativen]] [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu:
 +
 +
* [[Approximation|approximativer]] [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der]] <math>H_{0}:\;\left\{v|v\leq 1,645\right\}</math>
 +
 +
* [[Approximation|approximativer]] [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der]] <math>H_{0}:\;\left\{ v|v>1,645\right\}</math>.
 +
 +
Als Schätzergebnisse aus den beiden [[Zufallsstichprobe]]n habe sich ergeben:
 +
 +
weibliche Bankangestellte: <math>\overline{x}_{1}=52,22, \quad s_{1}^{2}=321,914</math>
 +
 +
männliche Bankangestellte: <math>\overline{x}_{2}=43,13, \quad s_{2}^{2}=306,527</math>
 +
 +
Unter Berücksichtigung von <math>\omega_{0}=5</math> errechnen sie daraus den [[Prüfwert]] <math>v = 1,154</math>.
 +
 +
Da <math>v = 1,154</math> in den [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] fällt, wird die [[Nullhypothese]] nicht abgelehnt.
 +
 +
Basierend auf den beiden [[Zufallsstichprobe]]n mit den [[Stichprobenumfang|Umfängen]] <math>n_{1} = 50</math> und <math>n_{2} = 50</math> konnte [[Statistik|statistisch]] nicht gezeigt werden, dass die Differenz <math>\mu_{1}- \mu_{2}</math> zwischen den [[Erwartungswert der Grundgesamtheit|Erwartungswerten der beiden Grundgesamtheiten]] größer als 5 ist, d.h. dass das Durchschnittsalter der weiblichen Bankangestellten um mehr als 5 Jahre über dem der männlichen Bankangestellten liegt.
 +
 +
Mit dieser [[Statistischer Test|Test]]entscheidung wird jedoch nicht verworfen, dass die weiblichen Bankangestellten im Mittel älter als die männlichen Bankangestellten sind, sondern lediglich dass Herr Schmidt die Größe dieses Unterschiedes offensichtlich zu hoch veranschlagt hat.
 +
 +
Allerdings besteht bei dieser [[Statistischer Test|Test]]entscheidung die Möglichkeit eines [[Fehler 2. Art|Fehlers 2. Art]] <math>(\mbox{''}H_{0}\mbox{''}|H_{1})</math>, wenn in Wirklichkeit die [[Alternativhypothese]] gilt.
 +
 +
Die [[Wahrscheinlichkeit]] dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird.
 +
 +
<!--==Interaktives Beispiel==
 +
 +
In einer Gesamtheit von 3100 Supermarktfilialen gibt es einen Käsestand und einen Fleischstand, die von verschiedenem Personal bedient werden. Es sei:
 +
 +
<math>X_{1} =\;</math> "Wartezeit am Käsestand in Minuten" und
 +
 +
<math>X_{2}=\;</math> "Wartezeit am Fleischstand in Minuten",
 +
 +
wobei unterstellt wird, dass beide Zufallsvariablen einer Normalverteilung mit unbekanntem [[STAT-Glossar#Erwartungswert|Erwartungswert]] <math>\mu_{1}</math> bzw. <math>\mu_{2}</math> und unbekannten Varianzen <math>\sigma_{1}^{2}</math> bzw. <math>\sigma_{2}^{2}</math> folgen. Es wird weiterhin angenommen, dass Varianzhomogenität <math>\sigma_{1}^{2} = \sigma_{2}^{2}</math> in den [[STAT-Glossar#Grundgesamtheit|Grundgesamtheiten]] unterstellt werden kann.
 +
 +
Auf einem [[STAT-Glossar#Signifikanzniveau|Signifikanzniveau]] von <math>\alpha</math> und basierend auf einfachen Zufallsstichproben vom Umfang <math>n_{1}</math> und <math>n_{2}</math> soll getestet werden, ob die mittlere Wartezeit am Käsestand gleich der mittleren Wartezeit am Fleischstand ist, d.h., ob die wahre Differenz <math>\mu_{1}-\mu_{2}</math> der
 +
[[STAT-Glossar#Erwartungswert|Erwartungswerte]] in der [[STAT-Glossar#Grundgesamtheit|Grundgesamtheit]] dem hypothetischen <math>\omega_{0}=0</math> entspricht:
 +
 +
<math>H_{0}:\mu_{1}-\mu_{2}=0\quad H_{1}:\mu_{1}-\mu_{2}\neq 0</math>
 +
 +
Mit diesem Beispiel haben Sie die Möglichkeit, den Test wiederholt durchzuführen, wobei
 +
'''für jede Testdurchführung erneut eine Zufallsstichprobe aus <math>X_1\;</math> und <math>X_2\;</math> gezogen wird'''. Dabei können Sie
 +
 +
* das [[STAT-Glossar#Signifikanzniveau|Signifikanzniveau]] <math>\alpha</math> und die Stichprobenumfänge <math>n_{1}</math> und <math>n_{2}</math> konstant halten;
 +
 +
* das [[STAT-Glossar#Signifikanzniveau|Signifikanzniveau]] <math>\alpha</math> verändern und die Stichprobenumfänge <math>n_{1}</math> und <math>n_{2}</math> konstant halten;
 +
 +
* das [[STAT-Glossar#Signifikanzniveau|Signifikanzniveau]] <math>\alpha</math> konstant halten und die Stichprobenumfänge <math>n_{1}</math> und <math>n_{2}</math> verändern;
 +
 +
* das [[STAT-Glossar#Signifikanzniveau|Signifikanzniveau]] <math>\alpha</math> und die Stichprobenumfänge <math>n_{1}</math> und <math>n_{2}</math> verändern
 +
-->

Version vom 23. Januar 2019, 16:45 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Zweistichproben-t-Test

Der Zweistichproben-t-Test ist ein Test auf Differenz zweier Mittelwerte, wobei die Standardabweichung \sigma als unbekannt vorrausgesetzt wird.

Im Folgenden gelten alle Voraussetzungen wie unter "Test auf Differenz zweier Mittelwerte" diskutiert.

Teststatistik des Zweistichproben-t-Tests

Im Fall eines Zweistichproben-t-Tests werden \sigma_{1} und \sigma_{2} mittels der Schätzfunktionen

S_{1}^{2}=\frac{1}{n_{1}-1}\cdot\;\sum_{i=1}^{n_{1}}\left(X_{1i}-\overline{X}_{1}\right)^{2},\quad S_{2}^{2}=\frac{1}{n_{2}-1}\cdot\;\sum_{i=1}^{n_{2}}\left(X_{2i}-\overline{X}_{2}\right)^{2}

aus den Stichproben geschätzt.

Annahme der Varianzhomogenität

Unter der Annahme der Varianzhomogenität, d.h. beide Grundgesamtheiten haben gleiche Varianz \sigma_{1}^{2}=\sigma_{2}^{2}, ergibt sich eine Schätzung S^{2}\; für die gemeinsame Varianz \sigma^{2} als gewogenes arithmetisches Mittel aus den beiden Stichprobenvarianzen

S^{2}=\frac{\left(n_{1}-1\right)\cdot S_{1}^{2} +\left(n_{2}-1\right)\cdot S_{2}^{2}}{n_{1} + n_{2}-2}

und als Schätzfunktion S_{D}^{2} für \sigma_{D}^{2}

S_{D}^{2}=S^{2}\cdot \left( \cfrac{1}{n_{1}} + \cfrac{1}{n_{2}}\right)=\cfrac{n_{1}+n_{2}}{n_{1}\; n_{2}}\cdot \cfrac{\left( n_{1}-1\right)\cdot S_{1}^{2} +\left(n_{2}-1\right)\cdot  S_{2}^{2}}{n_{1}+n_{2}-2}

Damit resultiert für die Teststatistik V\;:

V=\frac{D-\omega_{0}}{S_{D}}=\cfrac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\omega_{0}}{\sqrt{\cfrac{n_{1}+n_{2}}{n_{1}\;n_{2}}\cdot\cfrac{\left(n_{1}-1\right)\cdot S_{1}^{2}+\left(n_{2}-1\right) \cdot S_{2}^{2}}{n_{1}+n_{2}-2}}}

die unter H_{0} approximativ einer t-Verteilung mit der Anzahl der Freiheitsgrade f = n_{1} + n_{2} - 2 folgt.

Annahme der Varianzheterogenität

Unter der Annahme der Varianzheterogenität, d.h. beide Grundgesamtheiten haben ungleiche Varianzen \sigma_{1}^{2}\neq \sigma_{2}^{2}, kann nur eine Näherungslösung angegeben werden (Test von Welch).

Als Schätzfunktion S_{D}^{2} für \sigma_{D}^{2} ergibt sich:

S_{D}^{2}=\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}

Die Teststatistik lautet dann:

V=\frac{D-\omega_{0}}{S_{D}}=\frac{\left( \overline{X}_{1}-\overline{X}_{2}\right) -\omega_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}

die unter H_{0} approximativ einer t-Verteilung folgt mit der Anzahl der Freiheitsgrade (gerundet zur ganzen Zahl)

f=\frac{\left( \frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}\right)^{2}}{\frac{1}{n_{1}-1}\cdot \left(\frac{S_{1}^{2}}{n_{1}}\right)^{2}+\frac{1}{n_{2}-1}\cdot \left(\frac{S_{2}^{2}}{n_{2}}\right)^{2}}

Entscheidungsbereiche des Zweistichproben-t-Tests

Für das vorgegebene Signifikanzniveau \alpha findet man in beiden Fällen die kritischen Werte aus der Tabelle der Verteilungsfunktion der t-Verteilung.

Für die einzelnen Testvarianten erhält man die nachstehenden Entscheidungsbereiche bei Gültigkeit der Nullhypothese H_{0} und vorgegebenem Signifikanzniveau \alpha

Testvariante Ablehnungsbereich der H_{0} Nichtablehnungsbereich der H_{0}
zweiseitig \left\{v|v<-t_{1-\frac{\alpha}{2};n_{1}+n_{2}-2}\mbox{ oder } v>t_{1-\frac{\alpha}{2};n_{1}+n_{2}-2}\right\} \left\{v|-t_{1-\frac{\alpha}{2};n_{1}+n_{2}-2}\leq v\leq t_{1-\frac{\alpha}{2};n_{1}+n_{2}-2}\right\}
rechtsseitig \left\{ v|v>t_{1-\alpha ;n_{1}+n_{2}-2}\right\} \left\{ v|v\leq t_{1-\alpha ;n_{1}+n_{2}-2}\right\}
linksseitig \left\{v|v<-t_{1-\alpha ;n_{1}+n_{2}-2}\right\} \left\{v|v\geq -t_{1-\alpha ;n_{1}+n_{2}-2}\right\}

Prüfwert des Zweistichproben-t-Tests

Aufgrund der konkreten Zufallsstichproben können die Schätzwerte \overline{x}_{1} und \overline{x}_{2} für die Stichprobenmittelwerte und gegebenenfalls die Schätzwerte s_{1} und s_{2} für die Standardabweichungen berechnet werden.

Einsetzen in die entsprechende Teststatistik führt zu einem Prüfwert v.

Entscheidungssituationen des Zweistichproben-t-Tests

Testentscheidung und Interpretation erfolgen in analoger Weise wie beim Einstichproben-t-Test.

Zusatzinformationen

Approximation durch Zweistichproben-Gauß-Test

Bei genügend großen Stichprobenumfängen (n_{1}>30 und n_{2}>30) ist aufgrund der Wirksamkeit des zentralen Grenzwertsatzes die jeweilige Teststatistik V\; unter H_{0} approximativ N(0; 1)-verteilt.

Es können dann die kritischen Werte aus der Standardnormalverteilung entnommen und näherungsweise die entsprechenden Entscheidungsbereiche des Zweistichproben-Gauß-Tests (\sigma_{1} und \sigma_{2} sind bekannt) verwendet werden.

Beispiele

Hühnereier

Studentin Sabine kauft Eier auf 2 Hühnerfarmen, die sich durch die gehaltene Hühnerrasse unterscheiden. Nach dem Zufallsprinzip wählt sie auf der ersten Farm 10 Eier und auf der zweiten Farm 15 Eier aus.

Zu Hause angekommen, hat sie den Eindruck, dass die Eier der einen Hühnerrasse schwerer sind als die der anderen.

Um ihre Vermutung zu überprüfen, führt sie einen statistischen Test auf dem Signifikanzniveau \alpha = 0,05 durch.

Da die beiden Durchschnittsgewichte gegenüber gestellt werden, handelt es sich um einen Test auf Differenz zweier Mittelwerte \mu_{1}-\mu_{2}.

Da ihre Vermutung einen gerichteten Gewichtsunterschied beinhaltet, ist ein einseitiger Test durchzuführen.

Da Studentin Sabine statistisch "beweisen" will, dass die Eier der Hühnerrasse 1 schwerer sind als die der Hühnerrasse 2, formuliert sie diese Annahme als H_{1}.

Im Fall der Ablehnung der H_{0} ist ihr dann mit dem Signifikanzniveau \alpha die Wahrscheinlichkeit eines Fehlers 1. Art bekannt. Über die Größe des Gewichtsunterschiedes hat Studentin Sabine allerdings keine Vorstellungen, so dass sie den hypothetischen Wert der Differenz der beiden Erwartungswerte \mu_{1}-\mu_{2}=\omega_{0}=0 setzt.

Das Hypothesenpaar lautet somit:

H_{0}:\; \mu_{1}-\mu_{2}\leq 0\quad H_{1}:\;\mu_{1}-\mu_{2}>0

bzw. äquivalent

H_{0}:\;\mu_{1}\leq \mu_{2}\quad H_{1}:\;\mu_{1}>\mu_{2}

Teststatistik und Entscheidungsbereiche

Die Zufallsauswahl wurde von der Studentin eingehalten, allerdings wurde ein Zufallsauswahlmodell ohne Zurücklegen realisiert.

Die Umfänge der beiden Grundgesamtheiten sind jedoch genügend groß, so dass von der Realisierung einfacher Zufallsstichproben ausgegangen werden kann.

Die beiden Zufallsstichproben sind unabhängig voneinander, da die Eier auf zwei verschiedenen Hühnerfarmen mit verschiedenen Hühnerrassen gekauft wurden.

Studentin Sabine geht davon aus, dass die Zufallsvariablen X_{1}:\; "Gewicht der Eier der 1. Hühnerrasse" und X_{2}:\; "Gewicht der Eier der zweiten Hühnerrasse" in den Grundgesamtheiten normalverteilt sind, d.h. X_{1}\sim N\left( \mu_{1};\;\sigma_1\right) und X_{2}\sim N\left( \mu_{2};\;\sigma_{2}\right).

Die Erwartungswerte E\left[ X_{1}\right] =\mu_{1} und E\left[ X_{2}\right] =\mu_{2} sowie die Varianzen Var\left(X_{1}\right) =\sigma_{1}^{2} und Var \left( X_{2}\right) =\sigma_{2}^{2} sind unbekannt.

Desweiteren nimmt sie an, dass mit einer Vergrößerung des mittleren Gewichts der Eier nicht zwangsläufig eine Veränderung der Streuung einhergeht, d.h. sie unterstellt Varianzhomogenität \sigma_{1}^{2}=\sigma_{2}^{2} in den Grundgesamtheiten.

Damit sind die Voraussetzungen für die Anwendung der Teststatistik

V=\cfrac{\left( \overline{X}_{1}-\overline{X}_{2}\right) -\omega_{0}}{\sqrt{\cfrac{n_{1}+n_{2}}{n_{1}\,n_{2}}\;\cfrac{\left( n_{1}-1\right)\cdot S_{1}^{2}+\left( n_{2}-1\right) \cdot S_{2}^{2}}{n_{1}+n_{2}-2}}}

gegeben, wobei n_{1}=10 und n_{2}=15 die Stichprobenumfänge, \overline{X}_{1} und \overline{X}_{2} die beiden Stichprobenmittelwerte und S_{1}^{1} und S_{1}^{2} die Schätzfunktionen für \sigma_{1}^{2} und \sigma_{2}^{2} sind. Weiterhin folgt V\; unter H_{0} einer t-Verteilung mit der Anzahl der Freiheitsgrade f=n_{1}+n_{2}-2=10+15-2=23.

Aus der Tabelle der Verteilungsfunktion der t-Verteilung findet man für P\left(V\leq c\right) =1-\alpha =0,95 und f = 23 den kritischen Wert c=t_{0,95;23}=1,714.

Damit ergeben sich die Entscheidungsbereiche des Tests zu:

Nichtablehnungsbereich der H_{0}:\;\left\{v|v\leq 1,714\right\}

Ablehnungsbereich der H_{0}:\; \left\{ v|v>1,714\right\}.

Prüfwert und Testentscheidung

Studentin Sabine wiegt die Eier und berechnet je Hühnerrasse das arithmetische Mittel und die Varianz des Gewichts.

Es habe sich ergeben:

1. Hühnerrasse: \overline{x}_{1}=65,700 \quad s_{1}^{2}=50,35

2. Hühnerrasse: \overline{x}_{2}=60,433 \quad s_{1}^{2}=42,46

Unter Berücksichtigung von \omega_{0}=0 errechnet sie daraus den Prüfwert v = 1,91.

Da v = 1,91 in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von \alpha=0,05 und basierend auf den beiden Zufallsstichproben mit den Umfängen n_{1}=10 und n_{2}=15 konnte statistisch gezeigt werden, dass eine signifikant positive Differenz \mu_{1}-\mu_{2} zwischen den Erwartungswerten der beiden Grundgesamtheiten besteht, d.h. das mittlere Gewicht der Eier der 1. Hühnerrasse ist signifikant größer als das mittlere Gewicht der Eier der 2. Hühnerrasse.

Die Wahrscheinlichkeit P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right) eines Fehlers 1. Art bei dieser Testentscheidung entspricht dem Signifikanzniveau \alpha =0,05.

Alter

Zwei leitende Mitarbeiter einer großen Bank, Herr Schmidt und Herr Maier, geraten während der Mittagspause in einen Disput über das Alter der Bankangestellten.

  • 1. Variante:
Herr Schmidt behauptet, dass es einen Unterschied im Durchschnittsalter der männlichen und weiblichen Bankangestellten gibt, während Herr Maier die gegenteilige Auffassung vertritt.
  • 2. Variante:
Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt älter sind, Herr Maier widerspricht dem.
  • 3. Variante:
Herr Schmidt behauptet, dass die weiblichen Bankangestellten im Durchschnitt mehr als 5 Jahre älter sind. Herr Maier räumt zwar ein, dass das Durchschnittsalter der männlichen Bankangestellten unter dem der weiblichen Bankangestellten liegen könnte, aber nicht in dieser Größenordnung.

Da sie sich nicht einigen können, beschließen sie, einen statistischen Test auf dem Signifikanzniveau von \alpha = 0,05 durchzuführen, wobei es sich um einen Test auf Differenz zweier Mittelwerte \mu_{1}-\mu_{2} handelt.

Die Zufallsvariable X_{1}\; bezeichne das Alter der weiblichen Bankangestellten und die Zufallsvariable X_{2}\; das Alter der männlichen Bankangestellten. Die Erwartungswerte E[X_{1}]=\mu_{1} und E[X_{2}]=\mu_{2} sowie die Varianzen Var(X_{1}) = \sigma_{1}^{2} und Var(X_{2})=\sigma_{2}^{2} sind unbekannt.

Herr Schmidt und Herr Maier stimmen darin überein, dass nicht von einer Gleichheit der Varianzen in den Grundgesamtheiten ausgegangen werden kann (Annahme der Varianzheterogenität).

Über die Verteilungen der Zufallsvariablen X_{1}\; und X_{2}\; haben sie keine Erkenntnisse vorliegen, so dass sie beide Stichprobenumfänge n_{1} und n_{2} genügend groß wählen, damit der Zentrale Grenzwertsatz wirksam wird.

Da ihnen bekannt ist, dass in der Bank die Gesamtzahl der weiblichen und männlichen Bankangestellten etwa gleich ist, wählen sie auch die Stichprobenumfänge gleich groß, und zwar: n_{1}  = n_{2}  = 50.

Sie bitten die Personalabteilung um Unterstützung bei der Stichprobenziehung. Dort werden aus der Gesamtheit der Personalunterlagen der männlichen bzw. der weiblichen Bankangestellten jeweils 50 zufällig und nach dem Modell mit Zurücklegen (Realisierung einer einfachen Zufallsstichprobe) ausgewählt und das Alter registriert.

Durch die Problemstellung und die Ziehungsmodalitäten ist gewährleistet, dass die beiden Zufallsstichproben unabhängig voneinander sind.

Für jede Stichprobe wird das Durchschnittsalter und die Varianz berechnet. Aufgrund dieser für jede Variante gleichen Voraussetzungen kann auch die gleiche Teststatistik verwendet werden.

Da \sigma_{1} und \sigma_{2} unbekannt sind und Varianzheterogenität unterstellt wird, kommt die Teststatistik

V=\frac{\left(\overline{X}_{1}-\overline{X}_{2}\right)-\omega_{0}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}

zur Anwendung, wobei

\overline{X}_{1}=\frac{1}{n_{1}}\cdot\sum_{i=1}^{n_{1}}\;X_{1i},\quad \overline{X}_{2}=\frac{1}{n_{2}}\cdot\sum_{i=1}^{n_{2}}\;X_{2i}

die beiden Stichprobenmittelwerte sind und \sigma_{1} und \sigma_{2} mittels der Schätzfunktionen

S_{1}^{2}=\frac{1}{n_{1}-1}\cdot \sum_{i=1}^{n_{1}}\left( X_{1i}-\overline{X}_{1}\right)^{2},\quad S_{2}^{2}=\frac{1}{n_{2}-1}\cdot\sum_{i=1}^{n_{2}}\left(X_{2i}-\overline{X}_{2}\right)^{2}

aus den Zufallsstichproben geschätzt werden.

Da für beide Stichprobenumfänge n_{1}>30 und n_{2}>30 gilt, ist aufgrund der Wirksamkeit des Zentralen Grenzwertsatzes die Teststatistik V\; unter H_{0} approximativ N(0; 1)-verteilt (Approximation durch Zweistichproben-Gauß-Test - siehe oben).

1. Variante

Da Herr Schmidt mit seiner Behauptung eines Unterschiedes im Durchschnittsalter sehr allgemein in dem Sinne geblieben ist, dass er weder eine Richtung noch eine Größe des Altersunterschiedes angegeben hat, wird ein zweiseitiger Test mit dem hypothetischen Wert \omega_{0}=0 durchgeführt:

H_{0}:\;\mu_{1}-\mu_{2}=\omega_{0}=0\quad H_{1}:\mu_{1}-\mu_{2}\neq \omega_{0}=0

Eine äquivalente Hypothesenformulierung ist:

H_{0}:\mu_{1}=\mu_{2}\quad H_{1}:\mu_{1}\neq \mu _{2}

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für P\left(V\geq c_{o}\right)=1-\frac{\alpha}{2}=0,975 den oberen kritischen Wert c_{o}=z_{1-\frac{\alpha}{2}}=z_{0,975}=1,96.

Wegen der Symmetrie der Normalverteilung gilt c_{u}=-z_{1-\frac{\alpha}{2}}=-z_{0,975}=-1,96 und P\left( V\leq c_{u}\right)=\frac{\alpha}{2}=0,025.

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

Die Personalabteilung teilt den beiden leitenden Mitarbeitern folgende Schätzergebnisse aus den konkreten Zufallsstichproben mit:

weibliche Bankangestellte: \overline{x}_{1}=47,71, \quad s_{1}^{2}=260,875

männliche Bankangestellte: \overline{x}_{2}=41,80, \quad s_{2}^{2}=237,681

Unter Berücksichtigung von \omega_{0}=0 errechnen sie daraus den Prüfwert v = 1,87.

Da v = 1,87 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf den beiden Zufallsstichproben mit den Umfängen n_{1} = 50 und n_{2} = 50 konnte statistisch nicht gezeigt werden, dass eine signifikante Differenz zwischen den Erwartungswerten \mu_{1} und \mu_{2} der beiden Grundgesamtheiten, d.h. im mittleren Alter der männlichen und weiblichen Bankangestellten besteht.

Allerdings besteht bei dieser Testentscheidung die Möglichkeit eines Fehlers 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}), wenn in Wirklichkeit die Alternativhypothese gilt.

Die Wahrscheinlichkeit dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird, d.h. die Bereichsalternative in eine Punktalternative umgewandelt wird

2. Variante

Da Herr Schmidt im Verlauf des Disputs starke sachliche Argumente für seine Auffassung ins Feld geführt hat, besteht er darauf, dass seine Annahme als Alternativhypothese H_{1} formuliert wird.

Grund: Im Falle einer Entscheidung für H_{1} kennt er mit dem Signifikanzniveau \alpha die Wahrscheinlichkeit eines Fehlers 1. Art P(\mbox{''}H_{1}\mbox{''}|H_{0}).

Es resultiert ein rechtsseitiger Test.

Mit seiner Behauptung ist jedoch keine Größe des Altersunterschiedes verbunden, weshalb der hypothetische Wert \omega_{0}=0 gesetzt wird.

Das Hypothesenpaar lautet:

H_{0}:\mu_{1}-\mu_{2}\leq \omega_{0}=0\quad H_{1}:\mu_{1}-\mu_{2}>\omega_{0}=0 bzw. äquivalent

H_{0}:\mu_{1}\leq \mu_{2}\quad H_{1}:\mu_{1}>\mu_{2}

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für P\left(V\leq c\right) = 1 - \alpha = 0,95 den kritischen Wert c = z_{0,95} = 1,645.

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

Die Personalabteilung zieht die beiden Zufallsstichproben und übermittelt Herrn Schmidt und Herrn Maier folgende Schätzergebnisse:

weibliche Bankangestellte: \overline{x}_{1}=51,71, \quad s_{1}^{2}=385,509

männliche Bankangestellte: \overline{x}_{2}=45,16, \quad s_{2}^{2}=283,985

Unter Berücksichtigung von \omega_{0}=0, errechnen sie daraus den Prüfwert v = 1,79.

Da v = 1,79 in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von \alpha = 0,05 und basierend auf den beiden Zufallsstichproben mit den Umfängen n_{1} = 50 und n_{2} = 50 konnte statistisch gezeigt werden, dass eine signifikant positive Differenz \mu_{1} - \mu_{2} zwischen den Erwartungswerten der beiden Grundgesamtheiten besteht, d.h. das mittlere Alter der weiblichen Bankangestellten ist signifikant größer als das mittlere Alter der männlichen Bankangestellten.

Die Wahrscheinlichkeit eines Irrtums bei dieser Testentscheidung, d.h. die Wahrscheinlichkeit eines Fehlers 1. Art P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right), entspricht dem Signifikanzniveau \alpha =0,05.

Im Vergleich zu einem zweiseitigen Test besteht der Ablehnungsbereich der H_{0} nicht mehr aus zwei Segmenten, sondern liegt insgesamt rechts von E[V] = 0.

Da die Fläche unter der Standardnormalverteilung über diesem Ablehnungsbereich der H_{0} dem gesamten vorgegebenen Signifikanzniveau \alpha entspricht, ist der kritische Wert kleiner im Vergleich zum zweiseitigen Test.

Damit wird die H_{0} bei dem rechtsseitigen Test eher abgelehnt als bei einem zweiseitigen Test (bei gleichem Signifikanzniveau \alpha und gleichen Stichprobenumfängen n_{1} und n_{2}).

3. Variante

Mit seiner Behauptung hat Herr Schmidt neben der Richtung auch die Größe des Altersunterschiedes mit mehr als 5 Jahren fixiert, so dass der hypothetische Wert \omega_{0}=5 gesetzt wird.

Herr Maier willigt ein, dass die Annahme von Herrn Schmidt als Alternativhypothese H_{1} formuliert wird. Es resultiert ein rechtsseitiger Test.

Das Hypothesenpaar lautet:

H_{0}:\;\mu_{1}-\mu_{2}\leq 5 \quad H_{1}:\mu_{1}-\mu_{2}> 5

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für P(V \leq c) = 1 - \alpha = 0,95 den kritischen Wert c = z_{0,95} = 1,645.

Damit ergeben sich die approximativen Entscheidungsbereiche des Tests zu:

Als Schätzergebnisse aus den beiden Zufallsstichproben habe sich ergeben:

weibliche Bankangestellte: \overline{x}_{1}=52,22, \quad s_{1}^{2}=321,914

männliche Bankangestellte: \overline{x}_{2}=43,13, \quad s_{2}^{2}=306,527

Unter Berücksichtigung von \omega_{0}=5 errechnen sie daraus den Prüfwert v = 1,154.

Da v = 1,154 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf den beiden Zufallsstichproben mit den Umfängen n_{1} = 50 und n_{2} = 50 konnte statistisch nicht gezeigt werden, dass die Differenz \mu_{1}- \mu_{2} zwischen den Erwartungswerten der beiden Grundgesamtheiten größer als 5 ist, d.h. dass das Durchschnittsalter der weiblichen Bankangestellten um mehr als 5 Jahre über dem der männlichen Bankangestellten liegt.

Mit dieser Testentscheidung wird jedoch nicht verworfen, dass die weiblichen Bankangestellten im Mittel älter als die männlichen Bankangestellten sind, sondern lediglich dass Herr Schmidt die Größe dieses Unterschiedes offensichtlich zu hoch veranschlagt hat.

Allerdings besteht bei dieser Testentscheidung die Möglichkeit eines Fehlers 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}), wenn in Wirklichkeit die Alternativhypothese gilt.

Die Wahrscheinlichkeit dieses Fehlers kann jedoch nur bestimmt werden, wenn ein konkreter Alternativwert festgelegt wird.