Einstichproben-t-Test

Der Einstichproben-t-Test ist ein Test auf Mittelwert, wobei die Standardabweichung $\sigma$ des Stichprobenmittelwertes ${\bar {X}}$ als unbekannt vorrausgesetzt wird.

Im Folgenden gelten alle Voraussetzungen wie unter "Test auf Mittelwert" diskutiert.

Teststatistik des Einstichproben-t-Tests

In der standardisierten Zufallsvariablen

$V={\frac {{\bar {X}}-\mu _{0}}{\sigma }}\cdot {\sqrt {n}}$

ist nunmehr $\sigma$ unbekannt und muss durch eine Schätzung aus der Stichprobe ersetzt werden.

Eine erwartungstreue Schätzfunktion für die Varianz $\sigma ^{2}$ der Grundgesamtheit ist

$S^{2}={\frac {\sum _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}}{n-1}}$

Als Teststatistik wird somit

$V={\frac {{\bar {X}}-\mu _{0}}{S}}\cdot {\sqrt {n}}$

verwendet.

Bei Gültigkeit der Nullhypothese $H_{0}$ ist $V\;$ (zumindest approximativ) t-verteilt mit $f=n-1$ Freiheitsgraden (vgl. dazu den Abschnitt "Verteilung des Stichprobenmittelwertes").

Für das vorgegebene Signifikanzniveau $\alpha$ und die Anzahl der Freiheitsgrade $f=n-1$ können die kritischen Werte aus der Tabelle der t-Verteilung entnommen werden.

Entscheidungsbereiche des Einstichproben-t-Tests

Für die einzelnen Testmöglichkeiten erhält man die nachstehenden Entscheidungsbereiche bei Gültigkeit der Nullhypothese $H_{0}$

Zweiseitiger Test

Ablehnungsbereich der $H_{0}$ :

$\left\{v|v<-t_{1-{\frac {\alpha }{2}};n-1}{\mbox{ oder }}v>t_{1-{\frac {\alpha }{2}};n-1}\right\}$

Nichtablehnungsbereich der $H_{0}$ :

$\left\{v|-t_{1-{\frac {\alpha }{2}};n-1}\leq v\leq t_{1-{\frac {\alpha }{2}};n-1}\right\}$

Rechtsseitiger Test

Ablehnungsbereich der $H_{0}$ :

$\left\{v|v>t_{1-\alpha ;n-1}\right\}$

Nichtablehnungsbereich der $H_{0}$ :

$\left\{v|v\leq t_{1-\alpha ;n-1}\right\}$

Linksseitiger Test

Ablehnungsbereich der $H_{0}$ :

$\left\{v|v<-t_{1-\alpha ;n-1}\right\}$

Nichtablehnungsbereich der $H_{0}$ :

$\left\{v|v\geq -t_{1-\alpha ;n-1}\right\}$

Prüfwert des Einstichproben-t-Tests

Wenn die Zufallsstichprobe vom Umfang $n$ gezogen wurde, liegen die konkreten Stichprobenwerte $x_{1},\ldots ,x_{n}$ vor und der Schätzwert ${\bar {x}}$ für den Stichprobenmittelwert und der Schätzwert $s$ für die Standardabweichung können berechnet werden:

${\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}\;x_{i}$

$s={\sqrt {\frac {\sum _{i=1}^{n}\left(x_{i}-{\bar {x}}\right)^{2}}{n-1}}}$

Einsetzen in die Teststatistik führt zu einem Prüfwert:

$v={\frac {{\bar {x}}-\mu _{0}}{s}}\cdot {\sqrt {n}}$

Entscheidungssituationen des Einstichproben-t-Tests

Wenn $v$ in den Ablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese auf dem Signifikanzniveau $\alpha$ und basierend auf der Zufallsstichprobe vom Umfang $n$ abgelehnt $({\mbox{''}}H_{1}{\mbox{''}})$ :

Es konnte statistisch gezeigt werden, dass der wahre Erwartungswert

E[X]=\mu

in der Grundgesamtheit nicht gleich dem hypothetischen Wert

\mu _{0}

ist.

Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art

({\mbox{''}}H_{1}{\mbox{''}}|H_{0})

zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.

Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau

\alpha

.

Wenn $v$ in den Nichtablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese basierend auf der Zufallsstichprobe vom Umfang $n$ nicht abgelehnt $({\mbox{''}}H_{0}{\mbox{''}})$ .

Das Stichprobenergebnis gibt keine Veranlassung,

H_{0}

zu verwerfen:

Es konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert

E[X]=\mu

in der Grundgesamtheit vom hypothetischen Wert

\mu _{0}

abweicht.

Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 2. Art

({\mbox{''}}H_{0}{\mbox{''}}|H_{1})

zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Die Wahrscheinlichkeit für einen Fehler 2. Art ist im Allgemeinen nicht bekannt und kann nur für konkrete Alternativwerte

\mu _{1}

berechnet werden.

Zusatzinformationen

Approximation durch Gauß-Test

Bei genügend großem Stichprobenumfang $n\;(n\geq 30)$ ist aufgrund der Wirksamkeit des Zentralen Grenzwertsatzes die Teststatistik $V\;$ unter $H_{0}$ approximativ $N(0;1)$ - verteilt.

Es können dann näherungsweise die kritischen Werte aus der $N(0;1)$ entnommen und die entsprechenden Entscheidungsbereiche des Gauß-Tests ( $\sigma$ ist bekannt) verwendet werden.

Beispiele

Autoreifen

Mit diesem Beispiel wird demonstriert, wie die verfügbaren Informationen über die Grundgesamtheit die Wahl der Teststatistik, der Entscheidungsbereiche und möglicherweise, je nach konkretem Stichprobenergebnis, die Entscheidungssituationen beeinflussen.

Ein Unternehmen stellt Autoreifen her. Zur Erhöhung der Lebensdauer eines bestimmten Typs von Autoreifen wurden Materialänderungen vorgenommen.

Die Konkurrenz behauptet nun, dass durch die Materialänderung keine Erhöhung gegenüber der ursprünglichen mittleren Lebensdauer dieses Reifentyps von 38000 km erreicht wurde.

Die Zufallsvariable $X\;$ in der Grundgesamtheit ist die Lebensdauer des betrachteten Reifentyps mit dem hypothetischen Wert über den Erwartungswert $E[X]=\mu _{0}=38000{\mbox{ km}}$ .

Der Unternehmer behauptet, dass die mittlere Lebensdauer nach der Materialänderung größer ist: $\mu >\mu _{0}$ .

Diese Behauptung will er statistisch untermauern, wobei er das Risiko einer Fehlentscheidung möglichst klein halten will, um der Konkurrenz keine weiteren Argumente zu liefern.

Da nur Abweichungen von $\mu _{0}$ nach einer Seite von Bedeutung sind, wird ein einseitiger Test durchgeführt.

Die Behauptung des Unternehmers wird als Alternativhypothese formuliert, womit ein rechtsseitiger Test resultiert:

$H_{0}:\;\mu \leq \mu _{0}\quad {\mbox{(= 38000 km)}}$

$H_{1}:\;\mu >\mu _{0}\quad {\mbox{(= 38000 km)}}$

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Intention des Unternehmers eingehalten wird. Der bei der Ablehnung der $H_{0}$ mögliche Fehler 1. Art hat folgenden Inhalt:

${\mbox{''}}H_{1}{\mbox{''}}|H_{0}:$ Die "Lebensdauer hat sich durch die Materialänderung erhöht" | In Wirklichkeit hat sich die Lebensdauer nicht erhöht.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des dann möglichen Fehlers 2. Art:

$P({\mbox{''}}H_{0}{\mbox{''}}|H_{1}):$ "Die Lebensdauer hat sich nicht erhöht" | In Wirklichkeit hat sich die Lebensdauer durch die Materialänderung erhöht.

Der Fehler 1. Art ist für den Unternehmer der schwerwiegendere Fehler, denn die dauerhafte Verwendung des veränderten Reifens würde bald zeigen, dass die Lebensdauer durch die Materialänderung tatsächlich nicht größer wurde, was dem Ansehen des Reifenherstellers bei seinen Kunden erheblichen Schaden zufügen würde.

Die Wahrscheinlichkeit eines Fehlers 1. Art $P({\mbox{''}}H_{1}{\mbox{''}}|H_{0})$ ist das Signifikanzniveau $\alpha$ , mit dessen Vorgabe das Risiko eines derartigen Fehlers gering gehalten werden kann.

Damit wird die Zielstellung des Unternehmers bei der Durchführung des Tests eingehalten.

Die Wahrscheinlichkeit eines Fehlers 2. Art $P({\mbox{''}}H_{0}{\mbox{''}}|H_{1})=\beta$ ist unbekannt, da der wahre Erwartungswert $\mu$ unter der Alternativhypothese nicht bekannt ist.

Diese Wahrscheinlichkeit eines Fehlers 2. Art, d.h. das Risiko, die tatsächlich eingetretene Erhöhung der Lebensdauer nicht nachzuweisen, kann sehr groß sein.

Das muss der Unternehmer jedoch in Kauf nehmen, da er andere Prioritäten für die Überprüfung gesetzt hatte. In diesem Falle müsste er weitere technische Überprüfungen folgen lassen.

Einstichproben-t-Test

Bei gleichem Signifikanzniveau $\alpha =0,05$ und Stichprobenumfang $n=10$ wird weiterhin von einer Normalverteilung der Lebensdauer nach der Materialänderung ausgegangen.

Die Standardabweichung kann sich aber verändert haben, so dass sie nunmehr unbekannt ist.

Als Teststatistik ist jetzt

$V={\frac {{\overline {X}}-\mu _{0}}{S}}\cdot {\sqrt {n}}$

zu verwenden, die bei Gültigkeit der Nullhypothese $H_{0}$ einer t-Verteilung mit $f=n-1=9$ Freiheitsgraden folgt.

Aus der Tabelle der Verteilungsfunktion der t-Verteilung findet man für $P(V\leq c)=1-\alpha =0,95$ und $f=9$ den kritischen Wert $c=t_{0,95;9}=1,833$ .

Damit ergeben sich die Entscheidungsbereiche des Tests zu

Nichtablehnungsbereich der $H_{0}:$ $\{t|t\leq 1,833\}$

Ablehnungsbereich der $H_{0}:$ $\left\{t|t>1,833\right\}$

Neben dem Stichprobenmittelwert ${\bar {x}}$ muss auch die Standardabweichung $s$ aus der Stichprobe geschätzt werden. Es habe sich ergeben: ${\bar {x}}=38900{\mbox{ km}}$ und $s=1390{\mbox{ km}}$ .

Als Prüfwert erhält man:

$v={\frac {38900-38000}{1390}}\cdot {\sqrt {10}}=2,047$

Da $v=2,047$ in den Ablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von $\alpha =0,05$ und basierend auf einer einfachen Zufallsstichprobe vom Umfang $n=10$ konnte statistisch gezeigt werden, dass der wahre Erwartungswert $E[X]=\mu$ der Lebensdauer des Reifentyps nach der Materialänderung größer als der hypothetische Wert $\mu _{0}=38000{\mbox{ km}}$ ist.

Auch bei dieser Testentscheidung besteht natürlich die Möglichkeit, einen Fehler 1. Art zu begehen, falls in Wirklichkeit die Nullhypothese $H_{0}$ richtig ist.

Die Wahrscheinlichkeit $P({\mbox{''}}H_{1}{\mbox{''}}|H_{0})$ wurde jedoch mit dem Signifikanzniveau $\alpha =0,05$ klein gehalten.

Wenn in Wirklichkeit die Alternativhypothese $H_{1}$ richtig ist, wurde im Ergebnis des Tests eine richtige Entscheidung getroffen $({\mbox{''}}H_{1}{\mbox{''}}|H_{1})$ .

Die Wahrscheinlichkeit $P(''H_{1}''|H_{1})=1-\beta$ kann nur bestimmt werden, wenn ein konkreter Alternativwert $\mu$ angegeben werden kann und gleichzeitig unterstellt wird, dass die Punktschätzung $s=1390{\mbox{ km}}$ die wahre Standardabweichung in der Grundgesamtheit ist.

Approximation durch Gauß-Test

Nunmehr wird auch die Annahme der Normalverteilung für die Lebensdauer fallengelassen, womit diese Variante die praktisch relevanteste ist.

Um einen Test auf $\mu$ durchführen zu können, muss der Stichprobenumfang $n>30$ gewählt werden, damit der Zentrale Grenzwertsatz zur Anwendung kommen kann.

Der Unternehmer entscheidet sich für $n=35$ .

Eine Lebensdauerprüfung der Reifen diesen Umfangs ist natürlich mit wesentlich höheren Kosten verbunden, die er jedoch als "Tribut" für die fehlenden Informationen über die Grundgesamtheit zahlen muss, wenn er den Test überhaupt durchführen will.

Als Signifikanzniveau wählt er $\alpha =0,025$ .

Als Teststatistik ist

$V={\frac {{\overline {X}}-\mu _{0}}{S}}\cdot {\sqrt {n}}$

zu verwenden, die (wegen $n>30$ und der Wirksamkeit des Zentralen Grenzwertsatzes) unter $H_{0}$ approximativ $N(0;1)$ -verteilt ist.

Für $P(V\leq c)=1-\alpha =0,975$ findet man den kritischen Wert $c=z_{0,975}=1,96$ .

Damit ergeben sich die approximativen Entscheidungsbereiche:

Nichtablehnungsbereich der $H_{0}:\left\{t|t\leq 1,96\right\}$

Ablehnungsbereich der $H_{0}:\left\{t|t>1,96\right\}$ .

Neben dem Stichprobenmittelwert ${\bar {x}}$ muss auch bei dieser Variante die Standardabweichung $s$ aus der Stichprobe geschätzt werden. Es habe sich ergeben: ${\bar {x}}=38500{\mbox{ km}}$ und $s=1400{\mbox{ km}}$ .

Als Prüfwert erhält man:

$v={\frac {38500-38000}{1400}}\cdot {\sqrt {35}}=2,11$

Da $v=2,11$ in den Ablehnungsbereich der $H_{0}$ fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von $\alpha =0,025$ und basierend auf einer einfachen Zufallsstichprobe vom Umfang $n=35$ konnte statistisch gezeigt werden, dass der wahre Erwartungswert $E(X)=\mu$ der Lebensdauer des Reifentyps nach der Materialänderung größer als der hypothetische Wert $\mu _{0}=38000{\mbox{ km}}$ ist.

Falls in Wirklichkeit die Nullhypothese $H_{0}$ richtig ist, begeht man mit ihrer Ablehnung einen Fehler 1. Art, dessen Wahrscheinlichkeit $P({\mbox{''}}H_{1}{\mbox{''}}|H_{0})$ mit dem Signifikanzniveau $\alpha =0,025$ klein gehalten wurde.

Wenn in Wirklichkeit die Alternativhypothese richtig ist, wurde im Ergebnis des Tests eine richtige Entscheidung getroffen $({\mbox{''}}H_{1}{\mbox{''}}|H_{1})$ .

Die Wahrscheinlichkeit $P({\mbox{''}}H_{1}{\mbox{''}}|H_{1})=1-\beta$ kann nur bestimmt werden, wenn ein konkreter Alternativwert $\mu$ angegeben werden kann und gleichzeitig unterstellt wird, dass die Punktschätzung $s=1400{\mbox{ km}}$ die wahre Standardabweichung in der Grundgesamtheit ist.

Einstichproben-t-Test

Aus MM*Stat

Inhaltsverzeichnis

Grundbegriffe