Einstichproben-t-Test: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Testtheorie}} ==Grundbegriffe== ===Einstichproben-t-Test=== Der ''Einstichproben-t-Test'' ist ein Test auf Mittelwert, wobei die Standardabweichung…“)
 
({{Vorlage:Überschrift_2}})
Zeile 97: Zeile 97:
 
: Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] ist im Allgemeinen nicht bekannt und kann nur für konkrete Alternativwerte <math>\mu_{1}</math> berechnet werden.
 
: Die [[Wahrscheinlichkeit]] für einen [[Fehler 2. Art]] ist im Allgemeinen nicht bekannt und kann nur für konkrete Alternativwerte <math>\mu_{1}</math> berechnet werden.
  
=={{Vorlage:Überschrift_2}}==
+
==Zusatzinformationen==
  
 
===Approximation durch Gauß-Test===
 
===Approximation durch Gauß-Test===

Version vom 12. Februar 2018, 11:22 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Einstichproben-t-Test

Der Einstichproben-t-Test ist ein Test auf Mittelwert, wobei die Standardabweichung \sigma des Stichprobenmittelwertes \bar{X} als unbekannt vorrausgesetzt wird.

Im Folgenden gelten alle Voraussetzungen wie unter "Test auf Mittelwert" diskutiert.

Teststatistik des Einstichproben-t-Tests

In der standardisierten Zufallsvariablen

V=\frac{\bar{X}-\mu _{0}}{\sigma }\cdot\sqrt{n}

ist nunmehr \sigma unbekannt und muss durch eine Schätzung aus der Stichprobe ersetzt werden.

Eine erwartungstreue Schätzfunktion für die Varianz \sigma^{2} der Grundgesamtheit ist

S^{2} =\frac{\sum_{i=1}^{n}\left( X_{i}-\bar{X}\right)^{2}}{n-1}

Als Teststatistik wird somit

V=\frac{\bar{X}-\mu_{0}}{S}\cdot \sqrt{n}

verwendet.

Bei Gültigkeit der Nullhypothese H_{0} ist V\; (zumindest approximativ) t-verteilt mit f=n-1 Freiheitsgraden (vgl. dazu den Abschnitt "Verteilung des Stichprobenmittelwertes").

Für das vorgegebene Signifikanzniveau \alpha und die Anzahl der Freiheitsgrade f = n - 1 können die kritischen Werte aus der Tabelle der t-Verteilung entnommen werden.

Entscheidungsbereiche des Einstichproben-t-Tests

Für die einzelnen Testmöglichkeiten erhält man die nachstehenden Entscheidungsbereiche bei Gültigkeit der Nullhypothese H_{0}

Zweiseitiger Test

Ablehnungsbereich der H_{0}:

\left\{v|v<-t_{1-\frac{\alpha}{2};n-1}\mbox{ oder }v>t_{1-\frac{\alpha}{2};n-1}\right\}

Nichtablehnungsbereich der H_{0}:

\left\{ v|-t_{1-\frac{\alpha}{2};n-1}\leq v\leq t_{1-\frac{\alpha}{2};n-1}\right\}

Rechtsseitiger Test

Ablehnungsbereich der H_{0}:

\left\{v|v>t_{1-\alpha ;n-1}\right\}

Nichtablehnungsbereich der H_{0}:

\left\{v|v\leq t_{1-\alpha ;n-1}\right\}

Linksseitiger Test

Ablehnungsbereich der H_{0}:

\left\{v|v<-t_{1-\alpha ;n-1}\right\}

Nichtablehnungsbereich der H_{0}:

\left\{v|v\geq -t_{1-\alpha ;n-1}\right\}

Prüfwert des Einstichproben-t-Tests

Wenn die Zufallsstichprobe vom Umfang n gezogen wurde, liegen die konkreten Stichprobenwerte x_{1},\ldots ,x_{n} vor und der Schätzwert \bar{x} für den Stichprobenmittelwert und der Schätzwert s für die Standardabweichung können berechnet werden:

\bar{x}=\frac{1}{n}\sum_{i=1}^{n}\; x_{i}

s =\sqrt{\frac{\sum_{i=1}^{n}\left( x_{i}-\bar{x}\right)^{2}}{n-1}}

Einsetzen in die Teststatistik führt zu einem Prüfwert:

v=\frac{\bar{x}-\mu _{0}}{s}\cdot\sqrt{n}

Entscheidungssituationen des Einstichproben-t-Tests

Es konnte statistisch gezeigt werden, dass der wahre Erwartungswert E[X] = \mu in der Grundgesamtheit nicht gleich dem hypothetischen Wert \mu _{0} ist.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art (\mbox{''}H_{1}\mbox{''}|H_{0}) zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau \alpha.
Das Stichprobenergebnis gibt keine Veranlassung, H_{0} zu verwerfen:
Es konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert E[X] = \mu in der Grundgesamtheit vom hypothetischen Wert \mu_{0} abweicht.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}) zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist im Allgemeinen nicht bekannt und kann nur für konkrete Alternativwerte \mu_{1} berechnet werden.

Zusatzinformationen

Approximation durch Gauß-Test

Bei genügend großem Stichprobenumfang n\; (n \geq 30) ist aufgrund der Wirksamkeit des Zentralen Grenzwertsatzes die Teststatistik V\; unter H_{0} approximativ N(0; 1) - verteilt.

Es können dann näherungsweise die kritischen Werte aus der N(0; 1) entnommen und die entsprechenden Entscheidungsbereiche des Gauß-Tests (\sigma ist bekannt) verwendet werden.

Beispiele

Autoreifen

Mit diesem Beispiel wird demonstriert, wie die verfügbaren Informationen über die Grundgesamtheit die Wahl der Teststatistik, der Entscheidungsbereiche und möglicherweise, je nach konkretem Stichprobenergebnis, die Entscheidungssituationen beeinflussen.

Ein Unternehmen stellt Autoreifen her. Zur Erhöhung der Lebensdauer eines bestimmten Typs von Autoreifen wurden Materialänderungen vorgenommen.

Die Konkurrenz behauptet nun, dass durch die Materialänderung keine Erhöhung gegenüber der ursprünglichen mittleren Lebensdauer dieses Reifentyps von 38000 km erreicht wurde.

Die Zufallsvariable X\; in der Grundgesamtheit ist die Lebensdauer des betrachteten Reifentyps mit dem hypothetischen Wert über den Erwartungswert E[X] = \mu_{0} = 38000 \mbox{ km} .

Der Unternehmer behauptet, dass die mittlere Lebensdauer nach der Materialänderung größer ist: \mu > \mu_{0}.

Diese Behauptung will er statistisch untermauern, wobei er das Risiko einer Fehlentscheidung möglichst klein halten will, um der Konkurrenz keine weiteren Argumente zu liefern.

Da nur Abweichungen von \mu_{0} nach einer Seite von Bedeutung sind, wird ein einseitiger Test durchgeführt.

Die Behauptung des Unternehmers wird als Alternativhypothese formuliert, womit ein rechtsseitiger Test resultiert:

H_{0}:\;\mu \leq \mu_{0}\quad \mbox{(= 38000 km)}

H_{1}:\;\mu >\mu_{0}\quad \mbox{(= 38000 km)}

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Intention des Unternehmers eingehalten wird. Der bei der Ablehnung der H_{0} mögliche Fehler 1. Art hat folgenden Inhalt:

\mbox{''}H_{1}\mbox{''}|H_{0}: Die "Lebensdauer hat sich durch die Materialänderung erhöht" | In Wirklichkeit hat sich die Lebensdauer nicht erhöht.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des dann möglichen Fehlers 2. Art:

P(\mbox{''}H_{0}\mbox{''}|H_{1}): "Die Lebensdauer hat sich nicht erhöht" | In Wirklichkeit hat sich die Lebensdauer durch die Materialänderung erhöht.

Der Fehler 1. Art ist für den Unternehmer der schwerwiegendere Fehler, denn die dauerhafte Verwendung des veränderten Reifens würde bald zeigen, dass die Lebensdauer durch die Materialänderung tatsächlich nicht größer wurde, was dem Ansehen des Reifenherstellers bei seinen Kunden erheblichen Schaden zufügen würde.

Die Wahrscheinlichkeit eines Fehlers 1. Art P(\mbox{''}H_{1}\mbox{''}|H_{0}) ist das Signifikanzniveau \alpha, mit dessen Vorgabe das Risiko eines derartigen Fehlers gering gehalten werden kann.

Damit wird die Zielstellung des Unternehmers bei der Durchführung des Tests eingehalten.

Die Wahrscheinlichkeit eines Fehlers 2. Art P(\mbox{''}H_{0}\mbox{''}|H_{1})=\beta ist unbekannt, da der wahre Erwartungswert \mu unter der Alternativhypothese nicht bekannt ist.

Diese Wahrscheinlichkeit eines Fehlers 2. Art, d.h. das Risiko, die tatsächlich eingetretene Erhöhung der Lebensdauer nicht nachzuweisen, kann sehr groß sein.

Das muss der Unternehmer jedoch in Kauf nehmen, da er andere Prioritäten für die Überprüfung gesetzt hatte. In diesem Falle müsste er weitere technische Überprüfungen folgen lassen.

Einstichproben-t-Test

Bei gleichem Signifikanzniveau \alpha = 0,05 und Stichprobenumfang n = 10 wird weiterhin von einer Normalverteilung der Lebensdauer nach der Materialänderung ausgegangen.

Die Standardabweichung kann sich aber verändert haben, so dass sie nunmehr unbekannt ist.

Als Teststatistik ist jetzt

V=\frac{\overline{X}-\mu_{0}}{S}\cdot\sqrt{n}

zu verwenden, die bei Gültigkeit der Nullhypothese H_{0} einer t-Verteilung mit f = n - 1 = 9 Freiheitsgraden folgt.

Aus der Tabelle der Verteilungsfunktion der t-Verteilung findet man für P(V \leq c)=1-\alpha = 0,95 und f = 9 den kritischen Wert c=t_{0,95; 9} = 1,833.

Damit ergeben sich die Entscheidungsbereiche des Tests zu

Neben dem Stichprobenmittelwert \bar{x} muss auch die Standardabweichung s aus der Stichprobe geschätzt werden. Es habe sich ergeben: \bar{x} = 38900 \mbox{ km} und s = 1390 \mbox{ km}.

Als Prüfwert erhält man:

v=\frac{38900-38000}{1390}\cdot\sqrt{10}=2,047

Da v = 2,047 in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von \alpha = 0,05 und basierend auf einer einfachen Zufallsstichprobe vom Umfang n = 10 konnte statistisch gezeigt werden, dass der wahre Erwartungswert E[X] = \mu der Lebensdauer des Reifentyps nach der Materialänderung größer als der hypothetische Wert \mu_{0}= 38000 \mbox{ km} ist.

Auch bei dieser Testentscheidung besteht natürlich die Möglichkeit, einen Fehler 1. Art zu begehen, falls in Wirklichkeit die Nullhypothese H_{0} richtig ist.

Die Wahrscheinlichkeit P(\mbox{''}H_{1}\mbox{''}|H_{0}) wurde jedoch mit dem Signifikanzniveau \alpha = 0,05 klein gehalten.

Wenn in Wirklichkeit die Alternativhypothese H_{1} richtig ist, wurde im Ergebnis des Tests eine richtige Entscheidung getroffen (\mbox{''}H_{1}\mbox{''}|H_{1}).

Die Wahrscheinlichkeit P(''H_{1}''|H_{1})=1-\beta kann nur bestimmt werden, wenn ein konkreter Alternativwert \mu angegeben werden kann und gleichzeitig unterstellt wird, dass die Punktschätzung s = 1390 \mbox{ km} die wahre Standardabweichung in der Grundgesamtheit ist.

Approximation durch Gauß-Test

Nunmehr wird auch die Annahme der Normalverteilung für die Lebensdauer fallengelassen, womit diese Variante die praktisch relevanteste ist.

Um einen Test auf \mu durchführen zu können, muss der Stichprobenumfang n > 30 gewählt werden, damit der Zentrale Grenzwertsatz zur Anwendung kommen kann.

Der Unternehmer entscheidet sich für n = 35.

Eine Lebensdauerprüfung der Reifen diesen Umfangs ist natürlich mit wesentlich höheren Kosten verbunden, die er jedoch als "Tribut" für die fehlenden Informationen über die Grundgesamtheit zahlen muss, wenn er den Test überhaupt durchführen will.

Als Signifikanzniveau wählt er \alpha= 0,025.

Als Teststatistik ist

V=\frac{\overline{X}-\mu_{0}}{S}\cdot\sqrt{n}

zu verwenden, die (wegen n > 30 und der Wirksamkeit des Zentralen Grenzwertsatzes) unter H_{0} approximativ N(0; 1)-verteilt ist.

Für P(V \leq c) =1-\alpha = 0,975 findet man den kritischen Wert c = z_{0,975} = 1,96.

Damit ergeben sich die approximativen Entscheidungsbereiche:

Neben dem Stichprobenmittelwert \bar{x} muss auch bei dieser Variante die Standardabweichung s aus der Stichprobe geschätzt werden. Es habe sich ergeben: \bar{x} = 38500 \mbox{ km} und s = 1400 \mbox{ km}.

Als Prüfwert erhält man:

v=\frac{38500-38000}{1400}\cdot\sqrt{35}=2,11

Da v = 2,11 in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt.

Auf einem Signifikanzniveau von \alpha = 0,025 und basierend auf einer einfachen Zufallsstichprobe vom Umfang n = 35 konnte statistisch gezeigt werden, dass der wahre Erwartungswert E(X) = \mu der Lebensdauer des Reifentyps nach der Materialänderung größer als der hypothetische Wert \mu_{0} = 38000 \mbox{ km} ist.

Falls in Wirklichkeit die Nullhypothese H_{0} richtig ist, begeht man mit ihrer Ablehnung einen Fehler 1. Art, dessen Wahrscheinlichkeit P(\mbox{''}H_{1}\mbox{''}| H_{0}) mit dem Signifikanzniveau \alpha = 0,025 klein gehalten wurde.

Wenn in Wirklichkeit die Alternativhypothese richtig ist, wurde im Ergebnis des Tests eine richtige Entscheidung getroffen (\mbox{''}H_{1}\mbox{''}| H_{1}).

Die Wahrscheinlichkeit P(\mbox{''}H_{1}\mbox{''}|H_{1}) = 1 - \beta kann nur bestimmt werden, wenn ein konkreter Alternativwert \mu angegeben werden kann und gleichzeitig unterstellt wird, dass die Punktschätzung s = 1400 \mbox{ km} die wahre Standardabweichung in der Grundgesamtheit ist.