Einseitiger Test

Aus MM*Stat

(Weitergeleitet von Linksseitiger Test)
Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Einseitige Tests

Bei einseitigen Tests gibt es einen Ablehnungsbereich, da zu große Abweichungen der Teststatistik V\; vom hypothetischen Wert \theta_{0} nur in eine Richtung gegen die Nullhypothese sprechen.

Der kritische Wert wird mit c symbolisiert.

Linksseitiger Test

H_{0}:\theta \geq \theta _{0}\qquad H_{1}:\theta <\theta _{0}
Der Ablehnungsbereich der H_{0} besteht aus allen Realisationen v der Teststatistik V\;, die kleiner als der kritische Wert c sind:
\left\{v\,|\;v<c\right\}
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau \alpha:
P\left\{V<c\;|\;\vartheta _{0}\right\}\leq \alpha
Der Nichtablehnungsbereich der H_{0} besteht aus allen Realisationen v der Teststatistik V\;, die größer bzw. gleich dem kritischen Wert c sind:
\left\{v\;|\;v\geq c\right\}
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens 1-\alpha :
P\left\{V\geq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha

Abb. 1: Verteilung der Teststatistik V unter H_0 und Entscheidungsbereiche

Rechtsseitiger Test

H_{0}:\vartheta \leq \vartheta_{0} \qquad H_{1}: \vartheta > \vartheta_{0}
Der Ablehnungsbereich der H_{0} besteht aus allen Realisationen v der Teststatistik V\;, die größer als der kritische Wert c sind:
\left\{v\;|\;v>c\right\}
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau \alpha:
P\left\{V>c\;|\;\vartheta _{0}\right\}\leq\alpha
Der Nichtablehnungsbereich der H_{0} besteht aus allen Realisationen v der Teststatistik V\;, die kleiner bzw. gleich dem kritischen Wert c sind:
\left\{v\;|\;v\leq c\right\}
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens 1-\alpha:
P\left\{V\leq c\;|\;\vartheta _{0}\right\}\geq 1-\alpha

Beispiele

Testentscheidungen bei einem rechtsseitigen Test

Zur Veranschaulichung sei angenommen, dass

Der Ablehnungsbereich der H_{0} wird dann durch alle Werte der Teststatistik V\; gebildet, für die \{v|v>c\} gilt.

Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich der H_{0} zu erhalten, entspricht dem vorgegebenen Signifikanzniveau \alpha = P(V > c |\vartheta_{0}) und ist in der folgenden Abb. 2 (oben) durch die grüne Fläche gekennzeichnet.

Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test

Die Testentscheidung ist wie folgt: Ist der aus der Stichprobe berechnete Prüfwert ein Element des Ablehnungsbereiches der H_{0}, so wird die Nullhypothese auf dem vorgegebenen Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang n verworfen.

Andernfalls besteht keine Veranlassung, H_{0} abzulehnen. Die Testentscheidung basiert somit auf einem Vergleich des Prüfwertes v mit den Entscheidungsbereichen.

Bei Verwendung statistischer Software (z.B. R, STATA, SPSS, Matlab) wird ebenfalls der Prüfwert v auf der Grundlage der Stichprobe berechnet und im Output ausgewiesen.

Zusätzlich wird die Überschreitungswahrscheinlichkeit dieses Prüfwertes v ausgegeben, d.h. die Wahrscheinlichkeit P(V > v | \vartheta_{0}), dass die Teststatistik V\; einen Wert annimmt, der größer als dieser berechnete Prüfwert v ist (bei Gültigkeit der Nullhypothese H_{0}).

Diese Überschreitungswahrscheinlichkeit wird im Output statistischer Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim zweiseitigen Test).

Hier sei das Symbol P verwendet, so dass P = P(V > v | \vartheta_{0}) gilt. Abb. 2 (unten) veranschaulicht diese Überschreitungswahrscheinlichkeit durch die himmelblaue Fläche.

Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden Verteilung der Teststatistik V\; greifen, um den bzw. die kritischen Werte und damit die Entscheidungsbereiche des Tests zu ermitteln.

Im Output sind alle notwendigen Informationen für die Testentscheidung enthalten, die nunmehr auf dem Vergleich des vorgegebenen Signifikanzniveaus \alpha und der Überschreitungswahrscheinlichkeit P beruht.

Das sei wie folgt gezeigt.

Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert v, der weit von \vartheta_{0} entfernt liegt, dann ist die Überschreitungswahrscheinlichkeit P = P(V > v | \vartheta_{0}) unter der Verteilung von H_{0} sehr klein.
v ist ein für die Gültigkeit der Nullhypothese extremer Wert und die Nullhypothese erscheint unplausibel.
Ein solcher Wert v kommt eher unter der Alternativhypothese zustande, so dass auf einen signifikanten Unterschied zwischen \vartheta_{0} und \vartheta geschlossen wird, d.h. die Nullhypothese abgelehnt wird.
Entscheidungsregel:
Erhält man im Output der Software eine Überschreitungswahrscheinlichkeit, für die P\leq\alpha gilt, impliziert dies, dass der Prüfwert v ein Element des Ablehnungsbereiches der H_{0} zum vorgegebenen Signifikanzniveau \alpha ist. Die Nullhypothese wird abgelehnt.
Bei dem hier demonstrierten rechtsseitigen Test wird diese Entscheidungsregel in der Abb. 3 deutlich.

Abb. 3: Signifikanzniveau und Überschreitungswahrscheinlichkeit bei Gültigkeit der H_0
Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert v, der relativ nahe bei \vartheta_{0} liegt, dann ist die Überschreitungswahrscheinlichkeit P = P(V > v |\vartheta_{0}) unter der Verteilung von H_{0} groß.
v ist ein für die Gültigkeit der Nullhypothese plausibler Wert, die Abweichung zwischen v und \vartheta_{0} kann als zufällig angesehen werden. Die Nullhypothese wird in diesem Fall nicht abgelehnt.
Entscheidungsregel:
Ist P > \alpha, impliziert dies, dass der Prüfwert v ein Element des Nichtablehnungsbereiches der H_{0} ist. Die Nullhypothese wird nicht abgelehnt.
Mit den gleichen Regeln sind die Testentscheidungen bei einem linksseitigen Test bzw. einem zweiseitigen Test zu treffen.