Einseitiger Test: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Zeile 81: Zeile 81:


{{iframewiwi|
{{iframewiwi|
<iframe k="wiwi" p="examples?P=stat/EinseitigerTest/EinseitigerTestUeberschreitung.R&V=P&W=700&H=400" H="500"/>  
<iframe k="wiwi" p="examples/stat_EinseitigerTest_EinseitigerTest_R00480004800000000000000_plot.html" />
| Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test
| Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test
}}
}}

Version vom 29. Mai 2018, 13:30 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Einseitige Tests

Bei einseitigen Tests gibt es einen Ablehnungsbereich, da zu große Abweichungen der Teststatistik vom hypothetischen Wert nur in eine Richtung gegen die Nullhypothese sprechen.

Der kritische Wert wird mit symbolisiert.

Linksseitiger Test

Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner als der kritische Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer bzw. gleich dem kritischen Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :

Abb. 1: Verteilung der Teststatistik unter und Entscheidungsbereiche

Rechtsseitiger Test

Der Ablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die größer als der kritische Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich zu erhalten, ist höchstens so groß wie das vorgegebene Signifikanzniveau :
Der Nichtablehnungsbereich der besteht aus allen Realisationen der Teststatistik , die kleiner bzw. gleich dem kritischen Wert sind:
Die Wahrscheinlichkeit, eine Realisation aus dem Nichtablehnungsbereich zu erhalten, ist mindestens :

Beispiele

Testentscheidungen bei einem rechtsseitigen Test

Zur Veranschaulichung sei angenommen, dass

Der Ablehnungsbereich der wird dann durch alle Werte der Teststatistik gebildet, für die gilt.

Die Wahrscheinlichkeit, eine Realisation aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau und ist in der folgenden Abb. 2 (oben) durch die grüne Fläche gekennzeichnet.

Abb. 2: Signifikanzniveau, Entscheidungsbereiche (oben) und Überschreitungswahrscheinlichkeit (unten) beim rechtsseitigen Test

Die Testentscheidung ist wie folgt: Ist der aus der Stichprobe berechnete Prüfwert ein Element des Ablehnungsbereiches der , so wird die Nullhypothese auf dem vorgegebenen Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang verworfen.

Andernfalls besteht keine Veranlassung, abzulehnen. Die Testentscheidung basiert somit auf einem Vergleich des Prüfwertes mit den Entscheidungsbereichen.

Bei Verwendung statistischer Software (z.B. R, STATA, SPSS, Matlab) wird ebenfalls der Prüfwert auf der Grundlage der Stichprobe berechnet und im Output ausgewiesen.

Zusätzlich wird die Überschreitungswahrscheinlichkeit dieses Prüfwertes ausgegeben, d.h. die Wahrscheinlichkeit , dass die Teststatistik einen Wert annimmt, der größer als dieser berechnete Prüfwert ist (bei Gültigkeit der Nullhypothese ).

Diese Überschreitungswahrscheinlichkeit wird im Output statistischer Software sehr unterschiedlich bezeichnet (z.B. als Significance, p-value, 1-tailed P bzw. 1-tailed Sig beim einseitigen Test bzw. 2-tailed P bzw. 2-tailed Sig beim zweiseitigen Test).

Hier sei das Symbol verwendet, so dass gilt. Abb. 2 (unten) veranschaulicht diese Überschreitungswahrscheinlichkeit durch die himmelblaue Fläche.

Der Nutzer der Software braucht nun nicht erst zu Tabellen der entsprechenden Verteilung der Teststatistik greifen, um den bzw. die kritischen Werte und damit die Entscheidungsbereiche des Tests zu ermitteln.

Im Output sind alle notwendigen Informationen für die Testentscheidung enthalten, die nunmehr auf dem Vergleich des vorgegebenen Signifikanzniveaus und der Überschreitungswahrscheinlichkeit beruht.

Das sei wie folgt gezeigt.

Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der weit von entfernt liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von sehr klein.
ist ein für die Gültigkeit der Nullhypothese extremer Wert und die Nullhypothese erscheint unplausibel.
Ein solcher Wert kommt eher unter der Alternativhypothese zustande, so dass auf einen signifikanten Unterschied zwischen und geschlossen wird, d.h. die Nullhypothese abgelehnt wird.
Entscheidungsregel:
Erhält man im Output der Software eine Überschreitungswahrscheinlichkeit, für die gilt, impliziert dies, dass der Prüfwert ein Element des Ablehnungsbereiches der zum vorgegebenen Signifikanzniveau ist. Die Nullhypothese wird abgelehnt.
Bei dem hier demonstrierten rechtsseitigen Test wird diese Entscheidungsregel in der Abb. 3 deutlich.

Abb. 3: Signifikanzniveau und Überschreitungswahrscheinlichkeit bei Gültigkeit der
Ergibt sich aufgrund einer konkreten Stichprobe ein Prüfwert , der relativ nahe bei liegt, dann ist die Überschreitungswahrscheinlichkeit unter der Verteilung von groß.
ist ein für die Gültigkeit der Nullhypothese plausibler Wert, die Abweichung zwischen und kann als zufällig angesehen werden. Die Nullhypothese wird in diesem Fall nicht abgelehnt.
Entscheidungsregel:
Ist , impliziert dies, dass der Prüfwert ein Element des Nichtablehnungsbereiches der ist. Die Nullhypothese wird nicht abgelehnt.
Mit den gleichen Regeln sind die Testentscheidungen bei einem linksseitigen Test bzw. einem zweiseitigen Test zu treffen.