Entscheidungssituationen

Aus MM*Stat

Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Entscheidungssituationen

Da statistische Tests auf Stichprobenergebnissen basieren, können Fehlentscheidungen nicht ausgeschlossen werden.

Je nachdem, welches konkrete Ergebnis die Stichprobe liefert, wird man im Ergebnis des Tests die Nullhypothese entweder nicht ablehnen oder ablehnen.

Dies sei wie folgt symbolisiert:

Ebenso gibt es 2 Möglichkeiten für den wahren Zustand in der Grundgesamtheit:

  • : die Nullhypothese gilt in Wirklichkeit
  • : die Alternativhypothese gilt in Wirklichkeit.

Daraus ergeben sich 4 Entscheidungssituationen, wobei jede mit einer bestimmten Wahrscheinlichkeit behaftet ist.

Entscheidung im Ergebnis des Tests Wahrer Zustand in der Grundgesamtheit
trifft zu trifft nicht zu ( trifft zu)
wird nicht abgelehnt: Richtige Entscheidung

Fehler 2. Art

wird abgelehnt: Fehler 1. Art

Richtige Entscheidung

Fehler 1. Art bzw. α-Fehler

Es sei die Nullhypothese der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe eine große Abweichung zwischen dem Prüfwert der Teststatistik und dem hypothetischen Wert auftritt (d.h. in den Ablehnungsbereich von fällt), wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt .

Da jedoch in Wirklichkeit gilt, hat man einen Fehler begangen , der als Fehler 1. Art oder -Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung nicht ausgeschlossen werden, denn eine Realisation der Teststatistik mit einer großen Abweichung zu ist bei Gültigkeit der zwar relativ unwahrscheinlich, jedoch nicht unmöglich.

Der Fehler soll jedoch lediglich mit einer vor der Testdurchführung vorgegebenen kleinen Wahrscheinlichkeit vorkommen.

Da die Wahrscheinlichkeit, bei Gültigkeit der Nullhypothese eine Realisation der Teststatistik im Ablehnungsbereich der zu erhalten, mit dem Signifikanzniveau vorgegeben wird, ist das auch die Wahrscheinlichkeit für einen Fehler 1. Art.

Es gilt also:

Fehler 2. Art bzw. β-Fehler

Es sei die Alternativhypothese der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe die Abweichung der Realisation der Teststatistik vom hypothetischen Wert relativ klein ist (d.h. fällt in den Nichtablehnungsbereich von ), spricht dies für die Nullhypothese und man wird sie nicht ablehnen .

Da jedoch in Wirklichkeit gilt, hat man einen Fehler begangen , der als Fehler 2. Art oder -Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung ebenfalls nicht ausgeschlossen werden, denn eine Realisation der Teststatistik mit einer kleinen Abweichung zu ist zwar in der Regel unwahrscheinlich, wenn gilt, aber nicht unmöglich.

Der Fehler 2. Art beinhaltet die fälschliche Beibehaltung der Nullhypothese, d.h. die Nichtablehnung der Nullhypothese, obwohl sie falsch ist.

bezeichne die Wahrscheinlichkeit dafür, einen Fehler 2. Art zu begehen, wenn der wahre Parameterwert in der Grundgesamtheit ist:

Man sieht bereits aus dieser Formulierung, dass diese Wahrscheinlichkeit unbekannt ist, da der wahre Parameterwert nicht bekannt ist.

Wenn aufgrund der konkreten Stichprobe der Prüfwert der Teststatistik in den Ablehnungsbereich von fällt, wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt .

Da auch in Wirklichkeit gilt, hat man eine richtige Entscheidung getroffen .

Die Wahrscheinlichkeit für diese richtige Entscheidung ist durch

gegeben.

Die Wahrscheinlichkeit eines Fehlers 2. Art hängt von dem vorgegebenen Signifikanzniveau ab.

Zusatzinformationen

Zusammenhang zwischen Fehler 1. Art und Fehler 2. Art

Verringert man bei konstantem Stichprobenumfang das Signifikanzniveau , vergrößert sich die Wahrscheinlichkeit eines Fehlers 2. Art und umgekehrt.

Es ist somit nicht möglich, gleichzeitig beide Fehlerwahrscheinlichkeiten beliebig zu verringern.

Grafisch sei dieser Zusammenhang für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik gezeigt.

Abb. 1: Verteilung der Teststatistik unter und unter : Veränderung der Größe des Fehlers 1. Art und Fehlers 2. Art bei der Veränderung des Signifikanzniveaus

Die Wahrscheinlichkeit eines Fehlers 2. Art hängt (bei vorgegebenem Signifikanzniveau und Stichprobenumfang ) weiterhin von der Lage des wahren Parameterwertes gegenüber dem hypothetischen Wert unter ab.

Ist der Abstand groß, ist klein. Die Wahrscheinlichkeit eines Fehlers 2. Art wird jedoch immer größer, je kleiner der Abstand zwischen dem wahren Parameterwert und dem hypothetischen Wert unter wird.

Grafisch sei das wiederum für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik gezeigt.

Abb. 2: Verteilung der Teststatistik unter und unter : Veränderung der Größe des Fehlers 1. Art und Fehlers 2. Art bei der Veränderung des Abstandes zwischen wahren und hypothetischen Parameter

Interpretation von Testergebnissen

Da bei allen Testdurchführungen die Wirklichkeit unbekannt ist und die Entscheidung nur auf einem Stichprobenergebnis basiert, muss man sich stets bewusst sein, dass man mit der Testentscheidung einen Fehler begehen kann.

Daher bedeutet die Beibehaltung der Nullhypothese noch lange nicht, dass ihre Richtigkeit bewiesen ist! Man hat lediglich ein Stichprobenergebnis beobachtet, dass ihr nicht widerspricht.

Ablehnung bzw. Nichtablehnung der Nullhypothese haben eine unterschiedliche Aussagekraft.

Bei einer Ablehnung der Nullhypothese ist die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, mit dem vorgegebenen Signifikanzniveau auf einen kleinen Wert beschränkt.

Die Nichtablehnung von ist dagegen wesentlich unsicherer und statistisch nicht abgesichert, da die Wahrscheinlichkeit eines Fehlers 2. Art im Allgemeinen nicht bekannt ist und sehr groß sein kann.

Aus diesem Grund wird in der Regel diejenige Annahme als Alternativhypothese formuliert, die "statistisch bestätigt" werden soll oder deren fälschliche Annahme mit den schwerwiegenderen Folgen verbunden ist.

Dies ist vor allem bei einseitigen Tests zu beachten.