Entscheidungssituationen

Aus MM*Stat

(Weitergeleitet von Beta-Fehler)
Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Entscheidungssituationen

Da statistische Tests auf Stichprobenergebnissen basieren, können Fehlentscheidungen nicht ausgeschlossen werden.

Je nachdem, welches konkrete Ergebnis die Stichprobe liefert, wird man im Ergebnis des Tests die Nullhypothese entweder nicht ablehnen oder ablehnen.

Dies sei wie folgt symbolisiert:

Ebenso gibt es 2 Möglichkeiten für den wahren Zustand in der Grundgesamtheit:

Daraus ergeben sich 4 Entscheidungssituationen, wobei jede mit einer bestimmten Wahrscheinlichkeit behaftet ist.

Entscheidung im Ergebnis des Tests Wahrer Zustand in der Grundgesamtheit
H_{0} trifft zu H_{0} trifft nicht zu (H_{1} trifft zu)
H_{0} wird nicht abgelehnt: \mbox{''}H_{0}\mbox{''} Richtige Entscheidung

\mbox{''}H_{0}\mbox{''}|H_{0}: P(\mbox{''}H_{0}\mbox{''}|H_{0})=1-\alpha

Fehler 2. Art

\mbox{''}H_{0}\mbox{''}|H_{1}:P(\mbox{''}H_{0}\mbox{''}|H_{1})=\beta

H_{0} wird abgelehnt: \mbox{''}H_{1}\mbox{''} Fehler 1. Art

\mbox{''}H_{1}\mbox{''}|H_{0}:P(\mbox{''}H_{1}\mbox{''}|H_{0})=\alpha

Richtige Entscheidung

\mbox{''}H_{1}\mbox{''}|H_{1}:P(\mbox{''}H_{1}\mbox{''}|H_{1})=1-\beta

Fehler 1. Art bzw. α-Fehler

Es sei die Nullhypothese H_{0} der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe eine große Abweichung zwischen dem Prüfwert v der Teststatistik V\; und dem hypothetischen Wert \vartheta_{0} auftritt (d.h. v in den Ablehnungsbereich von H_{0} fällt), wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt (\mbox{''}H_{1}\mbox{''}).

Da jedoch in Wirklichkeit H_{0} gilt, hat man einen Fehler begangen (\mbox{''}H_{1}\mbox{''}|H_{0}), der als Fehler 1. Art oder \alpha-Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung nicht ausgeschlossen werden, denn eine Realisation der Teststatistik V\; mit einer großen Abweichung zu \vartheta_{0} ist bei Gültigkeit der H_{0} zwar relativ unwahrscheinlich, jedoch nicht unmöglich.

Der Fehler soll jedoch lediglich mit einer vor der Testdurchführung vorgegebenen kleinen Wahrscheinlichkeit vorkommen.

Da die Wahrscheinlichkeit, bei Gültigkeit der Nullhypothese eine Realisation der Teststatistik V\; im Ablehnungsbereich der H_{0} zu erhalten, mit dem Signifikanzniveau \alpha vorgegeben wird, ist das auch die Wahrscheinlichkeit für einen Fehler 1. Art.

Es gilt also:

P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)=\alpha

Fehler 2. Art bzw. β-Fehler

Es sei die Alternativhypothese H_{1} der wahre Zustand in der Grundgesamtheit.

Wenn aufgrund der konkreten Stichprobe die Abweichung der Realisation v der Teststatistik V\; vom hypothetischen Wert \vartheta_{0} relativ klein ist (d.h. v fällt in den Nichtablehnungsbereich von H_{0}), spricht dies für die Nullhypothese und man wird sie nicht ablehnen (\mbox{''}H_{0}\mbox{''}).

Da jedoch in Wirklichkeit H_1 gilt, hat man einen Fehler begangen (\mbox{''}H_{0}\mbox{''}|H_{1}), der als Fehler 2. Art oder \beta-Fehler bezeichnet wird.

Ein derartiger Fehler kann bei der Testdurchführung ebenfalls nicht ausgeschlossen werden, denn eine Realisation der Teststatistik V\; mit einer kleinen Abweichung zu \vartheta_{0} ist zwar in der Regel unwahrscheinlich, wenn H_{1} gilt, aber nicht unmöglich.

Der Fehler 2. Art beinhaltet die fälschliche Beibehaltung der Nullhypothese, d.h. die Nichtablehnung der Nullhypothese, obwohl sie falsch ist.

\beta(\vartheta_{1}) bezeichne die Wahrscheinlichkeit dafür, einen Fehler 2. Art zu begehen, wenn \vartheta_{1} der wahre Parameterwert in der Grundgesamtheit ist:

P\left(H_{0}|H_{1}\right)=\beta \left(\vartheta _{1}\right)

Man sieht bereits aus dieser Formulierung, dass diese Wahrscheinlichkeit unbekannt ist, da der wahre Parameterwert \vartheta_{1} nicht bekannt ist.

Wenn aufgrund der konkreten Stichprobe der Prüfwert v der Teststatistik V\; in den Ablehnungsbereich von H_{0} fällt, wird die Nullhypothese im Ergebnis der Testdurchführung abgelehnt (\mbox{''}H_{1}\mbox{''}).

Da auch in Wirklichkeit H_{1} gilt, hat man eine richtige Entscheidung getroffen (\mbox{''}H_{1}\mbox{''}|H_{1}).

Die Wahrscheinlichkeit für diese richtige Entscheidung ist durch

P\left(H_{1}|H_{1}\right)=1-\beta \left(\vartheta_{1}\right)

gegeben.

Die Wahrscheinlichkeit \beta(\vartheta_{1}) eines Fehlers 2. Art hängt von dem vorgegebenen Signifikanzniveau \alpha ab.

Zusatzinformationen

Zusammenhang zwischen Fehler 1. Art und Fehler 2. Art

Verringert man bei konstantem Stichprobenumfang n das Signifikanzniveau \alpha, vergrößert sich die Wahrscheinlichkeit \beta(\vartheta_{1}) eines Fehlers 2. Art und umgekehrt.

Es ist somit nicht möglich, gleichzeitig beide Fehlerwahrscheinlichkeiten beliebig zu verringern.

Grafisch sei dieser Zusammenhang für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik V\; gezeigt.


Abb. 1: Verteilung der Teststatistik V\; unter H_{0} und unter H_{1}: Veränderung der Größe des Fehlers 1. Art und Fehlers 2. Art bei der Veränderung des Signifikanzniveaus

Die Wahrscheinlichkeit eines Fehlers 2. Art hängt (bei vorgegebenem Signifikanzniveau \alpha und Stichprobenumfang n) weiterhin von der Lage des wahren Parameterwertes \vartheta_{1} gegenüber dem hypothetischen Wert \vartheta_{0} unter H_{0} ab.

Ist der Abstand groß, ist \beta(\vartheta_{1}) klein. Die Wahrscheinlichkeit eines Fehlers 2. Art wird jedoch immer größer, je kleiner der Abstand zwischen dem wahren Parameterwert \vartheta_{1} und dem hypothetischen Wert \vartheta_{0} unter H_{0} wird.

Grafisch sei das wiederum für einen rechtsseitigen Test unter Annahme der Normalverteilung für die Teststatistik V\; gezeigt.

Abb. 2: Verteilung der Teststatistik V\; unter H_{0} und unter H_{1}: Veränderung der Größe des Fehlers 1. Art und Fehlers 2. Art bei der Veränderung des Abstandes zwischen wahren und hypothetischen Parameter

Interpretation von Testergebnissen

Da bei allen Testdurchführungen die Wirklichkeit unbekannt ist und die Entscheidung nur auf einem Stichprobenergebnis basiert, muss man sich stets bewusst sein, dass man mit der Testentscheidung einen Fehler begehen kann.

Daher bedeutet die Beibehaltung der Nullhypothese noch lange nicht, dass ihre Richtigkeit bewiesen ist! Man hat lediglich ein Stichprobenergebnis beobachtet, dass ihr nicht widerspricht.

Ablehnung bzw. Nichtablehnung der Nullhypothese haben eine unterschiedliche Aussagekraft.

Bei einer Ablehnung der Nullhypothese ist die Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, mit dem vorgegebenen Signifikanzniveau auf einen kleinen Wert beschränkt.

Die Nichtablehnung von H_{0} ist dagegen wesentlich unsicherer und statistisch nicht abgesichert, da die Wahrscheinlichkeit eines Fehlers 2. Art im Allgemeinen nicht bekannt ist und sehr groß sein kann.

Aus diesem Grund wird in der Regel diejenige Annahme als Alternativhypothese H_{1} formuliert, die "statistisch bestätigt" werden soll oder deren fälschliche Annahme mit den schwerwiegenderen Folgen verbunden ist.

Dies ist vor allem bei einseitigen Tests zu beachten.