Test auf Anteilswert

Aus MM*Stat

Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Unterseiten

Statistik-Bücher

Grundbegriffe

Test auf Anteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein unbekannter Anteil \pi von Elementen eine interessierende Eigenschaft aufweist und ein Anteil 1 - \pi diese Eigenschaft nicht besitzt.

Über \pi existiert eine Annahme (hypothetischer Wert) \pi_{0}. Diese Annahme soll mittels eines statistischen Tests geprüft werden, wobei es sich um einen Parametertest handelt.

Es wird im Weiteren vorausgesetzt, dass der Test auf einer einfachen Zufallsstichprobe vom vorgegebenen Umfang n basiert, womit die Stichprobenvariablen X_{1},\ldots ,X_{n}, die nur die Werte 0 oder 1 annehmen können, unabhängig und identisch Bernoulli-verteilt sind.

Geprüft wird auf dem Signifikanzniveau \alpha.

Je nach Problemstellung können die Tests als zwei- oder einseitige Tests formuliert werden.

  • Zweiseitiger Test
H_{0}:\;\pi =\pi_{0},\quad H_{1}:\;\pi \neq \pi_{0}
  • Rechtsseitiger Test
H_{0}:\;\pi \leq \pi_{0},\quad H_{1}:\pi >\pi_{0}
  • Linksseitiger Test
H_{0}:\pi \geq \pi_{0},\quad H_{1}:\pi <\pi_{0}

Für die Wahl der Hypothesenformulierung gelten die Ausführungen zum "Test auf Mittelwert" in analoger Weise.

Teststatistik des Tests auf Anteilswert

Der Stichprobenanteilswert

\widehat{\pi}=\frac{X}{n}=\frac{1}{n}\cdot\sum_{i=1}^{n}X_{i}

ist eine geeignete Schätzfunktion für \pi.

Eine gleichwertige Stichprobenfunktion ist die Zufallsvariable X\;

X=\sum_{i=1}^{n}X_{i}

als Anzahl der Elemente mit der interessierenden Eigenschaft in der Zufallsstichprobe, denn sie unterscheidet sich nur durch den konstanten Faktor \frac{1}{n} vom Stichprobenanteilswert.

Wie bereits gezeigt (siehe Abschnitt "Verteilung des Stichprobenanteilswertes" und "Binomialverteilung"), ist X\; binomialverteilt mit den Parametern n und \pi:\; X \sim B(n;\pi).

Da der Stichprobenumfang n vorgegeben ist, muss zur konkreten Angabe der Binomialverteilung noch \pi festgelegt werden.

Die einzige verfügbare Information über \pi ist der hypothetische Wert \pi_{0}.

Es wird nun unterstellt, dass \pi_{0} der wahre Anteilswert in der Grundgesamtheit ist, d.h. \pi = \pi_{0} gilt.

Damit folgt:

Die Schätzfunktion X\; kann unmittelbar als Teststatistik verwendet werden, die bei Gültigkeit der Nullhypothese H_{0} binomialverteilt ist mit den Parametern n und \pi_{0}.

V=X \mbox{ ist unter }H_{0}\sim B(n;\;\pi_{0})\mbox{-verteilt}

Entscheidungsbereiche des Tests auf Anteilswert

Der Ablehnungsbereich der Nullhypothese beinhaltet alle Realisationen der Teststatistik V\;, deren aufsummierte Wahrscheinlichkeiten maximal \alpha betragen.

Die kritischen Werte findet man aus der Tabelle der Verteilungsfunktion F_{B} der B(n; \pi_{0}) wie folgt:

Zweiseitiger Test

Der untere kritische Wert x_{u} ist diejenige Realisation von X\;, für die F_{B}(x) den Wert \frac{\alpha}{2} gerade überschreitet, so dass gilt:

F_{B}(x_{u} - 1)\leq \frac{\alpha}{2} und F_{B}(x_{u})>\frac{\alpha}{2}.

Der obere kritische Wert x_{o} ist diejenige Realisation von X\;, für die F_{B}(x) den Wert 1 - \frac{\alpha}{2} gerade erreicht oder überschreitet, so dass gilt:

F_{B}(x_{o} - 1) < 1 -\frac{\alpha}{2} und F_{B}(x_{o})\geq 1 - \frac{\alpha}{2}.

Der Ablehnungsbereich der H_{0} ist gegeben durch

\left\{v|v<x_{u}\mbox{ oder }v>x_{o}\right\} mit P\left(V<x_{u}|\pi_{0}\right)+P\left(V>x_{o}|\pi_{0}\right) \leq \alpha.

Für den Nichtablehnungsbereich der H_{0} erhält man:

\left\{v|x_{u}\leq v\leq x_{o}\right\} mit P\left(x_{u}\leq V\leq x_{o}|\pi_{0}\right) \geq 1-\alpha.

Rechtsseitiger Test

Der kritische Wert x_{c} ist diejenige Realisation von X\;, für die F_{B}(x) den Wert 1-\alpha gerade erreicht oder überschreitet, so dass gilt:

F_{B}\left(x_{c}-1\right)<1-\alpha und F_{B}\left(x_{c} \right) \geq 1-\alpha.

Der Ablehnungsbereich der H_{0} ist gegeben durch

\left\{v|v>x_{c}\right\} mit P\left(V>x_{c}|\pi_{0}\right)\leq\alpha.

Für den Nichtablehnungsbereich der H_{0} erhält man:

\left\{v|v\leq x_{c}\right\} mit P\left(V\leq x_{c}|\pi_{0}\right) \geq 1-\alpha.

Linksseitiger Test

Der kritische Wert x_{c} ist diejenige Realisation von X\;, für die F_{B}(x) den Wert \alpha gerade überschreitet, so dass gilt:

F_{B}\left(x_{c}-1\right) \leq \alpha und F_{B}\left(x_{c}\right)>\alpha.

Der Ablehnungsbereich der H_{0} ist gegeben durch

\left\{v|v<x_{c}\right\} mit P\left(V<x_{c}|\pi_{0}\right)\leq\alpha.

Für den Nichtablehnungsbereich der H_{0} erhält man:

\left\{v|v\geq x_{c}\right\} mit P\left(V\geq x_{c}|\pi_{0}\right) \geq 1-\alpha.

Prüfwert des Tests auf Anteilswert

Wenn die einfache Zufallsstichprobe vom Umfang n gezogen wurde, liegen die konkreten Stichprobenwerte x_{1},\ldots ,x_{n} vor und der Prüfwert v der entsprechenden Teststatistik V\; kann ermittelt werden.

Entscheidungssituationen des Tests auf Anteilswert

Testentscheidung und Interpretation erfolgen in gleicher Weise wie beim "Test auf Mittelwert".

Gütefunktion des Tests auf Anteilswert

Für die Teststatistik V bei genügend großem Stichprobenumfang (Approximation durch die Normalverteilung - siehe unten)

V=\cfrac{\widehat{\pi }-\pi_{0}}{\sigma_{0}\left( \widehat{\pi }\right) }=\cfrac{\widehat{\pi }-\pi_{0}}{\sqrt{\cfrac{\pi_{0}\left( 1-\pi_{0}\right) }{n}}}

lassen sich für die verschiedenen Testvarianten die Formeln für die Berechnung der Gütefunktion in ähnlicher Weise wie beim Test auf Mittelwert herleiten, worauf an dieser Stelle verzichtet wird.

Wenn V = X\; die Teststatistik ist, muss auch zur Berechnung der Gütefunktion G(\pi) die Binomialverteilung verwendet werden, d.h. B(n;\pi) für alle zulässigen Werte 0 = \pi = 1 und festes n.

Für

G\left(\pi \right)=P\left( V=X\in \mbox{ Ablehnungsbereich der }H_{0}|\pi \right)

folgt

G\left(\pi\right)=P\left(V<x_{u}|\pi \right)+P\left(V>x_{o}|\pi \right)=P\left(V\leq x_{u}-1|\pi \right)+\left[1-P\left(V\leq x_{o}|\pi \right)\right]
G\left(\pi\right)=P\left(V>x_{c}|\pi \right)=1-P\left(V\leq x_{c}|\pi\right),
G\left(\pi\right)=P\left(V<x_{c}|\pi \right)=P\left(V\leq x_{c}-1|\pi \right).

Die Wahrscheinlichkeiten sind aus der Tabelle der Verteilungsfunktion der B(n;\pi) zu entnehmen.

Die Gütefunktion an der Stelle \pi =\pi_{0} entspricht stets dem exakten Signifikanzniveau \alpha_{exakt}.

Zusatzinformationen

Approximation durch die Normalverteilung

Da V = X\; eine diskrete Zufallsvariable ist, gilt für alle Testvarianten, dass das vorgegebene Signifikanzniveau \alpha nicht notwendig ausgeschöpft und somit nur mit dem sich ergebenden exakten Signifikanzniveau \alpha_{exakt} getestet wird.

Für genügend großen Stichprobenumfang n wird, ausgehend von der Schätzfunktion \widehat{\pi} die standardisierte Zufallsvariable

V=\cfrac{\widehat{\pi}-\pi_{0}}{\sigma_{0}\left( \widehat{\pi}\right)}=\cfrac{\widehat{\pi}-\pi_{0}}{\sqrt{\cfrac{\pi_{0}\left( 1-\pi_{0}\right)}{n}}}

als Teststatistik verwendet, wobei \sigma_{0}\left(\widehat{\pi}\right) die Standardabweichung der Schätzfunktion \widehat{\pi} unter H_{0} bezeichnet.

V\; ist bei Gültigkeit der Nullhypothese approximativ standardnormalverteilt (siehe Abschnitt Verteilung des Stichprobenanteilswertes). Für das vorgegebene Signifikanzniveau \alpha können die kritischen Werte aus der Tabelle der Standardnormalverteilung entnommen werden.

Für die einzelnen Testmöglichkeiten ergeben sich die Entscheidungsbereiche analog zum approximativen Einstichproben-t-Test. Da E\left[\widehat{\pi}\right]=\pi gilt, wird deutlich, dass eine Hypothese über den Anteilswert p einer Hypothese über den Erwartungswert entspricht.

Beispiele

Statistik-Bücher

Ein Statistik-Professor vermutet, dass es im letzten Jahr deutliche Verschiebungen im Anteil der Neuzugänge an Büchern in der Universitätsbibliothek zuungunsten der Statistik-Literatur gegeben hat.

In der Vergangenheit betrug der Anteil der Statistik-Literatur an allen Neuzugängen der Bibliothek mehr als 10%. Er beauftragt deshalb seinen Assistenten mit einer Überprüfung.

Dabei will er im Interesse seiner Studenten das Risiko, keinen Einspruch bei der Universitätsbibliothek einzulegen, obwohl der Anteil geringer geworden ist, klein halten.

Die Überprüfung läuft auf einen Test des Anteilswertes einer dichotomen Grundgesamtheit hinaus, wobei der hypothetische Wert \pi_{0} = 0,1 ist.

Die Grundgesamtheit ist in der Hinsicht dichotom, da eine weitere fachwissenschaftliche Untergliederung der Neuzugänge im Zusammenhang mit dem Test ohne Bedeutung ist, so dass nur zwei mögliche Ereignisse gegeben sind:

der Neuzugang ist ein Statistik-Buch und der Neuzugang ist kein Statistik-Buch.

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 und mittels einer einfachen Zufallsstichprobe vom Umfang n = 25 durchgeführt werden.

Da nur Abweichungen vom hypothetischen Wert nach einer Seite von Bedeutung sind, wird ein einseitiger Test durchgeführt.

Die Behauptung des Professors, dass der Anteil der Statistik-Lektüre an den Neuzugängen höchstens noch 10% beträgt, wird als Nullhypothese formuliert mit dem Ziel, sie möglichst abzulehnen.

Daraus ergibt sich ein rechtsseitiger Test:

H_{0}:\; \pi \leq \pi_{0}=0,1 \quad H_{1}:\; \pi > \pi_{0}=0,1

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Intention des Professors eingehalten wird.

Der bei der Ablehnung der H_{0} mögliche Fehler 1. Art hat folgenden Inhalt:

\mbox{''}H_{1}\mbox{''}|H_{0}= "Der Anteil der Statistik-Bücher an den Neuzugängen hat sich nicht verändert" | In Wirklichkeit hat er sich verringert.

Die Wahrscheinlichkeit eines Fehlers 1. Art P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right), ist das Signifikanzniveau \alpha, so dass mit dessen Vorgabe (hier \alpha = 0,05) das Risiko eines derartigen Fehlers gering gehalten werden kann.

Damit wird die Zielstellung des Professors bei der Durchführung des Tests eingehalten.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des dann möglichen Fehlers 2. Art:

\mbox{''}H_{0}\mbox{''}|H_{1}= "Der Anteil der Statistik-Bücher an den Neuzugängen hat sich verringert" | In Wirklichkeit ist alles wie vorher.

Die Wahrscheinlichkeit eines Fehlers 2. Art P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right) =\beta ist unbekannt, da der wahre Anteilswert \pi unter der Alternativhypothese nicht bekannt ist.

Diese Wahrscheinlichkeit für einen Fehler 2. Art, d.h. das Risiko für einen unberechtigten Einspruch des Professors bei der Universitätsbibliothek, kann sehr groß sein. Das muss der Professor jedoch in Kauf nehmen, da er andere Prioritäten für die Überprüfung gesetzt hatte.

Teststatistik und Entscheidungsbereiche

Die Schätzfunktion X\; "Anzahl der Statistik - Bücher in einer Zufallsstichprobe von Umfang n = 25" kann unmittelbar als Teststatistik V\; verwendet werden.

V = X\; ist unter H_{0} \sim B( 25;\;0,1)-verteilt.

Eine große Anzahl von Statistik-Büchern in der Stichprobe spricht dabei gegen die Nullhypothese und für die Alternativhypothese, d.h. für einen nicht gesunkenen Anteil der Statistik-Bücher an den Neuzugängen.

Der kritische Wert x_{c} ist diejenige Realisation von X\;, für die F_{B}\left( x\right) den Wert 1-\alpha =0,95 gerade erreicht oder überschreitet, so dass gilt F_{B}\left( x_{c}-1\right) <1-\alpha=0,95 und F_{B}\left(x_{c}\right) \geq 1-\alpha =0,95.

In der Tabelle der Verteilungsfunktion der B(25;\; 0,1) findet man x_{c} = 5.

Der Ablehnungsbereich der H_{0} ist damit gegeben durch

\left\{ v|v>5\right\}=\left\{6,7,\ldots ,25\right\} mit P\left( V>5|0,1\right) =0,0334=\alpha_{exakt}.

Da V = X\; eine diskrete Zufallsvariable ist, wird das vorgegebene Signifikanzniveau von \alpha = 0,05 nicht voll ausgeschöpft. Es ist nur \alpha_{exakt}= 0,0334.

Für den Nichtablehnungsbereich der H_{0} erhält man:

\left\{v|v\leq 5\right\} =\left\{0,1,2,3,4,5\right\} mit P\left(V\leq 5|0,1\right) =0,9666.

Prüfwert und Testentscheidung

Aus den Neuzugängen an Büchern in der Universitätsbibliothek im letzten Jahr werden 25 Bücher zufällig ausgewählt und festgestellt, ob es sich um ein Statistik-Buch handelt oder nicht.

Da die Gesamtheit aller Neuzugänge an Büchern pro Jahr in der Universitätsbibliothek als genügend groß anzusehen ist, spielt es kaum eine Rolle, ob eine Zufallsauswahl mit oder ohne Zurücklegen durchgeführt wird.

Eine einfache Zufallsstichprobe kann unterstellt werden.

Es habe sich x = 3 als Anzahl der Statistik-Bücher in der Zufallsstichprobe ergeben, was gleichzeitig der Prüfwert v ist.

Da v = x = 3 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf einer Zufallsstichprobe vom Umfang n = 25 konnte statistisch nicht bewiesen werden, dass der Anteil der Statistik-Bücher an den Neuzugängen der Universitätsbibliothek dem bisherigen Anteil von mehr als 10% entspricht. Der Professor wird Einspruch bei der Universitätsbibliothek einlegen.

Gütefunktion

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem rechtsseitigen Test (mit \pi_{0}=0,1,\; n=25,\; \alpha =0,05 und x_{c}=5) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0,2 betragen würde?

Gesucht ist die Wahrscheinlichkeit für einen Fehler 2. Art unter der Bedingung, dass \pi = 0,2 wahr ist:

P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right)=P\left( V=X\in \mbox{Nichtablehnungsbereich der } H_{0}|\pi =0,2\right) =P\left( V\leq 5|\pi =0,2\right)

Diese Wahrscheinlichkeit kann direkt aus der Tabelle der Verteilungsfunktion der B(25; 0,2) entnommen werden. Sie beträgt 0,6167.

Im Fall eines wahren Anteils von \pi = 0,2 wird in 61,67% aller Stichproben vom Umfang n = 25 die Abweichung vom hypothetischen Wert \pi_{0} = 0,1 durch den Test nicht aufgedeckt und ist die Wahrscheinlichkeit eines unberechtigten Einspruchs des Professors bei der Universitätsbibliothek.

Die Wahrscheinlichkeit eines Fehlers 2. Art kann auch über die Gütefunktion berechnet werden.

Die folgende Tabelle enthält für verschiedene zulässige Werte von \pi die Gütefunktion G( \pi ) und 1 - G( \pi ) für den oben durchgeführten rechtsseitigen Test

\pi Gültigkeit von G\left( \pi\right) 1-G\left( \pi\right)
0 H_{0} 0=\alpha 1=1-\alpha
0,05 H_{0} 0,0012=\alpha 0,9988=1-\alpha
0,1 H_{0} 0,0334=\alpha_{a} 0,9666=1-\alpha_{a}
0,15 H_{1} 0,1615=1-\beta 0,8385=\beta
0,20 H_{1} 0,3833=1-\beta 0,6167=\beta
0,25 H_{1} 0,6217=1-\beta 0,3783=\beta
0,30 H_{1} 0,8065=1-\beta 0,1935=\beta
0,35 H_{1} 0,9174=1-\beta 0,0826=\beta
0,40 H_{1} 0,9706=1-\beta 0,0294=\beta
0,45 H_{1} 0,9914=1-\beta 0,0086=\beta
0,50 H_{1} 0,9980=1-\beta 0,0020=\beta
0,60 H_{1} 0,9999=1-\beta 0,0001=\beta
0,70 H_{1} 1=1-\beta 0=\beta

Wenn z.B. der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0 ist, kann auf keinen Fall ein Statistik-Buch in der Stichprobe enthalten sein, d.h. man wird x = 0 erhalten und die Nullhypothese nicht ablehnen.

Die Ablehnung der Nullhypothese, d.h. \mbox{''}H_{1}\mbox{''}, ist ein unmögliches Ereignis.

Für die Gütefunktion, die für \pi = 0 die Wahrscheinlichkeit eines Fehlers 1. Art beinhaltet, folgt:

G\left(\pi = 0 \right) =P\left( V=X\in \mbox{ Ablehnungsbereich der } H_{0}|\pi =0\right) =P\left(\mbox{''}H_{1}\mbox{''}|0\right) =0

Wenn dagegen der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0,35 wäre, ergibt sich die Gütefunktion zu:

G\left(0,35\right)=P\left(V>5|\pi=0,35\right)=1-P\left(V\leq5|\pi=0,35\right)=1-0,0826=0,9174

wobei man P\left( V\leq 5|\pi=0,35\right) aus der Tabelle der Verteilungsfunktion der B(25; 0,35) für x_{c}=5 findet.

G(\pi = 0,35) beinhaltet die Wahrscheinlichkeit einer berechtigten Ablehnung der Nullhypothese, d.h. P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)=1- \beta.

Die Wahrscheinlichkeit eines Fehlers 2. Art ist \beta(\pi= 0,35) =1 - G( \pi = 0,35)= 0,0826. Im Fall eines wahren Anteils von \pi =0,35 wird in 8,26% aller Stichproben vom Umfang n = 25 die Abweichung vom hypothetischen Wert \pi_{0} = 0,1 durch den Test nicht aufgedeckt.

Die nachstehende Abbildung zeigt die Gütefunktion für den rechtsseitigen Test mit \pi_{0}= 0,1,\; n = 25,\; \alpha = 0,05 und x_{c} = 5.

Kreditwürdigkeit

Zu den wichtigsten Aufgaben einer Bank gehört die Bewertung der Kreditwürdigkeit potentieller Kreditnehmer, um Kreditverluste niedrig zu halten.

Die ABC-Bank will eine Verschärfung der Bewertungsrichtlinien der Kreditwürdigkeit vornehmen, wenn der Anteil von gewährten Krediten mit Schwierigkeiten bei der Rückzahlung nicht unter 20% liegt.

Sie lässt deshalb von ihrer Statistik-Abteilung einen Test durchführen. Dabei will die Bank das Risiko, keine Veränderung in den Bewertungsrichtlinien vorzunehmen, obwohl der Anteil 20% und mehr beträgt, gering halten.

Die Zufallsvariable X\;: "Schwierigkeiten bei der Kreditrückzahlung" weist nur die Werte 0 (nein) oder 1 (ja) auf. Der Anteil \pi der Kreditnehmer mit Schwierigkeiten bei der Rückzahlung ist unbekannt.

Die Überprüfung läuft auf einen Test des Anteilswertes einer dichotomen Grundgesamtheit hinaus, wobei der hypothetische Wert \pi_{0} = 0,2 ist.

Es sind nur Abweichungen vom hypothetischen Wert nach einer Seite von Bedeutung, so dass ein einseitiger Test durchgeführt wird.

Da die ABC-Bank nachweisen will, dass ihre derzeitigen Bewertungskriterien ausreichend sind, d.h. der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist, wird diese Annahme als Alternativhypothese formuliert, woraus ein linksseitiger Test resultiert:

H_{0}:\;\pi \geq \pi_{0}=0,2\quad H_{1}:\;\pi<\pi_{0}=0,2

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Vorgabe der Bank eingehalten wird.

Der bei der Ablehnung der H_{0} mögliche Fehler 1. Art hat folgenden Inhalt:

\mbox{''}H_{1}\mbox{''}|H_{0}= "Anteil mit Rückzahlungsschwierigkeiten  <20%; Veränderungen in den Bewertungsrichtlinien werden nicht vorgenommen" | in Wirklichkeit ist der Anteil mit Rückzahlungsschwierigkeiten \geq 20%; Veränderungen in den Bewertungsrichtlinien müssten erfolgen.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des möglichen Fehlers 2. Art:

\mbox{''}H_{0}\mbox{''}|H_{1} = "Anteil mit Rückzahlungsschwierigkeiten \geq 20%; Veränderungen in den Bewertungsrichtlinien sind vorzunehmen"| in Wirklichkeit ist der Anteil mit Rückzahlungsschwierigkeiten \leq 20%; Veränderungen in den Bewertungsrichtlinien sind nicht notwendig.

Der Fehler 1. Art entspricht der Risikovorgabe der ABC-Bank. Die Wahrscheinlichkeit für den Fehler 1. Art P(\mbox{''}H_{1}\mbox{''}|H_{0}) kann über die Festlegung des Signifikanzniveaus gesteuert werden. Die Bank will dieses Risiko klein halten und gibt deshalb \alpha = 0,05 vor.

Der Fehler 2. Art hat für die Bank keine schwerwiegenden Folgen, denn eine Verschärfung der Bewertungsrichtlinien, obwohl es aufgrund des gesetzten Kriteriums nicht notwendig gewesen wäre, ist nicht nachteilig.

Von dieser Hypothesenformulierung und dem vorgegebenen Signifikanzniveau \alpha = 0,05 wird bei den beiden folgenden Testvarianten ausgegangen.

Für die Durchführung des Tests soll eine einfache Zufallsstichprobe vom Umfang n aus den mehr als 10000 Kreditnehmern gezogen werden.

Bei der gegebenen Problemstellung ist es nicht sinnvoll, das Zufallsauswahlmodell mit Zurücklegen anzuwenden. Bei Einhaltung eines Auswahlsatzes von \frac{n}{N} \leq 0,05 kann jedoch eine Zufallsauswahl ohne Zurücklegen näherungsweise als eine einfache Zufallsstichprobe angesehen werden.

Stichprobenumfang n=30

Um die Kosten für die Überprüfung niedrig zu halten, wird der Stichprobenumfang auf n = 30 festgelegt. Die Forderung \frac{n}{N}\leq 0,05 wird eingehalten.

Teststatistik und Entscheidungsbereiche

Die Schätzfunktion X=\; "Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in einer Zufallsstichprobe von Umfang n = 30" kann unmittelbar als Teststatistik V\; verwendet werden.

V = X\; ist unter H_{0}\sim B(30; 0,2)-verteilt.

Eine kleine Anzahl von Kreditnehmern mit Rückzahlungsschwierigkeiten in der Stichprobe spricht dabei gegen die Nullhypothese.

Der kritische Wert x_{c} ist diejenige Realisation von X\;, für die F_{B}(x) den Wert \alpha = 0,05 gerade überschreitet, so dass gilt:

F_{B}(x_{c} - 1) \leq 0,05 und F_{B}(x_{c}) > 0,05.

In der Tabelle der Verteilungsfunktion der B(30; 0,2) findet man x_{c} = 3.

Damit folgt:

Ablehnungsbereich der H_{0}: \left\{v|v<3\right\}=\left\{0,1,2\right\}, mit P\left(V<3|0,2\right) =0,0442.

Nichtablehnungsbereich der H_{0}: \left\{v|v\geq 3\right\}=\left\{3,4,\ldots,30\right\}, mit P\left(V\geq 3|0,02\right) =0,9558.

Da V = X\; eine diskrete Zufallsvariable ist, wird das vorgegebene Signifikanzniveau von \alpha = 0,05 nicht voll ausgeschöpft. Es ist nur \alpha_{exakt}=0,0442.

Prüfwert und Testentscheidung

Aus den Kreditnehmern werden 30 zufällig ausgewählt und festgestellt, ob es Schwierigkeiten bei der Rückzahlung gab oder nicht.

Es habe sich x = 5 als Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in der Zufallsstichprobe ergeben, was gleichzeitig der Prüfwert v ist.

Da v = x = 5 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Der in der Stichprobe beobachtete Anteil \frac{5}{30} = 0,167 ist zwar kleiner als der hypothetische Wert \pi_{0}= 0,20, die Differenz zwischen beiden wird jedoch auf einem Signifikanzniveau von \alpha = 0,05 noch nicht als wesentlich angesehen.

Man beachte, dass bei Tests auf einem vorgegebenen Signifikanzniveau \alpha stets Entscheidungsbereiche (Nichtablehnungsbereich bzw. Ablehnungsbereich der H_{0}) der Testentscheidung zugrunde liegen und nicht nur die Punktschätzung.

Basierend auf einer Zufallsstichprobe vom Umfang n = 30 konnte statistisch nicht bewiesen werden, dass der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist. Die ABC-Bank wird ihre Bewertungskriterien überarbeiten.

Gütefunktion

Mit der Beibehaltung der Nullhypothese kann ein Fehler 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}) unterlaufen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit \pi_{0}=0,2,\; n = 30,\; \alpha = 0,05 und x_{c} = 3) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten \pi = 0,15 beträgt?

Für \pi = 0,15 gilt in Wirklichkeit die Alternativhypothese, so dass die Wahrscheinlichkeit für einen Fehler 2. Art gesucht wird:

\beta \left( \pi =0,15\right) =P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right) =P\left(V=X\in\mbox{ Nichtablehnungsbereich der }H_{0}|\pi =0,15\right)=P\left(V\geq 3|\pi=0,15\right)

Es ist

P\left( V\geq 3|\pi=0,15\right)=1-P\left(V<3|\pi=0,15\right)=1-P\left(V\leq 2|\pi=0,15\right)=1-0,1514=0,8486

wobei man P\left(V\leq 2|\pi=0,15\right) in der Tabelle der Verteilungsfunktion der B\left(30;\; 0,15\right) findet.

Im Fall eines wahren Anteils von \pi =0,15 wird in 84,86% aller Stichproben vom Umfang n = 30 die Abweichung vom hypothetischen Wert \pi_{0}=0,20, durch den Test nicht aufgedeckt.

Die Beibehaltung der Nullhypothese (\mbox{''}H_{0}\mbox{''}) im Ergebnis des Tests auf der Basis der konkreten Stichprobe veranlasst die Bank zur Verschärfung der Bewertungsrichtlinien; da jedoch mit \pi = 0,15 in Wirklichkeit die Alternativhypothese wahr ist, wäre die Veränderung der Bewertungsrichtlinien nicht notwendig.

\beta(\pi = 0,15) = 0,8496 ist somit die Wahrscheinlichkeit für eine nicht notwendige Veränderung der Richtlinien.

Obwohl sie recht hoch ist, stellt sie aber für die Bank bei der Testdurchführung nicht das entscheidende Problem dar (im Vergleich zur Wahrscheinlichkeit eines Fehlers 1. Art).

Mit der Beibehaltung der Nullhypothese kann aber auch eine richtige Entscheidung getroffen werden, wenn in Wirklichkeit die Nullhypothese richtig ist (\mbox{''}H_{0}\mbox{''}|H_{0}).

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit \pi_{0}=0,2,\; n = 30,\;\alpha = 0,05 und x_{c} = 3) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten \pi = 0,25 beträgt?

Für \pi = 0,25 gilt in Wirklichkeit die Nullhypothese, so dass folgende Wahrscheinlichkeit gesucht wird:

P\left( V=X \in \mbox{Nichtablehnungsbereich der }H_{0}|\pi=0,25\right) =P\left( V\geq 3|\pi =0,25\right) =P\left(\mbox{''}H_{0}\mbox{''}|H_{0}\right)=1-\alpha^{*}

Es ist

P\left(V\geq 3|\pi=0,25\right)=1-P\left(V\leq 2|\pi=0,25\right)=1-P\left(V\leq 2|\pi=0,25\right)=1-0,0106=0,9894

mit P\left( V\leq 2|\pi=0,25\right) aus der Tabelle der Verteilungsfunktion der B\left(30;\; 0,25\right)

Beide Wahrscheinlichkeitsberechnungen können für verschiedene zulässige Werte von \pi durchgeführt werden.

Eine geeignete Berechnungs- und Darstellungsweise ist die Gütefunktion G(\pi) bzw. 1 - G(\pi).

\pi Gültigkeit von G\left(\pi\right) 1-G\left(\pi\right)
0 H_{1} 1=1-\beta 0=\beta
0,05 H_{1} 0,8122=1-\beta 0,1878=\beta
0,10 H_{1} 0,4114=1-\beta 0,5886=\beta
0,15 H_{1} 0,1514=1-\beta 0,8486=\beta
0,20 H_{0} 0,0442=\alpha_{a} 0,9558=1-\alpha_{a}
0,25 H_{0} 0,0106=\alpha 0,9894=1-\alpha
0,30 H_{0} 0,0021=\alpha 0,9979=1-\alpha
0,35 H_{0} 0,0003=\alpha 0,9997=1-\alpha
0,40 H_{0} 0=\alpha 1=1-\alpha

Die nachstehende Abbildung zeigt die Gütefunktion für den linksseitigen Test mit \pi_{0}=0,20,\; n = 30,\; \alpha = 0,05 und x_{c} = 3.

Stichprobenumfang n=350

Die Statistik-Abteilung will nicht nur die Wahrscheinlichkeit des für die Bank schwerwiegenden Fehlers 1. Art durch die Vorgabe von \alpha = 0,05 niedrig halten, sondern auch erreichen, dass das Risiko für einen Fehler 2. Art nicht zu hoch ausfällt.

Da bekannt ist, dass bei festgelegtem Signifikanzniveau \alpha die Wahrscheinlichkeit \beta für einen Fehler 2. Art über die Erhöhung des Stichprobenumfangs verringert werden kann, entscheidet sich die Statistik-Abteilung gleich für einen großen Stichprobenumfang: n = 350. Die Forderung \frac{n}{N}\leq 0,05 wird eingehalten.

Teststatistik und Entscheidungsbereiche

Es wird die Teststatistik

V=\frac{\widehat{\pi }-\pi_{0}}{\sigma_{0}\left( \widehat{\pi }\right) }=
\frac{\widehat{\pi }-\pi_{0}}{\sqrt{\cfrac{\pi_{0}\left( 1-\pi_{0}\right) }{n}}}

verwendet, die bei Gültigkeit der Nullhypothese approximativ standardnormalverteilt ist, da aufgrund des sehr großen Stichprobenumfanges die Approximationsbedingungen erfüllt sind.

Für P(V \leq c) = 1 - \alpha = 0,95 findet man aus der Tabelle der Verteilungsfunktion der N(0; 1):\; c = z_{0,95} = 1,645, so dass wegen der Symmetrie der Normalverteilung der kritische Wert -c = - 1,645 ist.

Der approximative Ablehnungsbereich der H_{0} ist gegeben durch \left\{v|v<-1,645\right\}

Für den approximativen Nichtablehnungsbereich der H_{0} erhält man \left\{ v|v\geq -1,645\right\}

Prüfwert und Testentscheidung

Aus den Kreditnehmern werden 350 zufällig ausgewählt und festgestellt, ob es Schwierigkeiten bei der Rückzahlung gab oder nicht.

Es habe sich x = 63 als Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in der Zufallsstichprobe ergeben, womit der Anteil in der Stichprobe 0,18 beträgt.

Einsetzen in die Teststatistik führt zu dem Prüfwert:

v=\frac{0,18-0,2}{\sqrt{\cfrac{0,2\cdot 0,8}{350}}}=-0,935

Da v = - 0,935 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf einer Zufallsstichprobe vom Umfang n = 350 konnte statistisch nicht bewiesen werden, dass der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist.

Die ABC-Bank wird ihre Bewertungskriterien überarbeiten.

Wahrscheinlichkeit eines Fehlers 2. Art

Auch bei dieser Testvariante kann mit der Beibehaltung der Nullhypothese ein Fehler 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}) unterlaufen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Analog soll die Frage gestellt werden:

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit \pi_{0} = 0,2,\; n = 350,\; \alpha = 0,05) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten \pi = 0,15 beträgt?

Für \pi = 0,15 gilt in Wirklichkeit die Alternativhypothese, so dass die Wahrscheinlichkeit für einen Fehler 2. Art gesucht wird: \beta(\pi = 0,15)=P(\mbox{''}H_{0}\mbox{''}|H_{1}).

Zunächst wird der kritische Anteilswert p_{c} bei Gültigkeit der H_{0} ermittelt, der sich aus der Beziehung -c = \frac{p_{c} - \pi_{0}}{\sigma(\widehat{\pi})} zu p_{c} = \pi_{0} - c \cdot \sigma(\widehat{\pi }) = 0,2 - 1,645\left(0,2\cdot \frac{0,8}{350}\right) = 0,1648 ergibt.

\beta(\pi) ist somit die Wahrscheinlichkeit, dass die Schätzfunktion \widehat{\pi } einen Wert im Nichtablehnungsbereich der H_{0} annimmt, obwohl H_{1} gilt:

\beta \left( \pi =0,15\right) =P\left(\widehat{\pi}\geq p_{c}|\pi =0,15\right)=P\left(\widehat{\pi }\geq 0,1648|\pi =0,15\right)

Um diese Wahrscheinlichkeit aus der Tabelle der Standardnormalverteilung entnehmen zu können, muss ebenfalls eine Standardisierung vorgenommen werden, da jedoch H_{1} gilt mit E\left[\widehat{\pi }\right] =\pi =0,15 und Var\left(\widehat{\pi }\right) =\frac{\pi\left( 1-\pi \right)}{n}=\frac{0,15\cdot 0,85}{350}:

\beta \left( \pi =0,15\right) =P\left( \widehat{\pi }\geq p_{c}|\pi =0,15\right) =P\left( \frac{\widehat{\pi }-\pi_{0}}{\sqrt{\frac{\pi \left( 1-\pi \right) }{n}}}\geq \frac{p_{c}-\pi_{0}}{\sqrt{\frac{\pi\left( 1-\pi \right) }{n}}}|\pi =0,15\right)
 =P\left( V\geq \frac{0,1648-0,15}{\sqrt{\frac{0,15\cdot 0,85}{350}}}|\pi =0,15\right)=P\left( V\geq 0,775|\pi =0,15\right)

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man P\left( V\leq 0,775\right)=0,7808 und somit

\beta\left( \pi=0,15\right)=1-P\left( V\leq 0,775 \right)=1-0,7808=0,2192

Diese Wahrscheinlichkeit eines Fehlers 2. Art \beta\left( \pi=0,15\right) liegt deutlich unter vorheriger Variante mit Stichprobenumfang n=30. Dies resultiert aus der Erhöhung des Stichprobenumfanges.