Test auf Anteilswert/Beispiel: Statistik-Bücher

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Statistik-Bücher

Ein Statistik-Professor vermutet, dass es im letzten Jahr deutliche Verschiebungen im Anteil der Neuzugänge an Büchern in der Universitätsbibliothek zuungunsten der Statistik-Literatur gegeben hat.

In der Vergangenheit betrug der Anteil der Statistik-Literatur an allen Neuzugängen der Bibliothek mehr als 10%. Er beauftragt deshalb seinen Assistenten mit einer Überprüfung.

Dabei will er im Interesse seiner Studenten das Risiko, keinen Einspruch bei der Universitätsbibliothek einzulegen, obwohl der Anteil geringer geworden ist, klein halten.

Die Überprüfung läuft auf einen Test des Anteilswertes einer dichotomen Grundgesamtheit hinaus, wobei der hypothetische Wert \pi_{0} = 0,1 ist.

Die Grundgesamtheit ist in der Hinsicht dichotom, da eine weitere fachwissenschaftliche Untergliederung der Neuzugänge im Zusammenhang mit dem Test ohne Bedeutung ist, so dass nur zwei mögliche Ereignisse gegeben sind:

der Neuzugang ist ein Statistik-Buch und der Neuzugang ist kein Statistik-Buch.

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 und mittels einer einfachen Zufallsstichprobe vom Umfang n = 25 durchgeführt werden.

Da nur Abweichungen vom hypothetischen Wert nach einer Seite von Bedeutung sind, wird ein einseitiger Test durchgeführt.

Die Behauptung des Professors, dass der Anteil der Statistik-Lektüre an den Neuzugängen höchstens noch 10% beträgt, wird als Nullhypothese formuliert mit dem Ziel, sie möglichst abzulehnen.

Daraus ergibt sich ein rechtsseitiger Test:

H_{0}:\; \pi \leq \pi_{0}=0,1 \quad H_{1}:\; \pi > \pi_{0}=0,1

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Intention des Professors eingehalten wird.

Der bei der Ablehnung der H_{0} mögliche Fehler 1. Art hat folgenden Inhalt:

\mbox{''}H_{1}\mbox{''}|H_{0}= "Der Anteil der Statistik-Bücher an den Neuzugängen hat sich nicht verändert" | In Wirklichkeit hat er sich verringert.

Die Wahrscheinlichkeit eines Fehlers 1. Art P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right), ist das Signifikanzniveau \alpha, so dass mit dessen Vorgabe (hier \alpha = 0,05) das Risiko eines derartigen Fehlers gering gehalten werden kann.

Damit wird die Zielstellung des Professors bei der Durchführung des Tests eingehalten.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des dann möglichen Fehlers 2. Art:

\mbox{''}H_{0}\mbox{''}|H_{1}= "Der Anteil der Statistik-Bücher an den Neuzugängen hat sich verringert" | In Wirklichkeit ist alles wie vorher.

Die Wahrscheinlichkeit eines Fehlers 2. Art P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right) =\beta ist unbekannt, da der wahre Anteilswert \pi unter der Alternativhypothese nicht bekannt ist.

Diese Wahrscheinlichkeit für einen Fehler 2. Art, d.h. das Risiko für einen unberechtigten Einspruch des Professors bei der Universitätsbibliothek, kann sehr groß sein. Das muss der Professor jedoch in Kauf nehmen, da er andere Prioritäten für die Überprüfung gesetzt hatte.

Teststatistik und Entscheidungsbereiche

Die Schätzfunktion X\; "Anzahl der Statistik - Bücher in einer Zufallsstichprobe von Umfang n = 25" kann unmittelbar als Teststatistik V\; verwendet werden.

V = X\; ist unter H_{0} \sim B( 25;\;0,1)-verteilt.

Eine große Anzahl von Statistik-Büchern in der Stichprobe spricht dabei gegen die Nullhypothese und für die Alternativhypothese, d.h. für einen nicht gesunkenen Anteil der Statistik-Bücher an den Neuzugängen.

Der kritische Wert x_{c} ist diejenige Realisation von X\;, für die F_{B}\left( x\right) den Wert 1-\alpha =0,95 gerade erreicht oder überschreitet, so dass gilt F_{B}\left( x_{c}-1\right) <1-\alpha=0,95 und F_{B}\left(x_{c}\right) \geq 1-\alpha =0,95.

In der Tabelle der Verteilungsfunktion der B(25;\; 0,1) findet man x_{c} = 5.

Der Ablehnungsbereich der H_{0} ist damit gegeben durch

\left\{ v|v>5\right\}=\left\{6,7,\ldots ,25\right\} mit P\left( V>5|0,1\right) =0,0334=\alpha_{exakt}.

Da V = X\; eine diskrete Zufallsvariable ist, wird das vorgegebene Signifikanzniveau von \alpha = 0,05 nicht voll ausgeschöpft. Es ist nur \alpha_{exakt}= 0,0334.

Für den Nichtablehnungsbereich der H_{0} erhält man:

\left\{v|v\leq 5\right\} =\left\{0,1,2,3,4,5\right\} mit P\left(V\leq 5|0,1\right) =0,9666.

Prüfwert und Testentscheidung

Aus den Neuzugängen an Büchern in der Universitätsbibliothek im letzten Jahr werden 25 Bücher zufällig ausgewählt und festgestellt, ob es sich um ein Statistik-Buch handelt oder nicht.

Da die Gesamtheit aller Neuzugänge an Büchern pro Jahr in der Universitätsbibliothek als genügend groß anzusehen ist, spielt es kaum eine Rolle, ob eine Zufallsauswahl mit oder ohne Zurücklegen durchgeführt wird.

Eine einfache Zufallsstichprobe kann unterstellt werden.

Es habe sich x = 3 als Anzahl der Statistik-Bücher in der Zufallsstichprobe ergeben, was gleichzeitig der Prüfwert v ist.

Da v = x = 3 in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf einer Zufallsstichprobe vom Umfang n = 25 konnte statistisch nicht bewiesen werden, dass der Anteil der Statistik-Bücher an den Neuzugängen der Universitätsbibliothek dem bisherigen Anteil von mehr als 10% entspricht. Der Professor wird Einspruch bei der Universitätsbibliothek einlegen.

Gütefunktion

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem rechtsseitigen Test (mit \pi_{0}=0,1,\; n=25,\; \alpha =0,05 und x_{c}=5) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0,2 betragen würde?

Gesucht ist die Wahrscheinlichkeit für einen Fehler 2. Art unter der Bedingung, dass \pi = 0,2 wahr ist:

P\left(\mbox{''}H_{0}\mbox{''}|H_{1}\right)=P\left( V=X\in \mbox{Nichtablehnungsbereich der } H_{0}|\pi =0,2\right) =P\left( V\leq 5|\pi =0,2\right)

Diese Wahrscheinlichkeit kann direkt aus der Tabelle der Verteilungsfunktion der B(25; 0,2) entnommen werden. Sie beträgt 0,6167.

Im Fall eines wahren Anteils von \pi = 0,2 wird in 61,67% aller Stichproben vom Umfang n = 25 die Abweichung vom hypothetischen Wert \pi_{0} = 0,1 durch den Test nicht aufgedeckt und ist die Wahrscheinlichkeit eines unberechtigten Einspruchs des Professors bei der Universitätsbibliothek.

Die Wahrscheinlichkeit eines Fehlers 2. Art kann auch über die Gütefunktion berechnet werden.

Die folgende Tabelle enthält für verschiedene zulässige Werte von \pi die Gütefunktion G( \pi ) und 1 - G( \pi ) für den oben durchgeführten rechtsseitigen Test

\pi Gültigkeit von G\left( \pi\right) 1-G\left( \pi\right)
0 H_{0} 0=\alpha 1=1-\alpha
0,05 H_{0} 0,0012=\alpha 0,9988=1-\alpha
0,1 H_{0} 0,0334=\alpha_{a} 0,9666=1-\alpha_{a}
0,15 H_{1} 0,1615=1-\beta 0,8385=\beta
0,20 H_{1} 0,3833=1-\beta 0,6167=\beta
0,25 H_{1} 0,6217=1-\beta 0,3783=\beta
0,30 H_{1} 0,8065=1-\beta 0,1935=\beta
0,35 H_{1} 0,9174=1-\beta 0,0826=\beta
0,40 H_{1} 0,9706=1-\beta 0,0294=\beta
0,45 H_{1} 0,9914=1-\beta 0,0086=\beta
0,50 H_{1} 0,9980=1-\beta 0,0020=\beta
0,60 H_{1} 0,9999=1-\beta 0,0001=\beta
0,70 H_{1} 1=1-\beta 0=\beta

Wenn z.B. der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0 ist, kann auf keinen Fall ein Statistik-Buch in der Stichprobe enthalten sein, d.h. man wird x = 0 erhalten und die Nullhypothese nicht ablehnen.

Die Ablehnung der Nullhypothese, d.h. \mbox{''}H_{1}\mbox{''}, ist ein unmögliches Ereignis.

Für die Gütefunktion, die für \pi = 0 die Wahrscheinlichkeit eines Fehlers 1. Art beinhaltet, folgt:

G\left(\pi = 0 \right) =P\left( V=X\in \mbox{ Ablehnungsbereich der } H_{0}|\pi =0\right) =P\left(\mbox{''}H_{1}\mbox{''}|0\right) =0

Wenn dagegen der wahre Anteil der Statistik-Bücher an den Neuzugängen \pi = 0,35 wäre, ergibt sich die Gütefunktion zu:

G\left(0,35\right)=P\left(V>5|\pi=0,35\right)=1-P\left(V\leq5|\pi=0,35\right)=1-0,0826=0,9174

wobei man P\left( V\leq 5|\pi=0,35\right) aus der Tabelle der Verteilungsfunktion der B(25; 0,35) für x_{c}=5 findet.

G(\pi = 0,35) beinhaltet die Wahrscheinlichkeit einer berechtigten Ablehnung der Nullhypothese, d.h. P\left(\mbox{''}H_{1}\mbox{''}|H_{1}\right)=1- \beta.

Die Wahrscheinlichkeit eines Fehlers 2. Art ist \beta(\pi= 0,35) =1 - G( \pi = 0,35)= 0,0826. Im Fall eines wahren Anteils von \pi =0,35 wird in 8,26% aller Stichproben vom Umfang n = 25 die Abweichung vom hypothetischen Wert \pi_{0} = 0,1 durch den Test nicht aufgedeckt.

Die nachstehende Abbildung zeigt die Gütefunktion für den rechtsseitigen Test mit \pi_{0}= 0,1,\; n = 25,\; \alpha = 0,05 und x_{c} = 5.