Chi-Quadrat-Anpassungstest/Beispiel: Würfel

Aus MM*Stat

< Chi-Quadrat-Anpassungstest
Version vom 22. November 2018, 16:05 Uhr von Siskosth (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Beispiele

Würfel

Von einem gegebenen Würfel wird behauptet, dass es sich um einen fairen Würfel handelt.

Um diese Behauptung zu überprüfen, wird ein Chi-Quadrat-Anpassungstest auf dem Signifikanzniveau von \alpha =0,1 durchgeführt. Der Umfang der Stichprobe sei n=240.

Die interessierende Zufallsvariable ist X\;: "Geworfene Augenzahl des Würfels" mit den möglichen Realisationen x_{1}=1,\; x_{2}=2,\;x_{3}=3,\;x_{4}=4,\;x_{5}=5 und x_{6}=6. X\; ist eine diskrete Zufallsvariable.

Die Verteilung F(x) ist unbekannt, da nichts über den vorliegenden Würfel bekannt ist. Die Behauptung, dass es sich um einen fairen Würfel handelt, impliziert jedoch, dass die sechs möglichen Realisationen alle die gleiche Wahrscheinlichkeit des Eintretens aufweisen.

Es ist somit die Hypothese zu prüfen, dass die Zufallsvariable X\; eine diskrete Gleichverteilung aufweist, woraus sich das Hypothesenpaar

H_{0}:\; X ist diskret gleichverteilt

H_1:\; X ist nicht diskret gleichverteilt

ergibt.

Bei Gültigkeit der Nullhypothese folgt aufgrund der klassischen Definition der Wahrscheinlichkeit P(X = x_{j}) = p_{j} = \frac{1}{6} für alle j = 1,\ldots, 6, so dass die Hypothesen konkretisiert werden können:

H_{0}:\;P\left(X=x_{j}\right)=p_{j}=\frac{1}{6},\quad\forall j=1,\ldots ,6

H_{1}:\;P\left(X=x_{j}\right) \neq \frac{1}{6}, \quad für mindestens ein j

Teststatistik und Entscheidungsbereiche

Es wird die Teststatistik des Chi-Quadrat-Anpassungstests

V=\sum_{j=1}^{k}\frac{\left(H_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}

verwendet.

Sie ist bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteilt, da wegen n\cdot p_{j}=40>5 für alle j=1,\ldots ,6 die Approximationsbedingungen erfüllt sind.

Die diskrete Gleichverteilung ist eine vollständig spezifizierte Verteilung, d.h. es ist kein Parameter aus der Stichprobe zu schätzen, womit m = 0 ist.

Die Anzahl der Werte ist k = 6. Damit resultiert für die Anzahl der Freiheitsgrade: f = k - m - 1 = 5.

Für P\left( V\leq c\right) =1-\alpha =0,9 und f = 5 findet man in der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert c=\chi_{1-\alpha ;k-m -1}^{2}=\chi_{0,90;5}^{2}=9,24.

Die Entscheidungsbereiche sind damit:

Ablehnungsbereich der H_{0}: \left\{v|v>9,24\right\}

Nichtablehnungsbereich der H_{0}:\;\left\{ v|v\leq 9,24\right\}.

Prüfwert und Testentscheidung

Der Würfel wird 240 mal geworfen. Dabei handelt es sich um eine einfache Zufallsstichprobe, denn die Voraussetzung der Unabhängigkeit der Würfe ist gegeben.

Spalte 2 der folgenden Tabelle enthält die beobachtete Anzahl der Augenzahlen h_{j}

Augenzahl x_{j} beobachtete Anzahl h_{j} unter H_{0} erwartete Anzahl n\cdot p_{j} h_{j}-n\cdot p_{j} \left( h_{j}-n\cdot p_{j}\right)^{2} \frac{\left( h_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}
1 52 40 12 144 3,6
2 50 40 10 100 2,5
3 32 40 -8 64 1,6
4 36 40 -4 16 0,4
5 32 40 -8 64 1,6
6 38 40 -2 4 0,2

Abweichungen zwischen den beobachteten Anzahlen und den unter H_{0} erwarteten Anzahlen sind gegeben.

Können diese Abweichungen noch als zufällig angesehen werden, wenn es sich um einen fairen Würfel handeln soll?

Der Prüfwert ergibt sich als Summe der Werte in der letzten Spalte: v = 9,8

Da v in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt (\mbox{''}H_{1}\mbox{''}).

Auf einem Signifikanzniveau von \alpha=0,1 und basierend auf einer Zufallsstichprobe vom Umfang n = 240 konnte statistisch bewiesen werden, dass die Verteilung der Zufallsvariablen X\;: "Geworfene Augenzahl des Würfels" keiner diskreten Gleichverteilung entspricht, d.h. der vorliegende Würfel kein fairer Würfel ist.

Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art (\mbox{''}H_{1}\mbox{''}|H_{0}) zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.

Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau \alpha = 0,1.