Chi-Quadrat-Anpassungstest/Produktnachfrage (2.Version)

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Produktnachfrage (2. Version)

Eine Vertriebsgesellschaft führt eine umfassende Analyse ihrer Geschäftsaktivitäten durch, worunter auch die tägliche Nachfrage nach einem ihrer Spezialprodukte fällt.

In diesem Zusammenhang ist von besonderem Interesse, welche Verteilung die Anzahl der täglich nachgefragten Produkte aufweist.

Bei der Nachfrage nach dem Produkt handelt es sich um ein Ereignis, dass wiederholt, jedoch zufällig und unabhängig voneinander in einem Kontinuum (hier: Zeit) vorgegebenen Umfangs (hier: Tag) auftreten kann.

Die Zufallsvariable X\; bezeichne die Anzahl der täglich nachgefragten Produkte und ist diskret.

Es wird somit vermutet (vgl. Abschnitt "Poisson-Verteilung"), dass die Poisson-Verteilung ein adäquates Verteilungsmodell ist: X \sim PO(\lambda)\;.

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 durchgeführt werden. Eine einfache Zufallsstichprobe von n = 50 Tagen lieferte die beobachteten Daten, die in den Spalten 2 und 3 der Tabelle 1 enthalten sind.

Es wird auch bei dieser Version vermutet, dass die Poisson-Verteilung ein adäquates Verteilungsmodell ist: X \sim PO(\lambda).

Es liegen jedoch keine Erkenntnisse bzw. Erfahrungen über den Parameter \lambda vor. Der unbekannte Parameter \lambda muss aus der Stichprobe geschätzt werden.

Es wird die Zufallsstichprobe vom Umfang n = 50 aus der 1. Version verwendet. Wegen E[X] = \lambda ist der Stichprobenmittelwert

\bar{X}=\frac{1}{n}\cdot\sum_{i=1}^{n}X_{i}

eine geeignete Schätzfunktion. Als gewogenes arithmetisches Mittel aus der Stichprobe resultiert: \bar{x} = 125/50 = 2,5.

Das Hypothesenpaar lautet damit:

H_{0}:X\; ist Poisson-verteilt mit dem Parameter \lambda =2,5, d.h. X\sim PO\left( 2,5\right)

H_{1}:X\; ist nicht PO\left( 2,5\right)-verteilt.

In den Spalten 4 und 5 der Tabelle 3 sind die unter H_{0} geschätzten hypothetischen Wahrscheinlichkeiten P(X = x_{j}|H_{0})=p_{j} (die aus der Tabelle der PO(2,5) entnommen wurden) und absoluten Häufigkeiten n\cdot p_{j} enthalten.

Tabelle 3

j\; Anzahl nachgefragter x_{j}

Produkte (x_{j})

Anzahl der Tage mit x_{j}

nachgefragten Produkten h{j}

p_{j}=P\left(X=x_{j}|H_{0}\right) n\cdot p_{j}|H_{0}
1 0 3 0,0821 4,105
2 1 9 0,2052 10,260
3 2 14 0,2565 12,825
4 3 13 0,2138 10,690
5 4 6 0,1336 6,680
6 5 5 0,0668 3,340
7 6 und mehr 0 0,0420 2,100

Teststatistik und Entscheidungsbereiche

Es wird wieder die Teststatistik

V=\sum_{j=1}^{k}\frac{\left( H_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}

verwendet, die bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteilt mit f=k -m-1 Freiheitsgraden ist.

Überprüfung der Approximationsbedingungen:

Wie aus der Spalte 5 der Tabelle 3 ersichtlich, ist für die Realisation x_{1}=0 die Approximationsbedingung n\cdot p_{j}\geq 5 nicht erfüllt, so dass sie mit x_{2} zusammengefasst wird.

Weiterhin ist für die Realisationen x_{6} = 5 und x_{7} = 6 und mehr die Approximationsbedingung n\cdot p_{j}\geq 5 nicht erfüllt, so dass diese beiden Realisationen zusammengefasst werden.

Bestimmung der Anzahl der Freiheitsgrade:

Nach der Zusammenfassung verbleiben noch k = 5 Klassen. Da der Parameter \lambda aus der Stichprobe geschätzt werden musste, ist m=1 und somit f=5-1-1=3.

Unter H_{0} ist die Teststatistik V\; approximativ Chi-Quadrat-verteilt mit f = 3 Freiheitsgraden.

Für P(V \leq c) = 0,95 und f = 3 findet man in der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert c=\chi_{1-\alpha ;f}^{2}=\chi_{0,95;3}^{2}=7,81.

Die Entscheidungsbereiche sind damit:

Ablehnungsbereich der H_{0}:\; \left\{ v|v>7,81\right\}

Nichtablehnungsbereich der H_{0}:\;\left\{ v|v\leq 7,81\right\}.

Prüfwert und Testentscheidung

Die Tabelle 4 enthält alle notwendigen Zwischenergebnisse für die Berechnung des Prüfwertes

Tabelle 4

x_{j}\; h{j}\; n\cdot p_{j} h_{j}-n\cdot p_{j} \left(h_{j}-n\cdot p_{j}\right)^{2} \frac{\left(h_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}
0-1 12 14,365 -2,365 5,5932 0,3894
2 14 12,825 1,175 1,3806 0,1076
3 13 10,690 2,310 5,3361 0,4992
4 6 6,680 -0,680 0,4624 0,0692
5 und mehr 5 5,440 -0,440 0,1936 0,0356

Der Prüfwert ergibt sich als Summe der Werte in der letzten Spalte: v=1,101.

Da v in den Nichtablehnungsbereich der H_{0} fällt, wird die Nullhypothese nicht verworfen (\mbox{''}H_{0}\mbox{''}).

Basierend auf einer Zufallsstichprobe vom Umfang n = 50 konnte statistisch nicht bewiesen werden, dass die Zufallsvariable X:\; "Anzahl der täglich nachgefragten Produkte" nicht einer PO(2,5) folgt.

Bei dieser Entscheidung für H_{0} besteht die Möglichkeit, einen Fehler 2. Art (\mbox{''}H_{0}\mbox{''}|H_{1}) zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.

Die Wahrscheinlichkeit für einen Fehler 2. Art P(\mbox{''}H_{0}\mbox{''}| H_{1}) = \beta ist jedoch unbekannt.