Chi-Quadrat-Anpassungstest/Beispiel: Produktnachfrage (1.Version)

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Produktnachfrage (1. Version)

Eine Vertriebsgesellschaft führt eine umfassende Analyse ihrer Geschäftsaktivitäten durch, worunter auch die tägliche Nachfrage nach einem ihrer Spezialprodukte fällt.

In diesem Zusammenhang ist von besonderem Interesse, welche Verteilung die Anzahl der täglich nachgefragten Produkte aufweist.

Bei der Nachfrage nach dem Produkt handelt es sich um ein Ereignis, dass wiederholt, jedoch zufällig und unabhängig voneinander in einem Kontinuum (hier: Zeit) vorgegebenen Umfangs (hier: Tag) auftreten kann.

Die Zufallsvariable X\; bezeichne die Anzahl der täglich nachgefragten Produkte und ist diskret.

Es wird somit vermutet (vgl. Abschnitt "Poisson-Verteilung"), dass die Poisson-Verteilung ein adäquates Verteilungsmodell ist: X \sim PO(\lambda)\;.

Der Test soll auf einem Signifikanzniveau von \alpha = 0,05 durchgeführt werden. Eine einfache Zufallsstichprobe von n = 50 Tagen lieferte die beobachteten Daten, die in den Spalten 2 und 3 der Tabelle 1 enthalten sind.

Ein langjähriger Mitarbeiter der Firma vermutet aufgrund seiner Erfahrung, dass im Mittel neun Produkte an den 5 Werktagen einer Woche nachgefragt werden.

Da für den Erwartungswert der Poisson-Verteilung E[X] = \lambda gilt und als Zeitintervall ein Tag betrachtet wird, ist \lambda = 1,8 und es wird folgendes Hypothesenpaar formuliert:

H_{0}:X\; ist Poisson-verteilt mit dem Parameter \lambda =1,8, d.h. X\sim PO\left( 1,8\right)

H_{1}:X\; ist nicht PO\left( 1,8\right)-verteilt.

In den Spalten 4 und 5 der Tabelle 1 sind die unter H_{0} erwarteten Wahrscheinlichkeiten P(X = x_{j}|H_{0})=p_{j} (die aus der Tabelle der PO(1,8) entnommen wurden) sowie die erwarteten absoluten Häufigkeiten n\cdot p_{j} enthalten.

Tabelle 1

j\; Anzahl nachgefragter

Produkte (x_{j})

Anzahl der Tage mit x_{j}

nachgefragten Produkten (h_{j})

p_{j}=P\left(X=x_{j}|H_{0}\right) n\cdot p_{j}|H_{0}
1 0 3 0,1653 8,265
2 1 9 0,2975 14,875
3 2 14 0,2678 13,390
4 3 13 0,1607 8,035
5 4 6 0,0723 3,615
6 5 5 0,0260 1,300
7 6 und mehr 0 0,0104 0,520

Teststatistik und Entscheidungsbereiche

Es wird die Teststatistik des Chi-Quadrat-Anpassungstests

V=\sum_{j=1}^{k}\frac{\left(H_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}

verwendet. Sie ist bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteilt mit f = k - m - 1 Freiheitsgraden.

Überprüfung der Approximationsbedingungen:

Wie aus der Spalte 5 der Tabelle 1 ersichtlich, ist für die Realisationen x_{5} = 4 und x_{6} = 5 die Approximationsbedingung n\cdot p_{j} \geq 5 und für die Realisation x_{7} = 6 und mehr sogar die Bedingung n\cdot p_{j} \geq 1 nicht erfüllt, so dass diese 3 Realisationen zusammengefasst werden.

Bestimmung der Anzahl der Freiheitsgrade:

Nach der Zusammenfassung verbleiben noch k = 5 Klassen. Die Poisson-Verteilung wurde als eine vollständig spezifizierte Verteilung vorgeben, d.h. es ist kein Parameter aus der Stichprobe zu schätzen, womit m = 0 ist. Damit ist f = 5 - 1 = 4.

Unter H_{0} ist die Teststatistik V\; approximativ Chi-Quadrat-verteilt mit f = 4 Freiheitsgraden.

Für P(V \leq c) = 0,95 und f = 4 findet man in der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert c=\chi_{1-\alpha;k-m-1}^{2}=\chi_{0,95;4}^{2}=9,49.

Die Entscheidungsbereiche sind damit:

Ablehnungsbereich der H_{0}:\; \left\{ v|v>9,49\right\}

Nichtablehnungsbereich der H_{0}:\;\left\{v|v\leq 9,49\right\}.

Prüfwert und Testentscheidung

Die Tabelle 2 enthält alle notwendigen Zwischenergebnisse für die Berechnung des Prüfwertes.

Tabelle 2

x_{j}\; h{j}\; n\cdot p_{j} h_{j}-n\cdot p_{j} \left(h_{j}-n\cdot p_{j}\right)^{2} \frac{\left(h_{j}-n\cdot p_{j}\right)^{2}}{n\cdot p_{j}}
0 3 8,265 -5,265 27,7202 3,3539
1 9 14,875 -5,875 34,5156 2,3204
2 14 13,390 0,610 0,3721 0,0278
3 13 8,035 4,965 24,6512 3,0680
4 und mehr 11 5,435 5,565 30,9692 5,6981

Der Prüfwert ergibt sich als Summe der Werte in der letzten Spalte: v=14,4682.

Da v in den Ablehnungsbereich der H_{0} fällt, wird die Nullhypothese abgelehnt (\mbox{''}H_{1}\mbox{''}).

Auf einem Signifikanzniveau von \alpha = 0,05 und basierend auf einer Zufallsstichprobe vom Umfang n = 50 konnte statistisch bewiesen werden, dass die Verteilung der Zufallsvariablen X\;: "Anzahl der täglich nachgefragten Produkte" nicht eine PO(1,8) ist.

Das bedeutet jedoch nicht, dass das Verteilungsmodell der Poisson-Verteilung damit grundsätzlich verworfen wird, sondern nur dass die spezielle Poisson-Verteilung PO(1,8) nicht als die geeignete Verteilung anzusehen ist.

Bei dieser Entscheidung für H_{1} besteht die Möglichkeit, einen Fehler 1. Art (\mbox{''}H_{1}\mbox{''}| H_{0}) zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.

Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau \alpha = 0,05.