Chi-Quadrat-Anpassungstest/Beispiel: Produktnachfrage (2.Version)
Aus MM*Stat
Beispiele
Produktnachfrage (2. Version)
Eine Vertriebsgesellschaft führt eine umfassende Analyse ihrer Geschäftsaktivitäten durch, worunter auch die tägliche Nachfrage nach einem ihrer Spezialprodukte fällt.
In diesem Zusammenhang ist von besonderem Interesse, welche Verteilung die Anzahl der täglich nachgefragten Produkte aufweist.
Bei der Nachfrage nach dem Produkt handelt es sich um ein Ereignis, dass wiederholt, jedoch zufällig und unabhängig voneinander in einem Kontinuum (hier: Zeit) vorgegebenen Umfangs (hier: Tag) auftreten kann.
Die Zufallsvariable bezeichne die Anzahl der täglich nachgefragten Produkte und ist diskret.
Es wird somit vermutet (vgl. Abschnitt "Poisson-Verteilung"), dass die Poisson-Verteilung ein adäquates Verteilungsmodell ist: .
Der Test soll auf einem Signifikanzniveau von durchgeführt werden. Eine einfache Zufallsstichprobe von Tagen lieferte die beobachteten Daten, die in den Spalten 2 und 3 der Tabelle 1 enthalten sind.
Es wird auch bei dieser Version vermutet, dass die Poisson-Verteilung ein adäquates Verteilungsmodell ist: .
Es liegen jedoch keine Erkenntnisse bzw. Erfahrungen über den Parameter vor. Der unbekannte Parameter muss aus der Stichprobe geschätzt werden.
Es wird die Zufallsstichprobe vom Umfang aus der 1. Version verwendet. Wegen ist der Stichprobenmittelwert
eine geeignete Schätzfunktion. Als gewogenes arithmetisches Mittel aus der Stichprobe resultiert: .
Das Hypothesenpaar lautet damit:
ist Poisson-verteilt mit dem Parameter , d.h.
ist nicht -verteilt.
In den Spalten 4 und 5 der Tabelle 3 sind die unter geschätzten hypothetischen Wahrscheinlichkeiten (die aus der Tabelle der entnommen wurden) und absoluten Häufigkeiten enthalten.
Tabelle 3
Anzahl nachgefragter
Produkte |
Anzahl der Tage mit
nachgefragten Produkten |
|||
1 | 0 | 3 | 0,0821 | 4,105 |
2 | 1 | 9 | 0,2052 | 10,260 |
3 | 2 | 14 | 0,2565 | 12,825 |
4 | 3 | 13 | 0,2138 | 10,690 |
5 | 4 | 6 | 0,1336 | 6,680 |
6 | 5 | 5 | 0,0668 | 3,340 |
7 | 6 und mehr | 0 | 0,0420 | 2,100 |
Teststatistik und Entscheidungsbereiche
Es wird wieder die Teststatistik
verwendet, die bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteilt mit Freiheitsgraden ist.
Überprüfung der Approximationsbedingungen:
Wie aus der Spalte 5 der Tabelle 3 ersichtlich, ist für die Realisation die Approximationsbedingung nicht erfüllt, so dass sie mit zusammengefasst wird.
Weiterhin ist für die Realisationen und und mehr die Approximationsbedingung nicht erfüllt, so dass diese beiden Realisationen zusammengefasst werden.
Bestimmung der Anzahl der Freiheitsgrade:
Nach der Zusammenfassung verbleiben noch Klassen. Da der Parameter aus der Stichprobe geschätzt werden musste, ist und somit .
Unter ist die Teststatistik approximativ Chi-Quadrat-verteilt mit Freiheitsgraden.
Für und findet man in der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert .
Die Entscheidungsbereiche sind damit:
Prüfwert und Testentscheidung
Die Tabelle 4 enthält alle notwendigen Zwischenergebnisse für die Berechnung des Prüfwertes
Tabelle 4
0-1 | 12 | 14,365 | -2,365 | 5,5932 | 0,3894 |
2 | 14 | 12,825 | 1,175 | 1,3806 | 0,1076 |
3 | 13 | 10,690 | 2,310 | 5,3361 | 0,4992 |
4 | 6 | 6,680 | -0,680 | 0,4624 | 0,0692 |
5 und mehr | 5 | 5,440 | -0,440 | 0,1936 | 0,0356 |
Der Prüfwert ergibt sich als Summe der Werte in der letzten Spalte: .
Da in den Nichtablehnungsbereich der fällt, wird die Nullhypothese nicht verworfen .
Basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass die Zufallsvariable "Anzahl der täglich nachgefragten Produkte" nicht einer folgt.
Bei dieser Entscheidung für besteht die Möglichkeit, einen Fehler 2. Art zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist jedoch unbekannt.