Chi-Quadrat-Unabhängigkeitstest
Aus MM*Stat
Unterseiten Herleitung der Teststatistik • Beispiel: Mängel und Alter • Beispiel: Umfrage • R |
Grundbegriffe
Chi-Quadrat-Unabhängigkeitstest
Bei einem Chi-Quadrat-Unabhängigkeitstest wird geprüft, ob zwei Zufallsvariablen stochastisch unabhängig sind. Dieser statistische Test gehört zu den nichtparametrischen Tests.
An das Skalenniveau der Zufallsvariablen werden keine Voraussetzungen gestellt.
Es sei allgemein angenommen, dass zwei Zufallsvariablen und gleichzeitig an statistischen Einheiten () beobachtet werden, wobei die Unabhängigkeit der Stichprobenziehungen vorausgesetzt wird (einfache Zufallsstichprobe).
Sind und diskrete Zufallsvariablen (darunter werden im weiteren summarisch nominalskalierte, ordinalskalierte sowie diskrete Zufallsvariablen mit sehr wenigen Ausprägungen verstanden), nehmen sie die Stichprobenrealisationen und an.
Sind und stetige Zufallsvariablen (darunter werden im weiteren auch die diskreten Zufallsvariablen mit sehr vielen bzw. unendlich vielen Ausprägungen, d.h. die genannten quasi-stetigen Zufallsvariablen, gefasst), muss eine Intervallbildung der beobachteten Werte in disjunkte, aneinander angrenzende Klassen erfolgen.
und sind dann repräsentative Klassenwerte (im Allgemeinen die Klassenmitten) und und die Anzahl der gebildeten Klassen.
Eine geeignete Darstellungsform für die beobachtete gemeinsame Häufigkeitsverteilung der zwei Zufallsvariablen ist die zweidimensionale Häufigkeitstabelle (auch als Kontingenztabelle oder Kreuztabelle bezeichnet).
Zweidimensionale Häufigkeitstabelle:
RV | |||||||
RV |
bezeichnet die absolute Häufigkeit für das beobachtete Wertepaar , d.h. dass den Wert bzw. einen Wert aus der -ten Klasse und gleichzeitig den Wert bzw. einen Wert aus der -ten Klasse angenommen hat:
Die letzte Spalte enthält die beobachtete Randverteilung (RV) von mit den absoluten Randhäufigkeiten .
gibt an, wie oft den Wert bzw. einen Wert aus der -ten Klasse angenommen hat, wobei es gleichgültig ist, welchen Wert aufweist.
Die letzte Zeile weist die beobachtete Randverteilung von mit den absoluten Randhäufigkeiten aus.
gibt an, wie oft den Wert bzw. einen Wert aus der -ten Klasse angenommen hat, wobei es gleichgültig ist, welchen Wert aufweist.
Für die zweidimensionale Häufigkeitstabelle gelten folgende Beziehungen:
.
Die Nullhypothese lautet beim Chi-Quadrat-Unabhängigkeitstest stets, dass die Zufallsvariablen und in der Grundgesamtheit stochastisch unabhängig sind. Die Alternativhypothese enthält das logische Pendant.
: und sind stochastisch unabhängig.
: und sind nicht stochastisch abhängig.
Wenn die Nullhypothese gilt, dann ergibt sich nach dem Multiplikationssatz bei Unabhängigkeit
Dabei bezeichnen:
die Wahrscheinlichkeit, dass die Zufallsvariable den Wert bzw. einen Wert aus der -ten Klasse und gleichzeitig den Wert bzw. einen Wert aus der -ten Klasse annimmt;
die Wahrscheinlichkeit, dass die Zufallsvariable den Wert bzw. einen Wert aus der -ten Klasse annimmt (Randwahrscheinlichkeit von ) und
die Wahrscheinlichkeit, dass die Zufallsvariable den Wert bzw. einen Wert aus der -ten Klasse annimmt (Randwahrscheinlichkeit von ).
Das Hypothesenpaar kann somit konkretisiert werden:
für alle Paare
für mindestens ein Paar
Das Signifikanzniveau und der Stichprobenumfang sind vor der Testdurchführung festzulegen.
Teststatistik des Chi-Quadrat-Unabhängigkeitstests
Für die Bestimmung der Teststatistik wird von den absoluten Häufigkeiten ausgegangen. Der Test basiert auf dem Vergleich der in der Stichprobe beobachteten und der bei Gültigkeit der Nullhypothese erwarteten gemeinsamen absoluten Häufigkeiten.
Für die konkrete Stichprobe sind die gemeinsamen absoluten Häufigkeiten
in den Zellen der zweidimensionalen Häufigkeitstabelle gegeben. Da diese absoluten Häufigkeiten Ergebnis eines Zufallsexperimentes sind, können sie von Stichprobe zu Stichprobe unterschiedliche Werte annehmen, d.h., sie sind Realisationen von Zufallsvariablen .
Wenn die Nullhypothese gilt, ergeben sich die erwarteten gemeinsamen absoluten Häufigkeiten als .
Da die gemeinsamen Wahrscheinlichkeiten und die Randwahrscheinlichkeiten und für alle und unbekannt sind, müssen sie aus der Stichprobe geschätzt werden.
Erwartungstreue und konsistente Punktschätzungen für und sind die relativen Randhäufigkeiten und .
Das beinhaltet, dass von festen Randhäufigkeiten der zweidimensionalen Häufigkeitstabelle ausgegangen wird. Damit erhält man Schätzungen für die unter erwarteten gemeinsamen absoluten Häufigkeiten:
Der Vergleich zwischen den in der Stichprobe beobachteten und den bei Gültigkeit der Nullhypothese erwarteten gemeinsamen absoluten Häufigkeiten baut auf den Differenzen auf.
Eine summarische Größe, die die Abweichung von der Nullhypothese bewertet, ist die Teststatistik
Bei Gültigkeit der Nullhypothese ist die Teststatistik approximativ Chi-Quadrat-verteilt mit Freiheitsgraden.
Die Approximation an die Chi-Quadrat-Verteilung ist hinreichend, wenn für alle gilt.
Ist diese Bedingungen nicht erfüllt, müssen vor der Anwendung des Tests benachbarte Werte bzw. Klassen zusammengefaßt werden. und sind die Anzahlen der verbliebenen Werte bzw. Klassen nach einer eventuell notwendigen Zusammenfassung.
Der kritische Wert wird für und die Anzahl der Freiheitsgrade aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung entnommen.
Entscheidungsbereiche des Chi-Quadrat-Unabhängigkeitstests
Die Entscheidungsbereiche sind:
Die Wahrscheinlichkeit, dass die Teststatistik eine Realisation aus dem Ablehnungsbereich der annimmt, entspricht dem vorgegebenen Signifikanzniveau .
Die Wahrscheinlichkeit, dass die Teststatistik eine Realisation aus dem Nichtablehnungsbereich der annimmt, ist .
Nichtablehnungsbereich der | Ablehnungsbereich der
Prüfwert des Chi-Quadrat-Unabhängigkeitstests
Wenn die Zufallsstichprobe vom Umfang gezogen wurde, können die absoluten Häufigkeiten für alle beobachteten Wertepaare ermittelt, daraus die beobachteten Randhäufigkeiten für und bestimmt und die erwarteten absoluten Häufigkeiten berechnet werden.
Ist die Approximationsbedingung nicht erfüllt, müssen Werte bzw. Klassen geeignet zusammengefaßt und die Häufigkeiten , , und erneut bestimmt werden.
Einsetzen von und für alle in die Teststatistik führt zu einem Prüfwert .
Entscheidungssituationen des Chi-Quadrat-Unabhängigkeitstests
Wenn in den Ablehnungsbereich der fällt, wird die Nullhypothese auf dem Signifikanzniveau und basierend auf der Zufallsstichprobe vom Umfang abgelehnt .
Es konnte statistisch gezeigt werden, dass die Zufallsvariablen und nicht stochastisch unabhängig sind.
Bei dieser Entscheidung besteht die Möglichkeit einen Fehler 1. Art zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau .
Wenn in den Nichtablehnungsbereich der fällt, wird die Nullhypothese basierend auf der Zufallsstichprobe vom Umfang nicht abgelehnt .
Das Stichprobenergebnis gibt keine Veranlassung, die Unabhängigkeit der Zufallsvariablen und zu verwerfen.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 2. Art zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.
Beispiele
Mängel und Alter
Es wird vermutet, dass die Anzahl der festgestellten Mängel an einem Pkw und das Alter des Pkw stochastisch unabhängig sind.
Um diese Annahme zu überprüfen, wird ein Chi-Quadrat-Unabhängigkeitstest auf einem Signifikanzniveau von durchgeführt.
Für die Zufallsvariable : "Anzahl der Mängel am Pkw" werden die Realisationen = "kein Mangel", = "1 Mangel" und = "2 oder mehr Mängel" und
für die Zufallsvariable : "Alter des Pkw" die Realisationen = "bis einschließlich 1 Jahr", = "über 1 Jahr bis einschließlich 2 Jahre" und = "2 Jahre oder älter" betrachtet.
Da stets die Nullhypothese statistischgeprüft wird, muss die Unabhängigkeit zwischen und als formuliert werden, um die gemeinsamen erwarteten absoluten Häufigkeiten ermitteln zu können, so dass das Hypothesenpaar lautet:
und sind stochastisch unabhängig.
und sind nicht stochastisch unabhängig.
bzw.
für alle Paare
für mindestens ein Paar
Teststatistik
Es wird die Teststatistik des Chi-Quadrat-Unabhängigkeitstests verwendet:
die bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteiltist mit der Anzahl der Freiheitsgrade .
Die Entscheidungsbereiche der Nullhypothese können erst nach Vorliegen der Stichprobe festgelegt werden, da
- die gemeinsamen erwarteten absoluten Häufigkeiten aus der Stichprobe zu schätzen sind,
- erst dann die Approximationsbedingung überprüft werden kann und ersichtlich ist, ob Werte bzw. Klassen zusammenzufassen sind,
- erst danach die Anzahl der Freiheitsgrade feststeht und der kritische Wert aufgesucht werden kann.
Entscheidungsbereiche und Prüfwert
Bei einer konkreten Polizeikontrolle an verschiedenen Straßenstellen, wobei die Auswahl der Pkw zufällig erfolgte, wurde die Anzahl der Mängel und das Alter an 110 Pkw registriert.
Die sich aus der Stichprobe ergebenden gemeinsamen absoluten Häufigkeiten und Randhäufigkeiten sind in der folgenden Tabelle enthalten.
Gleichzeitig wurden in den Zellen dieser Tabelle die geschätzten gemeinsamen absoluten Häufigkeiten bei Gültigkeit der Nullhypothese aufgenommen, die sich gemäß
ergeben (gerundet auf eine Dezimalstelle).
Mängelanzahl | Alter | RV | |||
1-2 | 2 oder älter | ||||
0 | beobachtet | 30 | 14 | 5 | 49 |
erwartet | 26,7 | 13,4 | 8,9 | ||
1 | beobachtet | 18 | 10 | 4 | 32 |
erwartet | 17,5 | 8,7 | 5,8 | ||
2 oder mehr | beobachtet | 12 | 6 | 11 | 29 |
erwartet | 15,8 | 7,9 | 5,3 | ||
RV | 60 | 30 | 20 | 110 |
Die Approximationsbedingung ist erfüllt, da alle sind. Mit und folgt für die Anzahl der Freiheitsgrade: .
Für und findet man aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert .
Die Entscheidungsbereiche sind damit:
Als Prüfwert ergibt sich:
Testentscheidung
Da in den Ablehnungsbereich der fällt, wird die Nullhypothese abgelehnt .
Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch bewiesen werden, dass die Zufallsvariablen : "Anzahl der Mängel am Pkw" und : "Alter des Pkw" stochastisch unabhängig sind.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau .