|
|
Zeile 1: |
Zeile 1: |
| {{Testtheorie}} | | {{Testtheorie}} |
| {{SubpageToc|Herleitung der Teststatistik|Beispiel: Mängel und Alter|R}} | | {{SubpageToc|Herleitung der Teststatistik|Beispiel: Mängel und Alter|Beispiel: Umfrage|R}} |
|
| |
|
| ==Grundbegriffe== | | ==Grundbegriffe== |
Zeile 337: |
Zeile 337: |
|
| |
|
| Die [[Wahrscheinlichkeit]] für einen [[Fehler 1. Art]] entspricht dem vorgegebenen [[Signifikanzniveau]] <math>\alpha = 0,05</math>. | | Die [[Wahrscheinlichkeit]] für einen [[Fehler 1. Art]] entspricht dem vorgegebenen [[Signifikanzniveau]] <math>\alpha = 0,05</math>. |
|
| |
| ===Umfrage===
| |
|
| |
| Bei einer Umfrage in den Jahren 1991 und 1996 wurde zufällig ausgewählten Bürgern der Bundesrepublik Deutschland mit einem Alter von mindestens 18 Jahre zum Befragungszeitpunkt die folgenden Fragen gestellt:
| |
|
| |
| 1. "Wie beurteilen Sie die heutige wirtschaftliche Lage in Deutschland?"
| |
|
| |
| 2. "Wie wird die wirtschaftliche Lage in Deutschland in einem Jahr sein?"
| |
|
| |
| Die Einschätzungen konnten die Befragten jeweils auf einer fünfteiligen Skala vornehmen:
| |
|
| |
| 1. Frage: 1 - sehr gut, 2 - gut, 3 - teils gut / teils schlecht, 4 - schlecht, 5 - sehr schlecht
| |
|
| |
| 2. Frage: 1 - wesentlich besser als heute, 2 - etwas besser, 3 - gleichbleibend, 4 - etwas schlechter, 5 - wesentlich schlechter.
| |
|
| |
| Der Inhalt der 1. Frage wird als [[Zufallsvariable]] <math>X_{1}:\;</math> "Gegenwärtige Wirtschaftslage" und der Inhalt der 2. Frage als [[Zufallsvariable]] <math>X_{2}:\;</math> "Zukünftige Wirtschaftslage" definiert, die die genannten 5 möglichen [[Realisation]]en annehmen können.
| |
|
| |
| Darüber hinaus wurde u.a. erfasst, ob die befragte Person aus den alten Bundesländern (einschließlich West-Berlin) oder aus den neuen Bundesländern (einschließlich Ost-Berlin) stammt.
| |
|
| |
| Dies sei die [[Zufallsvariable]] <math>Y\;</math>: "Erhebungsgebiet" mit den möglichen [[Realisation]]en <math>y_{1} =</math> "West" und <math>y_{2} = </math> "Ost".
| |
|
| |
| Es soll auf einem [[Signifikanzniveau]] von <math>\alpha =0,05</math> geprüft werden, ob die [[Zufallsvariable]]n <math>X_{1}\;</math> und <math>Y\;</math> bzw. <math>X_{2}\;</math> und <math>Y\;</math> in den Jahren 1991 bzw. 1996 [[Unabhängigkeit (stochastisch)|unabhängig]] sind.
| |
|
| |
| Da stets die [[Nullhypothese]] [[Statistik|statistisch]] geprüft wird, muss die [[Unabhängigkeit (stochastisch)|Unabhängigkeit]] zwischen den beiden [[Zufallsvariable]]n als <math>H_{0}</math> formuliert werden, um die gemeinsamen erwarteten [[Absolute Häufigkeit|absoluten Häufigkeiten]] ermitteln zu können, so dass die [[Hypothese]]npaare lauten:
| |
|
| |
| <math>H_{0}:X_{1}\;</math> und <math>Y\;</math> sind [[Unabhängigkeit (stochastisch)|stochastisch unabhängig]].
| |
|
| |
| <math>H_{1}:X_{1}\;</math> und <math>Y\;</math> sind nicht [[Unabhängigkeit (stochastisch)|stochastisch unabhängig]].
| |
|
| |
| und
| |
|
| |
| <math>H_{0}:X_{2}\;</math> und <math>Y\;</math> sind [[Unabhängigkeit (stochastisch)|stochastisch unabhängig]].
| |
|
| |
| <math>H_{1}:X_{2}\;</math> und <math>Y\;</math> sind nicht [[Unabhängigkeit (stochastisch)|stochastisch unabhängig]].
| |
|
| |
| ====Teststatistik====
| |
|
| |
| Es wird die [[Teststatistik (Chi-Quadrat-Unabhängigkeitstest)|Teststatistik des Chi-Quadrat-Unabhängigkeitstest]] verwendet
| |
|
| |
| <math>V=\sum_{k=1}^{K}\sum_{j=1}^{J}\frac{\left( H_{kj}-\widehat{e}_{kj}\right)^{2}}{\widehat{e}_{kj}}</math>
| |
|
| |
| die bei Gültigkeit der [[Nullhypothese]] [[Approximation|approximativ]] [[Chi-Quadrat-Verteilung|Chi-Quadrat-verteilt]] ist mit der Anzahl der
| |
| [[Freiheitsgrad]]e <math>f = (K - 1)\cdot(J - 1)</math>.
| |
|
| |
| Die [[Entscheidungsbereiche]] der [[Nullhypothese]] können erst nach Vorliegen der [[Stichprobe]] festgelegt werden, da
| |
|
| |
| * die gemeinsamen erwarteten [[Absolute Häufigkeit|absoluten Häufigkeiten]] aus der [[Stichprobe]] zu [[Schätzung|schätzen]] sind,
| |
|
| |
| * erst dann die [[Approximation]]sbedingung überprüft werden kann und ersichtlich ist, ob Werte zusammenzufassen sind,
| |
|
| |
| * erst danach die Anzahl der [[Freiheitsgrad]]e feststeht und der [[Kritischer Wert|kritische Wert]] aufgesucht werden kann.
| |
|
| |
| ====Entscheidungsbereiche, Prüfwert und Testentscheidung====
| |
|
| |
| Die sich aus den [[Stichprobe]]n im Jahre 1991 und 1996 ergebenden gemeinsamen [[Absolute Häufigkeit|absoluten Häufigkeiten]] und [[Randhäufigkeit]]]en sind in den folgenden Tabellen 1 - 4 enthalten.
| |
|
| |
| Gleichzeitig werden in die Zellen dieser Tabellen die [[Schätzung|geschätzt]]en gemeinsamen [[Absolute Häufigkeit|absoluten Häufigkeiten]] bei Gültigkeit der [[Nullhypothese]], die sich gemäß
| |
|
| |
| <math>\widehat{e}_{kj}=\frac{h_{k\bullet }\cdot h_{\bullet j}}{n}</math>
| |
|
| |
| ergeben (gerundet auf eine Dezimalstelle), und die Differenzen <math>h_{kj}-\widehat{e}_{kj}</math> aufgenommen.
| |
|
| |
|
| |
| Tabelle 1: Gegenwärtige Wirtschaftslage <math>(X_{1})\;</math> und Erhebungsgebiet <math>(Y)\;</math> 1991
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |colspan="2" align="center" rowspan="2"|Gegenwärtige Wirtschaftslage <math>(X_{1})\;</math>
| |
| |align="center" colspan="2" |Erhebungsgebiet <math>(Y)\;</math>
| |
| |align="center" rowspan="2"|RV <math>X_{1}\;</math>
| |
| |-
| |
| |align="center"|West
| |
| |align="center"|Ost
| |
| |-
| |
| |align="center"|sehr gut
| |
| |align="center"|beobachtet
| |
| |align="center"|209
| |
| |align="center"|165
| |
| |align="center"|374
| |
| |-
| |
| |
| |
| |align="center"|erwartet
| |
| |align="center"|184,8
| |
| |align="center"|189,2
| |
| |
| |
| |-
| |
| |
| |
| |align="center"|Differenz
| |
| |align="center"|24,2
| |
| |align="center"|-24,2
| |
| |
| |
| |-
| |
| |align="center"|gut
| |
| |align="center"|beobachtet
| |
| |align="center"|744
| |
| |align="center"|592
| |
| |align="center"|1336
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|660,1
| |
| |align="center"|675,9
| |
| |
| |
| |-
| |
| |
| |
| |align="center"|Differenz
| |
| |align="center"|83,9
| |
| |align="center"|-83,9
| |
| |align="center"|
| |
| |-
| |
| |align="center"|teils/teils
| |
| |align="center"|beobachtet
| |
| |align="center"|431
| |
| |align="center"|647
| |
| |align="center"|1078
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|532,6
| |
| |align="center"|545,5
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-101,6
| |
| |align="center"|101,6
| |
| |align="center"|
| |
| |-
| |
| |align="center"|schlecht
| |
| |align="center"|beobachtet
| |
| |align="center"|36
| |
| |align="center"|39
| |
| |align="center"|75
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|37,1
| |
| |align="center"|37,9
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-1,1
| |
| |align="center"|1,1
| |
| |align="center"|
| |
| |-
| |
| |align="center"|sehr schlecht
| |
| |align="center"|beobachtet
| |
| |align="center"|4
| |
| |align="center"|15
| |
| |align="center"|19
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|9,4
| |
| |align="center"|9,6
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-5,4
| |
| |align="center"|5,4
| |
| |
| |
| |-
| |
| |align="center" colspan="2"|RV <math>Y\;</math>
| |
| |align="center"|1424
| |
| |align="center"|1458
| |
| |align="center"|2882
| |
| |}
| |
|
| |
|
| |
| Tabelle 2: Gegenwärtige Wirtschaftslage <math>(X_{1})\;</math> und Erhebungsgebiet <math>(Y)\;</math> 1996
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center" colspan="2" rowspan="2"|Gegenwärtige Wirtschaftslage <math>(X_{1})\;</math>
| |
| |align="center" colspan="2"|Erhebungsgebiet <math>(Y)\;</math>
| |
| |align="center" rowspan="2"|RV <math>X_{1}\;</math>
| |
| |-
| |
| |align="center"|West
| |
| |align="center"|Ost
| |
|
| |
| |-
| |
| |align="center"|sehr gut
| |
| |align="center"|beobachtet
| |
| |align="center"|20
| |
| |align="center"|6
| |
| |align="center"|26
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|17,2
| |
| |align="center"|8,8
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|2,8
| |
| |align="center"|-2,8
| |
| |align="center"|
| |
| |-
| |
| |align="center"|gut
| |
| |align="center"|beobachtet
| |
| |align="center"|264
| |
| |align="center"|116
| |
| |align="center"|380
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|251,3
| |
| |align="center"|128,7
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|12,7
| |
| |align="center"|-12,7
| |
| |align="center"|
| |
| |-
| |
| |align="center"|teils/teils
| |
| |align="center"|beobachtet
| |
| |align="center"|1006
| |
| |align="center"|557
| |
| |align="center"|1563
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|1033,7
| |
| |align="center"|529,3
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-27,7
| |
| |align="center"|27,7
| |
| |align="center"|
| |
| |-
| |
| |align="center"|schlecht
| |
| |align="center"|beobachtet
| |
| |align="center"|692
| |
| |align="center"|335
| |
| |align="center"|1027
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|679,2
| |
| |align="center"|347,8
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|12,8
| |
| |align="center"|-12,8
| |
| |align="center"|
| |
| |-
| |
| |align="center"|sehr schlecht
| |
| |align="center"|beobachtet
| |
| |align="center"|141
| |
| |align="center"|73
| |
| |align="center"|214
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|141,5
| |
| |align="center"|72,5
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-0,5
| |
| |align="center"|0,5
| |
| |
| |
| |-
| |
| |align="center" colspan="2"|RV <math>Y\;</math>
| |
| |align="center"|2123
| |
| |align="center"|1087
| |
| |align="center"|3210
| |
| |}
| |
|
| |
|
| |
| Tabelle 3: Zukünftige Wirtschaftslage <math>(X_{2})\;</math> und Erhebungsgebiet <math>(Y)\;</math> 1991
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center" colspan="2" rowspan="2"|Zukünftige Wirtschaftslage <math>(X_{2})\;</math>
| |
| |align="center" colspan="2"|Erhebungsgebiet <math>(Y)\;</math>
| |
| |align="center" rowspan="2"|RV <math>X_{2}\;</math>
| |
| |-
| |
| |align="center"|West
| |
| |align="center"|Ost
| |
| |-
| |
| |align="center"|wesentlich besser
| |
| |align="center"|beobachtet
| |
| |align="center"|75
| |
| |align="center"|203
| |
| |align="center"|278
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|137,4
| |
| |align="center"|140,6
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-62,4
| |
| |align="center"|62,4
| |
| |align="center"|
| |
| |-
| |
| |align="center"|etwas besser
| |
| |align="center"|beobachtet
| |
| |align="center"|449
| |
| |align="center"|763
| |
| |align="center"|1212
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|598,9
| |
| |align="center"|613,1
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-149,9
| |
| |align="center"|149,9
| |
| |align="center"|
| |
| |-
| |
| |align="center"|gleichbleibend
| |
| |align="center"|beobachtet
| |
| |align="center"|684
| |
| |align="center"|414
| |
| |align="center"|1108
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|547,5
| |
| |align="center"|560,5
| |
| |
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|136,5
| |
| |align="center"|-136,5
| |
| |align="center"|
| |
| |-
| |
| |align="center"|etwas schlechter
| |
| |align="center"|beobachtet
| |
| |align="center"|200
| |
| |align="center"|62
| |
| |align="center"|262
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|129,5
| |
| |align="center"|132,5
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|70,5
| |
| |align="center"|-70,5
| |
| |
| |
| |-
| |
| |align="center"|wesentlich schlechter
| |
| |align="center"|beobachtet
| |
| |align="center"|16
| |
| |align="center"|6
| |
| |align="center"|22
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|10,9
| |
| |align="center"|11,1
| |
| |
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|5,1
| |
| |align="center"|-5,1
| |
| |
| |
| |-
| |
| |colspan="2"|RV <math>Y\,</math>
| |
| |align="center"|1424
| |
| |align="center"|1458
| |
| |align="center"|2882
| |
| |}
| |
|
| |
|
| |
| Tabelle 4: Zukünftige Wirtschaftslage <math>(X_{2})\;</math> und Erhebungsgebiet <math>(Y)\;</math> 1996
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center" colspan="2" rowspan="2"|Zukünftige Wirtschaftslage <math>(X_{2})\;</math>
| |
| |align="center" colspan="2"|Erhebungsgebiet <math>(Y)\;</math>
| |
| |rowspan="2" align="center"|RV <math>X_{2}\;</math>
| |
| |-
| |
| |align="center"|West
| |
| |align="center"|Ost
| |
| |-
| |
| |align="center"|wesentlich besser
| |
| |align="center"|beobachtet
| |
| |align="center"|9
| |
| |align="center"|6
| |
| |align="center"|15
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|9,9
| |
| |align="center"|5,1
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-0,9
| |
| |align="center"|0,9
| |
| |
| |
| |-
| |
| |align="center"|etwas besser
| |
| |align="center"|beobachtet
| |
| |align="center"|190
| |
| |align="center"|131
| |
| |align="center"|321
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|212,3
| |
| |align="center"|108,7
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-22,3
| |
| |align="center"|22,3
| |
| |
| |
| |-
| |
| |align="center"|gleichbleibend
| |
| |align="center"|beobachtet
| |
| |align="center"|809
| |
| |align="center"|444
| |
| |align="center"|1253
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|828,7
| |
| |align="center"|42,3
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-19,7
| |
| |align="center"|19,7
| |
| |
| |
| |-
| |
| |align="center"|etwas schlechter
| |
| |align="center"|beobachtet
| |
| |align="center"|960
| |
| |align="center"|426
| |
| |align="center"|1386
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|916,7
| |
| |align="center"|469,3
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|43,3
| |
| |align="center"|-43,3
| |
| |
| |
| |-
| |
| |align="center"|wesentlich schlechter
| |
| |align="center"|beobachtet
| |
| |align="center"|155
| |
| |align="center"|80
| |
| |align="center"|235
| |
| |-
| |
| |align="center"|
| |
| |align="center"|erwartet
| |
| |align="center"|155,4
| |
| |align="center"|79,6
| |
| |align="center"|
| |
| |-
| |
| |align="center"|
| |
| |align="center"|Differenz
| |
| |align="center"|-0,4
| |
| |align="center"|0,4
| |
| |align="center"|
| |
| |-
| |
| |align="center" colspan="2"|RV <math>Y\;</math>
| |
| |align="center"|2123
| |
| |align="center"|1087
| |
| |align="center"|3210
| |
| |}
| |
|
| |
| Für alle 4 durchzuführende [[Statistischer Test|Tests]] gilt:
| |
|
| |
| Die [[Approximation]]sbedingung ist erfüllt, da alle <math>\widehat{e}_{kj}\geq 5</math> sind. Mit <math>K = 5</math> und <math>J = 2</math> folgt für die Anzahl der [[Freiheitsgrad]]e: <math>f = (K - 1)\cdot(J - 1) = 4\cdot1=4</math>.
| |
|
| |
| Für <math>P(V \leq c) = 0,95</math> und <math>f = 4</math> findet man aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Chi-Quadrat-Verteilung]] den [[Kritischer Wert|kritischen Wert]] <math>c=\chi_{1-\alpha ;\left( K-1\right) \cdot \left( J-1\right)}^{2}=\chi_{0,95;4}^{2}=9,49</math>.
| |
|
| |
| Die [[Entscheidungsbereiche]] sind damit:
| |
|
| |
| [[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der]] <math>H_{0}:\; \left\{v|v>9,49\right\}</math>
| |
|
| |
| [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der]] <math>H_{0}:\; \left\{ v|v\leq 9,49\right\}</math>
| |
|
| |
| Als [[Prüfwert]]e und Testentscheidung ergeben sich:
| |
|
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center"|Jahr
| |
| |align="center"|[[Zufallsvariable]]n
| |
| |align="center"|[[Prüfwert]] <math>v</math>
| |
| |align="center"|Testentscheidung
| |
| |-
| |
| |align="center"|1991
| |
| |align="center"|<math>X_{1}, Y</math>
| |
| |align="center"|71,85
| |
| |align="center"|<math>H_{1}</math>
| |
| |-
| |
| |align="center"|1996
| |
| |align="center"|<math>X_{1}, Y</math>
| |
| |align="center"|6,15
| |
| |align="center"|<math>H_{0}</math>
| |
| |-
| |
| |align="center"|1991
| |
| |align="center"|<math>X_{2}, Y</math>
| |
| |align="center"|278,17
| |
| |align="center"|<math>H_{1}</math>
| |
| |-
| |
| |align="center"|1996
| |
| |align="center"|<math>X_{2}, Y</math>
| |
| |align="center"|14,61
| |
| |align="center"|<math>H_{1}</math>
| |
| |}
| |
|
| |
| ====Interpretation====
| |
|
| |
| * Gegenwärtige Wirtschaftslage in Deutschland:
| |
|
| |
| : Während für 1991 auf einem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> die [[Nullhypothese]] abgelehnt wird, d.h. [[Statistik|statistisch]] eine Abhängigkeit zwischen den [[Zufallsvariable]]n <math>X_{1}\;</math>: "Gegenwärtige Wirtschaftslage" und <math>Y\;</math>: "Erhebungsgebiet" nachgewiesen werden konnte, wird für das Jahr 1996 die [[Nullhypothese]] nicht abgelehnt.
| |
|
| |
| : 1991 bewerteten die Befragten in den alten Bundesländern die gegenwärtige Wirtschaftslage tendenziell deutlich zufriedener als die Befragten in den neuen Bundesländern, was anhand der großen positiven Differenzen <math>h_{kj}-\widehat{e}_{kj}</math> bei der sehr guten und guten Einschätzung in der Spalte West der Tabelle 1 zu erkennen ist.
| |
|
| |
| : Auch 1996 treten Differenzen zwischen <math>h_{kj}</math> und <math>\widehat{e}_{kj}</math> auf, aber sie sind in ihrer Gesamtheit nicht mehr signifikant.
| |
|
| |
| : Es hat offensichtlich eine Angleichung in den Einschätzungen der gegenwärtigen Wirtschaftslage zwischen West und Ost stattgefunden.
| |
|
| |
| * Zukünftige Wirtschaftslage in Deutschland:
| |
|
| |
| : Bezüglich der [[Zufallsvariable]]n <math>X_{2}\;</math>: "Zukünftige Wirtschaftslage" und <math>Y\;</math>: "Erhebungsgebiet" wird für beide Jahre die [[Nullhypothese]] der [[Unabhängigkeit (stochastisch)|Unabhängigkeit]] auf einem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> abgelehnt.
| |
|
| |
| : Hierbei sind es jedoch die Befragten in den neuen Bundesländern, die in beiden Jahren die zukünftige Wirtschaftslage tendenziell deutlich optimistischer bewerten als die Befragten in den alten Bundesländern.
| |
|
| |
| : Vergleicht man beide Jahre miteinander, so sind die Differenzen <math>h_{kj}-\widehat{e}_{kj}</math> 1996 kleiner als 1991, was ebenfalls auf eine gewisse Annäherung in den Bewertungen zwischen West und Ost schließen lässt, jedoch sind sie auch 1996 in ihrer Gesamtheit noch [[Statistik|statistisch]] signifikant.
| |
Grundbegriffe
Chi-Quadrat-Unabhängigkeitstest
Bei einem Chi-Quadrat-Unabhängigkeitstest wird geprüft, ob zwei Zufallsvariablen stochastisch unabhängig sind. Dieser statistische Test gehört zu den nichtparametrischen Tests.
An das Skalenniveau der Zufallsvariablen werden keine Voraussetzungen gestellt.
Es sei allgemein angenommen, dass zwei Zufallsvariablen
und
gleichzeitig an
statistischen Einheiten (
) beobachtet werden, wobei die Unabhängigkeit der
Stichprobenziehungen vorausgesetzt wird (einfache Zufallsstichprobe).
Sind
und
diskrete Zufallsvariablen (darunter werden im weiteren summarisch nominalskalierte, ordinalskalierte sowie diskrete Zufallsvariablen mit sehr wenigen Ausprägungen verstanden), nehmen sie die Stichprobenrealisationen
und
an.
Sind
und
stetige Zufallsvariablen (darunter werden im weiteren auch die diskreten Zufallsvariablen mit sehr vielen bzw. unendlich vielen Ausprägungen, d.h. die genannten quasi-stetigen Zufallsvariablen, gefasst), muss eine Intervallbildung der beobachteten Werte in disjunkte, aneinander angrenzende Klassen erfolgen.
und
sind dann repräsentative Klassenwerte (im Allgemeinen die
Klassenmitten) und
und
die Anzahl der gebildeten Klassen.
Eine geeignete Darstellungsform für die beobachtete gemeinsame Häufigkeitsverteilung der zwei Zufallsvariablen ist die zweidimensionale Häufigkeitstabelle (auch als Kontingenztabelle oder Kreuztabelle bezeichnet).
Zweidimensionale Häufigkeitstabelle:
|
|
|
|
|
|
RV
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
RV
|
|
|
|
|
|
|
bezeichnet die absolute Häufigkeit für das beobachtete Wertepaar
, d.h. dass
den Wert
bzw. einen Wert aus der
-ten Klasse und
gleichzeitig den Wert
bzw. einen Wert aus der
-ten Klasse angenommen hat:
Die letzte Spalte enthält die beobachtete Randverteilung (RV) von
mit den absoluten
Randhäufigkeiten
.
gibt an, wie oft
den Wert
bzw. einen Wert aus der
-ten Klasse angenommen hat, wobei es gleichgültig ist, welchen Wert
aufweist.
Die letzte Zeile weist die beobachtete Randverteilung von
mit den absoluten Randhäufigkeiten
aus.
gibt an, wie oft
den Wert
bzw. einen Wert aus der
-ten Klasse angenommen hat, wobei es gleichgültig ist, welchen Wert
aufweist.
Für die zweidimensionale Häufigkeitstabelle gelten folgende Beziehungen:
.
Die Nullhypothese lautet beim Chi-Quadrat-Unabhängigkeitstest stets, dass die Zufallsvariablen
und
in der Grundgesamtheit stochastisch unabhängig sind. Die Alternativhypothese enthält das logische Pendant.
:
und
sind stochastisch unabhängig.
:
und
sind nicht stochastisch abhängig.
Wenn die Nullhypothese gilt, dann ergibt sich nach dem Multiplikationssatz bei Unabhängigkeit
Dabei bezeichnen:
die Wahrscheinlichkeit, dass die Zufallsvariable
den Wert
bzw. einen Wert aus der
-ten Klasse und
gleichzeitig den Wert
bzw. einen Wert aus der
-ten
Klasse annimmt;
die Wahrscheinlichkeit, dass die Zufallsvariable
den Wert
bzw. einen Wert aus der
-ten Klasse annimmt (Randwahrscheinlichkeit von
) und
die Wahrscheinlichkeit, dass die Zufallsvariable
den Wert
bzw. einen Wert aus der
-ten Klasse annimmt (Randwahrscheinlichkeit von
).
Das Hypothesenpaar kann somit konkretisiert werden:
für alle Paare
für mindestens ein Paar
Das Signifikanzniveau
und der Stichprobenumfang
sind vor der Testdurchführung festzulegen.
Teststatistik des Chi-Quadrat-Unabhängigkeitstests
Für die Bestimmung der Teststatistik wird von den absoluten Häufigkeiten ausgegangen. Der Test basiert auf dem Vergleich der in der Stichprobe beobachteten und der bei Gültigkeit der Nullhypothese erwarteten gemeinsamen absoluten Häufigkeiten.
Für die konkrete Stichprobe sind die gemeinsamen absoluten Häufigkeiten
in den Zellen der zweidimensionalen Häufigkeitstabelle gegeben. Da diese absoluten Häufigkeiten
Ergebnis eines Zufallsexperimentes sind, können sie von Stichprobe zu Stichprobe unterschiedliche Werte annehmen, d.h., sie sind Realisationen von Zufallsvariablen
.
Wenn die Nullhypothese gilt, ergeben sich die erwarteten gemeinsamen absoluten Häufigkeiten als
.
Da die gemeinsamen Wahrscheinlichkeiten
und die Randwahrscheinlichkeiten
und
für alle
und
unbekannt sind, müssen sie aus der Stichprobe geschätzt werden.
Erwartungstreue und konsistente Punktschätzungen für
und
sind die relativen Randhäufigkeiten
und
.
Das beinhaltet, dass von festen Randhäufigkeiten der zweidimensionalen Häufigkeitstabelle ausgegangen wird. Damit erhält man Schätzungen für die unter
erwarteten gemeinsamen absoluten Häufigkeiten:
Der Vergleich zwischen den in der Stichprobe beobachteten und den bei Gültigkeit der Nullhypothese erwarteten gemeinsamen absoluten Häufigkeiten baut auf den Differenzen
auf.
Eine summarische Größe, die die Abweichung von der Nullhypothese bewertet, ist die Teststatistik
Bei Gültigkeit der Nullhypothese ist die Teststatistik
approximativ Chi-Quadrat-verteilt mit
Freiheitsgraden.
Die Approximation an die Chi-Quadrat-Verteilung ist hinreichend, wenn
für alle
gilt.
Ist diese Bedingungen nicht erfüllt, müssen vor der Anwendung des Tests benachbarte Werte bzw. Klassen zusammengefaßt werden.
und
sind die Anzahlen der verbliebenen Werte bzw. Klassen nach einer eventuell notwendigen Zusammenfassung.
Der kritische Wert
wird für
und die Anzahl der Freiheitsgrade
aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung entnommen.
Entscheidungsbereiche des Chi-Quadrat-Unabhängigkeitstests
Die Entscheidungsbereiche sind:
Ablehnungsbereich der
Nichtablehnungsbereich der
Die Wahrscheinlichkeit, dass die Teststatistik
eine Realisation aus dem Ablehnungsbereich der
annimmt, entspricht dem vorgegebenen Signifikanzniveau
.
Die Wahrscheinlichkeit, dass die Teststatistik
eine Realisation aus dem Nichtablehnungsbereich der
annimmt, ist
.
Nichtablehnungsbereich der
| Ablehnungsbereich der
Prüfwert des Chi-Quadrat-Unabhängigkeitstests
Wenn die Zufallsstichprobe vom Umfang
gezogen wurde, können die absoluten Häufigkeiten
für alle beobachteten Wertepaare
ermittelt, daraus die beobachteten Randhäufigkeiten für
und
bestimmt und die erwarteten absoluten Häufigkeiten
berechnet werden.
Ist die Approximationsbedingung nicht erfüllt, müssen Werte bzw. Klassen geeignet zusammengefaßt und die Häufigkeiten
,
,
und
erneut bestimmt werden.
Einsetzen von
und für alle
in die Teststatistik führt zu einem Prüfwert
.
Entscheidungssituationen des Chi-Quadrat-Unabhängigkeitstests
Wenn
in den Ablehnungsbereich der
fällt, wird die Nullhypothese
auf dem Signifikanzniveau
und basierend auf der Zufallsstichprobe vom Umfang
abgelehnt
.
Es konnte statistisch gezeigt werden, dass die Zufallsvariablen
und
nicht stochastisch unabhängig sind.
Bei dieser Entscheidung besteht die Möglichkeit einen Fehler 1. Art
zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau
.
Wenn
in den Nichtablehnungsbereich der
fällt, wird die Nullhypothese basierend auf der Zufallsstichprobe vom Umfang
nicht abgelehnt
.
Das Stichprobenergebnis gibt keine Veranlassung, die Unabhängigkeit der Zufallsvariablen
und
zu verwerfen.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 2. Art
zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.
Beispiele
Mängel und Alter
Es wird vermutet, dass die Anzahl der festgestellten Mängel an einem Pkw und das Alter des Pkw stochastisch unabhängig sind.
Um diese Annahme zu überprüfen, wird ein Chi-Quadrat-Unabhängigkeitstest auf einem Signifikanzniveau von
durchgeführt.
Für die Zufallsvariable
: "Anzahl der Mängel am Pkw" werden die Realisationen
= "kein Mangel",
= "1 Mangel" und
= "2 oder mehr Mängel" und
für die Zufallsvariable
: "Alter des Pkw" die Realisationen
= "bis einschließlich 1 Jahr",
= "über 1 Jahr bis einschließlich 2 Jahre" und
= "2 Jahre oder älter" betrachtet.
Da stets die Nullhypothese statistischgeprüft wird, muss die Unabhängigkeit zwischen
und
als
formuliert werden, um die gemeinsamen erwarteten absoluten Häufigkeiten ermitteln zu können, so dass das Hypothesenpaar lautet:
und
sind stochastisch unabhängig.
und
sind nicht stochastisch unabhängig.
bzw.
für alle Paare
für mindestens ein Paar
Teststatistik
Es wird die Teststatistik des Chi-Quadrat-Unabhängigkeitstests verwendet:
die bei Gültigkeit der Nullhypothese approximativ Chi-Quadrat-verteiltist mit der Anzahl der
Freiheitsgrade
.
Die Entscheidungsbereiche der Nullhypothese können erst nach Vorliegen der Stichprobe festgelegt werden, da
Entscheidungsbereiche und Prüfwert
Bei einer konkreten Polizeikontrolle an verschiedenen Straßenstellen, wobei die Auswahl der Pkw zufällig erfolgte, wurde die Anzahl der Mängel und das Alter an 110 Pkw registriert.
Die sich aus der Stichprobe ergebenden gemeinsamen absoluten Häufigkeiten und Randhäufigkeiten sind in der folgenden Tabelle enthalten.
Gleichzeitig wurden in den Zellen dieser Tabelle die geschätzten gemeinsamen absoluten Häufigkeiten bei Gültigkeit der Nullhypothese aufgenommen, die sich gemäß
ergeben (gerundet auf eine Dezimalstelle).
Mängelanzahl
|
Alter
|
RV
|
|
1-2
|
2 oder älter
|
0
|
beobachtet
|
30
|
14
|
5
|
49
|
erwartet
|
26,7
|
13,4
|
8,9
|
|
1
|
beobachtet
|
18
|
10
|
4
|
32
|
erwartet
|
17,5
|
8,7
|
5,8
|
|
2 oder mehr
|
beobachtet
|
12
|
6
|
11
|
29
|
erwartet
|
15,8
|
7,9
|
5,3
|
|
RV
|
60
|
30
|
20
|
110
|
Die Approximationsbedingung ist erfüllt, da alle
sind. Mit
und
folgt für die Anzahl der Freiheitsgrade:
.
Für
und
findet man aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung den kritischen Wert
.
Die Entscheidungsbereiche sind damit:
Ablehnungsbereich der
Nichtablehnungsbereich der
Als Prüfwert ergibt sich:
Testentscheidung
Da
in den Ablehnungsbereich der
fällt, wird die Nullhypothese abgelehnt
.
Auf einem Signifikanzniveau von
und basierend auf einer Zufallsstichprobe vom Umfang
konnte statistisch bewiesen werden, dass die Zufallsvariablen
: "Anzahl der Mängel am Pkw" und
: "Alter des Pkw" stochastisch unabhängig sind.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art
zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau
.