|
|
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) |
Zeile 1: |
Zeile 1: |
| {{Bivariate Statistik}} | | {{Bivariate Statistik}} |
| | {{SubpageToc|Beispiel: Angestellte|Beispiel: Leichtathletik|Interaktives Beispiel: Vertrauen in Institutionen}} |
|
| |
|
| =={{Vorlage:Überschrift}}== | | =={{Vorlage:Überschrift}}== |
Zeile 43: |
Zeile 44: |
|
| |
|
| <math> -1\leq \tau \leq1</math>. | | <math> -1\leq \tau \leq1</math>. |
|
| |
| =={{Vorlage:Beispiele}}==
| |
|
| |
| ===Angestellte===
| |
|
| |
| 10 Angestellte wurden bezüglich ihrer organisatorischen Fähigkeiten <math>(X)\;</math> und ihrer Arbeitssorgfalt <math>(Y)\;</math> geprüft und für jedes der [[Merkmal]]e in eine Rangordnung gebracht.
| |
|
| |
| Um Aussagen über den Zusammenhang zwischen beiden [[Merkmal]]en treffen zu können, wird sowohl der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche Rangkorrelationskoeffizient]] als auch der Kendall'sche Rangkorrelationskoeffizient berechnet.
| |
|
| |
| {| class="wikitable"
| |
| |align="right"|Angestellter <math>i</math>
| |
| |align="right"|1
| |
| |align="right"|2
| |
| |align="right"|3
| |
| |align="right"|4
| |
| |align="right"|5
| |
| |align="right"|6
| |
| |align="right"|7
| |
| |align="right"|8
| |
| |align="right"|9
| |
| |align="right"|10
| |
| |-
| |
| |align="right"|<math>R(X)</math>
| |
| |align="right"|7
| |
| |align="right"|3
| |
| |align="right"|9
| |
| |align="right"|10
| |
| |align="right"|1
| |
| |align="right"|5
| |
| |align="right"|4
| |
| |align="right"|6
| |
| |align="right"|2
| |
| |align="right"|8
| |
| |-
| |
| |align="right"|<math>R(Y)</math>
| |
| |align="right"|3
| |
| |align="right"|9
| |
| |align="right"|10
| |
| |align="right"|8
| |
| |align="right"|7
| |
| |align="right"|1
| |
| |align="right"|5
| |
| |align="right"|4
| |
| |align="right"|2
| |
| |align="right"|6
| |
| |-
| |
| |align="right"|<math>{d_i}^2</math>
| |
| |align="right"|16
| |
| |align="right"|36
| |
| |align="right"|1
| |
| |align="right"|4
| |
| |align="right"|36
| |
| |align="right"|16
| |
| |align="right"|1
| |
| |align="right"|4
| |
| |align="right"|0
| |
| |align="right"|4
| |
| |}
| |
|
| |
| {| class="wikitable"
| |
| |align="right"|Angestellter <math>i</math>
| |
| |align="right"|5
| |
| |align="right"|9
| |
| |align="right"|2
| |
| |align="right"|7
| |
| |align="right"|6
| |
| |align="right"|8
| |
| |align="right"|1
| |
| |align="right"|10
| |
| |align="right"|3
| |
| |align="right"|4
| |
| |-
| |
| |align="right"|<math>R(X)</math>
| |
| |align="right"|1
| |
| |align="right"|2
| |
| |align="right"|3
| |
| |align="right"|4
| |
| |align="right"|5
| |
| |align="right"|6
| |
| |align="right"|7
| |
| |align="right"|8
| |
| |align="right"|9
| |
| |align="right"|10
| |
| |-
| |
| |align="right"|<math>R(Y)</math>
| |
| |align="right"|7
| |
| |align="right"|2
| |
| |align="right"|9
| |
| |align="right"|5
| |
| |align="right"|1
| |
| |align="right"|4
| |
| |align="right"|3
| |
| |align="right"|6
| |
| |align="right"|10
| |
| |align="right"|8
| |
| |-
| |
| |align="right"|<math>q</math> (kleiner)
| |
| |align="right"|6
| |
| |align="right"|1
| |
| |align="right"|6
| |
| |align="right"|3
| |
| |align="right"|0
| |
| |align="right"|1
| |
| |align="right"|0
| |
| |align="right"|0
| |
| |align="right"|1
| |
| |align="right"|0
| |
| |-
| |
| |align="right"|<math>p</math> (größer)
| |
| |align="right"|3
| |
| |align="right"|7
| |
| |align="right"|1
| |
| |align="right"|3
| |
| |align="right"|5
| |
| |align="right"|3
| |
| |align="right"|3
| |
| |align="right"|2
| |
| |align="right"|0
| |
| |align="right"|0
| |
| |}
| |
|
| |
|
| |
|
| |
| * Spearman'scher Rangkorrelationskoeffizient
| |
|
| |
| :<math>r_s=1-\frac{6\cdot \sum^n_{i=1}\limits d_i^2}{n\cdot(n^2-1)}</math>
| |
|
| |
| :<math>r_{s}=1-6\cdot \frac{ 118}{10\cdot 99}=0,2848</math>
| |
|
| |
|
| |
| * Kendall'scher Rangkorrelationskoeffizient
| |
|
| |
| :<math>Q=18, \quad P=27</math>
| |
|
| |
| :<math>Q+P=\frac{n\cdot(n-1)}{2}=10 \cdot \frac{9}{2}=45</math>
| |
|
| |
| :<math>\tau=\frac{27-18}{27+18}=\frac{9}{45}=0,200</math>
| |
|
| |
| ===Leichtathletik===
| |
|
| |
| Gegeben sei die Platzierung von 20 Sportlern in den beiden Leichtathletik-Disziplinen 100 Meter-Lauf und 200 Meter-Lauf:
| |
|
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center"|Sportler <math>(i)</math>
| |
| |align="center"|01
| |
| |align="center"|02
| |
| |align="center"|03
| |
| |align="center"|04
| |
| |align="center"|05
| |
| |align="center"|06
| |
| |align="center"|07
| |
| |align="center"|08
| |
| |align="center"|09
| |
| |align="center"|10
| |
| |align="center"|11
| |
| |align="center"|12
| |
| |align="center"|13
| |
| |align="center"|14
| |
| |align="center"|15
| |
| |align="center"|16
| |
| |align="center"|17
| |
| |align="center"|18
| |
| |align="center"|19
| |
| |align="center"|20
| |
| |-
| |
| |align="center"|100 Meter <math>(x)</math>
| |
| |align="center"|5
| |
| |align="center"|7
| |
| |align="center"|3
| |
| |align="center"|13
| |
| |align="center"|2
| |
| |align="center"|15
| |
| |align="center"|19
| |
| |align="center"|14
| |
| |align="center"|12
| |
| |align="center"|1
| |
| |align="center"|6
| |
| |align="center"|20
| |
| |align="center"|17
| |
| |align="center"|4
| |
| |align="center"|18
| |
| |align="center"|11
| |
| |align="center"|10
| |
| |align="center"|16
| |
| |align="center"|9
| |
| |align="center"|8
| |
| |-
| |
| |align="center"|200 Meter <math>(y)</math>
| |
| |align="center"|3
| |
| |align="center"|9
| |
| |align="center"|1
| |
| |align="center"|10
| |
| |align="center"|7
| |
| |align="center"|5
| |
| |align="center"|13
| |
| |align="center"|14
| |
| |align="center"|17
| |
| |align="center"|4
| |
| |align="center"|11
| |
| |align="center"|16
| |
| |align="center"|18
| |
| |align="center"|12
| |
| |align="center"|20
| |
| |align="center"|2
| |
| |align="center"|15
| |
| |align="center"|19
| |
| |align="center"|6
| |
| |align="center"|8
| |
| |}
| |
|
| |
| Im Folgenden soll der statistische Zusammenhang zwischen der Platzierung der Sportler in den einzelnen Disziplinen ermittelt werden.
| |
|
| |
| Da es sich um [[Ordinalskala|ordinalskalierte]] Daten handelt, werden der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche]] und der Kendall'sche Rangkorrelationskoeffizient verwendet.
| |
|
| |
| Die Berechnung beider Koeffizienten liefert die folgenden Ergebnisse:
| |
|
| |
| <pre>
| |
| Spearman'scher Rangkorrelationskoeffizient: 0.6617
| |
| Kendall'scher Rangkorrelationskoeffizient: 0.4526
| |
| konkordante Paare: 138
| |
| diskordante Paare: 52
| |
| gleich nur bzgl. x: 0
| |
| gleich nur bzgl. y: 0
| |
| gleich bzgl. x und y: 0
| |
| </pre>
| |
|
| |
| Der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche Rangkorrelationskoeffizient]] errechnet sich nach der Formel:
| |
|
| |
| <math>r_s = 1- \frac{6\cdot\sum_{i=1}^{n}{d_i}^2} {n\cdot(n^2-1)}</math>
| |
|
| |
| Die notwendigen Informationen lassen sich aus der Tabelle entnehmen:
| |
|
| |
| <math>d</math> ergibt sich als Differenz zwischen den beiden [[Variable]]n <math>x</math> und <math>y</math>.
| |
|
| |
| <math>n</math> ist die Anzahl der platzierten Sportler (= 20).
| |
|
| |
| Die Berechnung des [[Spearman'scher Rangkorrelationskoeffizient|Spearman'schen Rangkorrelationskoeffizienten]] ergibt einen Wert von 0,6617, was einen positiven Zusammenhang zwischen den Platzierungen in beiden Disziplinen impliziert.
| |
|
| |
| Gute Sportler über 100 Meter erreichen also auch über 200 Meter gute Platzierungen.
| |
|
| |
| Für die Berechnung des Kendall'schen Rangkorrelationskoeffizienten müssen die Paare der
| |
| [[Konkordante Merkmalspaare|konkordanten]] und [[Diskordante Merkmalspaare|diskordanten Paare]] ermittelt werden.
| |
|
| |
| Zwei Paare heißen [[Konkordante Merkmalspaare|konkordant]], wenn bezüglich beider [[Merkmal]]e die gleiche Ordnungsrelation vorliegt und [[Diskordante Merkmalspaare|diskordant]], wenn eine verschiedene Ordnungsrelation vorliegt.
| |
|
| |
| Für das Paar Sportler 1 und Sportler 2 liegt beispielsweise [[Konkordante Merkmalspaare|Konkordanz]] vor: Sportler 1 erreicht sowohl im 100 Meter-Lauf als auch im 200 Meter-Lauf eine bessere Platzierung.
| |
|
| |
| Anders dagegen beim Vergleich von Sportler 1 mit Sportler 5: Sportler 1 erreicht über 100 Meter eine schlechtere, über 200 Meter aber eine bessere Platzierung - es liegt eine [[Diskordante Merkmalspaare|Diskordanz]] vor.
| |
|
| |
| Insgesamt ergeben sich für dieses Beispiel <math>0,5 \cdot n \cdot (n-1) = 190</math> verschiedene Paare, davon sind 138 Paare [[Konkordante Merkmalspaare|konkordant]], 52 Paare [[Diskordante Merkmalspaare|diskordant]].
| |
|
| |
| Mit Kenntnis dieser Zahlen lässt sich der Kendall'sche Rangkorrelationskoeffizient errechnen:
| |
|
| |
| <math>\tau = \frac {P-Q}{P+Q}, \ \mbox{mit} \ Q=\sum_i q_i \ \mbox{und} \ P=\sum_i p_i</math>
| |
|
| |
| Dabei stellt <math>P</math> die Anzahl der [[Konkordante Merkmalspaare|konkordanten Paare]] und <math>Q</math> die Anzahl der [[Diskordante Merkmalspaare|diskordanten Paare]] dar.
| |
|
| |
| Der Kendall'sche Rangkorrelationskoeffizient beträgt für das obige Beispiel <math>0,4526</math>, was auch hier auf einen positiven Zusammenhang hinweist.
| |
|
| |
| <!--==Interaktives Beispiel==
| |
|
| |
|
| |
| Dieses Beispiel erlaubt die Berechnung des Spearman'schen und Kendall'schen
| |
| Rangkorrelationskoeffizienten für zwei einzugebende Rangreihen. Nach dem Start ist eine
| |
| Eingabe der Anzahl der Fälle erforderlich. Anschließend werden die Ausprägungen der einzelnen Fälle der beiden Variablen eingegeben.
| |
|
| |
| Zum Test kann beispielsweise der folgende Datensatz verwendet werden:
| |
|
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center"|Schüler
| |
| |align="center"|1
| |
| |align="center"|2
| |
| |align="center"|3
| |
| |align="center"|4
| |
| |align="center"|5
| |
| |align="center"|6
| |
| |-
| |
| |align="center"|Note Mathematik
| |
| |align="center"|1
| |
| |align="center"|4
| |
| |align="center"|5
| |
| |align="center"|1
| |
| |align="center"|3
| |
| |align="center"|2
| |
| |-
| |
| |align="center"|Note Physik
| |
| |align="center"|2
| |
| |align="center"|5
| |
| |align="center"|3
| |
| |align="center"|2
| |
| |align="center"|2
| |
| |align="center"|3
| |
| |}
| |
|
| |
|
| |
| Das Programm liefert für dieses Beispiel den folgenden Output:
| |
|
| |
| [[Bild:STAT-Output.gif]]
| |
| -->
| |
Grundbegriffe
Konkordante oder gleichsinnige Merkmalspaare
Als konkordant (oder gleichsinnig) werden Merkmalspaare bezeichnet, die eine gleiche Ordnungsrelation aufweisen, d.h. beide Variablen weisen einen niedrigen oder einen hohen Merkmalswert auf.
Diskordante oder gegensinnige Merkmalspaare
Als diskordant (oder gegensinnig) werden jene Paare bezeichnet, die eine entgegengesetzte Ordnungsrelation aufweisen, d.h. eine der Variablen weist einen niedrigen und die andere Variable einen hohen Merkmalswert auf.
Bindung
Desweiteren können Merkmalspaare existieren, die gleich bezüglich jeweils eines Merkmalswertes oder beider Merkmalswerte sind. Dieser Umstand wird als Bindung bezeichnet.
Kendall'scher Rangkorrelationskoeffizient
Der Kendall'sche Rangkorrelationskoeffizient basiert auf dem Vergleich der Ordnungsrelation für alle möglichen Paare von beobachteten Merkmalswerten zweier Merkmale.
Die Anzahl der konkordanten Paare und der diskordanten Paare lässt sich nach folgendem Schema ermitteln:
- Die Merkmalspaare und werden nach aufsteigend sortiert.
- Die Anzahl der auf nachfolgenden Rangzahlen, die größer sind als wird mit bezeichnet.
- Die Anzahl der auf nachfolgenden Rangzahlen, die kleiner sind als wird mit bezeichnet.
Unter Verwendung der Anzahl der konkordanten und diskordanten Paare lässt sich der
Kendall'sche Rangkorrelationskoeffizient berechnen:
.
Eine weitere Möglichkeit zur Berechnung des Kendall'schen Rangkorrelationskoeffizienten unter Verwendung der Gesamtanzahl aller zu vergleichenden Ränge lautet wie folgt:
Zusatzinformationen
Die Gesamtanzahl aller zu vergleichenden Ränge ergibt sich als:
.
Der Kendall'sche Rangkorrelationskoeffizient nimmt nur Werte zwischen und an:
.