Kendall'scher Rangkorrelationskoeffizient: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
 
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Bivariate Statistik}}
{{Bivariate Statistik}}
{{SubpageToc|Beispiel: Angestellte|Beispiel: Leichtathletik|Interaktives Beispiel: Vertrauen in Institutionen}}


=={{Vorlage:Überschrift}}==
=={{Vorlage:Überschrift}}==
Zeile 43: Zeile 44:


<math> -1\leq \tau \leq1</math>.
<math> -1\leq \tau \leq1</math>.
=={{Vorlage:Beispiele}}==
===Angestellte===
10 Angestellte wurden bezüglich ihrer organisatorischen Fähigkeiten <math>(X)\;</math> und ihrer Arbeitssorgfalt <math>(Y)\;</math> geprüft und für jedes der [[Merkmal]]e in eine Rangordnung gebracht.
Um Aussagen über den Zusammenhang zwischen beiden [[Merkmal]]en treffen zu können, wird sowohl der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche Rangkorrelationskoeffizient]] als auch der Kendall'sche Rangkorrelationskoeffizient berechnet.
{| class="wikitable"
|align="right"|Angestellter <math>i</math>
|align="right"|1
|align="right"|2
|align="right"|3
|align="right"|4
|align="right"|5
|align="right"|6
|align="right"|7
|align="right"|8
|align="right"|9
|align="right"|10
|-
|align="right"|<math>R(X)</math>
|align="right"|7
|align="right"|3
|align="right"|9
|align="right"|10
|align="right"|1
|align="right"|5
|align="right"|4
|align="right"|6
|align="right"|2
|align="right"|8
|-
|align="right"|<math>R(Y)</math>
|align="right"|3
|align="right"|9
|align="right"|10
|align="right"|8
|align="right"|7
|align="right"|1
|align="right"|5
|align="right"|4
|align="right"|2
|align="right"|6
|-
|align="right"|<math>{d_i}^2</math>
|align="right"|16
|align="right"|36
|align="right"|1
|align="right"|4
|align="right"|36
|align="right"|16
|align="right"|1
|align="right"|4
|align="right"|0
|align="right"|4
|}
{| class="wikitable"
|align="right"|Angestellter <math>i</math>
|align="right"|5
|align="right"|9
|align="right"|2
|align="right"|7
|align="right"|6
|align="right"|8
|align="right"|1
|align="right"|10
|align="right"|3
|align="right"|4
|-
|align="right"|<math>R(X)</math>
|align="right"|1
|align="right"|2
|align="right"|3
|align="right"|4
|align="right"|5
|align="right"|6
|align="right"|7
|align="right"|8
|align="right"|9
|align="right"|10
|-
|align="right"|<math>R(Y)</math>
|align="right"|7
|align="right"|2
|align="right"|9
|align="right"|5
|align="right"|1
|align="right"|4
|align="right"|3
|align="right"|6
|align="right"|10
|align="right"|8
|-
|align="right"|<math>q</math> (kleiner)
|align="right"|6
|align="right"|1
|align="right"|6
|align="right"|3
|align="right"|0
|align="right"|1
|align="right"|0
|align="right"|0
|align="right"|1
|align="right"|0
|-
|align="right"|<math>p</math> (größer)
|align="right"|3
|align="right"|7
|align="right"|1
|align="right"|3
|align="right"|5
|align="right"|3
|align="right"|3
|align="right"|2
|align="right"|0
|align="right"|0
|}
* Spearman'scher Rangkorrelationskoeffizient
:<math>r_s=1-\frac{6\cdot \sum^n_{i=1}\limits d_i^2}{n\cdot(n^2-1)}</math>
:<math>r_{s}=1-6\cdot \frac{ 118}{10\cdot 99}=0,2848</math>
* Kendall'scher Rangkorrelationskoeffizient
:<math>Q=18, \quad P=27</math>
:<math>Q+P=\frac{n\cdot(n-1)}{2}=10 \cdot \frac{9}{2}=45</math>
:<math>\tau=\frac{27-18}{27+18}=\frac{9}{45}=0,200</math>
===Leichtathletik===
Gegeben sei die Platzierung von 20 Sportlern in den beiden Leichtathletik-Disziplinen 100 Meter-Lauf und 200 Meter-Lauf:
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
|align="center"|Sportler <math>(i)</math>
|align="center"|01
|align="center"|02
|align="center"|03
|align="center"|04
|align="center"|05
|align="center"|06
|align="center"|07
|align="center"|08
|align="center"|09
|align="center"|10
|align="center"|11
|align="center"|12
|align="center"|13
|align="center"|14
|align="center"|15
|align="center"|16
|align="center"|17
|align="center"|18
|align="center"|19
|align="center"|20
|-
|align="center"|100 Meter <math>(x)</math>
|align="center"|5
|align="center"|7
|align="center"|3
|align="center"|13
|align="center"|2
|align="center"|15
|align="center"|19
|align="center"|14
|align="center"|12
|align="center"|1
|align="center"|6
|align="center"|20
|align="center"|17
|align="center"|4
|align="center"|18
|align="center"|11
|align="center"|10
|align="center"|16
|align="center"|9
|align="center"|8
|-
|align="center"|200 Meter <math>(y)</math>
|align="center"|3
|align="center"|9
|align="center"|1
|align="center"|10
|align="center"|7
|align="center"|5
|align="center"|13
|align="center"|14
|align="center"|17
|align="center"|4
|align="center"|11
|align="center"|16
|align="center"|18
|align="center"|12
|align="center"|20
|align="center"|2
|align="center"|15
|align="center"|19
|align="center"|6
|align="center"|8
|}
Im Folgenden soll der statistische Zusammenhang zwischen der Platzierung der Sportler in den einzelnen Disziplinen ermittelt werden.
Da es sich um [[Ordinalskala|ordinalskalierte]] Daten handelt, werden der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche]] und der Kendall'sche Rangkorrelationskoeffizient verwendet.
Die Berechnung beider Koeffizienten liefert die folgenden Ergebnisse:
<pre>
Spearman'scher Rangkorrelationskoeffizient: 0.6617
Kendall'scher Rangkorrelationskoeffizient: 0.4526
konkordante Paare: 138
diskordante Paare: 52
gleich nur bzgl. x: 0
gleich nur bzgl. y: 0
gleich bzgl. x und y: 0
</pre>
Der [[Spearman'scher Rangkorrelationskoeffizient|Spearman'sche Rangkorrelationskoeffizient]] errechnet sich nach der Formel:
<math>r_s = 1- \frac{6\cdot\sum_{i=1}^{n}{d_i}^2} {n\cdot(n^2-1)}</math>
Die notwendigen Informationen lassen sich aus der Tabelle entnehmen:
<math>d</math> ergibt sich als Differenz zwischen den beiden [[Variable]]n <math>x</math> und <math>y</math>.
<math>n</math> ist die Anzahl der platzierten Sportler (= 20).
Die Berechnung des [[Spearman'scher Rangkorrelationskoeffizient|Spearman'schen Rangkorrelationskoeffizienten]] ergibt einen Wert von 0,6617, was einen positiven Zusammenhang zwischen den Platzierungen in beiden Disziplinen impliziert.
Gute Sportler über 100 Meter erreichen also auch über 200 Meter gute Platzierungen.
Für die Berechnung des Kendall'schen Rangkorrelationskoeffizienten müssen die Paare der
[[Konkordante Merkmalspaare|konkordanten]] und [[Diskordante Merkmalspaare|diskordanten Paare]] ermittelt werden.
Zwei Paare heißen [[Konkordante Merkmalspaare|konkordant]], wenn bezüglich beider [[Merkmal]]e die gleiche Ordnungsrelation vorliegt und [[Diskordante Merkmalspaare|diskordant]], wenn eine verschiedene Ordnungsrelation vorliegt.
Für das Paar Sportler 1 und Sportler 2 liegt beispielsweise [[Konkordante Merkmalspaare|Konkordanz]] vor: Sportler 1 erreicht sowohl im 100 Meter-Lauf als auch im 200 Meter-Lauf eine bessere Platzierung.
Anders dagegen beim Vergleich von Sportler 1 mit Sportler 5: Sportler 1 erreicht über 100 Meter eine schlechtere, über 200 Meter aber eine bessere Platzierung - es liegt eine [[Diskordante Merkmalspaare|Diskordanz]] vor.
Insgesamt ergeben sich für dieses Beispiel <math>0,5 \cdot n \cdot (n-1) = 190</math> verschiedene Paare, davon sind 138 Paare [[Konkordante Merkmalspaare|konkordant]], 52 Paare [[Diskordante Merkmalspaare|diskordant]].
Mit Kenntnis dieser Zahlen lässt sich der Kendall'sche Rangkorrelationskoeffizient errechnen:
<math>\tau = \frac {P-Q}{P+Q}, \ \mbox{mit} \ Q=\sum_i q_i \ \mbox{und} \ P=\sum_i p_i</math>
Dabei stellt <math>P</math> die Anzahl der [[Konkordante Merkmalspaare|konkordanten Paare]] und <math>Q</math> die Anzahl der [[Diskordante Merkmalspaare|diskordanten Paare]] dar.
Der Kendall'sche Rangkorrelationskoeffizient beträgt für das obige Beispiel <math>0,4526</math>, was auch hier auf einen positiven Zusammenhang hinweist.
<!--==Interaktives Beispiel==
Dieses Beispiel erlaubt die Berechnung des Spearman'schen und Kendall'schen
Rangkorrelationskoeffizienten für zwei einzugebende Rangreihen. Nach dem Start ist eine
Eingabe der Anzahl der Fälle erforderlich. Anschließend werden die Ausprägungen der einzelnen Fälle der beiden Variablen eingegeben.
Zum Test kann beispielsweise der folgende Datensatz verwendet werden:
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
|align="center"|Schüler
|align="center"|1
|align="center"|2
|align="center"|3
|align="center"|4
|align="center"|5
|align="center"|6
|-
|align="center"|Note Mathematik
|align="center"|1
|align="center"|4
|align="center"|5
|align="center"|1
|align="center"|3
|align="center"|2
|-
|align="center"|Note Physik
|align="center"|2
|align="center"|5
|align="center"|3
|align="center"|2
|align="center"|2
|align="center"|3
|}
Das Programm liefert für dieses Beispiel den folgenden Output:
[[Bild:STAT-Output.gif]]
-->

Aktuelle Version vom 5. Juli 2020, 14:35 Uhr

Bivariate Statistik

Zweidimensionale Häufigkeitsverteilung • Graphische Darstellung zweidimensionaler Verteilungen • Randverteilungen, Bedingte Verteilungen • Parameter zweidimensionaler Verteilungen (empirisch) • Kontingenz • Spearman'scher Rangkorrelationskoeffizient • Kendall'scher Rangkorrelationskoeffizient • Kovarianz (empirisch) • Bravais–Pearson–Korrelationskoeffizient • Multiple Choice • Video • Aufgaben • Lösungen
3D-Balkendiagramm • 3D-Scatterplot • Absolute Häufigkeit (zweidimensional) • Ausprägungskombination • Bedingte Verteilung (empirisch) • Bindung • Chi-Quadrat-Koeffizient • Diskordante Merkmalspaare • Gegensinnige Merkmalspaare • Gemeinsame Variation • Gleichsinnige Merkmalspaare • Gruppiertes Balkendiagramm • Häufigkeitstabelle (zweidimensional) • Konditionale Verteilung • Konkordante Merkmalspaare • Kontingenzkoeffizient • Kontingenztabelle • Korrelation • Korrelationskoeffizient (empirisch) • Korrelationskoeffizient (nach Bravais-Pearson) • Korrigierter Kontingenzkoeffizient • Kreuztabelle • linearer Zusammenhang • Marginale Verteilung (empirisch) • Parameter (emp. Randverteilung) • Parameter (emp. bedingte Verteilung) • Quadratische Kontingenz • Randverteilung (empirisch) • Relative Häufigkeit (zweidimensional) • Scatterplot • Scatterplot-Matrix • Streuungsdiagramm • Unabhängigkeit (empirisch) • Unabhängigkeit (statistisch) • Variation (Streuung)

Grundbegriffe

Konkordante oder gleichsinnige Merkmalspaare

Als konkordant (oder gleichsinnig) werden Merkmalspaare bezeichnet, die eine gleiche Ordnungsrelation aufweisen, d.h. beide Variablen weisen einen niedrigen oder einen hohen Merkmalswert auf.

Diskordante oder gegensinnige Merkmalspaare

Als diskordant (oder gegensinnig) werden jene Paare bezeichnet, die eine entgegengesetzte Ordnungsrelation aufweisen, d.h. eine der Variablen weist einen niedrigen und die andere Variable einen hohen Merkmalswert auf.

Bindung

Desweiteren können Merkmalspaare existieren, die gleich bezüglich jeweils eines Merkmalswertes oder beider Merkmalswerte sind. Dieser Umstand wird als Bindung bezeichnet.

Kendall'scher Rangkorrelationskoeffizient

Der Kendall'sche Rangkorrelationskoeffizient basiert auf dem Vergleich der Ordnungsrelation für alle möglichen Paare von beobachteten Merkmalswerten zweier Merkmale.

Die Anzahl der konkordanten Paare und der diskordanten Paare lässt sich nach folgendem Schema ermitteln:

  • Die Merkmalspaare und werden nach aufsteigend sortiert.
  • Die Anzahl der auf nachfolgenden Rangzahlen, die größer sind als wird mit bezeichnet.
  • Die Anzahl der auf nachfolgenden Rangzahlen, die kleiner sind als wird mit bezeichnet.

Unter Verwendung der Anzahl der konkordanten und diskordanten Paare lässt sich der Kendall'sche Rangkorrelationskoeffizient berechnen:

.

Eine weitere Möglichkeit zur Berechnung des Kendall'schen Rangkorrelationskoeffizienten unter Verwendung der Gesamtanzahl aller zu vergleichenden Ränge lautet wie folgt:

Zusatzinformationen

Die Gesamtanzahl aller zu vergleichenden Ränge ergibt sich als:

.

Der Kendall'sche Rangkorrelationskoeffizient nimmt nur Werte zwischen und an:

.