Spearman'scher Rangkorrelationskoeffizient

Aus MM*Stat

Version vom 14. Mai 2018, 22:45 Uhr von Germainf (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Bivariate Statistik}} =={{Vorlage:Überschrift}}== ===Spearman'scher Rangkorrelationskoeffizient=== Ausgangspunkt für die Messung von Zusammenhängen bei…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Bivariate Statistik

Zweidimensionale Häufigkeitsverteilung • Graphische Darstellung zweidimensionaler Verteilungen • Randverteilungen, Bedingte Verteilungen • Parameter zweidimensionaler Verteilungen (empirisch) • Kontingenz • Spearman'scher Rangkorrelationskoeffizient • Kendall'scher Rangkorrelationskoeffizient • Kovarianz (empirisch) • Bravais–Pearson–Korrelationskoeffizient • Multiple Choice • Video • Aufgaben • Lösungen
3D-Balkendiagramm • 3D-Scatterplot • Absolute Häufigkeit (zweidimensional) • Ausprägungskombination • Bedingte Verteilung (empirisch) • Bindung • Chi-Quadrat-Koeffizient • Diskordante Merkmalspaare • Gegensinnige Merkmalspaare • Gemeinsame Variation • Gleichsinnige Merkmalspaare • Gruppiertes Balkendiagramm • Häufigkeitstabelle (zweidimensional) • Konditionale Verteilung • Konkordante Merkmalspaare • Kontingenzkoeffizient • Kontingenztabelle • Korrelation • Korrelationskoeffizient (empirisch) • Korrelationskoeffizient (nach Bravais-Pearson) • Korrigierter Kontingenzkoeffizient • Kreuztabelle • linearer Zusammenhang • Marginale Verteilung (empirisch) • Parameter (emp. Randverteilung) • Parameter (emp. bedingte Verteilung) • Quadratische Kontingenz • Randverteilung (empirisch) • Relative Häufigkeit (zweidimensional) • Scatterplot • Scatterplot-Matrix • Streuungsdiagramm • Unabhängigkeit (empirisch) • Unabhängigkeit (statistisch) • Variation (Streuung)

Grundbegriffe

Spearman'scher Rangkorrelationskoeffizient

Ausgangspunkt für die Messung von Zusammenhängen bei zwei ordinalskalierten Merkmalen X\; und Y\; bilden die Rangzahlen

R(x_i),R(y_i), \quad i=1,\ldots,n, die den Merkmalsausprägungen x_{i} und y_{j} entsprechend ihrer Rangordnung zugeordnet sind.

Für diese Rangzahlenpaare lässt sich der Spearman'sche Rangkorrelationskoeffizient wie folgt berechnen:


r_s=1-\frac{6 \cdot\sum^n_{i=1}\limits [R(x_i)-R(y_i)]^2}{n\cdot(n^2-1)}= 1-\frac{6\cdot\sum^n_{i=1}\limits d_i^2}{n\cdot(n^2-1)},\quad d_i=R(x_i)-R(y_i)


  • Der Spearman'sche Rangkorrelationskoeffizient nimmt nur Werte zwischen -1 und +1 an:
-1\leq r_{s}\leq1.
  • Den Wert +1 genau dann, wenn sich die Ränge völlig gleichsinnig verhalten, d.h.
\,R(x_{i})=R(y_{i}) für alle i.
  • Den Wert -1 genau dann, wenn sich die Ränge völlig gegensinnig verhalten, d.h.
\,R(x_{i})=n+1-R(y_{i}) für alle i.

Zusatzinformationen

Zusammenhang mit Bravais-Pearson-Korrelationskoeffizient

Der Spearman'sche Rangkorrelationskoeffizient entspricht dem auf Rangzahlen angewandten Bravais–Pearson–Korrelationskoeffizienten:

Es gilt:

\sum_{i=1}^{n}\limits R(x_{i})=\sum_{i=1}^{n}\limits R(y_{i})=\frac{n\cdot(n+1)}{2}

\sum^n_{i=1}\limits R(x_i)^2=\sum^n_{i=1}\limits R(y_i)^2=\frac{n\cdot(n+1)\cdot(2n+1)}{6}

\sum_{i=1}^{n}\limits R(x_{i})\cdot R(y_{i})=\frac{1}{2}\cdot\left[ \sum_{i=1}^{n}\limits R(x_{i})^{2}+\sum_{i=1}^{n}\limits R(y_{i})^{2}-\sum_{i=1}^{n}\limits(R(x_{i})-R(y_{i}))^{2}\right]

Der Bravais–Pearson–Korrelationskoeffizienten berechnet sich nach:

r_{yx}=\frac{n\cdot\sum_{i=1}^{n}\limits x_{i}\cdot y_{i}-\sum_{i=1}^{n}\limits x_{i}\cdot\sum_{i=1}^{n}\limits y_{i}}{\sqrt{\left[ n\cdot\sum_{i=1}^{n}\limits x_{i}^{2}-\left( \sum_{i=1}^{n}\limits x_{i}\right) ^{2}\right]\cdot \left[n\cdot\sum_{i=1}^{n}\limits y_{i}^{2}-\left( \sum_{i=1}^{n}\limits y_{i}\right)^{2}\right] }}

Werden anstelle der direkten Merkmalsausprägungen x_{i} und y_{i} die zugeordneten Rangzahlen R(x_{i}) und R(y_{i}) verwendet, lässt sich der Spearman'sche Rangkorrelationskoeffizient ableiten:

r_s=\frac{n\cdot \sum^n_{i=1}\limits R(x_i)\cdot R(y_i) - \sum^n_{i=1}\limits R(x_i) \sum^n_{i=1}\limits R(y_i)}{\sqrt{\left[n\cdot \sum^n_{i=1}\limits R(x_i)^2 - \left(\sum^n_{i=1}\limits R(x_i) \right)^2\right]\cdot \left[n\cdot\sum^n_{i=1}\limits R(y_i)^2 - \left(\sum^n_{i=1}\limits R(y_i)\right)^2\right]}}

=\frac{n\cdot \frac{1}{2}\cdot 2 \frac{n\cdot(n+1)\cdot(2n+1)}{6}-n\cdot \frac{1}{2}\cdot\sum^n_{i=1}\limits [R(x_i)-R(y_i)]^2 - \frac{n^2\cdot(n+1)^2}{4}} {n\cdot \frac{n\cdot(n+1)\cdot(2n+1)}{6}-\frac{n^2\cdot(n+1)^2}{4}}

=1-\frac{6\cdot\sum_{i=1}^{n}\limits[R(x_{i})-R(y_{i})]^{2}}{n\cdot(n+1)\cdot(n-1)}

Beispiele

Skisport

X\;- Platzierung des Sportlers in der Abfahrt

Y\;- Platzierung des Sportlers im Slalom

Besteht ein Zusammenhang zwischen der Platzierung in beiden Disziplinen?

Sportler i 1 2 3 4 5 6
Abfahrt X\; 2 1 3 4 5 6
Slalom Y\; 2 3 1 5 4 6
{d_{i}}^{2} 0 4 4 1 1 0

r= 1-\frac{6 \cdot 10} {6\cdot(36-1)}=0,7143

Der Koeffizient weist auf einen starken Zusammenhang zwischen der Platzierung in beiden Disziplinen hin.