Kovarianz (empirisch): Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Bivariate Statistik}} =={{Vorlage:Überschrift}}== ===(Empirische) Kovarianz=== Die ''empirische Kovarianz'' oder auch kurz ''Kovarianz'' ist ein speziel…“)
 
 
Zeile 68: Zeile 68:
EDV-Anlage (in 1000 €) beobachtet, deren [[Merkmalswert]]e in den Spalten 2 und 3 der folgenden Tabelle enthalten sind.
EDV-Anlage (in 1000 €) beobachtet, deren [[Merkmalswert]]e in den Spalten 2 und 3 der folgenden Tabelle enthalten sind.


{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
{| class="wikitable"
|align="center"|Unternehmen
|Unternehmen
|align="center"|Jahresgewinn in Mio. €
|Jahresgewinn in Mio. €
|align="center"|Jahresmiete in 1000 €
|Jahresmiete in 1000 €
|align="center"|
|
|align="center"|
|
|align="center"|
|
|-
|-
|align="center"|<math>\,i</math>
|<math>\,i</math>
|align="center"|<math>\,y_{i}</math>
|<math>\,y_{i}</math>
|align="center"|<math>\,x_{i}</math>
|<math>\,x_{i}</math>
|align="center"|<math>(y_{i}-\bar{y})</math>
|<math>(y_{i}-\bar{y})</math>
|align="center"|<math>(x_{i}-\bar{x})</math>
|<math>(x_{i}-\bar{x})</math>
|align="center"|<math>(y_{i}-\bar{y})\cdot(x_{i}-\bar{x})</math>
|<math>(y_{i}-\bar{y})\cdot(x_{i}-\bar{x})</math>
|-
|-
|align="center"|1
|align="right"|1
|align="center"|10
|align="right"|10
|align="center"|30
|align="right"|30
|align="center"|-20
|align="right"|-20
|align="center"|-170
|align="right"|-170
|align="center"|3400
|align="right"|3400
|-
|-
|align="center"|2
|align="right"|2
|align="center"|15
|align="right"|15
|align="center"|30
|align="right"|30
|align="center"|-15
|align="right"|-15
|align="center"|-170
|align="right"|-170
|align="center"|2550
|align="right"|2550
|-
|-
|align="center"|3
|align="right"|3
|align="center"|15
|align="right"|15
|align="center"|100
|align="right"|100
|align="center"|-15
|align="right"|-15
|align="center"|-100
|align="right"|-100
|align="center"|1500
|align="right"|1500
|-
|-
|align="center"|4  
|align="right"|4  
|align="center"|20
|align="right"|20
|align="center"|50
|align="right"|50
|align="center"|-10
|align="right"|-10
|align="center"|-150
|align="right"|-150
|align="center"|1500
|align="right"|1500
|-
|-
|align="center"|5
|align="right"|5
|align="center"|20
|align="right"|20
|align="center"|100
|align="right"|100
|align="center"|-10
|align="right"|-10
|align="center"|-100
|align="right"|-100
|align="center"|1000
|align="right"|1000
|-
|-
|align="center"|6
|align="right"|6
|align="center"|25
|align="right"|25
|align="center"|80
|align="right"|80
|align="center"|-5
|align="right"|-5
|align="center"|-120
|align="right"|-120
|align="center"|600
|align="right"|600
|-
|-
|align="center"|7
|align="right"|7
|align="center"|30
|align="right"|30
|align="center"|50
|align="right"|50
|align="center"|0
|align="right"|0
|align="center"|-150
|align="right"|-150
|align="center"|0
|align="right"|0
|-
|-
|align="center"|8
|align="right"|8
|align="center"|30
|align="right"|30
|align="center"|100
|align="right"|100
|align="center"|0
|align="right"|0
|align="center"|-100
|align="right"|-100
|align="center"|0
|align="right"|0
|-
|-
|align="center"|9
|align="right"|9
|align="center"|30
|align="right"|30
|align="center"|250
|align="right"|250
|align="center"|0
|align="right"|0
|align="center"|50
|align="right"|50
|align="center"|0
|align="right"|0
|-
|-
|align="center"|10
|align="right"|10
|align="center"|35
|align="right"|35
|align="center"|180
|align="right"|180
|align="center"|5
|align="right"|5
|align="center"|-20
|align="right"|-20
|align="center"|-100
|align="right"|-100
|-
|-
|align="center"|11
|align="right"|11
|align="center"|35
|align="right"|35
|align="center"|330
|align="right"|330
|align="center"|5
|align="right"|5
|align="center"|130
|align="right"|130
|align="center"|650
|align="right"|650
|-
|-
|align="center"|12
|align="right"|12
|align="center"|40
|align="right"|40
|align="center"|200
|align="right"|200
|align="center"|10
|align="right"|10
|align="center"|0
|align="right"|0
|align="center"|0
|align="right"|0
|-
|-
|align="center"|13
|align="right"|13
|align="center"|45
|align="right"|45
|align="center"|400
|align="right"|400
|align="center"|15
|align="right"|15
|align="center"|200
|align="right"|200
|align="center"|3000
|align="right"|3000
|-
|-
|align="center"|14
|align="right"|14
|align="center"|50
|align="right"|50
|align="center"|500
|align="right"|500
|align="center"|20
|align="right"|20
|align="center"|300
|align="right"|300
|align="center"|6000
|align="right"|6000
|-
|-
|align="center"|15
|align="right"|15
|align="center"|50
|align="right"|50
|align="center"|600
|align="right"|600
|align="center"|20
|align="right"|20
|align="center"|400
|align="right"|400
|align="center"|8000
|align="right"|8000
|}
|}


Wie groß ist die gemeinsame Variabilität der [[Merkmal]]e <math>X\;</math> und <math>Y\;</math> bei diesen 15 Unternehmen?
Wie groß ist die gemeinsame Variabilität der [[Merkmal]]e <math>X\;</math> und <math>Y\;</math> bei diesen 15 Unternehmen?

Aktuelle Version vom 3. April 2019, 15:35 Uhr

Bivariate Statistik

Zweidimensionale Häufigkeitsverteilung • Graphische Darstellung zweidimensionaler Verteilungen • Randverteilungen, Bedingte Verteilungen • Parameter zweidimensionaler Verteilungen (empirisch) • Kontingenz • Spearman'scher Rangkorrelationskoeffizient • Kendall'scher Rangkorrelationskoeffizient • Kovarianz (empirisch) • Bravais–Pearson–Korrelationskoeffizient • Multiple Choice • Video • Aufgaben • Lösungen
3D-Balkendiagramm • 3D-Scatterplot • Absolute Häufigkeit (zweidimensional) • Ausprägungskombination • Bedingte Verteilung (empirisch) • Bindung • Chi-Quadrat-Koeffizient • Diskordante Merkmalspaare • Gegensinnige Merkmalspaare • Gemeinsame Variation • Gleichsinnige Merkmalspaare • Gruppiertes Balkendiagramm • Häufigkeitstabelle (zweidimensional) • Konditionale Verteilung • Konkordante Merkmalspaare • Kontingenzkoeffizient • Kontingenztabelle • Korrelation • Korrelationskoeffizient (empirisch) • Korrelationskoeffizient (nach Bravais-Pearson) • Korrigierter Kontingenzkoeffizient • Kreuztabelle • linearer Zusammenhang • Marginale Verteilung (empirisch) • Parameter (emp. Randverteilung) • Parameter (emp. bedingte Verteilung) • Quadratische Kontingenz • Randverteilung (empirisch) • Relative Häufigkeit (zweidimensional) • Scatterplot • Scatterplot-Matrix • Streuungsdiagramm • Unabhängigkeit (empirisch) • Unabhängigkeit (statistisch) • Variation (Streuung)


Grundbegriffe

(Empirische) Kovarianz

Die empirische Kovarianz oder auch kurz Kovarianz ist ein spezieller Parameter für zweidimensionale Häufigkeitsverteilungen, der die gemeinsame Variabilität zweier metrisch skalierter Merkmale und misst.

Die Kovarianz wird kaum als eigenständiger Parameter verwendet. Sie dient vielmehr als Hilfsgröße, die zur Berechnung anderer Parameter gebraucht wird (vgl. Bravais–Pearson–Korrelationskoeffizient).

Für eine zweidimensionale Häufigkeitsverteilung mit den absoluten Häufigkeiten bzw. den relativen Häufigkeiten berechnet sich die Kovarianz wie folgt:

Im Gegensatz zur empirischen Varianz kann die Kovarianz auch negative Werte annehmen.

Zusatzinformationen

Kovarianz bei Unabhängigkeit

Sind die Merkmale und voneinander unabhängig, besteht also zwischen den Merkmalen und kein Zusammenhang, nimmt die Kovarianz den Wert Null an.

Es gilt:

Beweis:

Die Umkehrung dieses Satzes gilt nicht zwangsläufig. Das heißt, wenn die Kovarianz zwischen den Merkmalen und Null ist, kann nicht unbedingt daraus geschlossen werden, dass sie unabhängig sind.

Kovarianz und Varianz

Die empirische Kovarianz eines Merkmals mit sich selbst entspricht der empirischen Varianz dieses Merkmals

Lineare Transformation

Beispiele

Gewinn und Miete

An Unternehmen wurden die Merkmale - Jahresgewinn (in Mio. €) und - Jahresmiete für die EDV-Anlage (in 1000 €) beobachtet, deren Merkmalswerte in den Spalten 2 und 3 der folgenden Tabelle enthalten sind.

Unternehmen Jahresgewinn in Mio. € Jahresmiete in 1000 €
1 10 30 -20 -170 3400
2 15 30 -15 -170 2550
3 15 100 -15 -100 1500
4 20 50 -10 -150 1500
5 20 100 -10 -100 1000
6 25 80 -5 -120 600
7 30 50 0 -150 0
8 30 100 0 -100 0
9 30 250 0 50 0
10 35 180 5 -20 -100
11 35 330 5 130 650
12 40 200 10 0 0
13 45 400 15 200 3000
14 50 500 20 300 6000
15 50 600 20 400 8000


Wie groß ist die gemeinsame Variabilität der Merkmale und bei diesen 15 Unternehmen?

Die arithmetischen Mittel der Merkmale sind:

(Mio. €)

(1000 €)

Die Abweichungen der Merkmalswerte des Merkmals vom arithmetischen Mittel enthält die Spalte 4 der Tabelle.

Die Abweichungen der Merkmalswerte von vom arithmetischen Mittel sind in Spalte 5 angegeben.

Die Kovarianz errechnet sich nach der Formel

Die Abweichungsprodukte für jedes Unternehmen enthält die Spalte 6 der Tabelle.

Die Summe der Werte in dieser Spalte, dividiert durch , ist die gesuchte Kovarianz:

.