Grundbegriffe
(Empirische) Kovarianz
Die empirische Kovarianz oder auch kurz Kovarianz ist ein spezieller Parameter für zweidimensionale Häufigkeitsverteilungen, der die gemeinsame Variabilität zweier metrisch skalierter Merkmale und misst.
Die Kovarianz wird kaum als eigenständiger Parameter verwendet. Sie dient vielmehr als Hilfsgröße, die zur Berechnung anderer Parameter gebraucht wird (vgl. Bravais–Pearson–Korrelationskoeffizient).
Für eine zweidimensionale Häufigkeitsverteilung mit den absoluten Häufigkeiten bzw. den relativen Häufigkeiten berechnet sich die Kovarianz wie folgt:
|
|
|
|
Im Gegensatz zur empirischen Varianz kann die Kovarianz auch negative Werte annehmen.
Zusatzinformationen
Kovarianz bei Unabhängigkeit
Sind die Merkmale und voneinander unabhängig, besteht also zwischen den Merkmalen und kein Zusammenhang, nimmt die Kovarianz den Wert Null an.
Es gilt:
Beweis:
|
|
|
|
|
|
|
|
|
|
Die Umkehrung dieses Satzes gilt nicht zwangsläufig. Das heißt, wenn die Kovarianz zwischen den Merkmalen und Null ist, kann nicht unbedingt daraus geschlossen werden, dass sie unabhängig sind.
Kovarianz und Varianz
Die empirische Kovarianz eines Merkmals mit sich selbst entspricht der empirischen Varianz dieses Merkmals
Lineare Transformation
Beispiele
Gewinn und Miete
An Unternehmen wurden die Merkmale - Jahresgewinn (in Mio. €) und - Jahresmiete für die
EDV-Anlage (in 1000 €) beobachtet, deren Merkmalswerte in den Spalten 2 und 3 der folgenden Tabelle enthalten sind.
Unternehmen
|
Jahresgewinn in Mio. €
|
Jahresmiete in 1000 €
|
|
|
|
|
|
|
|
|
|
1
|
10
|
30
|
-20
|
-170
|
3400
|
2
|
15
|
30
|
-15
|
-170
|
2550
|
3
|
15
|
100
|
-15
|
-100
|
1500
|
4
|
20
|
50
|
-10
|
-150
|
1500
|
5
|
20
|
100
|
-10
|
-100
|
1000
|
6
|
25
|
80
|
-5
|
-120
|
600
|
7
|
30
|
50
|
0
|
-150
|
0
|
8
|
30
|
100
|
0
|
-100
|
0
|
9
|
30
|
250
|
0
|
50
|
0
|
10
|
35
|
180
|
5
|
-20
|
-100
|
11
|
35
|
330
|
5
|
130
|
650
|
12
|
40
|
200
|
10
|
0
|
0
|
13
|
45
|
400
|
15
|
200
|
3000
|
14
|
50
|
500
|
20
|
300
|
6000
|
15
|
50
|
600
|
20
|
400
|
8000
|
Wie groß ist die gemeinsame Variabilität der Merkmale und bei diesen 15 Unternehmen?
Die arithmetischen Mittel der Merkmale sind:
(Mio. €)
(1000 €)
Die Abweichungen der Merkmalswerte des Merkmals vom arithmetischen Mittel enthält die Spalte 4 der Tabelle.
Die Abweichungen der Merkmalswerte von vom arithmetischen Mittel sind in Spalte 5 angegeben.
Die Kovarianz errechnet sich nach der Formel
|
|
|
|
Die Abweichungsprodukte für jedes Unternehmen enthält die Spalte 6 der Tabelle.
Die Summe der Werte in dieser Spalte, dividiert durch , ist die gesuchte Kovarianz:
.