Parameter zweidimensionaler Verteilungen (stochastisch)

Aus MM*Stat

Wechseln zu: Navigation, Suche

Zufallsvariable

Zufallsvariable • Wahrscheinlichkeitsfunktion • Wahrscheinlichkeitsdichtefunktion • Verteilungsfunktion (stochastisch) • Randverteilung (stochastisch) • Bedingte Verteilung (stochastisch) • Stochastische Unabhängigkeit • Parameter eindimensionaler Verteilungen (stochastisch) • Parameter zweidimensionaler Verteilungen (stochastisch) • Multiple Choice • Video • Aufgaben • Lösungen
Bedingte Dichtefunktion • Bedingte Verteilungsfunktion • Bedingte Wahrscheinlichkeitsfunktion • Dichtefunktion (eindimensional) • Dichtefunktion (zweidimensional) • Diskrete Zufallsvariable • Erwartungswert • Erwartungswert (diskret) • Erwartungswert (stetig) • Korrelationskoeffizient (stochastisch) • Kovarianz (stochastisch) • Marginaldichte • Marginale Verteilung (stochastisch) • Randdichte • Randverteilungsfunktion • Realisation • Standardabweichung (stochastisch) • Standardisierung • Stetige Zufallsvariable • Tschebyschev-Ungleichung • Unabhängigkeit (stochastisch) • Varianz (stochastisch) • Varianz (stochastisch, diskret) • Varianz (stochastisch, stetig) • Verteilungsfunktion (stochastisch, eindimensional) • Verteilungsfunktion (stochastisch, zweidimensional) • Verteilungsfunktion der Randverteilung • Wahrscheinlichkeitsdichte (eindimensional) • Wahrscheinlichkeitsdichte (zweidimensional) • Wahrscheinlichkeitsfunktion (eindimensional) • Wahrscheinlichkeitsfunktion (zweidimensional) • Verteilung (stochastisch) • Wahrscheinlichkeitsverteilung

Grundbegriffe

Kovarianz

Mittels der Kovarianz wird die Richtung der Abhängigkeit zweier Zufallsvariablen gemessen. Die Kovarianz ist also ein Maß für den linearen Zusammenhang zweier Zufallsvariablen.

Der Kovarianz liegt das Produkt der Abweichungen der Zufallsvariablen X und Y von ihren Erwartungswerten zugrunde: (X-E(X))(Y-E(Y)).

Bildet man für dieses Produkt den Erwartungswert, erhält man die Kovarianz Cov(X,Y):

Cov(X,Y)=E[(X-E(X))\cdot (Y-E(Y))]=E(X\cdot Y)-E(X)\cdot E(Y)

Aus der Definition der Kovarianz folgt unmittelbar, dass die Kovarianz einer Zufallsvariablen zu sich selbst der Varianz entspricht:

Cov(X,X) = E[(X - E(X))\cdot (X-E(X))] = E[(X-E(X))^2] = Var(X).

Seien X und Y zwei diskrete Zufallsvariablen, dann berechnet sich die Kovarianz durch

Cov(X,Y) = \sum_i \sum_j [x_i - E(X)]\cdot [y_j - E(Y)]\cdot f(x_i, y_j) =  \sum_i \sum_j x_i\cdot y_j\dot f(x_i, y_j) - E(X)\cdot E(Y)

Seien X und Y zwei stetige Zufallsvariablen, dann ist die Kovarianz gegeben durch

Cov(X,Y) =  \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} [x - E(X)]\cdot [y - E(Y)]\cdot f(x, y)\, dx \, dy = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x\cdot y\cdot f(x, y)\, dx \,dy - E(X)\cdot E(Y)

Man beachte: Die Kovarianz kann im Gegensatz zur Varianz auch negativ werden.

Aussagen über die Stärke des Zusammenhanges können mit diesem Parameter nicht getroffen werden, da sich für die Kovarianz allgemein keine oberen und unteren Grenzen angeben lassen.

Es gilt jedoch der wichtige Satz:

Wenn die beiden Zufallsvariablen X und Y voneinander stochastisch unabhängig sind, dann ist die Kovarianz gleich Null.

Die Umkehrung dieses Satzes gilt nicht zwangsläufig, d.h. wenn die Kovarianz zweier Zufallsvariablen Null ist, folgt nicht, dass die beiden Zufallsvariablen stochastisch unabhängig sind.

Korrelationskoeffizient

Um nach der Berechnung der Kovarianz zusätzliche Aussagen über die Stärke des Zusammenhanges zu erhalten, wird der Korrelationskoeffizient verwendet.

Um ein Zusammenhangsmaß zu erhalten, dass nur Werte in einem endlichen Intervall annehmen kann, werden die beiden Zufallsvariablen X und Y standardisiert:

\frac{( X-E[X])}{\sigma _{x}};\;\frac{(Y-E[Y])}{\sigma _{y}}

Der Erwartungswert des Produkts der beiden standardisierten Zufallsvariablen heißt Korrelationskoeffizient:

\,\rho (X,Y)=E\left[ \frac{(X-E[X])}{\sigma _{x}}\cdot \frac{( Y-E[Y])}{\sigma _{y}}\right]=\frac{Cov(X,Y)}{\sigma _{x}\cdot \sigma _{y}}, falls \sigma _{x}>0,\ \sigma _{y}>0

Der Korrelationskoeffizient nimmt nur Werte zwischen -1 und +1 an, also -1\leq \rho (X,Y)\leq +1.

Zusatzinformationen

Eigenschaften des Korrelationskoeffizienten

Y = a+bX,  \mbox{ mit }b \neq 0 \mbox{ bzw. }X = c+dY,\mbox{ mit }d \neq 0
Die Umkehrung dieser Eigenschaft gilt nicht.
  • Ist \rho(X,Y)=0 dann werden X und Y als unkorreliert bezeichnet. Zwei unkorrelierte Zufallsvariablen können jedoch auch abhängig sein, z.B. wenn die Form der Abhängigkeit nichtlinear ist.

Correlation examples.png

Erwartungswert und Varianz bei Unabhängigkeit

Aus der Definition der Kovarianz

Cov(X,Y) = E[(X-E[X])\cdot (Y-E[Y])] = E[X\cdot Y] - E[X]\cdot E[Y]

erhält man durch Umstellung:

E[X\cdot Y] = E[X]\cdot E[Y] + Cov (X,Y) , falls X\, und Y\, stochastisch abhängig sind,

E[X\cdot Y] = E[X]\cdot E[Y] , falls X\, und Y\, stochastisch unabhängig sind.

Es ist weiterhin :

Var(X\cdot Y) = E[(X\cdot Y - E[X\cdot Y])^2] = E[(X\cdot Y)^2 - 2X \cdot Y E[X\cdot Y] + E[X\cdot Y] E[X\cdot Y]]= E[(X\cdot Y)^2] - 2E[X\cdot Y] E[X\cdot Y] + E[X\cdot Y] E[X\cdot Y]

Var(X\cdot Y) = E[(X\cdot Y)^2] - (E[X\cdot Y])^2 , wenn X \, und Y\, stochastisch abhängig und

Var(X\cdot Y) = E[X^2]\cdot E[Y^2] - (E[X]\cdot E[Y])^2 , wenn X\, und Y\, stochastisch unabhängig.

Linearkombinationen von Zufallsvariablen

Erwartungswerte und Varianzen von Linearkombinationen von Zufallsvariablen

\,Z \,E[Z] \,Var(Z)
a\cdot X \pm b\cdot Y a\cdot E[X]\pm b \cdot E[Y] a^2\cdot Var(X) + b^2\cdot Var(Y) \pm 2\cdot a\cdot b\cdot Cov(X,Y)
X + Y\; (a=b=1) \,E[X] + E[Y] \,Var(X) + Var(Y) + 2\cdot Cov(X,Y)
X - Y \;( a=1, \quad b= -1) \,E[X] - E[Y] \,Var(X) +Var(Y) - 2\cdot Cov(X,Y)
\frac{1}{2}\cdot (X + Y)\; ( a=b=\frac{1}{2}) \,\frac{1}{2}\cdot (E[X] + E[Y]) \,\frac{1}{4}\cdot Var(X) + \frac{1}{4}\cdot Var(Y) + \frac{1}{2}\cdot Cov(X,Y)

Beispiele

Polizeikontrolle

Beispiel für zwei diskrete Zufallsvariablen

Bei Polizeikontrollen wurde die Anzahl der Mängel pro Pkw (Zufallsvariable X) und das Alter des Pkw in Jahren (Zufallsvariable Y) registriert.

Für die weitere Betrachtung werden nur Pkw mit einem Alter von 1, 2 oder 3 Jahren ausgewählt.

Dann sei die gemeinsame Wahrscheinlichkeitsfunktion der beiden Zufallsvariablen mit den zugehörigen Randverteilungen wie folgt gegeben:

Mängelanzahl (X) Alter (Y) RV X
1 2 3
0 0,30 0,14 0,02 0,46
1 0,18 0,10 0,02 0,30
2 0,12 0,06 0,06 0,24
RV Y 0,60 0,30 0,10 1,000

Als Erwartungswerte und Varianzen der Randverteilungen erhält man:

E[X]=0\cdot 0,46+1\cdot 0,3+2\cdot 0,24=0,78

Var(X)=0\cdot 0,46+1\cdot 0,3+4\cdot 0,24-0,78^{2}=0,6516

E[Y]=1\cdot 0,6 + 2\cdot 0,3+3\cdot 0,1=1,5

Var(Y)=1\cdot 0,6+4\cdot 0,3+9\cdot 0,1-1,5^{2}=0,45

Für einen zufällig ausgewählten Pkw ist im Mittel eine Mängelanzahl von 0,78 bei einer Streuung von 0,65 und im Mittel ein Alter von 1,5 Jahren bei einer Streuung von 0,45 Jahren zu erwarten.

Kovarianz und Korrelationskoeffizient ergeben sich zu:

E[X\cdot Y]=0\cdot 1\cdot 0,3+0\cdot 2\cdot 0,14+0\cdot 3\cdot 0,02+1\cdot 1\cdot 0,18+1\cdot 2\cdot 0,1+1\cdot 3\cdot 0,02+2\cdot 1\cdot 0,12+2\cdot 2\cdot 0,06+2\cdot 3\cdot 0,06=1,28

Cov(X,Y)=1,28-0,78\cdot 1,5=0,11

\rho(X,Y)=\frac{0,11}{\sqrt{(0,6516\cdot 0,45)}}=0,2031

Mängelanzahl und Alter der Pkw sind somit positiv korreliert.

Beispiel für zwei stetige Zufallsvariablen

Gegeben seien zwei stetige Zufallsvariablen X und Y mit der gemeinsamen Dichtefunktion

f(x,y)=\begin{cases}\frac{x+3y}{2}& \mbox{, wenn }0<x<1 \mbox{ und }0<y<1 \\
0 & \mbox{, sonst}\end{cases}

und den Randverteilungen

f(x)=\begin{cases}\frac{x}{2}+\frac{3}{4}& \mbox{, wenn }0<x<1 \\
0 & \mbox{, sonst}\end{cases}

und

f(y)=\begin{cases}\frac{3y}{2}+\frac{1}{4} & \mbox{, wenn }0<y<1 \\
0 & \mbox{, sonst}\end{cases}

Für die Erwartungswerte und die Varianzen der Randverteilungen ergibt sich:

E[X]=\int_0^1x\cdot \left(\frac{x}{2}+\frac{3}{4}\right)dx=\left[\frac{x^3}{6}+\frac{3x^2}{8}\right]_0^1=\frac{1}{6}+\frac{3}{8}=\frac{13}{24}

E[Y]=\int_0^1y\cdot \left(\frac{3y}{2}+\frac{1}{4}\right)dy=\left[\frac{y^3}{2}+\frac{y^2}{8}\right]_0^1=\frac{1}{2}+\frac{1}{8}=\frac{5}{8}

Var(X)=\int_0^1x^2\cdot \left(\frac{x}{2}+\frac{3}{4}\right)dx+\left(\frac{13}{24}\right)^2=\left[\frac{x^4}{8}+\frac{x^3}{4}\right]_0^1+\left(\frac{13}{24}\right)^2=\frac{3}{8}+\frac{169}{576}=0,6684

Var(Y)=\int_0^1y^2\cdot \left(\frac{3y}{2}+\frac{1}{4}\right)dy+\left(\frac{5}{8}\right)^2=\left[\frac{3y^4}{8}+\frac{y^3}{12}\right]_0^1+\left(\frac{5}{8}\right)^2=\frac{11}{24}+\frac{25}{64}=0,849

für die Kovarianz folgt:

Cov(X,Y)\,  =  \int_0^1 \int_0^1 x\cdot  y\cdot  \left( \frac{x + 3y}{2} \right) \, dx\, dy - \left( \frac{13}{24} \right)\cdot  \left( \frac{5}{8} \right)
=  \frac{1}{2}\cdot  \int_0^1 \int_0^1 (x^2\cdot  y + 3 x\cdot  y^2) \, dx \, dy - \left(\frac{13}{24} \right)\cdot  \left( \frac{5}{8} \right)
= \frac{1}{2}\cdot  \int_0^1 \left[ \frac{x^2\cdot  y^2}{2} + x\cdot  y^3 \right]_0^1 \,dx - \left( \frac{13}{24} \right)\cdot  \left( \frac{5}{8} \right)
= \frac{1}{2}\cdot  \int_0^1 \left( \frac{x^2}{2} + x \right) \, dx - \left(\frac{13}{24} \right)\cdot  \left( \frac{5}{8} \right)
= \left[ \frac{x^3}{6} + \frac{x^2}{2} \right]_0^1 \, dx - \left( \frac{13}{24} \right)\cdot  \left( \frac{5}{8} \right)
= \frac{1}{3} - \frac{65}{192} = - \frac{1}{192}

Als Korrelationskoeffizient erhält man schließlich:

\rho(X,Y) = \frac{ - \frac{1}{192}}{\sqrt{0,6684 \cdot 0,849}} = - 0,007

Investmentfonds

Der Vermögensberater einer Bank bietet einem Kunden an, sein Vermögen in zwei Investmentfonds Securia (S) und Technoinvest (T) anzulegen.

Als Maß der Gewinnträchtigkeit einer Fondsanlage gilt im Allgemeinen die zu erwartende Rendite und als Maß des Risikos die Varianz bzw. Standardabweichung.

Die zu erwartenden Renditen sind jedoch entsprechend der künftigen Wirtschaftsentwicklung mit Unsicherheit verbunden.

Für die Aufteilung eines Portfolios auf unterschiedlich risikobehaftete Fonds ist weiterhin entscheidend, welche Korrelation zwischen den erwartenden Renditen des Investmentfonds besteht.

Der Vermögensberater gibt für drei Szenarien der Wirtschaftsentwicklung (1 - unverändert, 2 - Rezession, 3 - Konjunktur) eine Einschätzung über deren Eintrittswahrscheinlichkeiten sowie in Abhängigkeit von diesen Szenarien über die Renditen der zwei Investmentfonds Securia (S) und Technoinvest (T):

Szenario Wahrscheinlichkeit Rendite (S) (%) Rendite (T) (%)
1 0,5 3,5 5,0
2 0,3 4,0 -1,0
3 0,2 2,0 7,0

Daraus ergeben sich die erwarteten Renditen der beiden Investmentfonds

E[S]=3,5\cdot 0,5+4\cdot 0,3+2\cdot 0,2=3,35%

E[T]=5\cdot 0,5-1\cdot 0,3+7\cdot 0,2=3,6%

sowie die Varianzen und Standardabweichungen der Renditen

Var(S)=(3,5-3,35)^{2}\cdot 0,5+(4-3,35)^{2}\cdot0,3+(2-3,35)^{2}\cdot 0,2=0,5025\,,\quad \sigma (S)=0,7089%

Var(T)=(5-3,6)^{2}\cdot 0,5+(-1-3,6)^{2}\cdot 0,3+(7-3,6)^{2}\cdot0,2=9,64\,,\quad \sigma (T)=3,1048%

Die Variabilität der Renditen und damit das Risiko ist beim Investmentfond Technoinvest (T) deutlich höher als beim Investmentfond Securia (S).

Die Kovarianz der Renditen errechnet sich als

Cov(S,T)=(3,5-3,35)\cdot (5-3,6)\cdot 0,5+(4-3,35)\cdot (-1-3,6)\cdot0,3+(2-3,35)\cdot (7-3,6)\cdot 02=-1,71

Daraus ergibt sich ein Korrelationskoeffizient von

\rho (S,T)=\frac{-1,71}{0,7089\cdot 3,1048}=-0,7769

Die aufgrund der Szenarien erwarteten Renditen sind somit negativ korreliert.

Die erwartete Rendite eines Portefeuilles Z\, hängt nunmehr von der Aufteilung auf die beiden Investmentfonds ab.

Mit den Gewichten a und b für S\, und T\, (mit a + b = 1) folgt:

E[Z]=a\cdot E[S]+b\cdot E[T]\,

Var(Z)=a^{2}\cdot Var(S)+b^{2}\cdot Var(T)+2\cdot a\cdot b\cdot Cov(S,T)=a^{2}\cdot Var(S)+b^{2}\cdot Var(T)+2\cdot a\cdot b\cdot\sigma (S)\cdot \sigma (T)\cdot \rho (S,T)

Bei gegebenen Risiken der beiden Investmentfonds verringert sich das Risiko einer Splittung des Portefeuilles auf die Fonds, je geringer eine positive Korrelation bzw. je stärker eine negative Korrelation der erwarteten Renditen der beiden Investmentfonds ist.

Für gegebene a und b lassen sich nun E[Z] und Var(Z) ausrechnen, z.B.

  • a=b=0,5\,:
E[Z]=0,5\cdot 3,35+0,5\cdot 3,6=3,475
Var(Z)=0,25\cdot 0,5025+0,25\cdot 9,64-2\cdot 0,5\cdot 0,5\cdot 0,7089\cdot 3,1048\cdot 0,7769=1,6806
\sigma(Z)=1,296\,
  • a=0,8\; b=0,2:
E[Z]=0,8\cdot 3,35+0,2\cdot3,6=3,4
Var(Z)=0,64\cdot 0,5025+0,04\cdot 9,64-2\cdot 0,8\cdot 0,2\cdot 0,7089\cdot 3,1048\cdot 0,7769=0,16
\sigma (Z)=0,4\,

Bei einer Aufteilung des Portefeuilles mit 80% in Investmentfond Securia (S) und 20% in Investmentfond Technoinvest (T) ist das Risiko deutlich geringer als z.B. bei 50:50, ohne dabei erhebliche Verluste in der erwarteten Rendite des Portefeuilles hinnehmen zu müssen. Das Risiko dieser Aufteilung ist sogar geringer als das des risikoärmsten Investmentfonds.