Parámetros de distribuciones bidimensionales

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Podemos calcular facilmente los y varianzas de las distribuciones marginales y condicionadas. Las distribuciones condicionadas y marginales son unidimensionales y sus fórmulas correspondientes son facilmente derivables—vamos a usar simplemente las fórmulas para el valor esperado y varianza de la variable aleatoria unidimensional. Existen bastantes parámetros que están ligados diréctamente con la distribución conjunta de un par de variables aleatorias. Los más importantes son la covarianza y el coeficiente de correlación.

Covarianza:

La covarianza se basa en el producto de las diferencias de las variables aleatorias X e Y con respecto a sus valores esperados: (X - E(X))(Y - E(Y)). La covarianza Cov(X,Y) se define como el valor esperado de este producto: Cov(X,Y) = E[(X - E(X))(Y - E(Y))] = E(XY) - E(X)E(Y) La covarianza mide el tipo de dependencia de las variables aleatorias. Atención: la covarianza puede ser tanto positiva como negativa. En general, la covarianza no está acotada. Concerniente al valor de la covarianza, el siguiente teorema es muy importante:
La covarianza de las variables aleatorias (estocásticamente) independientes X e Y es igual a cero. En general, no es verdad lo contrario, es decir, un covarianza igual a cero no implica independencia.

Coeficiente de correlación

El coeficiente de correlación se utiliza para evaluar el grado de dependencia entre las variables. Se estandarizan las dos variables aleatorias X e Y con el fin de obtener una medida de dependencia que pueda presentar valores únicamente en un intervalo especificado: \frac{[X - E(X)]}{\sigma_x} ; \frac{[Y - E(Y)]}{\sigma_y} El valor esperado del producto de ambas variables estandarizadas se denomina coeficiente de correlación: \rho(X,Y) = E \left[ \frac{[X - E(X)]}{\sigma_x} \cdot \frac{[Y - E(Y)]}{\sigma_y} \right] = \frac{Cov(X,Y)}{\sigma_x \cdot \sigma_y} para \sigma_x > 0, \ \sigma_y > 0. Se puede ver que: -1 \leq \rho(X,Y) \leq +1 Las propiedades del coeficiente de correlación:

  • El signo del coeficiente de correlación y el signo de la covarianza deben ser el mismo, porque la desviación típica no puede ser negativa (raiz cuadrada de la varianza)
  • El coeficiente de correlación está siempre en el intervalo [-1;+1]
  • El coeficiente de correlación mide la dependencia lineal de dos variables
  • |\rho(X,Y)| = 1 si y sólo si X e Y cumplen Y = a+bX, \ b \neq 0, \ \text{resp.} \ X = c+dY, \ d \neq 0 para cualquier a,b,c,d
  • Si X e Y son independientes entonces \rho (X,Y) = 0

Correlación cero no implica independencia.
Si \rho (X,Y) = 0 entonces decimos que X e Y están incorreladas. Dos variables incorreladas pueden ser dependientes si su dependencia no es lineal. Los valores esperados y la varianza de combinaciones lineales de variables aleatorias:

Z E(Z) Var(Z)
aX \pm bY aE(X) \pm b(EY) a^2 Var(X) + b^2 Var(Y) \pm 2abCov(X,Y)
X + Y (caso: a=b=1) E(X) + E(Y)  Var(X) + Var(Y) + 2Cov(X,Y)
X - Y (caso: a=1, b=
-1) E(X) - E(Y)  Var(X) + Var(Y) - 2Cov(X,Y)
1/2(X + Y) (caso: a=b=1/2) 1/2 [E(X) + E(Y)]
 1/4 Var(X) + 1/4 Var(Y) + 1/2Cov(X,Y)


Es s2 16 e 1.gif Un consultor de inversiones ofrecía a sus clientes dos tipos de fondos: Securia (S) y Technoinvest (T). La ganancia esperada se toma normalmente como una medida de rentabilidad y la varianza (o, equivalentemente, la desviación típica) es una medida de riesgo. La ganancia esperada está relacionada con el desarrollo económico futuro. Para la distribución de la inversión entre diferentes fondos con diferente nivel de riesgo, tenemos que considerar la correlación entre las ganancias esperadas. El consultor ofrece una evaluación—probabilidades para tres diferentes escenarios en función de la evolución de la economía (1—sin cambio, 2—recesión, 3—especulación) y, dependiendo de la evolución económica, una estimación de la ganancia esperada de los fondos de inversión Securia y Technoinvest es la siguiente.

Escenario Rentabilidad Ganancia S (%) Ganancia T (%)
1 0,5 3,5 5,0
2 0,3 4,0 - 1,0
3 0,2 2,0 7,0


El valor esperado de los dos fondos de inversión sobre los posibles estados de la economía: E(S) = 3,5 \cdot 0,5 + 4 \cdot 0,3 + 2 \cdot 0,2 = 3,35 \,\% \text{ a } E(T) = 5 \cdot 0,5 - 1 \cdot 0,3 + 7 \cdot 0,2 = 3,6 \, \% y la varianza de estos fondos: Var(S) = (3,5 - 3,35)^2 \cdot 0,5 + (4 - 3,35)^2 \cdot 0,3 + (2 - 3,35)^2 \cdot 0,2 = 0,5025 \, , \quad \sigma (S) = 0,7089 \,\% Var(T) = (5 - 3,6)^2 \cdot 0,5 + (-1 - 3,6)^2 \cdot 0,3 + (7 - 3,6)^2 \cdot 0,2 = 9,64\, , \quad \sigma (T) = 3,1048 \,\% La variabilidad de la ganancia y por lo tanto del riesgo es mayor para el fondo de inversión Technoinvest (T) que para Securia (S). Vamos a calcular la covarianza de las ganancias Cov(S,T) = (3,5 - 3,35)(5 - 3,6) \cdot 0,5 + (4 - 3,35)(-1 - 3,6) \cdot 0,3 + (2 - 3,35)(7 - 3,6) \cdot 0,2 = -1,71 y obtener el coeficiente de correlación \rho (S,T) = -1,71/(0,7089 \cdot 3,1048) = - 0,7769 Las ganancias esperadas basadas en los escenarios anteriormente mencionados están negativamente correlacionadas. La ganancia esperada de la cartera Z depende de la distribución del dinero entre los dos fondos. Utilizando como pesos a y b (a + b
= 1), se obtiene E(Z) = aE(S) + bE(T) Var(Z) = a^2 Var(S) + b^2 Var(T) + 2ab Cov(S,T) = a^2 Var(S) + b^2 Var(T) + 2ab \cdot \sigma (S) \cdot \sigma (T) \cdot \rho (S,T) Si se conoce el riesgo en ambas inversiones, el riesgo de la cartera disminuirá si la correlación de las ganancias de los fondos disminuye, es decir, si la correlación positiva decrece, o la correlación negativa “aumenta”. Vamos a calcular E(Z) y Var(Z) para a b dados, por ejemplo, a = b = 0,5:
E(Z) = 0,5 \cdot 3,35 + 0,5 \cdot 3,6 = 3,475
Var(Z) = 0,25 \cdot 0,5025 + 0,25 \cdot 9,64 - 2 \cdot 0,5 \cdot 0,5 \cdot 0,7089 \cdot 3,1048 \cdot 0,7769 = 1,6806
\sigma (Z) = 1,296

a = 0,8 \ b = 0,2:
E(Z) = 0,8 \cdot 3,35 + 0,2 \cdot 3,6 = 3,4
Var(Z) = 0,64 \cdot 0,5025 + 0,04 \cdot 9,64 - 2 \cdot 0,8 \cdot 0,2 \cdot 0,7089 \cdot 3,1048 \cdot 0,7769 = 0,16
\sigma (Z) = 0,4
El riesgo es mucho menor si invertimos el 80% en el fondo Securia (S) y 20 % en el fondo Technoinvest (T) que si distribuimos las cuotas al 50:50. Al mismo tiempo, la ganancia esperada permanece constante. El riesgo de esta distribución es menor incluso que el riesgo del fondo más seguro por si mismo. Es s2 45 f 4.gif El departamento de policía tomó datos del número de problemas técnicos (variable aleatoria X) y la edad de los coches en años (variable aleatoria Y). Sólo los coches con 1,2 o 3 años se seleccionaron para la investigación. Las funciones de probabilidad marginales y conjunta de estas dos variables (para los coches seleccionados) se muestran en la siguiente tabla:

Número de problemas (X) MD X
1 2 3
0 0,30 0,14 0,02 0,46
1 0,18 0,10 0,02 0,30
2 0,12 0,06 0,06 0,24
MD Y 0,60 0,30 0,10 1,000


Los valores esperados y las varianzas de las distribuciones marginales son: E(X) = 0 \cdot 0,46 + 1 \cdot 0,3 + 2 \cdot 0,24 = 0,78 \, , \quad Var(X) = 0 \cdot 0,46 + 1 \cdot 0,3 + 4 \cdot 0,24 - 0,78^2 = 0,6516 E(Y) = 1 \cdot 0,6 + 2 \cdot 0,3 + 3 \cdot 0,1 = 1,5 \, , \quad Var(Y) = 1 \cdot 0,6 + 4 \cdot 0,3 + 9 \cdot 0,1 - 1,5^2 = 0,45 Se espera que un coche elegido aleatoriamente tenga, de media, 0.78 y problemas técnicos con una desviación de 0.65. La edad de un coche elegido al azar es en promedio de 1.5 años con una desviación de 0.45 años. La varianza y el coeficiente de correlación son calculados del siguiente modo: E(XY) = 0 \cdot 1 \cdot 0,3 + 0 \cdot 2 \cdot 0,14 + 0 \cdot 3 \cdot 0,02 + 1 \cdot 1 \cdot 0,18 + 1 \cdot 2 \cdot 0,1 + 1 \cdot 3 \cdot 0,02 + 2 \cdot 1 \cdot 0,12 + 2 \cdot 2 \cdot 0,06 + 2 \cdot 3 \cdot 0,06 = 1,28 Cov(X,Y) = 1,28 - 0,78 \cdot 1,5 = 0,11 \, , \quad \rho(X,Y) = 0,11/(0,6516 \cdot 0,45)^{0,5} = 0,2031 Esto significa que el número de problemas y la edad están relacionados positivamente,
Consideremos dos variables aleatorias continuas X e Y con la densidad conjunta f(x,y) = \left\{ \begin{array}{cl}
                        \frac{x + 3 y}{2} \quad & \text{para } 0 < x < 1 \ \text{y } 0 < y < 1\\
                        0 & \text{otro caso}
                    \end{array}
                \right. y distribuciones marginales f(x) = \left\{ \begin{array}{cl}
                        \frac{x}{2} + \frac{3}{4} \quad & \text{para } 0 < x < 1 \\
                        0 & \text{otro caso.}
                    \end{array}
                \right. y f(y) = \left\{ \begin{array}{cl}
                        \frac{3 y}{2} + \frac{1}{4} \quad & \text{para } 0 < y < 1\\
                        0 & \text{otro caso.}
                    \end{array}
                \right. Los valores esperados y las varianzas: \begin{align}
    E(X) & = & \int_0^1 x \left( \frac{x}{2} + \frac{3}{4} \right) \, dx = \left[ \frac{x^3}{6} + \frac{3x^2}{8} \right]_0^1 = \frac{1}{6} + \frac{3}{8} = \frac{13}{24}\\
    E(Y) & = & \int_0^1 y \left( \frac{3y}{2} + \frac{1}{4} \right) \, dy = \left[ \frac{y^3}{2} + \frac{y^2}{8} \right]_0^1 = \frac{1}{2} + \frac{1}{8} = \frac{5}{8}\\
    Var(X) & = & \int_0^1 x^2 \left( \frac{x}{2} + \frac{3}{4} \right) \, dx + \left( \frac{13}{24} \right)^2 = \left[ \frac{x^4}{8} + \frac{x^3}{4} \right]_0^1 + \left( \frac{13}{24} \right)^2 = \frac{3}{8} + \frac{169}{576} = 0,\,6684\\
    Var(Y) & = & \int_0^1 y^2 \left( \frac{3y}{2} + \frac{1}{4} \right) \, dy + \left( \frac{5}{8} \right)^2 = \left[ \frac{3y^4}{8} + \frac{y^3}{12} \right]_0^1 + \left( \frac{5}{8} \right)^2 = \frac{11}{24} + \frac{25}{64} = 0,\,849\\\end{align} La covarianza: \begin{align}
    Cov(X,Y) & = & \int_0^1 \int_0^1 x y \left( \frac{x + 3y}{2} \right) \, dx \, dy - \left( \frac{13}{24} \right) \left( \frac{5}{8} \right)\\
    & = & \frac{1}{2} \int_0^1 \int_0^1 (x^2 y + 3 x y^2) \, dx \, dy - \left( \frac{13}{24} \right) \left( \frac{5}{8} \right)\\
    & = & \frac{1}{2} \int_0^1 \left[ \frac{x^2 y^2}{2} + x y^3 \right]_0^1 \, dx - \left( \frac{13}{24} \right) \left( \frac{5}{8} \right)\\
    & = & \frac{1}{2} \int_0^1 \left( \frac{x^2}{2} + x \right) \, dx - \left( \frac{13}{24} \right) \left( \frac{5}{8} \right)\\
    & = & \left[ \frac{x^3}{6} + \frac{x^2}{2} \right]_0^1 \, dx - \left( \frac{13}{24} \right) \left( \frac{5}{8} \right)\\
    & = & \frac{1}{3} - \frac{65}{192} = - \frac{1}{192}\end{align} Y el coeficiente de correlación: \rho(X,Y) = \frac{ - \frac{1}{192}}{\sqrt{0,6684 \cdot 0,849}} = - 0,007 Los valores esperados y las varianzas de las distribuciones marginales a) para dos variables aleatorias discretas E(X) = \sum_i \sum_j x_i \cdot f(x_i,y_j) = \sum_i x_i \sum_j f(x_i,y_j) = \sum_i x_i f(x_i) E(Y) = \sum_j \sum_i y_j \cdot f(x_i,y_j) = \sum_j y_j \sum_i f(x_i,y_j) = \sum_j y_j \cdot f(y_j) Var (X) = E[(X - E(X))]^2 = \sum_i \sum_j [x_i - E(X)]^2 f(x_i, y_j) = \sum_i [x_i - E(X)]^2 \sum_j f(x_i,y_j) = = \sum_i [x_i - E(X)]^2 f(x_i) = \sum_i x_i^2 f(x_i) - [E(X)]^2 Var (Y) = E[(Y - E(Y))]^2 = \sum_j \sum_i [y_j - E(Y)]^2 f(x_i, y_j) = \sum_j [y_j - E(Y)]^2 \sum_i f(x_i,y_j) = = \sum_j [y_j - E(Y)]^2 f(y_j) = \sum_j y_j^2 f(y_j) - [E(Y)]^2 b) para dos variables aleatorias continuas E(X) = \int_{-\infty}^{+\infty}  \int_{-\infty}^{+\infty} x f(x,y) \, dx\, dy =  \int_{-\infty}^{+\infty} x \left[  \int_{-\infty}^{+\infty} f(x,y \, dy \right] \, dx =  \int_{-\infty}^{+\infty} x f(x) \, dx E(Y) =  \int_{-\infty}^{+\infty}  \int_{-\infty}^{+\infty} y f(x,y) \, dx \, dy =  \int_{-\infty}^{+\infty} y \left[  \int_{-\infty}^{+\infty} f(x,y) \, dx \right] \, dy =  \int_{-\infty}^{+\infty} y f(y) \, dy Var (X) =  \int_{-\infty}^{+\infty} [x - E(X)]^2 \cdot f(x) \, dx =  \int_{-\infty}^{+\infty} x^2 f(x) \, dx - [E(X)]^2 Var (Y) =  \int_{-\infty}^{+\infty} [y - E(Y)]^2 \cdot f(y) \, dy =  \int_{-\infty}^{+\infty} y^2 f(y) \, dy - [E(Y)]^2 Los valores esperados y las varianzas de las distribuciónes condicionadas a) para dos variables aleatorias discretas E(X|y_j) = \sum_i x_i f(x_i|y_j \, , \qquad E(Y|x_i) = \sum_j y_j f(y_j|x_i) Var(X|y_j) = \sum_i [x_i - E(X|y_j)]^2 f(x_i|y_j) = \sum_i x_i^2 f(x_i|y_j) - [E(X|y_j)]^2 Var(Y|x_i) = \sum_j [y_j - E(y|x_i)]^2 f(y_j|x_i) = \sum_j y_j^2 f(y_j|x_i) - [E(Y|x_i)]^2 b) para dos variables aleatorias continuas E(X|y) =  \int_{-\infty}^{+\infty} x f(x|y) \, dx \, , \qquad E(Y|x) =  \int_{-\infty}^{+\infty} y f(y|x) \, dx Var(X|y) =  \int_{-\infty}^{+\infty} [x - E(X|y)]^2 \cdot f(x|y) \, dx Var(Y|x) =  \int_{-\infty}^{+\infty} [y - E(Y|x)]^2 \cdot f(y|x) \, dy Covarianza: Cálculo de la covarianza de X e Y en casos específicos
a) X e Y discretas: \begin{align}
    Cov(X,Y) & = & \sum_i \sum_j [x_i - E(X)] [y_j - E(Y)] f(x_i, y_j)\\
    & = & \sum_i \sum_j x_i y_j f(x_i, y_j) - E(X)E(Y)\end{align} b) X e Y continuas: \begin{align}
    Cov(X,Y) & = &  \int_{-\infty}^{+\infty}  \int_{-\infty}^{+\infty} [x - E(X)] [y - E(Y)] f(x, y)\, dx \, dy\\
    & = &  \int_{-\infty}^{+\infty}  \int_{-\infty}^{+\infty} x y f(x, y)\, dx \, dy - E(X)E(Y)\end{align} La definición de la covarianza implica que la covarianza de una variable aleatoria por si misma es igual a la varianza: Cov(X,X) = E[(X - E(X)) (X-E(X))] = E[(X-E(X))^2]\, . De la definición de la covarianza: Cov(X,Y) = E[(X-E(X)) (Y-E(Y))] = E(XY) - E(X)E(Y) se obtiene: E(XY) = E(X)E(Y) + Cov (X,Y)\,\ \text{si } X\ \text{e } Y\ \text{ son dependientes y} E(XY) = E(X)E(Y)\,\  \text{si } X\ \text{e } Y\ \text{ son independientes.} Además: Var(XY) = E\{[XY - E(XY)]^2\} = E\{(XY)^2 - 2XY E(XY) + E(XY) E(XY)\} = = E[(XY)^2] - 2E(XY) E(XY) + E(XY) E(XY) \Longrightarrow Var(XY) = E[(XY)^2] - [E(XY)]^2\ \text{para} \ X\  \text{e}\ Y\ \text{ dependientes y} Var(XY) = E(X^2)E(Y^2) - [E(X)E(Y)]^2 \ \text{para} \ X\  \text{e}\ Y\ \text{independientes.}