Distribución Normal

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Decimos que una variable aleatoria continua X tiene una distribución normal con parámetros \mu y \sigma y se denota como  X \sim N(\mu ,\sigma) si y sólo si su densidad densidad es de la siguiente forma: f_NV(x;\mu ,\sigma) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-(x- \mu)^2/2
\sigma^2} \quad -\infty < x < + \infty , \sigma > 0 La función de distribución es la siguiente: F_NV(x;\mu ,\sigma) = \frac{1}{\sigma \sqrt{2 \pi}} \int\limits_{- \infty}^x
e^{-(t- \mu)^2/2 \sigma^2}\,dt La distribución normal depende de dos parámetros \mu y \sigma. que son el valor esperado y la desviación típica de la variable aleatoria X. El valor esperado, varianza y desviación típica: E(X) = \mu = \int\limits_{- \infty}^{+ \infty} xf(x)\,dx, \quad Var(X) =
{\sigma}^2 = \int\limits_{- \infty}^{+ \infty} (x - \mu)^2 f(x)\,dx, \quad
\sigma = \sqrt{{\sigma}^2} Dos propiedades importantes de las variables aleatorias normales son:

  • Transformación lineal

    Sea X una variable distribuida normalmente, X
\sim N(\mu,\sigma) e Y una combinación lineal de X: Y = a +
bX\, , b \neq 0. Entonces, la variable aleatoria Y también tiene una distribución normal:

    Y \sim N(a + b\mu, | b | \cdot \sigma.

    Los valores de los parámetros de una variable aleatoria transformada se obtienen a partir de reglas que se usan para calcular valores esperados y varianzas:

    E(a + bX) = a + b \cdot E(X)
    Var(a + bX) = b^2 Var(X) = b^2 {\sigma}^2.

  • Propiedad reproductiva

    Sean n variables aleatorias X_1,X_2 \dots,X_n con distribuciones Normales: X_i \sim N(\mu_i,\sigma_i), E(X_i)
=
\mu_i, Var(X_i) = \sigma_i^2.

    La suma de variables aleatorias independientes distribuidas normalmente X_1,
\dots, X_n, es decir
    Y = a_1X_1 + a_2X_2 + \dots + a_nX_n, a_i \neq 0 para al menos un i, tiene de nuevo una distribución normal.

    Y = \sum\limits_{i=1}^nA_iX_i \sim N \left(\sum\limits_{i=1}^na_i\mu_i,
\sqrt{\sum\limits_{i=1}^n a_i^2 \sigma_i^2}\right)

El siguiente gráfico muestra la densidad y la función de distribución de N(2;1). Densidad:

Es s2 26 12.gif

La función de distribución de N(2;1):

Es s2 26 13.gif

Variable aleatoria estandarizada: Z = \frac{X - \mu}{\sigma} Con la variable aleatoria Z se indica una variable aleatoria estandarizada, que se encuentra centrada respecto a la media y escalada por la desviación típica.
Si X se distribuye como una Normal, entonces Z también se distribuye como una Normal.
Distribución Normal estandarizada: La distribución normal Z se denota habitualmente como la distribución Normal estandarizada N(0;1).
la densidad de la distribución Normal estandarizada: \varphi (z) = \frac{1}{\sqrt{2\pi}} e^{- \frac{z^2}{2}} La función de distribución de la distribución Normal estandarizada: \Phi(z) = \frac{1}{\sqrt{2\pi}} \int\limits_{-\infty}^{z} e^{-v^{2}/2}\,dv El valor esperado de la distribución Normal estandarizada: E(Z) = 0 \quad Var(Z) = 1 En los siguientes gráficos se muestran la función de densidad y distribución Normal estandarizada.
Densidad de N(0;1)

Es s2 26 14.gif

Función de distribución de N(0;1)

Es s2 26 15.gif

La relación entre la distribución Normal N(\mu,\sigma) y la distribución Normal estandarizada:
z  x = \mu + z \cdot \sigma, z = \frac{x - \mu}{\sigma} lo que implica: F_{NV}(x;\mu,\sigma) = P(X \leq x) = P \left( \frac{X - \mu}{\sigma} \leq
\frac{x - \mu}{\sigma} \right) = P(Z \leq z) = \Phi(z) Intervalos de confianza: Un intervalo de confianza para una variable aleatoria X es un intervalo con límites x_l y x_u (x_l \leq x_u), que contiene el valor de la variable aleatoria X con una probabilidad 1 - \alpha, es decir, el (1 -\alpha) \cdot 100% de todos los valores de X están dentro de este intervalo y el \alpha
\cdot 100% de todos los valores están fuera del intervalo. a la cantidad 1-\alpha se le denomina normalmente como el nivel de confianza.
Para valores conocidos de \mu, el valor esperado de X, el intervalo es construido de forma que X esté fuera del intervalo de esta región (hay dos regiones) con una probabilidad \alpha/2. Llamamos al intervalo [x_u \leq x_o] = [\mu - k \leq X \leq \mu + k] el intervalo (simétrico) a un nivel de confianza P(x_u \leq X \leq x_o) = 1 - \alpha . Para remarcar la importancia de la desviación típica como un parámetro de escala, la desviación de X con respecto al valor esperado \mu normalmente se mide en múltiplos de \sigma. El intervalo de confianza tiene la siguiente forma: [\mu - c\sigma \leq X \leq \mu + c\sigma] Si la variable aleatoria X tiene una distribución Normal N(\mu,\sigma), entonces tenemos que para x = \mu + c\sigma se cumple: \frac{x - \mu}{\sigma} = \frac{\mu + c\sigma - mu}{\sigma} z = c y P(Z \leq z) = \Phi(z) = 1 - \alpha/2 . El valor crítico z_{1-\alpha/2} para la probabilidad 1 - \alpha/2 se puede obtener de las tablas tabuladas de la distribución Normal estandar. Utilizando estos valores, también se obtiene el intervalo de confianza para una variable aleatoria distribuida como una normal: [\mu - z_{1-\alpha/2}\sigma \leq X \mu + z_{1-\alpha/2}\sigma] y la probabilidad de “este intervalo”: P(\mu - z_{1-\alpha/2}\sigma \leq X \mu + z_{1-\alpha/2}\sigma) = 1 - \alpha El intervalo de confianza de una variable aleatoria con distribución normal:

Es s2 26 11.gif

Tenemos P(-z \leq Z \leq z) = P(Z \leq z) - P(Z \leq -z) = P(Z \leq z) - [1 - P(Z \leq z)] = 2P(Z \leq z) -1 ,
que implica que P(\mu - z_{1-\alpha/2}\sigma \leq X \mu + z_{1-\alpha/2}\sigma) = 2 \Phi(z) -
1 . Para valores dados de z podemos calcular los niveles de confianza del intervalo, por ejemplo:

P(\mu - z\sigma \leq X \mu + z\sigma) = 0.6827
for z = 1
= 0.9545 for z = 2
= 0.9973 for z = 3

Por otra parte, también se pueden encontrar el valor z que produce el nivel de confianza deseado 1-\alpha, por ejemplo, P(\mu - z_{1-\alpha/2}\sigma \leq X \mu + z_{1-\alpha/2}\sigma) = 0.95, z = 1.96. La distribución Normal depende de dos parámetros que afectan a:

  • forma
  • localización y
  • escala (varianza)

En este ejemplo interactivo, puedes elegir el valor de ambos parámetros y ver como cambian los gráficos de la la densidad y la función de distribución N(\mu, \sigma). Recomendamos modificar sólo uno de los dos parámetros al tiempo para observar sus efectos en la función de distribución. Para una mejor comparación, la densidad de la distribución Normal estandarizada también se muestra (en negro). Además, puedes calcular la probabilidad de que X esté en algún intervalo. Consideremos la variable aleatoria X que tiene distribución Normal N(100;\,10).

  1. Queremos calcular P(X \leq x) para x = 125: z = (x - \mu) / \sigma = (125 - 100) / 10 = 2,5 P(X \leq 125) = F(125) = \Phi \left( \frac{125 - 100}{10} \right) =
                \Phi (2.5) = 0.99379

    Es s2 26 f 2.gif

    Con una probabilidad del 99.38% la variable aleatoria X es más pequeña que 125.

  2. Queremos calcular la probabilidad P(X \geq x) para x = 115.6: z = (x - \mu) / \sigma = (115.6 - 100) / 10 = 1.56 \begin{align}
                P(X \geq 115.6) & = & 1 - P(X \leq 115.6) = 1 - F(115.6)\\
                & = & 1 - \Phi \left( \frac{115.6 - 100}{10} \right) = 1 - \Phi (1.56)\\
                & = & 1 - 0.94062 = 0.05938
                \end{align}

    Es s2 26 f 4.gif

    Hay una probabilidad del 5.94% de que la variable aleatoria X sea mayor que 115.6.

  3. Calculemos la probabilidad P(X \leq x) para x = 80: z = (x - \mu) / \sigma = (80 - 100) / 10 = -2 P(X \leq 80) = F(80) =  \Phi \left( \frac{80 - 100}{10} \right) =
                \Phi
                (-2) = 1 - \Phi (2) = 1 - 0.97725 = 0.02275

    Es s2 26 f 6.gif

    Con probabilidad 2.275% la variable aleatoria X es menor que 80.

  4. Calculemos P(X \geq x) para x = 94.8: z = (x - \mu) / \sigma = (94.8 - 100) / 10 = - 0.52 \begin{align}
                P(X \geq 94.8) & = & 1 - P(X \leq 94.8) = 1 - F(94.8)\\
                & = & 1 - \Phi \left( \frac{94.8 - 100}{10} \right) = 1 - \Phi (-0.52)\\
                & = & 1 - (1 - \Phi (0.52)) = \Phi(0.52) = 0.698468
                \end{align}

    Es s2 26 f 8.gif

    La probabilidad de que la variable aleatoria X sea mayor que 94.8 es 69,85% .

  5. Obtengamos la probabilidad P(x_u \leq X \leq x_o) para x_u = 88.8 y x_o = 132: z_u = (x_u - \mu) / \sigma = (88.8 - 100) / 10 = - 1.12 z_o = (x_o - \mu) / \sigma = (132 - 100) / 10 = 3.2 \begin{align}
                P(88.8 \leq X \leq 132) & = & P(X \leq 132) - P(X \leq 88,8)\\
                & = & F(132) - F(88.8)\\
                & = & \Phi (3.2) - \Phi (- 1.12)\\
                & = & \Phi (3.2) - (1 - \Phi (1.12)\\
                & = & 0.999313 + 0.868643 - 1\\
                & = & 0.867956\\
                \end{align}

    Es s2 26 f 10.gif

    La variable aleatoria X está en el intervalo [88,8\,;\,132] con una probabilidad del 86.8% .

  6. Calculemos P(x_u \leq X \leq x_o) para x_u = 80.4 y x_o = 119.6: z_u = (x_u - \mu) / \sigma = (80.4 - 100) / 10 = - 1.96 z_o = (x_o - \mu) / \sigma = (119.6 - 100) / 10 = 1.96 \begin{align}
                P(80.4 \leq X \leq 119.6) & = & P(X \leq 119.6) - P(X \leq 80.4)\\
                & = & F(119.6) - F(80.4)\\
                & = & \Phi (1.96) - \Phi (-1.96)\\
                & = & \Phi (1.96) - (1 - \Phi (1.96)\\
                & = & 2 \Phi (1.96) - 1\\
                & = & 2 \cdot 0.975 - 1 = 0.95\\
                \end{align}

    Es s2 26 f 12.gif

    Con probabilidad 95% la variable aleatoria X cae en el intervalo [80,4\,;\,119,6].

  7. Queremos calcular un intervalo, simétrico respecto al valor esperado, y que contenga 99% de los resultados de X: \begin{align}
                P(x_u \leq X \leq x_o) & = & 0.99\\
                & = & P \left( \frac{x_u - 100}{10} \leq Z \leq \frac{x_o - 100}{10}
                \right)\\
                & = & P( -z \leq Z \leq z) = 2 \Phi (z) - 1\\
                \Phi (z) & = & \frac{1.99}{2} = 0.995\\
                \end{align}

    Para el valor (la probabilidad) de 0.995 encontramos en las tablas de la función de distribución de la función Normal que z
=2,58. Esto implica: x_o = \mu + z \sigma = 100 + 2.58 \cdot 10 = 125.8 x_u = \mu - z \sigma = 100 - 2.58 \cdot 10 = 74.2 P(74.2 \leq X \leq 125.8) = 0.99.

    Es s2 26 f 14.gif

    Con probabilidad 99% la variable aleatoria X está en el intervalo [74,2\,;\,125,8].

  8. Vamos a obtener el x que hace que el 76,11% de las realizaciones de X sean menores que x: \begin{align}
                P(X \leq x) & = & 0.7611\\
                & = & P \left(Z \leq \frac{x - 100}{10} \right) = P(Z \leq z)\\
                \end{align}

    Para un valor 0.7611 obtenemos en la tabla de la función de distribución de una variable normal estandarizada que z = 0.71. Por lo tanto: x = \mu + z \sigma = 100 + 0.71 \cdot 10 = 107.1 por lo que P(X \leq 107.1) = 0.7611.

    Es s2 26 f 16.gif

    Con probabilidad 76.11% la variable aleatoria X es menor que 107.1.

  9. Calculamos el x tal que el 3,6% de las realizaciones de X son mayores que x: \begin{align}
                P(X \geq x) & = & 0.036\\
                & = & P \left(Z \geq \frac{x - 100}{10} \right) = P(Z \geq z)\\
                \end{align}

    Pesto que P(Z \geq z) = 1 - P(Z \leq z) = 0.964, vemos en la tabla de la función de distribución de la Normal estandarizada el valor z = 1,8 para una probabilidad 0.964. por lo tanto, x = \mu - z \sigma = 100 - 1.8 \cdot 10 = 118 así que P(X \geq 118) = 0.036.

    Es s2 26 f 18.gif

    Con probabilidad 3,6% , la variable aleatoria X es mayor que 118.

La distribución Normal es la distribución continua más importante porque:

  • al menos, la aproximación normal es asumida en casi todas las aplicaciones
  • Nos permite aproximar muchas otras distribuciones
  • Se usa como modelo en muchas situaciones, suponiendo que el número de observaciones es suficientemente grande

Una variable aleatoria con distribución Normal puede tomar valores entre -\infty y +\infty, es decir, el rango de estas variables es ilimitado. La distribución Normal a veces también se llama distribución gausiana. La densidad de la distribución Normal se denomina campana de Gauss.
Las formulas para la densidad (o la función de distribución) indican que la distribución Normal está dada por los parámetros \mu
\text{ y }
\sigma. Variando estos paraámetros podemos obtener cualquier distribución Normal. El siguiente gráfico muestra 5 densidades normales para distintos valores de \mu \text{ y } \sigma.

Es s2 26 m 1.gif

El parámetro \mu especifica la localización de la distribución. Si cambiamos el parámetro \mu, la curva se moverá pero no asi su forma.
Incrementando o disminuyendo el parámetro \sigma, la densidad se “dispersa” o “concentra”. Para valores grandes de \sigma, la curva es más plana y extensa. Para valores pequeños de \sigma, la curva es más concentrada y alta. Otras propiedades de la distribución Normal:

  • la densidad tiene un máximo global (la moda) en el punto x = \mu
  • la densidad es simétrica entorno al punto x = \mu. La simetría implica que la mediana es x_{0,5} = \mu .
  • la densidad tiene puntos de inflexión en x_1 = \mu - \sigma y x_2 = \mu + \sigma
  • la densidad es asintóticamente igual a cero 0 para  x \rightarrow - \infty y  x \rightarrow \infty .

Los siguientes gráficos muestran las propiedades de N(2;1)

Es s2 26 m 2.gif Es s2 26 m 3.gif

Distribución Normal estandarizada: La tabulación de la función de distribución de una Normal para todos los valores de \mu y \sigma no es posible.
Sin embargo, debido a que podemos transformar un variable aleatoria Normal para obtener otra variable aleatoria Normal, sólo será necesario tabular una tabla. La elección más obvia es la distribución Normal de valor esperado 0, E(X) =
\mu  = 0 y desviación típica 1, \sigma  = 1. Esta distribución se denomina distribución Normal estandarizada, denotada como N(0,1). Las variables aleatorias que siguen esta distribución se denotan con la letra Z.
La variable aleatoria Z da el valor de la variable aletoria X centrada en su media y dividido por la desviación típica1. Por lo tanto E(Z) = 0 y Var(Z) = 1. Si X se distribuye normalmente, entonces la variable aleatoria Z tiene una distribución Normal (estandarizada). La distribución Normal estandarizada es importante porque cada variable aleatoria X una distribución Normal arbitraria puede ser transformada linealmente en una variable Z con distribución Normal estandarizada. En muchas tablas de la distribución Normal estandarizada sólo puedes encontrar los valores positivos de Z.Las tablas de la distribución Normal estandarizada para valores negativos de Z no son necesarias debido a la simetría de la distribución Normal. \Phi (-z) = P(Z \leq -z) = 1 - P(Z \leq z) = 1 - \Phi (z)