Aproximación de Distribuciones

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


La aproximación significa que, bajo ciertas condiciones, podemos usar en lugar de la distribución exacta alguna más sencilla. Los teoremas límites (por ejemplo, el Teorema Central del Límite) ofrecen herrramientas teóricas para este tipo de aproximaciones. Como son aproximaciones a la verdadera distribución pueden haber errores en la aproximación. Sin embargo, existen métodos para evaluar la calidad de la aproximación. A continuación vamos a presentar aproximaciones para un número de distribuciones asi como los criterios que pueden ser usados para evaluar la calidad de estas aproximaciones. Distribución Normal como límite de otras distribuciones:

  • Aproximación de la distribución Binomial por la distribución Normal:

    Esta aproximación se basa el teorema límite de Laplace y DeMoivre.
    Sean X_1,\dots,X_n independientes, con distribución de Bernoulli con E(X_i) = p y Var(X_i) = p(1-p) para todo i. Entonces X = X_1 + \dots + X_n es una variable aleatoria con distribución Binomial B(n,p), con E(X) = np y varianza Var(X) = np(1-p).
    Para n \rightarrow
\infty, la distribución de la variable aleatoria estandarizada
    Z = \frac{X - np}{\sqrt{np(1-p}}

    converge a la distribución Normal estandarizada N(0;1). Para n grande tenemos:
    X_n \approx N(np;\sqrt{np(1-p)})

    con valor esperado \mu = np y varianza \sigma^2
= np(1-p).

    Debido a que la distribución Binomial es discreta, y la distribución Normal es continua, vamos a mejorar los resultados mediante el uso de un ajuste por continuidad:

    P(X \leq x) = F_B(x;n,p) \approx \Phi \left( \frac{x + 0.5 - np}{\sqrt{np(1
- p)}} \right)

    P(X = x) = f_B(x;n,p) \approx \Phi \left( \frac{x + 0.5 - np}{\sqrt{np(1 -
p)}} \right) - \Phi \left( \frac{x - 0.5 - np}{\sqrt{np(1 - p)}} \right)

    Una regla para una aproximación suficientemente buena a la distribución Binomial requiere:
    np \geq 5 a n(1-p) \geq 5 .

  • Aproximación de la distribución de Poisson por la distribución Normal

    La distribución de Poisson con \lambda = np se puede derivar de una distribución Binomial. Como la distribución Binomial puede ser aproximada por una Normal entonces la distribución Normal también puede aproximar una de Poisson.

    Sea X una variable aleatoria con distribución PO(\lambda). Entonces, para \lambda grande, se aproxima la distribución de Poisson utilizando la distribución Normal con valor esperado \mu
=
\lambda y varianza \sigma^2
= \lambda (con la corrección por continuidad):
    P(X \leq x) = F_{PO}(x;\lambda) \approx \Phi \left( \frac{x + 0.5 -
\lambda}{\sqrt{\lambda}} \right)

    Una regla para una “calidad razonable” de la aproximación es: \lambda
\geq 10

  • Aproximación de la distribución Hipergeométrica por la distribución Normal

    Sea nM/N \geq 5,\ n(1-M/N) \geq 5 y n/M \leq 0.05. Entonces una variable aleatoria con distribución Hipergeométrica puede ser aproximada utilizando una distribución normal de parámetros:
    E(X) = \mu = n \cdot \frac{M}{N}  \quad  Var(X) = \sigma^2 = n \cdot
\frac{M}{N} \cdot \left( 1 - \frac{M}{N} \right)

    También podemos usar la corrección por continuidad para mejorar la aproximación.

  • Aproximación de la distribución Hipergeométrica por la distribución Binomial

    Las distribuciones Hipergeométrica y Binomial utilizan diferentes modelos de muestreo aleatorio. La distribución Binomial usa modelos con devolución (repeticiones), mientras que la Hipergeométrica se basa en la ausencia de repeticiones. Cuanto más incrementemos los parámetros de la distribución Hipergeométrica y mayor sea el número de elementos M que tienen además la propiedad de que M/N converge a la constante p, menor será la diferencia entre ambos modelos. Cuando N 
\rightarrow
\infty (y M 
\rightarrow \infty) la distribución Hipergeométrica gonverge hacia la distribución Binomial. Esto implica que para N y M grande y n/N , la distribución Hipergeométrica puede ser aproximada por la distribución Binomial con parámetros p = M/N. Se requiere que: n/M \leq 0.05 .

  • Aproximación de la distribución Binomial por la ditribución de Poisson

    La distribución de Poisson puede ser derivada de la distribución Binomial. Por lo tanto, la distribución Binomial puede ser aproximada por la distribución de Poisson PO(\lambda =np), si n es grande y la probabilidad p es pequeña.
    Se requiere que: n > 30 y p \leq 0.05.

En una determinada ciudad, una de cada 100 casas sufre todos los años daños debido a las tormentas. ?‘Cuál es la probabilidad de que las tormentas dañen cuatro casas en un año si la ciudad tiene 100 casas?
Para cada casa, sólo existen dos posibles resultados – “daño” y “no daño”. Las probabilidades de estos resultados son constantes: p
= 0.01 y 1 - p = 0.99. La variable aleatoria X = {número de casas dañadas} tiene una distribución binomial B(n,p)
= B(100;\,0,01). Calculamos la probabilidad P(X=4): P(X=4) = f_B(4;\,100;\,0,01) = \left( \begin{array}{c}
                                                                                        100\\
                                                                                        4\\
                                                                                        \end{array} \right)
\cdot 0.01^4 \cdot 0.99^{96} = 0.01494\,. También, podríamos usar la distribución de Poisson(de parámetro \lambda
= np
= 1 para aproximar la probabilidad ya que se satisfacen las condiciones para una buena aproximación: F_{PO} (4;\,1) = \frac{1^4}{4\,!} e^{-1} = 0.01533\,. Vemos que las probabilidades f_B(4) y F_{PO}(4) son muy parecidas. De forma más general, se observa que la aproximación es bastante buena para otros puntos de la distribución.

x  B(100;\,0,1)  PO(1)
0 0.36603 0.36788
1 0.36973 0.36788
2 0.18486 0.18394
3 0.06100 0.06131
4 0.01494 0.01533
5 0.00290 0.00307
6 0.00046 0.00051
7 0.00006 0.00007
8 0.00000 0.00000

Es s2 28 e 5.gif

Tras una tormenta en la región, hay 300 casas dañadas de un total de 2000. ?‘Cuál es la probabilidad de que existan exactamente 2 casas dañadas de 10 elegidas aleatoriamente? De nuevo, sólo hay dos posibilidades para cada casa – “daño” y “no daño”. Como N=2000, M = 300, y N-M=1700. La probabilidad P(X=2) es igual a P(X=2) = f_H(2) =
\frac{
        \left( \begin{array}{c}
                                                                                        300\\
                                                                                        2\\
                                                                                        \end{array} \right)
                                                                                        \cdot
\left( \begin{array}{c}
                                                                                        1700\\
                                                                                        8\\
                                                                                        \end{array} \right)
                                                                                        }
{\left( \begin{array}{c}
                                                                                        2000\\
                                                                                        10\\
                                                                                        \end{array} \right)
                                                                                        }
= 0.2766\,. Este cálculo es relativamente complicado. Afortunadamente, podemos usar la aproximación de la distribución Binomial (con parámetro p=M/N = 0,15) para aproximar esta probabilidad: P(X=2) - f_B(2) = \left( \begin{array}{c}
                                                                                        10\\
                                                                                        2\\
                                                                                        \end{array} \right)
\cdot 0.15^2 \cdot 0.85^8 = 0.2759\,.

Es s2 28 f 3.gif

Debido a la experiencia, sabemos que el 10% de las declaraciones de renta con derecho a devolución tienen errores. Usando una muestra de 100 devoluciones de esta ciudad ?‘Cuál es la probabilidad de que 12 de ellas tengan errores? Sólo hay dos posibles resultados para el experimento – “incorrecto” o “correcto”, cuyas probabilidades son p = 0.1 a 1 - p = 0.9. La variable aleatoria X – “número de devoluciones incorrectas elegidas aleatoriamente de 100 posibles” sigue una distribución Binomial B(n,p) = B(100;\,0.1). Queremos calcular la probabilidad P(X
= 12) = f_B(12): f_B(12;\,100;\,0,1) =
\left( \begin{array}{c}
                                                                                        2000\\
                                                                                        10\\
                                                                                        \end{array} \right)
\cdot 0.1^{12} \cdot 0.9^{88} = 0.0988\,. Si el valor f_B(12;\,100;\,0,1) no está en las tablas, deberiamos calcularlo, lo que puede ser bastante complicado. Sin embargo, como se satisfacen las condiciones para realizar una aproximación mediante una Normal. (np = 10
\geq 5 x n(1-p) = 90 \geq 5). El valor esperado y la varianza de la distribución Binomial son: \mu = np = 100 \cdot 0.1 = 10\,,\quad \sigma^2 = np(1-p) = 100 \cdot 0.1 \cdot 0.9 = 9\,. por lo que podemos usar una distribución Normal N(10;\,3) (vease el gráfico). Recuerdo: Para variables aleatorias continuas, las probabilidades se obtienen como el área debajo de la densidad y por lo tanto la probabilidad de un punto específico es cero, por ejemplo, P(X=12)
= 0. Por lo tanto, sumamos y restamos 0.5 a 12; este es un tipo de corrección por continuidad. En lugar de x=12 (para una variable discreta) usamos un intervalor para una continua 11.5
\leq x \leq 12.5 y f_B(12;\,100;\,0,1) está entonces aproximada por P(11.5 \leq x \leq 12.5), es decir, el área bajo la densidad N(10;\,3) entre los puntos 11.5 y 12.5.

Es s2 28 f 2.gif

Las tablas contienen la función de distribución de una variable aleatoria N(0,1) por lo que tenemos que estandarizar la variable aleatoria X: z_1 = (12.5 - 10)/3 = 0.83\ \text{and}\ z_2 = (11.2 - 10)/3 = 0.5\,. Utilizando las tablas de la Normal, obetenemos \Phi (0.83)
= 0.7967 y \Phi(0.5) = 0.6915.
Por lo tanto, P(11.5 \leq x \leq 12.5) = \Phi (0.83 - \Phi (0.5) = 0.7967 - 0.6915 =
0.1052\,. La aproximación funciona bastante bien, el error de aproximación es sólo 0.1052 - 0.0988 = 0.0064. De los cálculos anteriores se puede ver que:

  • la probabilidad aproximada de tener a lo sumo 12 devoluciones incorrectas es P(X \leq 12) = \Phi[12 + 0.5 - 10]/3] = \Phi (0.83) = 0,7967
  • la probabilidad aproximada de más de 12 devoluciones incorrectas es P(X > 12) = 1- \Phi[12 + 0.5 - 10]/3] = 1 - \Phi (0.83) = 1 - 0.7967 =
        0.2033
  • la probabilidad aproximada de obtener al menos 12 devoluciones incorrectas es P(X \geq 12) = 1- \Phi[12 - 0.5 - 10]/3] = 1 - \Phi (0.5) = 1 - 0.6915 =
        0.3085