Intervalo de confianza para la varianza

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Queremos derivar un intervalo de confianza para la varianza desconocida \sigma^2 de la población bajo los siguentes supuestos:

  1. La esperanza E(X) = \mu es desconocida.

Un estimador insesgado de la varianza desconocida \sigma^2 es (ver capítulo propiedades de los estimadores): S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n (X_i - \bar X)^2 \, . Se ha comprobado (ver distribución de la varianza muestral) que la forma normalizada de S^2 \frac{(n-1)S^2}{\sigma^2} = \frac{1}{\sigma^2} \sum\limits_{i=1}^n (X_i - \bar X)^2 = \sum\limits_{i=1}^n \left( \frac{X_i - \bar X}{\sigma} \right) ^2 tiene una distribución chi-cuadrado con f = n-1 grados de libertad. Con la ayuda de la distribución de (n-1)S^2 / \sigma^2 podemos hacer afirmaciones estadísticas de la varianza muestral S^2. Podemos dar un intervalo de confianza central para S^2 a un nivel de confianza P \left( \frac{ \sigma^2 \chi^2_{\frac{\alpha}{2};n-1}}{n-1} \leq S^2 \leq \frac{\sigma^2
\chi^2_{1 - \frac{\alpha}{2};n-1}}{n-1} \right) = 1- \alpha Aquí, \chi^2_{\frac{\alpha}{2};n-1} es el \alpha / 2 - cuantil y \chi^2_{1- \frac{\alpha}{2};n-1} el  \ (1 -
\alpha / 2) - cuantil de la distribución chi-cuadrado con f =n-1 grados de libertad. Mediante operaciones en la desigualdad se obtiene el nivel de confianza: P \left( \frac{(n-1) S^2}{\chi^2_{1 - \frac{\alpha}{2};n-1}} \leq \sigma^2 \leq \frac{(n-1) S^2}{\chi^2_{\frac{\alpha}{2};n-1}} \right) = 1- \alpha \, . El correspondiente intervalo de confianza es \left[ \frac{(n-1) S^2}{\chi^2_{1 - \frac{\alpha}{2};n-1}} \, ; \, \frac{(n-1) S^2}{\chi^2_{\frac{\alpha}{2};n-1}} \right] = 1- \alpha \, . Para una muestra dada con variables aleatorias x_1, \dots, x_n una estimación puntual \bar X da un estimador de la varianza desconocida \sigma^2 de la población s^2 = \frac{1}{n-1} \sum\limits_{i=1}^n (x_i - \bar x)^2 y un intervalo de confianza \left[ \frac{(n-1) s^2}{\chi^2_{1 - \frac{\alpha}{2};n-1}} \, ; \, \frac{(n-1) s^2}{\chi^2_{\frac{\alpha}{2};n-1}} \right] = 1- \alpha \, . La interpretación es similar a la de los otros intervalos.

  • El intervalo de confianza es simétrico respecto a la probabilidad, dado que tenemos: P \left( \sigma^2 < \frac{(n-1) S^2}{\chi^2_{1 - \frac{\alpha}{2};n-1}} \right) = \frac{\alpha}{2} \ ; \ P \left( \frac{(n-1) S^2}{\chi^2_{\frac{\alpha}{2};n-1}} < \sigma^2 \right) = \frac{\alpha}{2} \, .
  • El intervalo de confianza no es simétrico respecto a la estimación puntual S^2, ya que la distribución chi-cuadrado no es simétrica.
  • La amplitud L del intervalo depende L = (n-1) S^2 \left( \frac{1}{\chi^2_{\frac{\alpha}{2};n-1}} - \frac{1}{\chi^2_{1 - \frac{\alpha}{2};n-1}} \right) de los valores muestrales X_1, \dots, X_n. La amplitud de la variable aleatoria depende del tamaño muestral n y del nivel de confianza 1-\alpha.

Hay una población de N=3000 hogares. Se han medido las siguientes variables:
X1= ingreso medio mensual en DM
X2 = gasto en alquiler mensual
X3 = gasto mensual en el coche
La esperanza \mu y la varianza \sigma^2 de las variables son desconocidas. Suponemos que la población tiene una distribución normal. El objetivo es encontrar una estimación puntual y una por intervalos de la varianza desconocida \sigma^2. Con este ejemplo puedes estudiar la influencia del nivel de confianza y del tamaño muestral en la amplitud del intervalo. Recomendamos modificar sólo uno de los parámetros y dejar el otro fijo cada vez Por favor, decide

  • la variable que se va a analizar
  • el tamaño muestral n
  • el nivel de confianza 1-\alpha (como un decimal, por ejemplo 0,95)

Resultado:
Los resultados de este ejemplo interactivo son

  1. un gráfico boxplot

Si eliges la misma variable otra vez, pero con diferente nivel de signifación o tamaño muestral, también se mostrará el resultado previo. Pincha con tu ratón para comenzar el ejemplo interactivo.
Son necesarios algunos segundos para cargarlo. Aviso: Es necesario cierto tiempo para mostrar los resultados. Para una población de N=2000 hogares sea X ingreso neto de cada hogar (DM). Suponemos que X tiene una distribución normal, Sin embargo, los dos parámetros de la distribución normal E(X)=\mu y la varianza \sigma^2 son desconocidos. Por lo tanto, tenemos: X \sim N(\mu ; \sigma). Se puede construir un intervalo de confianza el desconocido ingreso medio de los hogares \mu como se ha visto en el capítulo intervalo de confianza para la esperanza. Aquí, queremos concentrarnos en la varianza desconocida \sigma^2, para la que queremos construir un intervalo de confianza de acuerdo al nivel de confianza 1-\alpha= 0,95. Una muestra aleatoria simple de tamaño n=20 de la población nos da las siguientes realizaciones (ordenadas por tamaño):

i Ingreso neto del hogar (DM) x_i i Ingreso neto del hogar (DM) x_i
1 800 11 2500
2 1200 12 2500
3 1400 13 2500
4 1500 14 2700
5 1500 15 2850
6 1500 16 3300
7 1800 17 3650
8 1800 18 3700
9 2300 19 4100
10 2400 20 4300

La media del ingreso neto en la muetra es \bar x = 48\,300 / 20 = 2\,415 \ \text{DM}\, . y es una estimación de la media del ingreso de los hogares en la población. Como estimación puntual de la varianza desconocida \sigma^2 tenemos s^2 = 1\,002\,131,\,58 \ \text{DM}^2\, . De la tabla de la distribución de la chi-cuadrado se obtiene \chi^2_{\alpha/2;n-1} = \chi^2_{0,025;19} = 8,91 \ \text{a} \ \chi^2_{1-\alpha/2;n-1} = \chi^2_{0,975;19} = 32,85\, . Por lo tanto el intervalo de confianza será \left[ \frac{19 \cdot 1002131,58}{32,85} \, ; \, \frac{19 \cdot 1002131,58}{8,91} \right] = [579619,48 \, ; \, 2136980,923]\, . Dado que el nivel de significación es muy alto, confiamos en que el intervalo incluya el verdadero valor de la varianza \sigma^2.