Estimación por Intervalos

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


En una estimación puntual se obtiene para un parámetro desconocido \vartheta un valor estimado \widehat{\vartheta} como realización de una variable aleatoria. Incluso si el estimador presenta “buenas” características, la probabilidad de que el valor estimado coincida con el valor real del parámetro de una población es normalmente pequeña con variables aleatorias discretas y cero con variables aleatorias continuas. Para lograr cierta exactitud en el proceso de estimación se suele recurrir a la estimación por intervalos. Una estimación por intervalos estima un parámetro desconocido \vartheta tal que:

  • se obtiene un intervalo como resultado
  • la probabilidad de que el intervalo, que se obtiene mediante este procedimiento, contenga al verdadero valor del parámetro \vartheta de la población es 1- \alpha.

Cada intervalo se llama intervalo de confianza. La evaluación de un intervalo se basa:

Ambas funciones responden a los criterios

  • V_u \leq V_o para una muestra x_1, \dots, x_n y
  • P(V_u \leq \vartheta \leq V_o) = 1- \alpha\, , por lo tanto, la probabilidad debe ser (aproximadamente) determinada sin mayores especificaciones para el valor verdadero del parámetro desconocido \vartheta,

entonces [V_u ; V_o] precisa un intervalo para \vartheta con un nivel de confianza de 1-
\alpha. Para una muestra específica con valores muestrales x_1,
\dots, x_n un intervalo de confianza es de la forma [v_u ; v_o]. La segunda condición indica que el nivel de confianza al menos tiene que estar en concordancia con la probabilidad dada 1-\alpha. Este nivel de confianza tiene que ser ajustado de caso a caso. Normalmente se eligen probabilidades muy altas, por ejemplo 0,90,\, 0,95 \text{o}\ 0,99. Puntos a considerar tras la interpretación:
los límites del intervalo de confianza son variables aleatorias. Dado que V_u y V_o son funciones de las variables muestrales (es decir, funciones de variables aleatorias), también son variables aleatorias. Por lo tanto [V_u ; V_o] es un intervalo aleatorio, en el cual se puede obtener la probabilidad predicha. 1-\alpha es la probabilidad de que el procedimiento de estimación devuelva intervalos que contengan el verdadero valor del parámetro poblacional \vartheta. En otras palabras: El nivel de confianza da la proporción de todos los posibles intervalos intervalos [v_u; v_o] que contienen el parámetro desconocido \vartheta. \alpha es la probabilidad de que el procedimiento de estimación devuelva intervalos que no tengan el verdadero valor del parámetro poblacional \vartheta. Es decir: \alpha da la proporción de que los intervalos estimados [v_u ; v_o] que no incluyen el valor desconocido del parámetro \vartheta. En este sentido, \alpha se conoce como el error de probabilidad. En la estimación de intervalos se dice habitualmente que uno obtiene en un (1-\alpha)\cdot 100\,\% de los casos un intervalo que contiene \vartheta y consecuentemente en un \alpha
\cdot 100 \,\% de los casos un intervalo que no contiene a \vartheta. , están disponibles realizaciones concretas x_1, \dots, x_n para las variables muestrales. Substituyendo estos valores muestrales en las funciones muestrales V_u y V_o son realizaciones v_u = g_1(x_1, \dots, x_n) y v_o = g_2(x_1,
\dots, x_n) y por lo tanto se obtiene un intervalo de confianza [v_u ; v_o]. Los límites del intervalo de estimación v_u y v_o son además valores fijos y no se puede obtener predicciones de probabilidades. Es posible que el parámetro desconocido \vartheta esté en el intervalo estimado o no. Pero como el nivel de confianza 1-\alpha se ha elegido cercano a uno, se espera obtener un intervalo estimado para la muestra que incluya \vartheta. Si en casos individuales este supuesto es cierto o no, no se puede decir, no se puede decir. Sin embargo la media de porcentajes de errores que se conoce como \alpha
\cdot 100\,\%, se obtiene en el caso de observaciones repetidas de muestras de tamaño n. Si uno de los límites desde el inicio no tiene restricciones, entonces se generarán intervalos por una sola cola:

  • (-\infty ; V_o], con V_u = -\infty para una muetra x_1, \dots, x_n con el correspondiente nivel de confianza P(\vartheta \leq V_o) = 1-\alpha, resp.
  • [V_u ; + \infty ), con V_o = + \infty para una muestra x_1, \dots, x_n con el correspondiente nivel de confianza P(V_u \leq \vartheta) = 1-\alpha.

Dado que los intervalos de una cola no son interesantes, nos centraremos en los intervalos de dos colas, [V_u
; V_o], donde se obtienen desviaciones en los dos sentidos que tienen consecuencias prácticas. Con intervalos de confianza de dos colas, la diferencia V_o - V_u se llama amplitud o longitud del intervalo de confianza. En muchos casos la amplitud del intervalo de confianza depende del nivel de significación 1-\alpha y del tamaño muestral n. Manteniendo constante el tamaño muestral n entonces un incremento en el nivel de confianza 1-\alpha normalmente implicará intervalos más amplios. Así pues, una mayor seguridad sobre el parámetro verdadero \vartheta está relacionada con una mayor imprecisión a la hora de predecir su posición. Por el lado contrario, manteniendo constante el nivel de confianza 1-\alpha entonces un incremento del tamaño muestral n produce en general una disminución en la amplitud del intervalo de confianza, es decir, se vuelve mas fino lo que supone una mejora en la predicción. Los intervalos de confianza simétricos o centrales son un caso particular de los intervalos de dos colas. Una característica de estos es que la probabilidad de que el parámetro desconocido \vartheta esté por debajo del límite inferior del intervalo es igual a la probabilidad de que \vartheta esté por encima del límite superior del intervalo. Como la probabilidad de que \vartheta esté fuera del intervalo [V_u
; V_o] es igual al error de probabilidad \alpha entonces: P(\vartheta < V_u) = \alpha / 2 \ \text{a} \ P(V_o < \vartheta) = \alpha / 2 y consecuentemente P(\vartheta < V_u) + P(V_o < \vartheta) = \alpha / 2 + \alpha / 2 = \alpha. Se puede ver que esta característica de simetría se refiere a probabilidades y no a V_u y V_o.
La siguiente manipulación de intervalos de confianza está limitada a los intervalos de confianza simétricos. Para determinar los límites del intervalo de confianza, normalmente, se usa el estimador \widehat{\Theta} que ya se usaba para la estimación puntual. La exactitud el proceso de estimación está implicita en la construcción de un intervalo de confianza mediante la desviación típica del estimador \sigma(\widehat{\Theta}) y el nivel de confianza 1-\alpha dado como un múltiplo de su desviación típica. Sea c_{\alpha / 2} y c_{1-\alpha
/ 2} el múltiplo de la desviación típica de un estimador y supongamos que se cumple que c_{\alpha / 2}
\neq 0 y c_{1-\alpha / 2} \neq 0, entonces el intervalo de conferencia se escribe como: [V_u ; V_o] = [\widehat{\Theta} - |c_{\alpha / 2}| \cdot \sigma(\widehat{\Theta}) ; \widehat{\Theta} + |c_{1- \alpha / 2}| \cdot \sigma(\widehat{\Theta})] con el correspondiente nivel de confianza P(V_u \leq \vartheta \leq V_o) = P(\widehat{\Theta} - |c_{\alpha / 2}| \cdot \sigma(\widehat{\Theta}) \leq \vartheta \leq \widehat{\Theta} + |c_{1- \alpha / 2}| \cdot \sigma(\widehat{\Theta})) = 1 - \alpha\, . Los límites V_u y V_o del intervalo construidos de esta forma dependen de:

  1. la desviación típica del estimador \sigma(\widehat{\Theta}).

Cuanto mayor (menor) sea la desviación típica del estimador, más ancho (fino) es el intervalo de confianza en ceteris paribus. Cuanto mayor (menor) sea el nivel de confianza, más ancho (fino) es el intervalo de confianza en ceteris paribus. Como la distribución del parámetro depende de la distribución de las variables muestrales X_1, \dots, X_n y normalmente la distribución de estas variables depende de la distribución de la variable aleatoria X únicamente es necesario conocer la distribución de la población.