Teoría de Estimación

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Supongamos una población dada con la función de distribución F(x) y parámetros corrspondientes (es decir, esperanza \mu, varianza \sigma^2 o proporción \pi). Generalmente la función de distribución F(x) y los parámetros son desconocidos excepto en el caso de tener muestreos preliminares. Como se ha mostrado previamente, la información concerniente a la población se puede extraer mediante muestreo (aleatorio). La conclusión de resultados de la muestra en la población se denomina inferencia inductiva o inferencia indirecta. No es seguro decir que la afirmación de la conclusión inductiva es absolutamente cierta, sufre de cierto riesgo de error. A condición de que unos pocos criterios se cumplan, el grado de incertidumbre se puede evaluar mediante cálculos de probabilidad. El método para la determinación de la distribución o para la determinación de los parámetros de la población mediante muestras se llama en estadística estimación. El proceso de determinar estimadamente la distribución o los parámetros de la población mediante muestras aleatorias se llama estimación estricta haciendo caso a un proceso de estimación fijado previamente. El foco se centra aquí en el parámetro desconocido. Supongamos que \vartheta es un parámetro de la población. Utilizando muestreo aleatorio deseamos estimar su valor desconocido. Podemos diferenciar dos tipos de estimaciones diferentes: estimaciones puntuales y estimaciones por intervalos.

Estimación Puntual

La determinación de un único estimador basado en los resultados de una muestra aleatoria se denomina estimación puntual. Se supone que este estimador da un valor tan bueno como sea posible de una aproximación del parámetro desconocido de la población. La estimación se basa en una de tamaño n con las variables muestrales X_1 , \dots, X_n.

Función de Estimación (Estimador)

Una función muestral \widehat{\Theta} = g(X_1 , \dots, X_n) \, , que es, debido a sus propiedades, adecuada para la estimación de un parámetro en una población se denomina función de estimación o estimador. Una función muestral es una función de variables aleatorias (las variables muestrales X_1 , \dots, X_n) y por lo tanto, también es una variable aleatoria. Consecuentemente, toda función de estimación es una variable aleatoria. Una muestra aleatoria con variables muestrales x_1 , \dots, x_n tiene una realización de la función de estimación \widehat{\Theta}: \widehat{\vartheta} = g(x_1 , \dots, x_n) \, . \widehat{\vartheta} es un valor estimado y una estimación puntual del parámetro desconocido \vartheta de la población. Una estimación puntual por lo tanto depende del tamaño muestral n y de las realizaciones de las variables muestrales. Las estimaciones puntuales como realizaciones de variables aleatorias raramente se corresponden con el verdadero valor del parámetro poblacional. Si se repite el muestreo diferentes veces esto produce distintos valores estimados, que van a estar más o menos cerca del verdadero valor del parámetro. Un problema crucial en la estimación puntual es la selección del mejor estimador. Como un estimador de la función muestral, se suele usar el que corresponde con el parámetro poblacional que se desea estimar que presenta características deseables. Como veremos con posterioridad, podemos, por ejemplo, para la estimación la la esperanza desconocida E(X) = \mu de la población, usar la media muestral como la media aritmética de las variables observadas \bar X = \frac{1}{n} \sum\limits_{i=1}^n X_i. Supongamos una población dada de n=2000 personas. Las características observadas se resumen en dos variables X_1 = edad (en años) y X_2 = ingreso neto (en DM). La esperanza y varianza de ambas variables son desconocidas. Tienes ahora la posibilidad de sacar muestras aleatorias sin restricciones de esta población con el fin de estimar los parámetros desconocidos. Por lo tanto, se debe especificar inicialmente

  • cual es el tamaño de la muestra n y
  • que variable (edad o ingreso neto)

vamos a usar. Para la estimación de E(X_1) = \mu_1, respectivamente E(X_2) = \mu_2 la función de estimación \bar X= \frac{1}{n} \sum\limits_{i=1}^n X_i y para la estimación de Var(X_1) = \sigma_1^2 resp. Var(X_2) =\sigma_2^2 se usará la función S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n (X_i - \bar X)^2. Como salida se recibe el valor estimado \bar x y s^2 como una estimación puntual de \mu y \sigma^2. Mediante la repetición de la obtención de muestras se pueden estudiar los problemas de las estimación puntual.

Es s2 40 f 5.gif

Supongamos una población de N=2000 hogares, sea la variable aleatoria X ingreso neto del hogar (en DM). La media del ingreso neto de esta población, es decir, la esperanza E(X) = \mu es desconocida y objeto de nuestra estimación. Para estimar \mu se usa la media muestral \bar X = \frac{1}{n} \sum\limits_{i=1}^n X_i
\, . como estimador. Una muestra aleatoria de tamaño n produce los valores muestrales x_1, \dots, x_n. Substituyendo estos valores en el estimador nos ofrece el valor de estimación \bar x = \frac{1}{n}
\sum\limits_{i=1}^n x_i \, , como una estimación puntual de la media del ingreso neto de los hogares.

  1. Muestras aleatorias de tamaño n=20. Una muestra aleatoria de tamaño n=20 de los hogares de la población anteriormente mencionada produce los siguites valores: Tabla 1: Valores muestrales del ingreso neto de los hogares de una muestra de tamaño n=20 (ordenados segun valor):

    i Ingreso neto de los hogares (DM) x_i i Ingreso neto de los hogares (DM) x_i
    1 800 11 2500
    2 1200 12 2500
    3 1400 13 2500
    4 1500 14 2700
    5 1500 15 2850
    6 1500 16 3300
    7 1800 17 3650
    8 1800 18 3700
    9 2300 19 4100
    10 2400 20 4300

    La media del ingreso neto de los hogares con esta muestra da \bar x = 48300/20 = 2415 DM, es un estimador de la media de ingreso neto de los hogares de la población. Como puede verse facilmente, el cálculo es idéntico a la media aritmetica, una medida que vamos ya usamos en estadística descriptiva. Mientras que la tarea en la estadística descriptiva era calcular el comentario “La media del ingreso neto de los hogares de 20 hogares evaluados es 2415 DM”, ahora nuestros resultados son evaluados más allá. Para inferir la media de ingreso neto de los hogares E(X) = \mu para los 2000 hogares aplicamos \bar x = 2415 como un estimador de \mu. Como de significativo, es decir, como exáctamente este valor estimado es el mismo que el valor de la media verdadera de la población, es lo que se trata de obtener aquí.

    Con el fin de demostrar los problemas de la estimación puntual, se calcularon otras 24 muestras aleatorias de tamaño n = 20 de la misma población y se calculó la media del ingreso neto de los hogares para cada una de ellas. La siguiente tabla contiene las medias de ingreso neto de los hogares \bar x para las 25 muestras.

    Tabla 2: Media del ingreso neto de los hogares (DM) en 25 muestras aleatorias de tamaño n=20 (ordenadas por valor):

    Muestra bar x Muestra bar x Muestra bar x
    1 1884,90 10 2241,15 18 2395,25
    2 1915,30 11 2243,15 19 2413,40
    3 2060,90 12 2267,75 20 2415,00
    4 2062,15 13 2298,80 21 2567,50
    5 2110,30 14 2317,00 22 2607,25
    6 2126,50 15 2319,55 23 2635,00
    7 2163,10 16 2361,25 24 2659,00
    8 2168,50 17 2363,50 25 2774,30
    9 2203,85

    La función de estimación \bar X es una variable aleatoria, porque los valores estimados varían de una muestra a otra debido a los diferentes valores muestrales x_i, \ i=1, \dots, 20. Por lo tanto, un valor estimado es asignado al parámetro poblacional \mu mediante una estimación puntual, que depende de la muestra concreta y que casi seguro que va a ser distinto del verdadero valor del parámetro (media del ingreso neto de los 2000 hogares).

    Consecuentemente, estimaciones puntuales deben ser complementadas con la precisión en el proceso de estimación (por ejemplo, dando la desviación típica del estimador) o con otras estimaciones.

    El siguiente gráfico muestra los valores estimados \bar x de las 25 muestras como puntos. Con el fin de clarificar las desviaciones de los valores estimados con respecto a la media poblacional, se muestra el valor actual \mu mediante una linea discontinua.

    Fig. 1: Valores Estimados \bar x de 25 muestras aleatorias de tamaño n=20

    Es s2 40 f 3.gif

  2. Muestras aleatorias de tamaño n=100
    De la misma población se tomaron 100 muestras aleatorias de tamaño n=100 y se calculó la media de los ingresos de los hogares en cada una. El siguiente gráfico contiene los valores estimadoss \bar x de las 100 muestras aleatorias. De nuevo, el valor actual \mu es la linea discontinua del gráfico.

    Fig. 2: Valores Estimados \bar x de 100 muestras aleatorias de tamaño n=100

    Es s2 40 f 4.gif