Distribuciones muestrales

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Una de las tareas de la estadística es la obtención de información sobre las características del estado de las cosas o de su desarrollo. El problema específico determina las unidades estadísticas que van a ser examinadas (personas, hogares, empresas, naciones) y cuales de sus características se van a incluir en el análisis estadístico.

(1) Población

La colección de todas las unidades estadísticas (o elementos) que son de interés para el análisis se denomina población. La población debe ser definida de forma precisa y comprensible a fin de que para cada unidad estadística se pueda determinar si pertenece o no a la población considerada. Tamaño de población.
El tamaño de la población, N, es simplemente el número de unidades estadísticas en la población. Las poblaciones pueden ser o de tamaño finito o infinito, y podrían ser hipotéticas. Los valores x_j ( j = 1,\dots, N ) de la característica (o variable)X son tomados de la población con determinadas frecuencias absolutas o relativas h ( x_j ) y f ( x_j ). Los valores y sus frecuencias comprenden la distribución de la característica X en la población. Para caracterizar de forma fácil la distribución, determinados números, llamados parámetros, se calculan. Estos parámetros poblacionales se denotan con letras griegas:

  • La media \mu = \frac{\sum\limits_{j=1}^N x_j h(x_j)}{n} = \sum\limits_{j=1}^N x_j f(x_j)
  • La varianza \sigma^2 = \frac{1}{N} \sum\limits_{j=1}^N (x_j - \mu)^2 h(x_j) = \sum\limits_{j=1}^N (x_j - \mu)^2 f(x_j)
  • La desviación típica \sigma = \sqrt{\sigma^2}
  • La proporción

la proporción de elementos que toman uno de dos posibles valores (normalmente cifrado x_j = 0 y x_j =
        1) \pi = \frac{\sum\limits_{j=1}^N x_j}{N} Los parámetros de la población son fijos, valores constantes en la población. La distribución de la variable X y sus parámetros son típicamente desconocidos. Para aprender acerca de ellos hay que tomar todos los elementos de la población, es decir, tener un censo. En un censo todos los elementos de la población son inspeccionados y los valores de las variables estudiadas se registran. Es la única forma en que la distribución y los parámetros de X pueden ser calculados exactamente. Un modo diferente de conseguir información es obtener una muestra.

muestra

Al subconjunto finito de elementos de la población se le denomina muestra. El número de elementos de una muestra se le denomina n. Dado que una muestra sólo contiene un subconjunto de los elementos de toda la pobación, meramente proporciona información incompleta acerca de la distribución de la variable X en la población. A pesar de todo, los resultados obtenidos de analizar la muestra van a ser usados para realizar inferencia sobre la población. Este tipo de inferencia (de la muestra a la población) se denomina inferencia inductiva. Las inferencias inductivas no pueden ser hechas con certeza y pueden ser falsas. En determinadas situaciones las leyes de probabilidad pueden ser usadas pra calcular el grado de incertidumbre de estas conclusiones. Esto es, la estadística inductiva suministra un conjunto de herramientas para extraer caonclusiones no seguras sobre la población de la muestra. Estas herramientas se basan en la teoría de probabilidad y su precisión puede ser cuantificada. Utilizando estas herramientas se requiere que la muestra sea obtenida de algún modo que pueda ser formalizada mediante un modelo de probabilidad. Esto es seguro si la selección de los elementos de la muestra ha sido aleatoria. En un muestreo aleatorio cada elemento de la población tiene una posibilidad no nula de ser elegido para la muestra, pero no todos los elementos tienen la misma posibilidad de salir.
En el muestreo aleatorio, cada elemento de la población tiene la misma probabilidad de salir elegido en la muestra.
El muestreo aleatorio simple es un muestreo aleatorio con la siguiente restricción, que las n elecciones de la población han de ser independientes entre si. Se puede lograr la independencia si se realiza el muestreo con reemplazamiento.

Observaciones

Cada vez que se extrae un elemento de la población y se registra su valor de alguna variable X, observamos una realización de esa variable. La realización de X en una muestra es una variable aleatoria (antes de la extracción actual) y se denota como X. La función de distribución acumulada (fdc) de X, F ( x ) = P ( X = x ), da la probabilidad de que un elemento de la población elegido al azar tenga el valor X mas pequeño o igual que x. La distribución indicada por F(x) también se está refiriendo a la distribución de X en la población, es decir, a la distribución poblacional. “Variable" y “variable aleatoria" se usan como sinónimos y conceptos de la teoría probabilística como valor esperado o varianza ahora aplicados a la población son (“valor esperado o varianza poblacional"). Extraer una muestra de tamaño n puede ser visto como n replicas de un experimento aleatorio. Cada extracción corresponde a una variable aleatoria y la muestra completa es una colección de n variables aleatorias X_1, ..., X_n. La variable aleatoria X_i representa la realización potencial de la variable X en (o antes) la i-esima extracción ( i = 1,\ldots, n ).
Una muestra (X_1,\ldots,X_n) de n observaciones de una variable X con distribución F(x) en la población se llama muestra aleatoria simple de tamaño n si verifica las siguientes condiciones:

  • Las variables aleatorias X_1,\ldots,X_n están idénticamente distribuidas y todas tienen la misma función de distribución F(x) que la variable X en la población.
  • Las variables aleatorias X_1,\ldots,X_n son variables aleatorias independientes.

Las n existente realizaciones de X_1,\ldots,X_n se denotan como x_1,\ldots,x_n.

Estadístico

Una función U = U ( X_1,\ldots, X_ n ) de las variables aleatorias X_1,\ldots,X_n se denomina estadístico. Un estadístico, que es una función de variables aleatorias, es en si una variable aleatoria, con su propia distribución, denominada distribución muestral. El valor esperado, varianza y desviación típica de la distribución muestral se denotan como

  • valor esperado E( U ) = \mu_ U
  • varianza Var ( U ) = \sigma^2_U
  • desviación típica \sigma_u=\sqrt{Var(u)}

Después de que se obtiene la muestra, se observan las n realizaciones existentes x_1,\ldots, x_n de la variable aleatoria X_1,\ldots,X_n. Calculando u = U ( x_1,\ldots,x_ n) como una función de las n realizaciones existentes x_1,\ldots, x_n provoca la obtención del estadístico U
= U ( X_1,\ldots, X_ n ). Si se realizan repetidas extracciones de un tamaño dado n de la misma población entonces las correspondientes realizaciones de X y U variarán de muestra a muestra. El propósito de calcular estadísticos del tipo denotados por U es usarlos para realizar inferencia acerca de los parámetros desconocidos de la población que caracterizan a la distribución de X. La regla específica para calcular un estadístico se obtiene normalmente por el principio de analogía: calcular el estadístico U de forma análoga a la definición del parámetro poblacional acerca del cual queremos realizar inferencia. Ejemplos importantes son:

  • (o media muestral) en analogía con la esperanza poblacional \mu \bar X = \frac{1}{n} \sum\limits_{i=1}^n X_i
  • in analogía con la varianza poblacional \sigma^2
    • si la esperanza poblacional (valor esperado) E(X) = \mu es conocida: S^{\star 2} = \frac{1}{n} \sum\limits_{i=1}^n (X_i - \mu)^2
    • si E(X) = \mu no es conocida: S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n (X_i - \bar X)^2 S^{\star 2} = \frac{1}{n} \sum\limits_{i=1}^n (X_i - \bar X)^2
  • en analogía con la proporción poblacional \pi \widehat{\pi} = \frac{1}{n} \sum\limits_{i=1}^n X_i

Es s2 30 f 1.gif

Hay N = 7 estudiantes en el examen de un curso de nivel superior. Tabla 1:

Estudiante A B C D E F G
Puntos 10 11 11 12 12 12 16

La variable X = \text{número de puntos en el examen} tiene la siguiente frecuencia de distribución en la población: Tabla 2:

x  h(x)  f(x) = h(x) / N  F(x)
10 1 1/7 1/7
11 2 2/7 3/7
12 3 3/7 6/7
16 1 1/7 7/7

De esta distribución, se puede calcular la media, varianza y desviación típica de la variable X en la población: \mu = 12\, , \quad \sigma^2 = 22/7 = 3,143 \, , \quad \sigma = 1,773 Un examen seleccionado aleatoriamente de la población registrando los puntos obtenidos da origen a una variable aleatoria, que también se denomina X ya que comparte el significado y los posibles valores que puede tomar la variable poblacional X. Las frecuencias relativas en la población se corresponden con las probabilidades de que un examen con una determinada puntuación sea elegido. Por lo tanto, La variable aletaoria X tiene la función de probabilidad f(x) y función de distribución acumulada F(X) como las que se muestran en la Tabla 2, así como también el valor esperado \mu= 12 y la varianza \sigma^2 = 3,143.

Muestreo aleatorio con reemplazamiento

Supongamos que se seleccionan aleatoriamente dos examenes de la población y se registra la puntuación obtenida, pero tras cada extracción, el examen seleccionado se devuelve a la población antes de que el siguiente examen sea extraido. Las variables aleatorias X_1 = Número de puntos del examen seleccionado en la primera extracción“ y X_2 = Número de puntos del examen seleccionado en la segunda extracción” pueden delimitarse consecuentemente. X_1 y X_2 son variables aleatorias. La Tabla 3 muestra todas las posibles muestras de tamaño n
= 2 que se pueden obtener de muestrear con reemplazamiento y poniendo atención al orden de las extracciones. Table 3:

1. examen
10 11 11 12 12 12 16
10 10;10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12 16;16

La probabilidad de obtener cualquiera de estas muestras es 1/49. De forma directa se puede inferir las funciones de probabilidad de X_1 y X_2 de la Tabla 3. Tabla 4:

x_1  h(x_1) f(x_1) x_2 h(x_2) f(x_2)
10 7 7/49 = 1/7 10 7 7/49 = 1/7
11 14 14/49 = 2/7 11 14 14/49 = 2/7
12 21 21/49 = 3/7 12 21 21/49 = 3/7
16 7 7/49 = 1/7 16 7 7/49 = 1/7

Las funciones de probabilidad de X_1 y X_2 son idénticas entre ellas y también con respecto a la distribución de la variable X en la población. También se puede deducir la distribución de probabilidad bidimensional de f(x1, x2) de la Tabla 3. Tabla 5:

X_1 f(x_1)
10 11 12 16
10 1 / 49 2 / 49 3 / 49 1 / 49 1 / 7
11 2 / 49 4 / 49 6 / 49 2 / 49 2 / 7
12 3 / 49 6 / 49 9 / 49 3 / 49 3 / 7
16 1 / 49 2 / 49 3 / 49 1 / 49 1 / 7
f(x_2)  1 / 7  2 / 7  3 /
7  1 / 7  1

La última columna de la Tabla 5 contiene la distribución marginal de X_1 y la última fila es la distribución marginal de X_2, que ya se habia dado en la Tabla 4. Por cada celda de la Tabla 5, es decir, por cada par (x1, x2), se cumple que: f(x_1, x_2) = f(x_1) \cdot f(x_2) Las variables aleatorias X_1 y X_2 son por lo tanto independientes. Conclusión: Dado que X_1 y X_2 son independientes e identicamente distribuidas y tienen la misma distribución que la variable de la población X, se puede concluir que el muestreo con reemplazamiento produce un muestreo aleatorio simple.

Muestreo aleatorio sin reemplazamiento

Dos examenes son seleccionados aleatoriamente sin reemplazamiento y las variables aleatorias X_1 y X_2 se definen como antes. La Tabla 6 muestra todas las posibles muestras de tamaño n
= 2 de muestrear sin reemplazamiento, prestando atención al orden de las extracciones. Tabla 6:

1. examen
10 11 11 12 12 12 16
10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12

La probabilidad de obtener una muestra cualquiera es 1/42. Se puede obtener de forma directa las funciones de probabilidad de X_1 y X_2 de la Tabla 6. Tabla 7:

x_1  h(x_1) f(x_1) x_2 h(x_2) f(x_2)
10 6 6/42 = 1/7 10 6 6/42 = 1/7
11 12 12/42 = 2/7 11 12 12/42 = 2/7
12 18 18/42 = 3/7 12 18 18/42 = 3/7
16 6 6/42 = 1/7 16 6 6/42 = 1/7

No es sorprendente que f(x_1), la función de probabilidad de X_1, sea idéntica a distribución de X en la población. Sin embargo, en el muestreo aleatorio sin reemplazamiento, la distribución poblacional cambia después de cada extracción porque los elementos muestrales no se devuelven. Ahora, depende de los valores de pasadas extracciones. En el ejemplo, si en la primera extracción se saca un examen con 10 puntos (X_1 = 10), entonces –condicionado al resultado de la primera extracción– la probabilidad de sacar un examen con una puntuación de 10 en la segunda extracción es cero (P(X_2 = 10 | X_1 = 10) = 0), porque tras esta primera extracción ya no hay examenes con una puntuación de 10. La Tabla 8 contiene las probabilidades condicionadas: Tabla 8:

x_2 P(X_2 = x_2 | X_1 = 10) P(X_2 = x_2 | X_1 = 11) P(X_2 = x_2 | X_1 = 12) P(X_2 = x_2 | X_1 =
16)
10 0 3/6 1/6 1/6
11 2/6 1/6 2/6 2/6
12 3/6 3/6 2/6 3/6
16 1/6 1/6 1/6 0
\sum 1 1 1 1

La probabilidad de que X_2 tome el valor específico x_2 (es decir, P(X_2 = x_2) = f(x_2)) se puede calcular mediante la ley de las probabilidades totales: P(X_2 = 10) = P(X_2 = 10 | X_1=10) \cdot P(X_1 = 10) + P(X_2 = 10 | X_1=11) \cdot P(X_1 = 11) + P(X_2 = 10 | X_1=12)
\cdot P(X_1 = 12) + P(X_2 = 10 | X_1=16) \cdot P(X_1 = 16) = = 0 \cdot 1/7 + 1/6 \cdot 2/7 + 1/6 \cdot 3/7 + 1/6 \cdot 1/7 = 6/42 = 1/7 P(X_2 = 11) = P(X_2 = 11 | X_1=10) \cdot P(X_1 = 10) + P(X_2 = 11 | X_1=11) \cdot P(X_1 = 11) + P(X_2 = 11 | X_1=12)
\cdot P(X_1 = 12) + P(X_2 = 11 | X_1=16) \cdot P(X_1 = 16) = = 2/6 \cdot 1/7 + 1/6 \cdot 2/7 + 2/6 \cdot 3/7 + 2/6 \cdot 1/7 = 12/42 = 2/7 P(X_2 = 12) = P(X_2 = 12 | X_1=10) \cdot P(X_1 = 10) + P(X_2 = 12 | X_1=11) \cdot P(X_1 = 11) + P(X_2 = 12 | X_1=12)
\cdot P(X_1 = 12) + P(X_2 = 12 | X_1=16) \cdot P(X_1 = 16) = = 3/6 \cdot 1/7 + 3/6 \cdot 2/7 + 2/6 \cdot 3/7 + 3/6 \cdot 1/7 = 18/42 = 3/7 P(X_2 = 16) = P(X_2 = 16 | X_1=10) \cdot P(X_1 = 10) + P(X_2 = 16 | X_1=11) \cdot P(X_1 = 11) + P(X_2 = 16 | X_1=12)
\cdot P(X_1 = 12) + P(X_2 = 16 | X_1=16) \cdot P(X_1 = 16) = = 1/6 \cdot 1/7 + 1/6 \cdot 2/7 + 1/6 \cdot 3/7 + 0 \cdot 1/7 = 6/42 = 1/7 Estas son las probabilidades dadas en la Tabla 7. Por lo tanto, f(x_2) es idéntica a f(x_1) y ambas son iguales a la distribución poblacional. Sin embargo, X_1 y X_2 no son independientes. Se puede ver esto a través de las distribuciones condicionadas de la Tabla 8 (que no son idénticas) a la distribución conjunta bidimensional f(x1, x2) calculada en la Tabla 6. Tabla 9:

X_1 f(x_1)
10 11 12 16
10 0 2 / 42 3 / 42 1 / 42 1 / 7
11 2 / 42 4 / 42 6 / 42 2 / 42 2 / 7
12 3 / 42 6 / 42 9 / 42 3 / 42 3 / 7
16 1 / 42 2 / 42 3 / 42 1 / 42 1 / 7
f(x_2)  1 / 7  2 / 7  3 / 7  1 /
7  1

Claramente, f(x_1, x_2) \neq f(x_1) \cdot f(x_2), y por lo tanto X_1 y X_2 no son independientes.
Conclusión:
X_1 y X_2 están idénticamente distribuidas y tienen la misma distribución que la variable X en la población pero no son independientes. Por lo tanto, el muestreo sin reeplazamiento no produce una muestra aleatoria simple.

razones para obtener muestras

A pesar de la completa información acerca de la distribución de alguna variable X en la población puede ser obtenida sólo mediante un censo, existen importantes razones para realizar muestras

  • Un censo no es factible
    • La realización del censo implica la destrucción de todos los elementos de la población

ejemplo: X es el tiempo de vida de una pila o bombilla. En este caso, inspeccionar cada elemento de la población implica usarlo hasta que queda inutilizable.

    • la población es muy grande

ejemplo: escribir un informe sobre el estado de los bosques en Alemania, es imposible inspeccionar cada arbol en tierra alemana.

    • la población es hipotética o teórica y de tamaño infinito.

ejemplo: la población de todas las posibles realizaciones en la lotería de sacar 6 bolas de las 49.

    • la población (en parte) consiste en elementos que existen sólo en el futuro.

ejemplo: la población de todos elementos producidos por una determinada máquina.

  • Un censo es muy caro
  • un censo consume mucho tiempo

Relativo al muestreo aleatorio

Se pueden distinguir dos tipos de muestreo aleatorio: muestreo con reemplazamiento y muestreo sin reemplazamiento. En el muestreo aleatorio con reemplazamiento, cada elemento de la población tiene la misma oportunidad de salir en una extracción y tras cada extracción , el elemento extraido se devuelve a la población antes de la siguiente extracción. De esta forma, un elemento de la población puede ser seleccionado varias veces. El muestreo con reemplazamiento garantiza que

  • las variables aleatorias que representan las n extracciones (X_1,\ldots,X_n) son independientes debido a que tras cada extracción, las condiciones son idénticas y no se ven afectadas por las extracciones anteriores.
  • las variables aleatorias (X_1,\ldots,X_n) tienen la misma función de distribución F ( x ). Por lo tanto, la probabilidad de obtener un valor de X más pequeño o igual que un valor x es la misma en la primera, segunda, …, n-esima extracción: P(X_1 \leq x) = P(X_2 \leq x) = \dots = P(X_n \leq x) = F(x). En otras palabras, la variables X_1,\ldots,X_n están idénticamente distribuidas.

El muestreo con reemplazamiento lleva por lo tanto a una muestra aleatoria simple. En el muestreo sin reemplazamiento, cada elemento tiene la misma probabilidad de salir pero tras cada extracción, el elemento seleccionado no es devuelto a la población antes de la siguiente extracción. Como consecuencia, la distribución de las variables X_1,\ldots,X_n no es independiente y no es idéntica. Sin embargo, la distinción entre muestreo con y sin reemplazamiento es relevante sólo para poblaciones finitas. Incluso para poblaciones de tamaño finito la distribución es irrelevante si la muestra contiene una fracción pequeña (regla: menos del 5%) de los elementos de la población. En este caso, antes de cada extracción, las condiciones son casi idénticas incluso si los elementos sacados no son devueltos antes de la siguiente extracción. Existen otros tipo de muestreo aleatorio, además de los ya mencionados aquí, existen otros como el muestreo estratificado, muestreo agrupado.