Distribución muestral de la media

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


La distribución de un estadístico (es decir, una función de las variables aleatorias) se llama distribución muestral. Los estadísticos se usan para estimar parámetros poblacionales y para contrastar hipótesis sobre estos parámetros. Esta tarea incluye afirmaciones probabilísticas que sólo se pueden hacer si las distribuciones muestrales de los estadísticos son conocidas. Las distribuciones muestrales, valor esperado y varianza de los estadísticos más importantes se presenta a continuación.

Distribución de la media muestral

Considerese una muestra de una población con función de distribución F ( x ), valor esperado E ( X ) =
\mu y varianza Var ( X ) = \sigma^2. Uno de los estadísticos más importantes es la media muestral. La media muestral (o esperanza muestral) es una función de la muestra de variables aleatorias X_1, \dots,
X_n: \bar X = \frac{1}{n} \sum\limits_{i=1}^n X_i Antes de obtener la muestra, las varialbes muestrales X_1,
\dots, X_n son variables aleatorias y por lo tanto también la media muestral lo es, debido a que es una función de X_1,
\dots, X_n. Después de extraer una muestra, los valores muestrales actuales x_1, \dots, x_n son observados y la media muestral presenta el valor específico \bar x = \frac{1}{n} \sum\limits_{i=1}^n x_i

valor esperado, varianza y desviación típica de la media muestral

El valor esperado, varianza y desviación típica de la media muestral son los dados a continuación:

  1. par una muestra aleatoria sin reemplazamiento E(\bar X) = \mu Var (\bar X) = \sigma^2 (\bar X) = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1} \sigma (\bar X) = \frac{\sigma}{\sqrt{n}} \cdot \sqrt{\frac{N-n}{N-1}} Al factor \frac{N-n}{N-1} corrección por muestra finita.

Si la varianza poblacional Var (X) = \sigma^2 es desconocida debe ser estimada por el estadístico S^2. En las fórmulas anteriores \sigma^2 tiene que ser substituida por S^2 que nos produce un estimador de la varianza de la media muestral, y viene dado por la siguiente expresión

  • para una muestra aleatoria simple: \widehat{\sigma^2}(\bar X) = \frac{S^2}{n}
  • para una muestra aleatoria sin reemplazamiento \widehat{\sigma^2}(\bar X) = \frac{S^2}{n} \cdot \frac{N-n}{N-1}

Estos resultados para la esperanza y varianza de la media muestral se mantienen independientemente de la forma específica de la distribución muestral.

Distribución de la media muestral

La distribución muestral F(\bar X) de la media muestral se determina mediante la distribución de la variable X en la población, o más bien, por los supuestos que se han hecho sobre la distribución de la población.

  1. Se supone que X está distribuida como una normal con valor esperado \mu y varianza \sigma^2: X \sim N(\mu,\,\sigma)

    1. La varianza poblacional \sigma^2 es conocida

      Si X sigue una distribución normal N(\mu,\,\sigma) y \sigma^2 es conocida, el muestreo aleatorio simple \bar X tiene la siguiente distribución normal: \bar X \sim N(\mu,\,\sigma(\bar X)) y la variable aleatoria estandarizada Z = \frac{\bar X - \mu}{\sigma(\bar X)} = \frac{\bar X - \mu}{\sigma} \sqrt{n} tiene una distribución normal estandarizada Z \sim N(0;1).

    2. La varianza poblacional \sigma^2 es desconocida. Si \sigma^2 es desconocida, tiene que ser estimada por S^2. En este caso,no se pueden hacer afirmaciones sobre la distribución de \bar X pero la distribución de la siguiente variable estandarizada es conocida T = \frac{\bar X - \mu}{S} \sqrt{n} \text{.}

      La variable aleatoria T sigue en el caso de muestreo aleatorio simple una distribución t de parámetro f = n-1: T \sim t(f = n-1) El parámetro f es igual a los grados de libertad de T. Si f \rightarrow \infty la distribución t converge a una distribución normal estandar. entonces la aproximación de la distribución t mediante una normal estandarizada funciona bastante bien para f > 30. Por lo tanto, se puede usar la distribución normal estandar en lugar de la distribución t en este caso: T \approx N(0;1) \text{ pro } f > 30 \text{.}

  2. Este es el caso más relevante para las aplicaciones en finanzas y economía, ya que la distribución de muchas variables interesantes o bien no tiene una distribución aproximadamente normal o sencillamente su forma es desconocida.

    Considerese n variables muestrales X_1, \dots, X_n con distribución idéntica pero desconocida teniendo por esperanza E(X_i) = \mu y varianza Var(X_i) = \sigma^2. De acuerdo con el teorema central del límite las siguientes afirmaciones son ciertas:

    • Si las variables muestrales X_1, \dots, X_n son independientes (muestra aleatoria simple) y \sigma^2 es conocida, entonces la variable aleatoria Z = \frac{\bar X - \mu}{\sigma} \sqrt{n} se distribuye aproximadamente como una normal para n suficientemente grande.

    • Si las variables muestrales X_1, \dots, X_n son independientes (muestra aleatoria simple) y \sigma^2 es desconocida, entonces la variable T = \frac{\bar X - \mu}{S} \sqrt{n} tiene aproximadamente una distribución normal para n suficientemente grande.

    • Si las variables aleatorias X_1, \dots, X_n son dependientes (muestreo sin reemplazamiento) entonces la variable aleatoria Z = \frac{\bar X - \mu}{\frac{\sigma}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}}} respectivamente T = \frac{\bar X - \mu}{\frac{S}{\sqrt{n}} \sqrt{\frac{N-n}{N-1}}} tiene aproximadamente una distribución normal para un tamaño muestral n y poblacional N suficientemente grande.

    Como regla de decisión, se puede usar la distribución normal para n > 30.

Si \bar X sigue una distribución normal y \mu y \sigma^2 son conocidas entonces la probabilidad

  • que \bar X tome un valor menor o igual que un determinado valor \bar x se puede calcular como P(\bar X \leq \bar x) = \Phi \left( \frac{\bar x - \mu}{\sigma(\bar X)} \right) = \Phi \left( \frac{\bar x - \mu}{\sigma} \sqrt{n} \right) = \Phi(z)
  • que \bar X tome un valor en el intervalo [\bar{x_1}; \bar{x_2}] puede ser calculado como P(\bar{x_1} \leq \bar X \leq \bar{x_2}) = \Phi \left( \frac{\bar{x_2} - \mu}{\sigma(\bar X)} \right) - \Phi \left( \frac{\bar{x_1} - \mu}{\sigma(\bar X)} \right) = \Phi(z_2) - \Phi(z_1) \,\text{,}

donde \Phi es la función de distribución acumulada de la distribución normal. Estos cálculos se mantienen de forma aproximada si X se distribuye de forma arbitraria y n es suficientemente grande. Si \bar X sigue una distribución normal y \mu y \sigma^2 son conocidas entonces un intervalo central de variación \left[ \mu - z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \leq \bar X \leq \mu + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \right] \,\text{,} se puede calcular, y contendrá el valor esperado de la media muestral con una probabilidad 1 - \alpha: P(\mu -
z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \leq \bar X
\leq \mu + z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} =
1- \alpha \text{.} La probabilidad 1 - \alpha se mantiene si X tiene cualquier distribución y n es suficientemente grande.

Ley débil de grandes números

Supongamos que X_1, \dots, X_n son n variables aleatorias independientes e identicamente distribuidas con esperanza E(X_i)
= \mu y varianza Var(X_i) = \sigma^2. Entonces, para cada \epsilon
> 0 se cumple que: \lim_{n \rightarrow \infty} P(|\bar{X_n} -
\mu | < \epsilon) = 1 \text{.} Esto se puede mostrar del siguiente modo:
De acuerdo con la desigualdad deTschebyschev se cumple que P(|\bar{X_n} - \mu | < \epsilon ) \geq 1 -
\frac{\sigma^2 (\bar X)}{\epsilon^2}. substituyendo \sigma^2
(\bar X) = \sigma^2 / n: P(|\bar{X_n} - \mu | < \epsilon )
\geq 1 - \frac{\sigma^2}{n \epsilon^2} Si n tiende a infinito el segundo término de la parte derecha se va a cero. Implicación de esta ley:
Cuando se incrementa n, la probabilidad de que la media muestral \bar X se diferencie de su esperanza \mu en menos que \epsilon
> 0 tiende a uno. Si el tamaño muestral es suficientemente grande la media muestral tomará valores en la el intervalo [\mu -
\epsilon; \mu + \epsilon] con una probabilidad alta, independientemente de la distribución poblacional de X.

Es s2 31 e 7.gif

Este ejemplo está dedicado a explicar de manera formal la distribución, esperanza y varianza de la media muestral. Ciertos supuestos se deben hacer sobre la población. En particular, se supone que la media de ingresos brutos por hora de todos los 5000 trabajadores de una compañia es igual a 27,30 DM con desviación típica de 5,90 DM.

Problema 1:

Supongase que la variable X = “ingresos brutos por hora de un trabajador (seleccionado aleatoriamente) en esta compañia" tiene una distribución normal Esto es, X \sim N ( 27,3 ; 5,9 ).
De la población total de trabajadores de esta compañia se extrae una muestra aleatoria simple de n trabajadores. La media muestral da el promedio del ingreso bruto por hora de los n trabajadores de la muestra. Calcular el valor esperado, varianza, desviación típica y encontrar la forma específica de la distribución de \bar
X para los siguientes tamaños muestrales:

  1. n = 50 y

Todas las muestras aleatorias simples, independientemente de n, tienen el valor esperado E(\bar X) = \mu = 27,30 \ \text{DM.}


Como una muestra aleatoria simple se corresponde con un muestreo con reemplazamiento la varianza de la media muestral es igual a Var(\bar X) = \sigma^2(\bar X) = \sigma^2 / n \, . De esta manera, Var(\bar X) = \sigma^2(\bar X) = 5,9^2 / 10 = 34,81 / 10 = 3,481
\sigma(\bar X) = 1,8657 DM. Var(\bar X) = \sigma^2(\bar X) = 5,9^2 / 50 = 34,81 / 50 = 0,6962
\sigma(\bar X) = 0,8344 DM. Var(\bar X) = \sigma^2(\bar X) = 5,9^2 / 200 = 34,81 / 200 = 0,17405
\sigma(\bar X) = 0,4172 DM. Claramente, la desviación típica de \bar X es menor que la desviación típica poblacional de X. Aún más, la desvición típica de \bar X disminuye de 1,8657 a 0,8344 y a 0,4172, cuando el tamaño muestral pasa de 10 a 50 y a 200. El hecho de incrementar el tamaño muestral por cinco reduce la desvición a la mitad. Si se incrementa por veinte la desviación tiípica está por debajo de 1/4.


Como se supone que X se distribuye normalmente entonces la media muestral \bar X también se distribuye normalmente bajo un muestreo aleatorio simple, independientemente del tamaño de la muestra. De esta manera:

  1. para muestras aleatorias de tamaño n = 10
    X \sim N(( 27,3 ; 1,8657)
    La curva roja corresponde a la distribución poblacional de X mientras que la azul describe la distribución de la media media muestral \bar X.

    Es s2 31 e 4.gif

  2. para muestras aleatorias de tamaño n = 50
    X \sim N ( 27,3 ; 0,8344 )
    Es s2 31 e 5.gif

  3. para muestras aleatorias de tamaño n = 200
    X \sim N ( 27,3 ; 0,4172 )
    Es s2 31 e 6.gif

Problema 2:

Supongamos que la variable X = “ingreso bruto por hora de un trabajador (seleccionado aleatoriamente) de esta compañia" se distribuye como una normal. Entonces, X \sim
N ( 27,3 ; 5,9 ). Se selecciona un tamaño muestral n de forma aleatoria sin reemplazamiento. La media muestral suministra los ingresos brutos por hora de n trabajadores de la muestra. Calcular el valor esperado, la varianza, y la desviación típica de \bar X para los siguientes tamaños muestrales:

  1. n = 50 y

Todas las muestras aleatorias sin reemplazamiento, independientemente de n, tienen el mismo valor esperado que en el problema primero: E(\bar X) = \mu = 27,30 \ \text{DM.}


Como se utiliza una muestra aleatoria sin reemplazamiento la varianza de la media muestral viene dada por Var(\bar X) =
\sigma^2(\bar X) = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1} \,
. Sin embargo, la correccíon por muestra finita puede ser deshechada si n es suficientemente pequeño en comparación con N (n / N \leq 0,05). Por lo tanto, Como n/N = 10 / 5000 = 0,002 < 0,05 la varianza se puede calcular aproximadamente usando Var (\bar X) = \sigma^2(\bar X) = \sigma^2 / n. Lo que lleva al mismo resultado que el problema 1:
Var(\bar X) = \sigma^2(\bar X) = 5,9^2 / 10 = 34,81 / 10 = 3,481
\sigma(\bar X) = 1,8657 DM.
Para comparar, la fórmula de la varianza con la corrección por muestra finita da Var (\bar X) = \sigma^2 (\bar X) = 3,4747 and \sigma(\bar X) = 1,8641 DM, con lo que se muestra la inutilidad de la corrección.
Como n/N = 50 / 5000 = 0,01 < 0,05 la varianza se puede calcular de forma aproximada usando Var (\bar X) = \sigma^2(\bar X) = \sigma^2 / n. Lo que lleva al mismo resultado que el problema 1:
Var(\bar X) = \sigma^2(\bar X) = 5,9^2 / 50 = 34,81 / 50 = 0,6962
\sigma(\bar X) = 0,8344 DM. Para comparar, la fórmula de la varinza con corrección por muestra finita da Var (\bar X) = \sigma^2 (\bar X) = 0,6894 y \sigma(\bar X) = 0,8303 DM.
Como n/N = 1000/5000 = 0,2 > 0,05 la varianza y la desviación típica tienen que ser calculadas utilizando la corrección por muestra finita: \begin{align}
                Var(\bar X) = \sigma^2(\bar X) & = & \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1} \\
                                                                                &= & \frac{5,9^2}{1000} \cdot \frac{5000 - 1000}{5000-1} = 0,0279 \ \text{a}\\
                                                \sigma(\bar X) & = & 0,1669 \ \text{DM.}
        \end{align}

Problema 3:

Supongamos que, de forma más realista, la distribución de X = “ingresos brutos por hora de un trabajador (seleccionado aleatoriamente) de esta empresa" es desconocida. Por lo tanto, todo lo que sabemos es que E(X) = \mu
= 27,30 DM y \sigma(X) = 5,90 DM.
El tamaño muestral n se obtiene de forma aleatoria. La media muestral da el ingreso bruto por hora de n trabajadores en la muestra. Calcular el valor esperado, varianza, desviación típica y la distribución de \bar X para los siguientes tamaños muestrales:

  1. n = 50 y

Como el valor esperado de E (\bar X  ) se calcula de forma que no dependa de la distribución. Entonces, no existen elementos nuevos en esta situación y por lo tanto los resultados son idénticos a los dos problemas anteriores: E(\bar X) = \mu =
27,30 \ \text{DM.}


La varianza de \bar X se calcula independientemente de la distribución poblacional de X, pero si depende del tipo de tamaño de la muestra aleatoria. En el enunciado del problema 3 no se especifica el tipo de muestra aletoria. Sin embargo, para los tres tamaños muestrales considerados es cierto que n / N < 0,05 y, por lo tanto, si la muestra se realiza sin reemplazamiento se puede usar la fórmula Var (\bar X) = \sigma^2(\bar X) = \sigma^2 / n como una aproximación. lll para n = 10 & Var (\bar X) = \sigma^2(\bar X) = 3,481 &  \sigma (\bar X) = 1,8657 DM

para n = 50 & Var (\bar X) = \sigma^2(\bar X) = 0,6962 &  \sigma (\bar X) = 0,8344 DM

para n = 200 & Var (\bar X) = \sigma^2(\bar X) = 0,17405 &  \sigma (\bar X) = 0,4172 DM


Dado que la distribución poblacional de X es desconocida no se pueden hacer ninguna afirmación acerca de la de la distribución de \bar X. Sin embargo, el teorema central del límite implica que si la vairable aleatoria estandarizada Z Z = \frac{\bar X -
\mu}{\sigma} \sqrt{n} \ \text{resp.} \ Z = \frac{\bar X -
\mu}{\sigma \sqrt{\frac{N-n}{N-1}}} \sqrt{n} se distribuye aproximadamente como una normal, si el tamaño muestral n
> 30 y –en un muestreo aleatorio sin reemplazamiento– el tamaño poblacional N es sufientemente grande. Esto lo satisfacen los casos b) n = 50 y c) n = 200.

Es s2 30 f 1.gif

N = 7 estudiantes toman parte en un examen de un curso de doctorado obteniendo las siguientes puntuaciones totales: Tabla 1:

Estudiante A B C D E F G
Puntuación 10 11 11 12 12 12 16

La variable X = “puntos obtenidos en un examen" tiene la siguiente distribución de frecuencia poblacional: Tabla 2:

x  h(x)  f(x) = h(x) / N  F(x)
10 1 1/7 1/7
11 2 2/7 3/7
12 3 3/7 6/7
16 1 1/7 7/7

con parámetros poblacionales \mu = 12, \sigma^2 = 3,143 y \sigma = 1,773.

muestreo aleatorio con reemplazamiento

se muestrean n = 2 examenes con reemplazamiento de la población. La Tabla 3 contiene todas las posibles muestras de tamaño n = 2 con reemplazamiento si se presta atención al orden de las extracciones: Tabla 3:

1. examen
10 11 11 12 12 12 16
10 10;10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12 16;16

Para cada posible muestra, se puede calcular la media muestral, que se muestra en la Tabla 4. Tabla 4:

1. examen
10 11 11 12 12 12 16
10 10 10,5 10,5 11 11 11 13
11 10,5 11 11 11,5 11,5 11,5 13,5
11 10,5 11 11 11,5 11,5 11,5 13,5
12 11 11,5 11,5 12 12 12 14
12 11 11,5 11,5 12 12 12 14
12 11 11,5 11,5 12 12 12 14
16 13 13,5 13,5 14 14 14 16

Por lo tanto, \bar X puede tomar distintos valores con determinadas probabilidades. De la tabla 4 se puede determinar la distribución de \bar X como la dada en las dos primeras columnas de la Tabla 5. Tabla 5:

\bar X P(\bar X = \bar x) \bar x - E(\bar X) [\bar x - E(\bar X)]^2 [\bar x - E(\bar X)]^2 \cdot
P(\bar X = \bar x)
10 1 / 49 - 2 4 4 / 49
10,5 4 / 49 - 1,5 2,25 9 / 49
11 10 / 49 - 1 1 10 / 49
11,5 12 / 49 - 0,5 0,25 3 / 49
12 9 / 49 0 0 0
13 2 / 49 1 1 2 / 49
13,5 4 / 49 1,5 2,25 9 / 49
14 6 / 49 2 4 24 / 49
16 1 / 49 4 16 16 / 49

La media de esta distribución, es decir, el valor esperado de \bar X, es E(\bar X) = 588/49 = 12\, , que es igual al valor esperado de la variable poblacional X: E ( X ) = 12. Si Usamos los resultados intermedios de las columnas tres a cinco de la Tabla 5 podemos calcular la varianza de \bar X: Var (\bar
X) = \sigma^2 (\bar X) = 77/49 = 11/7 = 1,5714 Este resultado está en concordancia con la fórmula para \sigma^2 (\bar X) dada anteriormente: \sigma^2(\bar X) = \sigma^2 / n = (22/7)/2
= 11/7\, . Se observa facilmente que la varianza de \bar X es ciertamente menor que la varianza poblacional de X. muestreo aleatorio sin reemplazamiento
De una población, se extraen aleatoriamente y sin reemplazamiento n = 2 examenes. La Tabla 6 muestra todas las posibles muestras de tamaño n = 2 para muestreo sin reemplazamiento, prestando atención al orden de las extracciones. Tabla 6:

1. examen
10 11 11 12 12 12 16
10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12

Para cada posible muestra, la Tabla 7 muestra el cálculo de la media muestral: Tabla 7:

1. examen
10 11 11 12 12 12 16
10 10,5 10,5 11 11 11 13
11 10,5 11 11,5 11,5 11,5 13,5
11 10,5 11 11,5 11,5 11,5 13,5
12 11 11,5 11,5 12 12 14
12 11 11,5 11,5 12 12 14
12 11 11,5 11,5 12 12 14
16 13 13,5 13,5 14 14 14

Las dos primeras columnas de la Tabla 8 contienen la distribución de probabilidad de la media muestral: Tabla 8:

\bar X P(\bar X = \bar x) \bar x - E(\bar X) [\bar x - E(\bar X)]^2 [\bar x - E(\bar X)]^2 \cdot
P(\bar X = \bar x)
10,5 4 / 42 - 1,5 2,25 9 / 42
11 8 / 42 - 1 1 8 / 42
11,5 12 / 42 - 0,5 0,25 3 / 42
12 6 / 42 0 0 0
13 2 / 42 1 1 2 / 42
13,5 4 / 42 1,5 2,25 9 / 42
14 6 / 42 2 4 24 / 42

El valor esperado E(\bar X) es E(\bar X) = 504/42 = 12 y es igual al valor esperado poblacional de X. La varianza es Var (\bar X) = \sigma^2(\bar X) = 55/42 = 1,3095
\, , que está en consonancia con la fórmula para calcular \sigma^2(\bar X) dada anteriormente: \begin{align}
        Var(\bar X) = \sigma^2 (\bar X) & = & \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1}\\
                                                                        & = & \frac{22/7}{2} \cdot \frac{7 - 2}{7 - 1} = \frac{22 \cdot 5}{7 \cdot 2 \cdot 6} = \frac{55}{42} \, .\\\end{align} Considerese una población con función de distribución F ( x
), valor esperado E(X) =\mu y varianza Var (X) = \sigma^2. Las variables muestrales X_i, i = 1, \dots, n tienen todas las misma función de distribución F(x_i) = F(x), esperanza E(X_i) = \mu y varianza Var (X_i) = \sigma^2. Esperanza de la media muestral \bar X
Utilizando las reglas de la esperanza de una combinación lineal de variables aleatorias se puede calcular que E(\bar X) = E \left( \frac{1}{n} \sum\limits_{i=1}^n X_i \right) = \frac{1}{n} E \left( \sum\limits_{i=1}^n X_i
\right) = \frac{1}{n}
\sum\limits_{i=1}^n E(X_i) = \frac{1}{n} \cdot n \cdot \mu = \mu
\, , con E(X_i) = \mu. Este resultado se mantiene en muestreo aleatorio simple así como en muestreo sin reemplazamiento, y es valido para cualquier tamaño muestral n. Varianza de la media muestral \bar X (1) \begin{align}
Var(\bar X) & = & E[(\bar X - E(\bar X ))^2] = E[(\bar X -\mu )^2]\\ &=& E \left[ \left( \frac{1}{n}
\sum\limits_{i=1}^n X_i - \mu \right)^2 \right]\\ &=& E \left[ \left( \frac{1}{n} X_1 - \mu + \dots + \frac{1}{n}
(X_n - \mu) \right)^2 \right]\\ &=& \frac{1}{n^2} [E(X_1 - \mu)^2 + \dots + E(X_n - \mu)^2 + \sum\limits_{i \neq
j} \sum\limits_{i \neq j} E(X_i - \mu)(X_j - \mu)]\\ &=& \frac{1}{n^2} [Var(X_1) + \dots + Var(X_n) +
\sum\limits_{i \neq j} \sum\limits_{i \neq j} Cov(X_i, X_j]\\\end{align} Dado que para cada i = 1, \dots, n es cierto que Var (X_i) =
\sigma^2 y como el muestreo aleatorio simple implica la independencia de las variables de la muestra y por lo tanto que Cov(X_i, X_j) = 0, la varianza de la media muestral Var (\bar
X) = \frac{1}{n^2} n \sigma^2 = \frac{\sigma^2}{n} \, . Observar que la varianza de \bar X es igual a la varianza poblacional de la variable X dividida por n. Esto supone que Var (\bar X) es menor que Var (X) y que Var (\bar X) disminuye cuando se incrementa n. En otras palabras, para n grande, la distribución de \bar X está muy concentrada en torno a su valor esperado \mu.
(2) La derivación de Var(\bar X) en el caso de muestreo aleatorio sin reemplazamiento se realiza de forma similar a la de reemplazamiento pero es más complicada debido a la dependencia entre las variables muestrales. En cuanto a la corrección por muestra finita, para poblaciones grandes se tiene que la siguiente aproximación es bastante exacta \frac{N-n}{N-1}
\approx \frac{N-n}{N}\, , y se puede usar la corrección 1-n/N. En muestreo sin reemplazamiento n nunca puede ser mayor que N. Para n fijo, la corrección por muestra finita se aproxima a 1 cuando se incrementa N : \lim_{N \rightarrow \infty} \frac{N-n}{N-1} = 1\, . Par aplicaciones, la corrección se puede ignorar si n es pequeño en comparación con N.
Se puede usar como regla: n/N \leq 0,05
Sin embargo, esto sólo es una aproximación a Var (\bar X). En la distribución de \bar X Supongase que X sigue una distribución poblacional normal con esperanza \mu y varianza \sigma^2: X \sim N(\mu, \sigma). En este caso, las variables muestrales X_i, i = 1, \dots, n están normalmente distribuidas: X_i \sim N(\mu,
\sigma) para cada i = 1, \dots, n. La suma de n variables independientes e idénticamente distribuidas como una normal tiene también una distribución normal: \sum\limits_{i=1}^n X_i \sim N(n \mu,
\sqrt{n \sigma^2})\, . El estadístico \bar X se diferencia de esta suma únicamente en el elemento 1 / n y, por lo tanto, también tendrá una distribución normal: \bar
X \sim N(\mu, \sigma(\bar X)). Dado que sólo la distribución estandar está tabulada vamos a considerar la siguiente transformacion de \bar X : Z = \frac{\bar X - \mu}{\sigma(\bar
X)} = \frac{\bar X - \mu}{\sigma} \sqrt{n}\, , que sigue una distribución normal estandarizada: Z \sim N(0,1). Aparentemente, el hecho de utilizar la variable estandarizada Z ayuda para conocer la variable poblacional \sigma^2.
Si la varianza poblacional \sigma^2 es conocida:
La varianza desconocida \sigma^2 se estima como S^2 =
\frac{\sum\limits_{i=1}^n (X_i - \bar X)^2}{n-1} Dividiendo ambas partes por \sigma^2 se obtiene \begin{align}
        \frac{S^2}{\sigma^2} & = & \frac{1}{\sigma^2} \frac{\sum\limits_{i=1}^n (X_i - \bar X)^2}{n-1}\\
        \frac{n-1}{\sigma^2} S^2 & = & \sum\limits_{i=1}^n \frac{(X_i - \bar X)^2}{\sigma}\, .\\\end{align} Para simplificar, Y = \frac{(n-1) S^2}{\sigma^2}.
En un muestreo aleatorio, las X_i, i=1, \dots, n son independientes y por lo tanto, Y es una suma de variables aleatorias independientes elevadas al cuadrado, entonces Y está distribuida como una chi-cuadrado con parámetro f = n - 1. Utilizando la variable estandarizada Z para construir el ratio T = \frac{Z}{\sqrt{\frac{Y}{f}}}\, , implica que la variable aleatoria T se distribuye como una t de parámetro f
= n - 1, debido a que es una división entre una variable aleatoria distribuida como una normal estandar y otra como chi-cuadrado que son independientes una de otra. Substituyendo las expresiones de Z, Y f y reordenando términos se obtiene: T = \frac{\frac{\bar X -
\mu}{\sigma}\sqrt{n}}{\sqrt{\frac{1}{n-1} \left(
\frac{n-1}{\sigma^2} S^2 \right)}} = \frac{\bar X - \mu}{S}
\sqrt{n} intervalo central de variación:
Un intervalo en torno al valor esperado \mu de la media muestral es un intervalo de límites fijos [\mu - c
\leq \bar X \leq \mu + c], que incluye las realizaciones de \bar X con una probabilidad predeterminada 1-\alpha: P[\mu - c \leq \bar X \leq \mu + c] = 1- \alpha . Considerese que la variable aleatoria estandarizada Z da \begin{align}
        P(\mu - c \leq \bar X \leq \mu + c) & = & 1 - \alpha\\
        P( - c \leq \bar X - \mu \leq  c) & = & 1 - \alpha\\
        P \left( \frac{ - c}{\sigma(\bar X)} \leq \frac{\bar X - \mu}{\sigma(\bar X)} \leq \frac{ c}{\sigma(\bar X)} \right) & = & 1 - \alpha\\
        P \left( \frac{ - c}{\sigma(\bar X)} \leq Z \leq \frac{ c}{\sigma(\bar X)} \right) & = & 1 - \alpha\\
        P \left( - z_{1-\frac{\alpha}{2}} \leq Z \leq z_{1-\frac{\alpha}{2}} \right) & = & 1 - \alpha \, ,\ \text{and}\\
        \frac{c}{\sigma(\bar X)} & = & z_{1-\frac{\alpha}{2}}\\
        c & = & z_{1-\frac{\alpha}{2}} \cdot \sigma(\bar X)\\\end{align} La desviación c respecto a \mu se calcula como un múltiplo de \sigma (\bar X). Insertando \sigma (\bar X) se obtiene el intervalo \left[ \mu - z_{1-\frac{\alpha}{2}} \cdot
\frac{\sigma}{\sqrt{n}} \leq \bar X \leq \mu +
z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \right] con probabilidad P \left( \mu - z_{1-\frac{\alpha}{2}} \cdot
\frac{\sigma}{\sqrt{n}} \leq \bar X \leq \mu +
z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \right) =
1-\alpha Si \mu y \sigma son conocidas y X se distribuye como una normal entonces el intervalo central de variación de probabilidad 1-\alpha se determina leyendo z_{1-\alpha/2} en una tabla de una normal estandar. La probabilidad 1-\alpha es aproximadamente válida si X tiene una distribución cualquiera pero si el tamaño muestral n es suficientemente grande.