Intervalo de confianza para la diferencia de medias

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Existen muchas formas de construir un intervalo de confianza para la diferencia de dos medias \mu_1
-
\mu_2. Sólo vamos a estudiarlo para cuando se cumplen los siguientes supuestos:

  • En las dos poblaciones las variables aleatorias X_1 y X_2 tienen una distribución normal con parámetros E(X_1) = \mu_1 y E(X_2) = \mu_2, y Var(X_1) = \sigma_1^2 y Var(X_2) = \sigma_2^2, es decir X_1 \sim N(\mu_1 ; \sigma_1) a X_2 \sim N(\mu_2 ; \sigma_2).
  • Para cada población se selecciona una muestra aleatoria simple y suponemos que el tamaño muestral de cada una de ellas es suficientemente grande como para que el muestreo aleatorio simple sea válido. El tamaño muestral es n_1 y n_2.
  • Las muestras aleatorias se extraen independientemente.

Cuando se investigan los intervalos de confianza para la diferencia \mu_1
- \mu_2 de dos medias, es de especial interés ver si el valor 0 está en el intervalo o no. Tan pronto como podamos decir que \mu_1 - \mu_2 =0 no es un elemento del intervalo, entonces la diferencia de \mu_1 y \mu_2 es significativa. Dado que X_1 y X_2 se distribuyen como una normal, esto también es verdad para \bar{x_1} y \bar{X_2} (ver capítulo distribución de la media muetral). Más aún, tenemos:

E(\bar{X_1}) = \mu_1 Var(\bar{X_1}) = \sigma^2(\bar{X_1}) = \frac{\sigma^2_1}{n_1}
E(\bar{X_2}) = \mu_2 Var(\bar{X_2}) = \sigma^2(\bar{X_2}) = \frac{\sigma^2_2}{n_2}.

Resumiendo: \bar{X_1} \sim N \left( \mu_1 ; \frac{\sigma_1}{\sqrt{n_1}} \right) \qquad \bar{X_2} \sim N \left( \mu_2 ; \frac{\sigma_2}{\sqrt{n_2}} \right) Teniendo en cuenta la propiedad reproductiva de la distribución normal (la suma de variables con distribución normal tiene una distribución normal), se obtiene que la diferencia de las dos medias muestrales D = \bar{X_1} - \bar{X_2} tiene también una distribución normal con esperanza E(D) = E(\bar{X_1} - \bar{X_2}) = E(\bar{X_1}) - E(\bar{X_2}) = \mu_1 - \mu_2 y varianza Var(D) = \sigma^2_D = Var(\bar{X_1} - \bar{X_2}) = Var(\bar{X_1}) + Var(\bar{X_2}) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \, . La variable aleatoria estandarizada Z = \frac{D - E(D)}{\sigma_D} = \frac{(\bar{X_1} - \bar{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} es por lo tanto N(0;1). Examinando el denominador de Z aclara que para construir el intervalo para \mu_1
-
\mu_2 debemos diferenciar entre :

  • las varianzas de las dos poblaciones \sigma_1^2 y \sigma_2^2 son conocidas
  • las varianzas de las dos poblaciones \sigma_1^2 y \sigma_2^2 son desconocidas

1. Caso: las varianzas \sigma_1^2 y \sigma_2^2 de las poblaciones son conocidas. Si los supuestos indicados antes son ciertos y ambas varianzas \sigma_1^2 y \sigma_2^2 son conocidas, tenemos que \left[ (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \, ; \, (\bar{X_1} - \bar{X_2}) + z_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right] es un intervalo de confianza para la diferencia \mu_1 - \mu_2 de las dos medias a un nivel de confianza P \left( (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \leq \mu_1 - \mu_2 \leq (\bar{X_1} - \bar{X_2}) + z_{1-\frac{\alpha}{2}} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} \right) = 1-\alpha \, . Para una probabilidad dada 1-\alpha obtenemos z_{1-\alpha /2} de la tabla de la distribución normal estandarizada. Con la extracción de las dos muestras, se puede construir los intervalos de confianza apropiados.

  • El intervalo de confianza es simétrico respecto a la probabilidad, ya que: P \left( \mu_1 - \mu_2 < D - z_{1-\frac{\alpha}{2}} \sigma_D \right) = \frac{\alpha}{2} \, , \quad P \left( D + z_{1-\frac{\alpha}{2}} \sigma_D < \mu_1 - \mu_2 \right) = \frac{\alpha}{2} \, .
  • El intervalo de confianza es simétrico respecto a la estimación puntual. los extremos tienen la misma distancia con respecto a D .
  • La amplitud del intervalo y el error no dependen de la muestra, pero si de los tamaños muestrales n_1 y n_2, las varianzas \sigma_1^2 y \sigma_2^2 de la población y del nivel de confianza 1-\alpha.
Si no suponemos que la población tiene una distribución normal, pero los tamaños muestrales son n_1 \geq 30 y n_2
\geq 30, podemos usar el mismo intervalo de confianza a causa del teorema central del límite. El nivel de confianza es aproximadamente 1-\alpha.

2. Caso: Las varianzas \sigma_1^2 y \sigma_2^2 de las dos poblaciones son desconocidas. En est caso \sigma_1^2 y \sigma_2^2 son estimadas mediante estimadores insesgados y consistentes S_1^2 = \frac{1}{n_1-1} \sum\limits_{i=1}^{n_1} (X_{1i} - \bar{X_1})^2 \, \qquad S_2^2 = \frac{1}{n_2-1} \sum\limits_{i=1}^{n_2} (X_{2i} - \bar{X_2})^2. Si suponemos homogeneidad de varianza homogeneidad de varianza , es decir, \sigma_1^2=\sigma_2^2, se puede estimar S^2 para la varianza conjunta \sigma^2. Esta es una media aritmética ponderada de las dos varianzas muestrales: S^2 = \frac{(n_1 - 1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 -2} El estimador S_D^2 de \sigma_D^2 es por tanto: S_D^2 = S^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) = \frac{n_1+n_2}{n_1n_2} \frac{(n_1 - 1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 -2} \, . Se utiliza para estandarizar la desviación típica S_D – la raiz cuadrada de S_D^2 –. La variable aleatoria resultante T = \frac{D - E(D)}{S_D} = \frac{(\bar{X_1} - \bar{X_2} - (\mu_1 - \mu_2)}{\sqrt{\frac{n_1+n_2}{n_1n_2} \frac{(n_1 - 1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 -2}}} tiene una distribución t con f = n_1 + n_2 -2 grados de libertad. Con los resultados obtenidos, podemos construir un intervalo de confianza: Si se cumplen los supuestos vistos anteriormente y las varianzas desconocidas son \sigma^2_1 = \sigma^2_22, entonces \left[  (\bar{x}_{1}-\bar{x}_{2})-t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}s_{D}\,,\,\,\,\,\,(\bar{x}_{1}-\bar{x}_{2})+t_{n_{1}+n_{2}-2;1-\frac{\alpha
}{2}}s_{D}\right] es un intervalo de confianza para la diferencia \mu_1 -\mu_2 a un nivel de confianza (1-\alpha): P\left(  (\bar{x}_{1}-\bar{x}_{2})-t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}s_{D}\,\,\,\leq\,\,\,\mu_{1}-\mu_{2}\,\,\,\leq\,\,\,(\bar{x}_{1}-\bar{x}_{2})+t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}s_{D}\right)  \approx1-\alpha\,. Para una probabilidad dada 1-\alpha encontramos en la tabla de la distribución t el valor t_{f,1-\alpha/2} . Si ambos tamaños muestrales son lo suficientemente grandes (regla: n_1>30 and n_2>30), podemos reemplazar t_{f,1-\alpha/2} por z_{1-\alpha/2} de la distribución normal estandar. El nivel de confianza es aproximadamente 1-\alpha. Si las varianzas son heterogeneas, es decir, en las poblaciones tenemos varianzas \sigma^2_1
\neq
\sigma^2_2 distintas, el estimador S_D^2 para \sigma_D^2. S{D}^{2}=\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}} Si las dos muestras son lo suficientemente grandes (n_1>30 y n_2>30), se puede realizar la siguiente afirmación: Dada la validez de los supuestos expuestos anteriormente y la varianza heterogenea, \left[  (\bar{x}_{1}-\bar{x}_{2})-z_{1-\frac{\alpha}{2}}\,\sqrt{\frac
{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}},\,\,\,\,\,(\bar{x}_{1}-\bar{x}_{2})+z_{1-\frac{\alpha}{2}}\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\right] es un intervalo de confianza aproximado para la diferencia \mu_1
-\mu_2 a un nivel de confianza (1-\alpha): P\left(  (\bar{x}_{1}-\bar{x}_{2})-z_{1-\frac{\alpha}{2}}\,\sqrt{\frac
{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\,\,\,\leq\,\,\,\mu_{1}-\mu
_{2}\,\,\,\leq\,\,\,(\bar{x}_{1}-\bar{x}_{2})+z_{1-\frac{\alpha}{2}}\,\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\right)  =1-\alpha\,. Para una probabilidad dada 1-\alpha obtenemos en la tabla de la distribución normal estandar el valor z_{1-\alpha/2}.
Para n_1 y n_2 pequeños también podemos usasr la distribución t para encontrar un intervalo de confianza para \mu_1-\mu_2.

  • El intervalo de confianza es simétrico respecto a la probabilidad.
  • El intervalo de confianza es simétrico respecto al estimador puntual. Los extremos están a la misma distancia de D .
  • La amplitud del intervalo y el error son variables aleatorias, dado que dependen, via S_1^2 y S_2^2, de las realizaciones de la muestra.
  • Los intervalos de confianza dependen también del tamaño muestral n_1 y n_2 del nivel de confianza 1-\alpha.

Tenemos una población de N=3100 coches producidos por Speed, Eco, Space y Run. Medimos las siguientes variables:
X1 = consumo de gasolina cada 100 km de la compañia Speed
X2 = consumo de gasolina cada 100 km de la compañia Eco
X3= consumo de gasolina cada 100 km de la compañia Space
X4 = consumo de gasolina cada 100 km de la compañia Run
Se desconoce las medias y varianzas. nos gustaría realizar alguna afirmación sobre la diferencia de medias en el consumo de gasolina cada 100 km de dos tipos de coches. Para una muestra aleatoria dada, obtener una estimación puntual y por intervalo para la diferencia desconocida de medias \mu_1 y \mu_2. Además, suponemos que las varianzas son heterogeneas y que las poblaciones tienen una distribución normal. Con este ejemplo tienes la oportunidad de estudiar la influencia del nivel de confianza y del tamaño de la muestra en la amplitud del intervalo de confianza. Recomendamos no alterar a la vez los dos valores. Por favor, decide

  • las variables que se van a analizar
  • los tamaños muestrales n_1 y n_2
  • el nivel de confianza 1-\alpha (como un número decimal, por ejemplo 0,95)

Indicación: Contrasta que supuestos relativos a la población estás utilizando. Resultado:
Este ejemplo interactivo devuelve como resultado

  1. el intervalo de confianza de acuerdo con el nivel de significación dado

Si continuas usando las mismas variables, pero con diferentes niveles de confianza a tamaños muestrales, también se muestran los resultados previos.

Es s2 47 e 17.gif

La corporación X quiere analizar su rendimiento en dos bolsas distintas de Alemania. Para esta comparación se observa el precio diariamente a las 12.00 a.m. Especialmente, la compañia está interesada en la diferencia media de precios. Aparte de una investigación puntual de la diferencia de medias, estamos interesados en encontrar un intervalo de confianza a un nivel 1-\alpha = 0,95. Las variables aleatorias de las dos poblaciones son
X_1 - el precio en la bolsa de Frankfurt
X_2 - el precio en la bolsa de Berlin
con medias desconocidas E(X_1) = \mu_1 y E(X_2) = \mu_2 y varianzas desconocidas Var (X_1) = \sigma_1^2 y Var (X_2) = \sigma_2^2. Queremos suponer que

  • la cotización es independiente en los dos mercados
  • las varianzas son iguales (homogeneidad de varianza)

Extraemos una muestra aleatoria de esta población. El tamaño muestral en Frankfurt es n_1 y en Berlin n_2. A fin de evitar el doble muestreo se usa un modelo sin reemplazamiento. Dado que la corporación X lleva mucho tiempo en la bolsa, ambas poblaciones se pueden considerar grandes. Por lo tanto, no tiene importancia si se usa o no el reemplazamiento. Podríamos utilizar una muestra aleatoria simple, además suponemos independencia entre las dos muestras. Para demostrar dos formas de construir intervalos para la diferencia \mu_1 - \mu_2 de dos medias, vamos a modificar los supuestos sobre X_1 y X_2 del siguiente modo:

  • X_1 y X_2 tienen distribución normal (lo cual no parece muy realista)
  • las distribuciones de X_1 y X_2 son desconocidas

1. Caso:
Debido al supuesto, tenemos X_1 \sim N(\mu_1;\sigma) y X_2 \sim N(\mu_2; \sigma). La variable aleatoria estandarizada T = \frac{D - E(D)}{S_D} = \frac{(\bar{X_1} - \bar{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{n_1 + n_2}{n_1 n_2}
\cdot \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}}} \, , se distribuye como t con f = n_1 + n_2 - 2 =18 grados de libertad. Si los supuestos anteriormente dichos se cumplen y las varianzas son \sigma_1^2 = \sigma_2^2, entonces \left[
(\bar{X_1} - \bar{X_2}) - t_{n_1 + n_2 - 2; 1-\frac{\alpha}{2}} S_D \, ; \, (\bar{X_1} - \bar{X_2}) + t_{n_1 +
n_2 - 2; 1-\frac{\alpha}{2}} S_D \right] es el intervalo de confianza para la diferencia de medias de los dos precios \mu_1 - \mu_2 a un nivel de confianza P \left( (\bar{X_1} - \bar{X_2}) - t_{n_1 + n_2 - 2;
1-\frac{\alpha}{2}} S_D \leq \mu_1 - \mu_2 \leq (\bar{X_1} - \bar{X_2}) + t_{n_1 + n_2 - 2; 1-\frac{\alpha}{2}}
S_D \right) = 1-\alpha = 0,95 \, . Para el nivel de confianza dado 1 - \alpha = 0,95, obtenemos t_{f, 1 -
\alpha/2} = t_{18; 0,975} = 2,101 en la tabla de la función de distribución t. Para los mismos días se extrae una muestra aleatoria del precio diario (en DM) con un tamaño muestral de n=10. Observamos los siguientes valores (columna 2 y 3).

i precio en la bolsa de Frankfurt (x_{1i}) precio en la bolsa de Berlin (x_{2i}) (x_{1i}
- \bar{X_1})^2 (x_{2i} - \bar{X_2})^2
1 18,50 18,45 0,0841 0,1296
2 19,00 18,90 0,0441 0,0081
3 18,70 18,80 0,0081 0,0001
4 19,30 19,50 0,2601 0,4761
5 17,10 17,30 2,8561 2,2801
6 18,30 18,10 0,2401 0,5041
7 18,60 18,80 0,0361 0,0001
8 19,00 18,85 0,0441 0,0016
9 19,40 19,50 0,3721 0,4761
10 20,00 19,90 1,4641 1,1881

De acuerdo con \bar{x_1} = \frac{1}{n_1} \sum_{i=1}^{n_1} x_{1i} \qquad \qquad \bar{x_2} = \frac{1}{n_2}
\sum_{i=1}^{n_2} x_{2i} \, . obtenemos la estimación puntual de \mu_1 y \mu_2: \bar{x_1} = 18,79 \text{DM} \qquad \qquad \bar{x_2} = 18,81 \ \text{DM} y de acuerdo con s_1^2 = \frac{1}{n_1 - 1}
\sum_{i=1}^{n_1} (X_{1i} - \bar{x_1})^2 \qquad \qquad s_2^2 = \frac{1}{n_2 - 1} \sum_{i=1}^{n_2} (X_{2i} -
\bar{x_2})^2 las estimaciones puntuales de \sigma_1 a \sigma_2: s_1^2 = 0,601 \qquad \qquad s_2^2 =0,563\, . Dado que asumimos homogeneidad de varianzas, la estimación puntual s^2 para la varianza conjunta \sigma^2 se obtiene mediante la media aritmética ponderada de las dos varianzas muestrales: s^2 = \frac{(n_1 - 1)S_1^2 + (N_2 - 1)s_2^2}{n_1 + n_2 - 2} = \frac{9 \cdot 0,601 + 9 \cdot 0,563}{18} =0,582\, . Para la estimación puntual s_D^2 de \sigma_D^2, la varianza de la diferencia de las medias muestrales, es s_D^2 = s^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) = 0,582 \cdot \frac{1}{5} = 0,1164\, . La desviación típica es por lo tanto s_D = 0,3412. Utilizando los resultados anteriores, se obtiene el intervalo de confianza para las dos medias de precios: [(18,79 - 18,81) - 2,101 \cdot 0,3412 \, ; \, (18,79 - 18,81) + 2,101 \cdot 0,3412] = [-0,7369 \, ; \,
0,6969]\, . Dado que elegimos un nivel de confianza muy alto, suponemos que tenemos uno de los intervalos de confianza en los que se encuentra el verdadero valor de la diferencia \mu_1 - \mu_2. Nuestro intervalo de confianza cubre el 0. Por lo tanto, estadísticamente no existen diferencias significativas entre las medias de los dos precios \mu_1 de la bolsa de Frakfurt y \mu_2 de la bolsa de Berlin.
2. Caso:
Ahora, queremos trabajar sin suponer normalidad de X_1 y X_2. Consecuentemente, no podemos hacer ninguna afirmación sobre la distribución de las dos medias muestrales \bar{X_1} y \bar{X_2} y de su diferencia \bar{X_1} - \bar{X_2}. A fin de encontrar un intervalo para la diferencia \mu_1 - \mu_2 de las dos medias de precios, es necesario que el tamaño de ambas muestras sea n_1 \geq 30 y n_2 \geq 30. Entonces, podemos aplicar el teorema central del límite. La variable aleatoria estandar T = \frac{D - E(D)}{S_D} =\frac{(\bar{X_1} - \bar{X_2}) - (\mu_1 - \mu_2)}{\sqrt{\frac{n_1 + n_2}{n_1 n_2} \cdot \frac{(n_1 - 1)S_1^2 +
(n_2 - 1)S_2^2}{n_1 + n_2 - 2}}} \, , tiene aproximadamente una distribución normal. Si los supuestos anteriormente expuestos son válidos y las varianzas desconocidas son \sigma_1^2 = \sigma_2^2, entonces \left[ (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}} S_D \, ; \, (\bar{X_1} - \bar{X_2}) +
z_{1-\frac{\alpha}{2}} S_D \right] es el intervalo de confianza para la diferencia \mu_1 - \mu_2 de las media de los precios a un nivel de confianza aproximado de P \left( (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}}
S_D \leq \mu_1 - \mu_2 \leq (\bar{X_1} - \bar{X_2}) + z_{1-\frac{\alpha}{2}} S_D \right) \approx 1-\alpha = 0,95
\, . Para un nivel de confianza dado 1 - \alpha = 0,95 se obtiene en la tabla de la distribución normal estandarizada (N(0,1)) el valor z_{1 - \alpha/2} = z_{0,975} = 1,96. Extraemos una muestra aleatoria del precio diario (en DM) donde el tamaño muestral es n=50. Como estimaciones puntuales tenemos: \bar{x_1} = 18,80 \ \text{DM} \qquad \qquad s_1^2 = 0,5967 \bar{x_2} =18,83 \ \text{DM} \qquad \qquad s_2^2 = 0,6188\, . Dado que asumimos que las varianzas son homogeneas en las dos poblaciones, la estimación puntual s^2 de la varianza conjunta \sigma^2 es s^2 = \frac{49 \cdot 0,5967 + 49 \cdot 0,6188}{98} = 0,6078\, . Como estimación puntual s_D^2 de \sigma_D^2, tenemos s_D^2 = s^2 \left( \frac{1}{n_1} + \frac{1}{n_2}
\right) = 0,6078 \cdot \frac{1}{25} = 0,0243\, . Por lo tanto, la desviación típica es s_D = 0,1559. El intervalo de confianza para la diferencia de las dos medias de precios es: [(18,80 - 18,83) - 1,96 \cdot
0,1559 \, ; \, (18,80 - 18,83) + 1,96 \cdot 0,1559] = [-0,3356 \, ; \, 0,2756]\, . La interpretación es igual que en el caso primero. Comparando las dos aproximaciones, se puede concluir:

  • En el caso uno se tiene más información disponible respecto a la población que en el caso 2.
  • Las diferencias de las dos medias muestrales y de las varianzas conjuntas son aproximadamente las mismas en los dos casos.
  • La varianza s_D^2 y su desviació típica s_D de la diferencia de las dos medias es mucho más pequeña que el caso 1. Evidentemente, esto se debe al mayor tamaño muestral utilizado.
  • La amplitud del intervalo de confianza en el caso 2 es mucho menor que el caso 1.

La ausencia de conocimiento respecto a la población en el caso 2 se refleja en el hecho de que el intervalo de confianza es sólo aproximadamente cierto. Sin embargo, is reflected in the fact that the confidence level is only approximately true.

Es s2 47 f 6.gif

El club del automóvil ADAC quiere hacer un comentario sobre el consumo medio de gasolina en autopista cada 100 km de dos tipos de coches similares producidos por las compañias A y B. Para este propósito, le gustaría construir un intervalo de confianza para la diferencia de medias \mu_1 - \mu_2 a un nivel de confianza 1-\alpha= 0,95. Antes del muestreo, tenemos en cuenta las siguientes consideraciones estadísticas:

  • Se supone que las variables aleatorias X_1 = consumo de gasolina cada 100 km del coche A

    X_2 = consumo de gasolina cada 100 km del coche B
    están normalmente distribuidas con medias desconocidas E(X_1) = \mu_1 y E(X_2) = \mu_2 y varianzas desconocidas Var (X_1) = \sigma_1^2 y Var (X_2) = \sigma_2^2.

  • No podemos asumir varianzas iguales. A fin de trabajar con la distribución normal, se tienen que elegir muestras con tamaño n_1 \geq 30 y n_2 \geq 30.

  • Dado que la población de cada tipo de coche es bastante grande, carece de sentido si la muestra es con o sin reemplazamiento. Suponemos que es una muestra aleatoria simple .

  • Debido a la situación descrita, suponemos independencia para las dos muestras.

Por ello, el intervalo de confianza para la diferencia \mu_1 - \mu_2 se puede construir de acuerdo a \left[ (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}} \sqrt{\frac{S_1^2}{n_1} + \frac{s_2^2}{n_2}} \, ; \,
(\bar{X_1} - \bar{X_2}) + z_{1-\frac{\alpha}{2}} \sqrt{\frac{S_1^2}{n_1} + \frac{s_2^2}{n_2}} \right] con el nivel de confianza aproximado P \left( (\bar{X_1} - \bar{X_2}) - z_{1-\frac{\alpha}{2}} \sqrt{\frac{S_1^2}{n_1}
+ \frac{s_2^2}{n_2}} \leq \mu_1 - \mu_2 \leq (\bar{X_1} - \bar{X_2}) + z_{1-\frac{\alpha}{2}}
\sqrt{\frac{S_1^2}{n_1} + \frac{s_2^2}{n_2}} \right) = 0,95 \, . De la tabla de la distribución estandar se obtiene z_{1-\alpha/2} = 1,96. El ADAC prueba 36 coches de la compañia A y 40 coches de la compañia B bajo las mismas condiciones, observándose los siguientes valores:

\bar{x_1} = 9,2 l/100 km s = 0,6 l/100 km
\bar{x_2} = 8,4 l/100 km s = 0,4 l/100 km

El intervalo de confianza es: \left[ (9,2 - 8,4) - 1,96 \cdot \sqrt{\frac{0,6^2}{36} + \frac{0,4^2}{40}} \, ;
\, (9,2 - 8,4) + 1,96 \cdot \sqrt{\frac{0,6^2}{36} + \frac{0,4^2}{40}} \right] = [0,586 \, ; \, 1,032] \, . Como hemos usado un nivel de confianza muy alto, suponemos que tenemos un intervalo de confianza que cubre el verdadero valor de la diferencia \mu_1 - \mu_2. Este intevalo no incluye el 0. Por lo tanto, existen diferencias significativas entre el consumo de gasolina medio.