Contraste de Medias Normales

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


En muchas aplicaciones un está interesado en la media de la distribución de población de un determinado atributo. Los contrastes estadísticos nos ‘dicen’ como estimar del mejor modo la esperanza para una determinada distribución, todavía no nos ayudan en evaluar la certeza de la media estimada: un promedio calculado para un tamaño muestral n=5 será un solo número asi como el calculado con una muestra de n=5\,000. La intuición (y la ley de grandes números) lleva a creer que el estadístico último es probablemente más representativo que el anterior en el que el promedio de la media muestral (por ejemplo, la media aritmética) de una muestra grande está más cercana de la de la población que el de una muestra pequeña. Esto es, la media muestral calculada para grandes muestras es estadísiticamente de más confianza. Una manera de cuantificar esta cercanía con respecto al parámetro de la población es calcular la desviación típica del estadístico considerado (la media), es decir, la raiz cuadrada de la media de las desviaciones delestimador respecto al parámetro poblacional. La media muestral para una determinada media junto con su desviación típica especificaría un intervalo en el cual la media muestral no es ‘improbable’ que se encuentre, dada la media teórica igual a la estimada para una muestra concreta. Supongamos que un científico propone un valor para la media teórica derivado de un análisis anterior. Si el valor hipotético está cercano de la media mustral, en particular, en un determinado rango al rededor de la media muestral como el indicado por la desviación típica, es más probable proponer que la verdadera media de la población que proponer cualquier otro valor. pero ?’C?ómo como puede ser evaluada en términos de probabilidad la distantcia de la media muestral respecto a la hipotética media de la población de forma adecuada basandose en el concepto de error \alpha? En otras palabras: ?’Cómo se puede construir un contraste estadístico para la media de una variable aleatoria? Nuestro objetivo es contrastar para un determinado valor de la esperanza \mu
=
\text{E}\left( X \right) de una distribución poblacional. Los datos se obtienen de una muestra aleatoria de tamaño n, teóricamente representada por las variables muestrales X_{1}, \ldots , X_{n}, y queremos basasr la decisión del contraste en el nivel de significación \alpha.

Hipótesis

Podemos construir un contraste de una cola o de dos.

1) Contraste de dos colas\text{H}_{0}: \mu = \mu_{0},  \mu
\neq \mu_{0}.

2) Contraste por la derecha\text{H}_{0}: \mu \leq \mu_{0}, 
\mu > \mu_{0}.

3) Contraste por la izquierda\text{H}_{0}: \mu \geq \mu_{0}, 
\mu < \mu_{0}.

En problema de contrastar una hipótesis de una cola la conjetura científica que se valida está normalmente como hipótesis alternativa \text{H}_{1} más que como hippotesis nula \text{H}_{0}. Esto es, el investigador intenta verificar estadísticamente la negación de la hipótesis para verificar que no se cumple para un nivel de significacón \alpha. Esto es debido a que la ‘naturaleza’ del nivel de significación mencionado anteriormente: No rechazar la hipótesis nula a un determinado nivel de significación sólo significa que la probabilidad de que sea falsa es mayor que \alpha. Todavía se elige pequeño (normalmente 0.01), dado que se puede controlar el error \alpha a fin de que sea ‘rezonablemente cierta’ que una proposición ‘no deseada’ es no cierta. Esto tiene sentido si se piensa que en algunas aplicaciones que dependen de este enfoque. En la contrastación de una nueva droga de efectos dañinos, por ejemplo, se quiere un razonamiento para rechazar la ocurrencia sistemática. Para hacerlo, se acepta la afirmación opuesta de que los efectos son ‘pequeños’. Bajo este enfoque está la relación (desconocida) entre \alpha y \beta: Mientras que podamos controlar lo anterior, lo último es una función también condiciones como la distribución subyacente. Por estas razones, es común hablar de no rechazo de una hipótesis en lugar de aceptarla.

Estadístico de contraste, su distribuciíon y derivación de las regiones de decisión

Necesitamos una cantidad que condense la información de la muestra aleatoria que se necesita para realizar afirmaciones probabilísticas sobre los aspectos de una distribución desconocida. Para los contrastes paramétricos, esto es un estimador del parámetro. Ya hemos visto que la media aritmética \overline{X}=\frac{1}{n} \sum_{i=1}^{n}\, X_{i}es un estimador puntual ‘adecuado’ de la esperanza desconocida E\left( X\right), en particular, es insesgado y consistente. La varianza y la desviación típica de \overline{X} calculadas de una muestra aleatoria (es decir, independiente e identicamente distribuida—i.i.d.)dada en el capítulo 7 
Var
\left(
\overline{X}\right)=\sigma^{2}\left(
\overline{X}\right)=\sigma^{2}_{\overline{X}}=\frac{\sigma^{2}_{X}}{n}


\sigma\left( \overline{X}\right)=\frac{\sigma_{X}}{n} Construiremos nuestro estadístico de contraste sobre la media muestral \overline{X}. A fin de derivar las regiones de (rechazo/aceptación) correspondientes para un nivel de significación dado, necesitamos hacer supuestos respecto a la distribución de de la media muestral. Se cumple

  • la varible aleatoria bajo estudio X tiene distribución normal, implicando distribución normal para \overline{X} o
  • n es suficientemente grande que justifica la aplicación del teorema central del límite: Si las variables muestrales X_{i} son i.i.d. con esperanza y varianza finita, \overline{X} sigue aproximadamente una distribución normal si tener en cuenta la distribución (continua o discreta, simétrica o no) subyacente. En este caso, nuestro contraste es apropiado.

De esta manera consideramos:
\overline{X} está (al menos aproximadamente) normalmente distribuida con esperanza E\left(
\overline{X}\right)=\mu y varianza Var\left(
\overline{X}\right)=\sigma^{2}_{X}/n. Por ello, la distribución del estimador de la media de la población \mu depende del parámetro desconocido que pretendemos contrastar \mu. La única forma de solucionar este circulo vicioso es asignar un valor numérico a \mu. El menor valor arbitrario que toma el valor del límite en la hipótesis nula, es decir, el valor que separa los rangos paramétricos de \text{H}_{0} y \text{H}_{1}: \mu_{0}. De hecho, este método tiene sentido, si se recuerda que el motivo de rechazar (es decir, no aceptar) la hipótesis nula es aceptar la hippótesis alternativa: Basando la decisión en una distribución determinada de nuestro estadístico de contraste con parámetro \mu_{0} nos permite rechazar este particular \mu, habiendo extraido la incertidumbre en la función de distribución, sencillamente estamos aplicando teoría de probabilidad, como se ha podido ver. Notese que en el test de dos colas este \mu construye el espacio parámetrico completo de la hipótesis nula. En los test de una cola, es el valor límite. Pongamos nuestro supuesto en práctica y sea el conjunto de la esperanza de X, \mu a \mu_{0}: Dada la hipótesis nula \text{H}_{0}:\mu =\mu_{0} como cierta, respectivamente \mu es igual al valor límite de la hipótesis nula para un test de una cola, podemos escribir
\overline{X} está (al menos aproximadamente) con distribución normal con esperanza E\left(
\overline{X}\right)=\mu_{0} y varianza Var\left(
\overline{X}\right)=\sigma^{2}_{X}/n, o, utilizando la notación común para la distribución normal estandar:\overline{X}\overset{\text{H}_{0}}{\thicksim} \N
\left(
\mu_{0}; \, \sigma / \sqrt{n}\right). Hasta ahora, nos hemos centrado en el parámetro de localización \mu. pero ?’Qué pasa con el momento central de segundo orden que especifica una determinada distribución normal (la varianza de una variable aleatoria) ? Como se verá, para la construción de la regla de decisión es crítico diferenciar entre situaciones en las que pueda tener \sigma como conocida a los casos en los que no. Dada un \sigma conocida, la distribución de \overline{X} está completamente especificada. Como no podemos integrar analíticamente la función de densidad normal para lograr la función de distribución normal más próxima, confiamos en las tablas de soluciones numéricas para \N
\left(
\mu=0, \, \sigma =1\right). Estandarizamos \overline{X} y tomamos V=\frac{\overline{X}-\mu_{0}}{\sigma}\, \sqrt{n}como el estadístico de contraste. Dado \text{H}_{0} como cierto, V tiene (aproximadamente) una distribución normal estandarizada: V\overset{\text{H}_{0}}{\thicksim} \N \left( 0, \, 1\right). El valor crítico correspondiente al nivel de significación \alpha se puede obtener en la tabla de la distribución normal estandar. Podemos escribir ahora las regiones de decisión para los tres tipos de test para un nivel de significación \alpha, dada la esperanza límite en \text{H}_{0}, es decir \mu_{0}, es la verdadera esperanza poblacional. 1) Test de dos colas La probabilidad de que V esté en la región de rechazo de \text{H}_{0} debe ser igual al nivel de significación \alpha:P \left( V < c_{l} | \mu_{0}\right) +
P
\left( V
>c_{u} | \mu_{0}\right)=\alpha / 2 + \alpha / 2 = \alpha. Para P \left( V \leq c_{u} \right)= 1 - \alpha / 2 podemos tomar el valor crítico superior de la tabla de la distribución acumulada de una normal estandarizada \N
\left( 0,\, 1\right): c_{u}=z_{1-\alpha
/ 2}. Debido a la simetría de la función se tiene c_{l}=-z_{1 - \alpha / 2}. La región de rechazo de \text{H}_{0} está dada por \left\{ v | v < -z_{1 - \alpha / 2}
\,
\text{ o }\, v > z_{1 -
\alpha / 2}\right\}. La región de aceptación de \text{H}_{0} es entonces \left\{ v |
-z_{1 - \alpha / 2} \leq v \leq z_{1 - \alpha / 2}\right\}. La probabilidad de V tome un valor de la región de aceptación \text{H}_{0} esP
\left( c_{l}
\leq V \leq c_{u}|\mu_{0}\right)=P \left( -z_{1 - \alpha / 2} \leq V \leq z_{1 - \alpha / 2}|\mu_{0}\right)= 1
-
\alpha 2) Test por la derecha Las desviaciones del estadístico de contraste estandarizado V respecto E \left( V
\right)=0 por la ‘parte derecha’ (es decir, positiva \left(
V-0\right)) tienden a contradecir \text{H}_{0}. La región de rechazo estará por tanto en las realizaciones positivas del estadístico de contraste v. La probabilidad de observar realizaciones de V en estas regiones debe ser igual al nivel de significación dado \alpha:P
\left( V > c | \mu_{0}\right) = \alpha. Para P \left( V \leq c \right)= 1 - \alpha / 2 encontramos que el valor crítico en la tabla de la distribución acumulada de una normal estandar \N \left( 0,\, 1\right): c=z_{1-\alpha}. La región de rechazo de \text{H}_{0} está dada por \left\{ v | v >
-z_{1 - \alpha}\right\}, y la región de aceptación de \text{H}_{0} es \left\{ v | v \leq z_{1 -
\alpha}\right\}. La probabilidad de que V tome valores en la región de aceptación de \text{H}_{0} esP
\left( V
\leq c
\,|\,\mu_{0}\right)=P \left( V \leq z_{1 -
\alpha}\,|\,\mu_{0}\right)= 1 - \alpha 3) Test por la izquierda Medias muestrales menores que \mu_{0} implican realizaciones negativas del estadístico de contraste V, esto es, desviaciones de V respecto E \left( V\right)=0 por la parte izquierda de la recta de los números reales. La región de rechazo de \text{H}_{0} por lo tanto consiste en los resultados negativos de V. Consecuentemente, el valor crítico c será negativo para niveles de significación ‘estandares’. Una vez más, precisamos la probabilidad de las realizaciones observadas de V en la zona de rechazo igual a \alpha:P \left( V < -c |
\mu_{0}\right) = \alpha. Utilizando la propiedad de simetía de la distribución normal, transformamos P
\left( V <
-c
\right) en 1-P \left( V < c
\right). De esta manera, el valor crítico absoluto, |-c|=c, es elvalor de la inversa de la función de distribución normal acumulada para la probabilidad \left( 1-\alpha\right), es decir c=z_{1-\alpha}, y -c=-z_{1-\alpha} La región de rechazo de \text{H}_{0} está dada por\left\{ v | v <
-z_{1 - \alpha}\right\}, y la región de aceptación de \text{H}_{0} es \left\{ v | v \geq
-z_{1 - \alpha}\right\}. La probabilidad de que V tome un valor dentro de la región de aceptación de \text{H}_{0} esP
\left( V
\geq
-c
\,|\,\mu_{0}\right)=P \left( V \geq -z_{1 -
\alpha}\,|\,\mu_{0}\right)= 1 - \alpha. Si no sabemos apriori la desviación típica de la variable aleatoria que se está investigando, necesitamos un estimador de ella para el estadístico de contrasteV=\frac{\overline{X}-\mu_{0}}{\sigma}\,
\sqrt{n}. Un estimador insesgado de la varianza de la población esS^{2}
=\frac{\sum_{i=1}^{n}\left( X_{i}-\overline{X}\right)^{2}}{n-1}. Reemplazando \sigma por la raiz cuadrada de S^{2} da el nuevo estadístico de contraste:T=\frac{\overline{X}-\mu_{0}}{S}\, \sqrt{n}. Si la hipótesis nula \text{H}_{0} es verdad, T tiene (al menos aproximadamente) una distribución t con f=n-1 grados de libertad (ver capítulo 8). Para un nivel de significación dado \alpha y grados de libertad f=n-1, se puede obtener el valor crítico de la tabla de la distribución t. Si denotamos a la inversa de la acumulada de la distribución t con f grados de libertad para una probabilidad p como t_{p; \, f}, y suponemos \mu_{0} es la verdadera media de la población, tenemos las siguientes regiones de decisión para los diferentes test que se consideran. 1) Test de dos colas La región de rechazo de \text{H}_{0}:\left\{ t | t < -t_{1 - \alpha
/ 2 ;n-1} \, \text{ or } \,  t > t_{1 - \alpha / 2 ;n-1}\right\}, donde t es la realización de la variable aleatoria T para una determinada muestra. La región de aceptación de \text{H}_{0}:\left\{ t | -t_{1 - \alpha / 2 ;n-1} \leq v
\leq t_{1
-
\alpha
/ 2
;n-1}\right\}. 2) Test por la derecha La región de rechazo de \text{H}_{0}:\left\{ t | t > t_{1 - \alpha
/ 2 ;n-1} \right\}. La región de aceptación de \text{H}_{0}:\left\{ t | t \leq t_{1 -
\alpha / 2 ;n-1} \right\}. 3) Test por la izquierda La región de rechazo de \text{H}_{0}:\left\{ t | t < t_{1 - \alpha
/ 2 ;n-1} \right\}. la región de aceptación de \text{H}_{0}:\left\{ t | t \geq t_{1 -
\alpha / 2 ;n-1} \right\}. Ver que si el tamaño muestral es suficientemente grande (n>30), la distribución t se puede aproximar por la distribución normal estandarizada, esto es, T tiene aproximadamente una distribución \N
\left( 0;\, 1\right). Entonces los valores críticos pueden ser obtenidos de la tabla de la normal, y las regiónes de decisión son iguales a las derivadas para el caso de \sigma conocida. Por lo tanto, para n grande podemos estimar \sigma mediante S y resumir el error de estimación (el cual ocurre con probabildad uno, incluso si el estimador acierta en el verdadero valor del parámetro, es decir, es insesgado).

Cálculo del estadístico de contraste de una muestra concreta

Cuando hemos obtenido una muestra aleatoria x_{1}, \ldots , x_{n}, podemos calcular la contrapartida empírica del test teórico en el que hemos basado nuestro procedimiento de contraste. Desde un punto de vista teórico, se pueden expresar en términos variables muestrales (teóricas), es decir, X_{1}, \ldots , X_{n}, denotándolas con letras mayusculas: \overline{X}, V y S. Los valores calculados de la muestra de tamaño n, x_{1},
\ldots , x_{n}, se denotan por \overline{x}, v y s y se diferencian de su contrapartida teórica sólo en que las variables toman como valor un número real en lugar de un rango de valores posibles. Por lo tanto, la fórmula empírica para la media muestral y la desviacón típica es \overline{x}=\frac{1}{n} \sum_{i=1}^{n}\, x_{i}ys
=\sqrt{\frac{\sum_{i=1}^{n}\left(
x_{i}-\overline{x}\right)^{2}}{n-1}}. Por lo tanto, los dos estadísticos para contrastar medias normales para varianza conocida y desconocida sonv=\frac{\overline{x}-\mu_{0}}{\sigma}\,
\sqrt{n}yt=\frac{\overline{x}-\mu_{0}}{s}\, \sqrt{n}. Se puede ver que se ha aplicado esta notación cuando se ha especificado las regiones de decisión.

Decisión de contraste e interpretación

Si v cae en la región de rechazo, se rechaza la hipótesis nula \text{H}_{0} de acuerdo con la muestra aleatoria de tamaño n y para un nivel de significación \alpha: \text{'H'}_{1}. Estadísticamente, la esperanza verdadera E \left( X\right)=\mu no es igual a la hipotética \mu_{0}. Si el parámetro verdadero pertenece al rango de valores postulados en la hipótesis nula (\text{H}_{0}), cometemos el error tipo I: '\text{H}_{1}'|\text{H}_{0}. De hecho, cuando se elige el nivel de significación, estamos decidiendo que la probabilidad de cometer un error de tipo I es igual al nivel de significación: P\left( '\text{H}_{1}' |\text{H}_{0}\right)=\alpha. Por otra parte, si v está en la región de aceptación, la muestra nos lleva a aceptar la hipótesis nula para un nivel de significación: \text{'H'}_{0}. No podemos mostrar estadíscamente que el verdadero parámetro E
\left( X\right)=\mu difiere de el hipotético (\mu_{0}). Por lo tanto, estamos cometiendo el error de tipo II , es decir, la hipótesis alternativa describe correctamente la realidad: '\text{H}_{0}'|\text{H}_{1}. Como ya se ha mostrado, la probabilidad de comoeter el error \beta es, en general, desconocida y se debe calcular para valores paramétricos alternativos individuales \mu_{1}.

Potencia

?‘Cómo podemos garantizar la ‘bondad’ de un contraste? Hemos visto que al realizar un contraste se controla la probabilidad del error \alpha (mediante el nivel de significación \alpha). La probabilidad de cometer un error \beta se determina mediante el verdadero (y desconocido) valor del parámetro. Cuanto más pequeño sea \beta para un parámetro verdadero \mu, más podremos confiar en el test en el sentido de que es más frecuente rechazar la hipótesis nula cuando la hipótesis alternativa es cierta. Por lo tanto, dado un nivel de significación, queremos que \beta sea tan pequeña como sea posible para valores del parámetro verdadero fuera del rango especificado por la hipótesis nula, o, equivalentemente, queremos maximizar la probabilidad de realizar la decisión correcta \left( '\text{H}_{1}'|
\text{H}_{1}\right), que maximiza la cantidad \left( 1-\beta\right) para un verdadero \mu fuera de la región de la hipótesis nula, es decir, dentro de la hipótesis alternativa. La noción de ‘bondad’ de un contraste se denomina potencia, una función que asigna probabilidades de rechazo \text{H}_{0} \left( 1- \beta\right) de los valores paramétricos verdaderos \mu en la región paramétrica \text{H}_{1} para un \alpha y parámetro hipotético \mu_{0}. Estas probabilidades representan las medias teóricas de tomar la decisión correcta de rechazar \text{H}_{0} sobre todas las posibles muestras (dado \alpha y \mu_{0}). También se puede calcular sin usar las muestras, de hecho, la potencia se puede calcular porque se puede obtener sólo una muestra finita y tratamos de cuantificar la esperanza de la exactitud del procedimiento de contraste. Técnicamente, la potencia P\left( \mu\right) mapea la probabilidad de rechazo de \text{H}_{0} en los parámetros hipotéticos \mu:P\left( \mu\right)=P\left( V \in
\text{región de rechazo de H}_{0}|\mu
\right)=P\left( '\text{H}_{1}'|\mu\right) 1) Dos colas En un test de dos colas, la hipotesis nula es verdads si, y sólo si, \mu=\mu_{0}. El rechazo de \text{H}_{0} dado ese conjunto significa que se comete un error de tipo I: =P\left( V
\in
\text{región de rechazo de H}_{0}|\mu = \mu_{0} \right)=P\left( '\text{H}_{1}'|
\text{H}_{0}\right)=\alpha. Para todos los posibles valores paramétricos, rechazar \text{H}_{0} es la decisión correcta: =P\left(
V
\in
\text{región de rechazo de H}_{0}|\mu \neq \mu_{0} \right)=P\left( '\text{H}_{1}'|
\text{H}_{1}\right)=1-\beta. Por lo que tenemosP\left( \mu \right)=\begin{cases} P\left( '\text{H}_{1}'|
\text{H}_{0}\right)=\alpha, &\text{si }\mu =
\mu_{0}\\ P\left( '\text{H}_{1}'|
\text{H}_{1}\right)=1-\beta, &\text{si }\mu \neq \mu_{0}.
\end{cases} Usando nuestro supuesto sobre la distribución de probabilidad subyacente, podemos calcular analíticamente la potencia de un test de dos colas:P\left(
\mu
\right)=1-\left[ P
\left( V\leq z_{1-\alpha /2} -
\frac{\mu
-
\mu_{0}}{\sigma / \sqrt{n}}\right) -
P \left( V\leq -z_{1-\alpha /2} - \frac{\mu - \mu_{0}}{\sigma /
\sqrt{n}}\right) \right]. La probabilidad de error tipo II puede ser calculada a partir de la potencia:P\left( '\text{H}_{0}'|
\text{H}_{1}\right)=1-P\left(
\mu \neq \mu_{0}\right)=\beta . Propiedades de la potencia de un contraste de dos colas:

  • Para \mu = \mu_{0}, la potencia alcanza su mínimo, \alpha.
  • La potencia es simétrica respecto al valor del parámetro hipotético \mu_{0}
  • La potencia aumenta cuando aumenta la distancia entre el parámetro verdadero \mu y el hipotético \mu_{0} y converte a uno cuando la distancia se incrementa hacia \infty o -\infty.

Las anteriores caracteristicas se ilustran en el siguiente diagrama.

Es s2 51 14.gif

En el diagrama superior, se muestran dos valores alternativos del parámetro verdadero \mu_{1} y \mu_{2}. Si \mu_{1} es el parámetro verdadero, la distancia \mu_{1}-\mu_{0} es comparativamente mayor. Consecuentemente, la probabilidad 1-\beta de tomar la decisión acertada de aceptar la hipótesis alternativa \text{H}_{1} es relativamente alta y la probabildad del error de tipo II, \beta, pequeña. La distancia del ‘hipotético verdadero’ valor del parámetro \mu_{2} respecto al valor del parámetro \mu, \mu_{2}-\mu_{0}, es relativamente pequeño. Por lo tanto, la probabilidad de la decisión correcta de rechazar la hipótesis nula, 1-\beta, es más pequeña que en el primer ejemplo, la probabilidad de cometer un error de tipo II, \beta, es mayor. 2) Contraste por la derecha En el test por la derecha, la hipótesis nula es verdad si el parámetro verdadero es menor o igual que el valor del límite hipotético de \mu_{0}, es decir, si \mu
\leq
\mu_{0}. Si este es el caso, la probabilida máxima de rechazar la hipótesis nula y por lo tanto cometer un error de tipo I, es igual al nivel de significación \alpha:P\left( V \in
\text{región de rechazo de H}_{0}|\mu
\leq \mu_{0} \right)=P\left( '\text{H}_{1}'|
\text{H}_{0}\right)\leq\alpha. Si la hipótesis alternativa es la condición verdadera, es decir, \mu
>
\mu_{0} es cierta, rechazar la hipótesis nula y por lo tanto tomar la decisión correcta ocurre con una probabilidad:=P\left( V
\in \text{región de rechazo de H}_{0}|\mu \geq \mu_{0}
\right)P\left( '\text{H}_{1}'| \text{H}_{1}\right)=1-\beta. Combinando estas fórmulas para los dos conjuntos disjuntos del espacio paramétrico se obtiene la potencia:P\left(
\mu
\right)=\begin{cases}
P\left( '\text{H}_{1}'| \text{H}_{0}\right)\leq\alpha,
&\text{si }\mu \leq \mu_{0}\\ P\left( '\text{H}_{1}'|
\text{H}_{1}\right)=1-\beta, &\text{si }\mu > \mu_{0}.
\end{cases} Se puede calcular de forma exacta la potencia del test por la derecha para todos los posibles valores verdaderos del parámetro \mu:P\left( \mu
\right)=1-P \left( V\leq z_{1-\alpha} - \frac{\mu -
\mu_{0}}{\sigma / \sqrt{n}}\right). El siguiente diagrama muestra la forma típica de la potencia de un contraste por la derecha.

Es s2 51 17.gif

Para todos los valores del conjunto paramétrico de la hipótesis alternativa, la potencia se incrementa monótonamente y converge a uno. Cuanto mayor es la distancia \mu
-
\mu_{0}, mayor es la probabilidad 1-\beta de cometer la decisión correcta de aceptar la hipótesis alternativa, y por lo tanto, menor es la probabilidad \beta de cometer un error de tipo II. En el punto \mu = \mu_{0} la potencia es \alpha, el nivel de significación. Para todos los otros valores asociados con la hipótesis nula, es decir, \mu<\mu_{0}, la potencia es menor que \alpha. Esto es lo que se supuso cuando se construyó el contraste: queremos que \alpha sea la máxima probabilidad de rechazo de la hipótesis nula cuando la ésta es verdad. Como se puede ver en el gráfic, la probabilidad disminuye cuando aumenta la distancia en términos absolutos \mu
-
\mu_{0}. 3) Contraste por la izquierda En el contraste por la izquierda, la hipótesis nula es cierta si el verdadero parámetro es mayor o igual que el valor del límite hipotético, es dicir, si \mu
\geq
\mu_{0}. En este caso, rechazar la hipótesis nula y por lo tanto cometer un error de tipo I, ocurrirá con probabilidad no mayor que \alpha: P\left( V
\in
\text{región de rechazo de H}_{0}|\mu \geq \mu_{0}
\right)=P\left( '\text{H}_{1}'|
\text{H}_{0}\right)\leq\alpha. Si la hipótesis alternativa es cierta, es decir, \mu < \mu_{0}, el investigador está tomando la decisión correcta de rechazar la hipótesis nula, la probabilidad es: P\left(
V
\in
\text{región de rechazo de H}_{0}|\mu \leq \mu_{0} \right)=P\left( '\text{H}_{1}'|
\text{H}_{1}\right)=1-\beta. Para todo el espacio paramétrico tenemos que: P\left( \mu
\right)=\begin{cases} P\left( '\text{H}_{1}'|
\text{H}_{0}\right)\leq\alpha, &\text{si }\mu \geq \mu_{0}\\
P\left( '\text{H}_{1}'| \text{H}_{1}\right)=1-\beta, &\text{si}\mu < \mu_{0}.
\end{cases} Para nuestra población con distribución normal, podemos calcular la probabilidad de rechazo de \text{H}_{0} como una función del verdadero valor del parámetro \mu (la potencia) de forma explícita:P\left(
\mu
\right)=P \left( V\leq -z_{1-\alpha} - \frac{\mu -
\mu_{0}}{\sigma / \sqrt{n}}\right). Un gráfico típico para un constraste por la izquierda es el siguiente

Es s2 51 19.gif

La interpretación de este gráfico de similar al del contraste por la derecha. Consideramos el siguiente contraste por la izquierda:\text{H}_{0}: \mu
\leq 0
\quad
\text{ versus }
\quad
\text{H}_{0}:
\mu >0. La desviación típica de la población es conocida \sigma=8. En este ejemplo interactivo puedes estudiar el impacto del nivel de significación \alpha y del tamaño muestral n en el valor del error tipo II. Puedes especificar

  • el tamaño muestral n,
  • el nivel de significación \alpha,
  • y un \mu verdadero que incremente el error tipo II, es decir, \mu mayor que cero.

Tras realizar tus elecciones, los resultados que se darán son

  • la distribución de la media muestral bajo \text{H}_{0} (curva roja),
  • la distribución de la media muestral bajo \text{H}_{1} usando tu elección de \mu (curva azul),
  • El valor crítico para rechazar la hipótesis nula (línea vertical negra),
  • La probabilidad de cometer un error tipo I (área roja bajo la curva roja),
  • y la probabilidad de cometer un error tipo II (área azul bajo la curva azul).

Modificando n, \sigma y \mu, se puede observar el impacto en la probabilidad de cometer un error de tipo II. Para una mejor compresión de los impactos, recomendamos modificar uno solo de los parámetros en cada prueba. Para facilitar la comparación se te mostrará tanto el resultado actual (gráfico inferior) y el previo (superior). Supongamos que la variable aleatoria X=\text{'tamaño del límite de crédito'} en una población deN=3\,000 tiene una distribución normal con esperanza desconocida \mu y desviación típica conocida \sigma=1\,174 \text{ marcos alemanes (DEM)}. Basándose en un muestreo aleatorio simple, se ha contrastado la hipótesis de que \mu es igual al valor hipótetico \mu_{0}=1\,800
\text{ DEM} con un nivel de significación de \alpha:\text{H}_{0}: \mu = 1\,800
\text{ DEM} \quad \text{ versus } \quad \text{H}_{0}: \mu
\neq 1\,800 \text{ DEM}. Puedes realizar este test tantas veces como quieras—para cada nueva ejecución, se genera una nueva muestra de esa población. Puedes controlar, si quieres, el nivel de significación \alpha y el tamaño muestral n. Los puedes modificar como quieras y observar los efectos individuales dejando uno de ellos constante. En particular, puedes

Es s2 51 e 8.gif

Vamos a ilustrar como información sobre la población puede afectar a la elección del contraste estadístico, a las regiones de decisión y—dependiendo de la muestra—a la decisión del test. Un fabricante de neumáticos modifica el porcentaje en que se mezclan las materias primas en un intento de incrementar la duración media de las ruedas. Tras haberse comercializado los nuevos neumáticos, los competidores dicen que la vida media de las nuevas ruedas no es superior al de las antiguas, que se conoce que es de 38\,000 \text{ km}. La variable aleatoria que se desea investigar es la vida de un elemento de la población de nuevas ruedas, medida en km, denotado como X, y el productor considera que la esperanza E\left( X
\right)=\mu es superior a la de las antiguas, \mu_{0}=38\,000 \text{ km}. La dirección quiere contrastar este hecho de forma científica y manda una investigación estadística que verifique que la esperanza de vida ha aumentado, es decir, que \mu
>
\mu_{0}. Pero quieren minimizar el riesgo de tomar una decisión erronea para no verse expuesto a las críticas de los competidores.

Hipótesis

Sólo se consideran desviaciones en uno de los sentidos, por lo tanto se considera un test de una cola. Siendo la afirmación del productor la hipótesis alternativa con la esperanza de rechazarla, esto implica un test por la derecha:\text{H}_{0}:\mu \leq\mu_{0}
\quad\text{ versus }\quad \text{H}_{1}:\mu
>\mu_{0},donde \mu_{0}= 38\,000 \text{ km}. ?‘Es cierta la afirmación del productor? Podemos contestar esta cuestión analizando los posibles errores. Rechazar \text{H}_{0} implica la probabilidad de error tipo I. En este ejemplo, esto es el conjunto'\text{H}_{1}'|\text{H}_{0}=\text{'la vida media se incrementa'}|\text{en realidad, la vida media no se ha incrementado}. No rechazar la hipótesis nula puede implicar un error de tipo II:'\text{H}_{0}'|\text{H}_{1}=\text{'vidia media no se ha incrementado'}|\text{cuando en realidad, si se ha incrementado}. El productor quiere que el error tipo I sea pequeño, ya que sus implicaciones son mas severas que para las de el error de tipo II: Si se incrementa la producción y las posibles muestras de ruedas nuevas aumentan, tarde o temprano se encontrará una muestra que tenga media inferior a la deseada. La probabilidad máxima del error tipo I, P\left( '\text{H}_{1}'|\text{H}_{0}\right) está dada por el \alpha, un parámetro que el fabricante puede controlar. Por lo tanto, el contraste está de acuerdo con los requisitos del fabricante. La probabilidad del error tipo II, P\left( '\text{H}_{0}'|\text{H}_{1}\right)=\beta, es desconocida, ya que la vida media verdadera de las nuevas ruedas es desconocida. La probabilidad de no verificar un incremento en la vida media de las ruedas puede ser bastante grande. Este es el precio que el fabricante debe pagar por elegir una opción conservadora y controlar activamente el nivel de significación que es crucial para mantener bajo el error de tipo I. Este trade-off tiene sentido, ya que se percibe que es más importante la fiabilidad a largo plazo que las ventas en el corto plazo.

Primera alternativa

Nivel de significación y tamaño muestral

El test se puede realizar a un 0.05 de nivel de significación. Se toma un tamaño muestral de n=10. Como la población es razonablemente grande (se han producido ya miles de ruedas), la muestra se puede considerar como una muestra aleatoria simple.

Contraste estadístico y su distribución; regiones de decisión

se realizan investigaciones basadas en las muestras de las propiedades de las ruedas tras la modificación en la proceso productivo, indicando, que las fluctuaciones en la vida de las ruedas se puede describir ‘razonablemente’ mediante una distribución muestral con desviación típica \sigma=1\,500
\text{ km}. Suponiendo que esto es válido para el nuevo proceso productivo, entonces tenemos para la distribución de la media muestral bajo la hipótesis nula:\overline{X}\overset{\text{H}_{0}}{\thicksim}
\N
\left( 38\,000; \, 1\,500 \right). Bajo \text{H}_{0}, el estadístico de contraste V=\frac{\overline{X}-\mu_{0}}{\sigma}\,
\sqrt{n},tiene una distribución normal estandar: V\overset{\text{H}_{0}}{\thicksim} \N \left( 0 ; \, 1 \right). El valor crítico c que satisface P\left( V\leq c\right)=1-\alpha=0.95 se puede obtener en la tabla de la distribución acumulada de una normal estandar como el cuantil 95 %: c=z_{0.95}=1.645. Las regiones de decisión resultantes son Región de aceptación de \text{H}_{0}: \left\{ v \, | \, v \leq 1.645 \right\}. Región de rechazo de \text{H}_{0}: \left\{ v \, | \, v > 1.645
\right\}.

Muestreo y cálculo del estadístico de contraste

La vida media de 10 ruedas seleccionadas aleatoriamente es \overline{x}=39\,100
\text{ km}. El valor de test es entoncesv=\frac{39\,100-38\,000}{1\,500}\,\sqrt{10}=2.32.

Decisión del contraste e interpretación

Como 2.32 es un elemento de la región de rechazo de \text{H}_{0}, entonces se rechaza la hipótesis nula. Basándose en una muestra de tamaño n=10 y a un nivel de significación de \alpha=0.05, hemos mostrado estadísticamente, que las nuevas ruedas se pueden usar más que las antiguas de forma significativa, esto es, que la verdera esperanza E
\left( X\right)=\mu de la vida de las ruedas es mayor que el valor hipotético \mu_{0}=38\,000
\text{ km}. El test implica la aceptación de la hipótesis alternativa \text{H}_{1}:
\text{'vida media ha aumentado'}. El fabricante quiere un error tipo I ('\text{H}_{1}'|\text{H}_{0}) si la hipótesis nula describe correctamente la realidad (\text{H}_{0}:\text{'vida media no se incrementa'}). Pero la probabilidad de una ocurrencia de este tipo de error ha sido pequeño con el nivel de significación \alpha=0.05. Si la hipótesis alternativa es cierta, se ha tomado la decisión correcta: '\text{H}_{1}'|\text{H}_{1}. La probabilidad P \left( '\text{H}_{1}'|\text{H}_{1}\right) de este conjunto se puede calcular para unos parámetros poblaciones especficos. Supongamos que este valor es \mu=39\,000
\text{ km}, la potencia es\begin{align}
P\left( 39\,000\right)&=1-P\left( V \leq 1.645
- \frac{39\,000-38\,000}{1\,500} \,
\sqrt{10}\right)\\&=1-P\left( V \leq -0.463\right)=1-\left[
1-P\left( V\leq0.463\right)\right]\\&=0.6783=1-\beta.\end{align} Cuanto mayor es la longevidad media, mayor es la probabilidad 1-\beta. Por ejemplo, si se alcanza un valor de 40\,000, la potencia será 0.9949: P\left( 40\,000\right)=1-\beta=0.9949.

Segunda alternativa

Se mantienen constante el nivel de significación \alpha=0.05 y el tamaño muetral n=10, y continuamos suponiendo una distribución normal en la vida de las nuevas ruedas. Lo que evitamos es el supuesto restrictivo de una desviación típica constante.

Estadístico de contraste y su distribución; regiones de decisión

Como tenemos que estimar la desviación típica mediante su contrapartida muestral, la raiz cuadrada de la varianza, S, debemos usar el estadístico T T=\frac{\overline{X}-\mu_{0}}{S}\,\sqrt{n},which, under \text{H}_{0}, tiene una distribución t con f=n-1=9 grados de libertad. Podemos ver que el valor crítico c que satisface P\left( V\leq c
\right)=1-\alpha=0.95 es el cuantil superior 0.05 de la distribución t con 9 grados de libertad en la tabla, y se obtiene un valor de t_{0.95;9}=1.833. Nuetras regiones de decisión serán: Región de aceptación de \text{H}_{0}: \left\{ t \, | \, t \leq 1.833 \right\}. Región de rechazo de \text{H}_{0}: \left\{ t \, | \, t > 1.833
\right\}. Observese que le tamaño de la región de rechazo ha aumentado. Esto se debe al hecho de aumentar la incertidumbre sobre la dispersión del parámetro \sigma. Consecuentemente, hay una mayor concesión para la variabilidad en el estadístico de contraste para el mismo nivel de significación y tamaño muestral que con respecto al test con desviación típica conocida.

Muestreo y cálculo del estadístico de contraste

Junto con la media muestral \overline{X} también se calcula la desviación típica s. Sus valores son \overline{X}=38\,900 \text{ km} y s=1\,390 \text{ km}. Por lo tanto, el valor del estadístico de contraste es t=\frac{\overline{x}-\mu_{0}}{s}\,\sqrt{n}=\frac{38\,900-38\,000}{1\,390}\,\sqrt{10}=2.047.

Decisión del contraste e interpretación

Como t=2.047 está en la región de rechazo, entonces la hipótesis nula es rechazada. Basandose en una muestra de tamaño n=10 y un nivel de signifación de \alpha=0.05, no podemos reflejar estadísticamente que el la esperanza verdadera (y desconocida) E\left( X\right)=\mu de las nuevas ruedas ha aumentado para el anterior valor \mu_{0}=38\,000
\text{ km}. Por supueto, todavía no sabemos el verdadero valor del parámetro \mu, si ocurre que es mayor que 38\,000
\text{ km}, estamos cometiendo el error tipo I, para el que rechazamos la verdadera hipótesis nula: '\text{H}_{1}'|\text{H}_{0}. En la elección de un nivel de significación de 5 por ciento, restringimos la probabilidad de este error a un máximo del 5 por ciento (el valor depende del parámetro verdadero \mu). Si el parámetro verdadero \mu está en la región especificada por la región alternativa, estamos tomando la decisión correcta de rechazar la hipótesis nula: '\text{H}_{1}'|\text{H}_{1}. La probabilidad de este suceso, P\left('\text{H}_{1}'|\text{H}_{0}\right)=1-\beta, se puede calcular para distintas medias poblacionales verdaderas \mu si suponemos que la desviación típica s es la verdadera de la población, es decir, s=\sigma.

Tercera alternativa

Ahora eliminamos el supuesto de normalidad, la situación más relevante desde un punto de vista aplicaciones prácticas. A fin de obtener un test para \mu, necesitamos que el tamaño muestral sea mayor que 30. Si el tamaño muestral es menor que 30, no podemos justificar la aplicación del teorema central del límite, ya que la aproximación no es sufientemente buena. La dirección decide tomar una muestra de n=35 ruedas, incurriendo en un coste mayor como precio por emplear un procedimiento estadístico más adecuado y por lo tanto más creible. El nivel de significación se elige en \alpha=0.025.

Estadístico de contraste y su distribución; regiones de decisión

Como en la segunda alternativa, se tiene que usar el estadístico T T=\frac{\overline{X}-\mu_{0}}{S}\,\sqrt{n},. Habiendo elegido n>30 observaciones independientes, podemos justificar el uso del teorema central del límite y aproximar la distribución de la media muestral por la distribución normal estandar: V\overset{\text{as}}{\thicksim} \N \left( 0 ; \, 1 \right).En el teorema superior, ‘as’ indica ‘asintóticamente’: V es asintoticamente normal, esto es, la distribución normal estandar es el límite al que converge si n tiende a infinito. Para muestras finitas, la distribución estandar sirve como aproximación. El valor crítico c que satisface P\left( V\leq c
\right)=1-\alpha=0.975 es (aproximadamente) el cuantil superior del 2.5 por ciento de la normal estandar, z_{0.975}=1.96, y tenemos las siguientes regiones de decisión: Región de aceptación de \text{H}_{0}: \left\{ v \, | \, v \leq 1.96
\right\}. Región de rechazo de \text{H}_{0}: \left\{ v \, | z, v > 1.96
\right\}.

Muetreo y cálculo del estadístico de contraste

Como en la segunda alternativa, tenemos que usar tanto la media muestral \overline{x} como la desviación típica s como estimadores de sus contrapartidas poblaciones \mu y \sigma. Supongase que sus valores son \overline{X}=38\,500 \text{ km} y s=1\,400
\text{ km} para nuestro nuevo tamaño muestral 35. El valor del estadístico de contraste es t=\frac{\overline{x}-\mu_{0}}{s}\,\sqrt{n}=\frac{38\,500-38\,000}{1\,400}\,\sqrt{35}=2.11.

Decisión de contraste e interpretación

Como v=2.11 está en la región de rechazo, la hipótesis nula es rechazada. En base a esta muestra de tamaño n=35 y un nivel de significación de \alpha=0.05 no podemos afirmar estadisticamente que el verdadero valor de la media E\left( X\right)=\mu de las nuevas ruedas sea mayor que el esperado antes de la implantación del nuevo proceso, \mu_{0}=38\,000
\text{ km}. Si la hipótesis nula es cierta, cometemos el error tipo I. Afortunadamente, la probabilidad de que esto ocurra, (dada que hemos rechazado \text{H}_{0} como es este caso) ha de ser elegido de forma que no exceda \alpha=0.025 para una media poblacional verdadera \mu que cae en el espacio paramétrico establecido por \text{H}_{0}. Dada la pequeña (y máxima)probabilidad de error tipo I de 0.025, es muy posible que sea cierto el hecho de rechazar la hipótesis nula: '\text{H}_{1}'|\text{H}_{1}. La probabilidad asociada, P\left('\text{H}_{1}'|\text{H}_{0}\right)=1-\beta, sólo se puede calcular para un determinado valor del parámetro verdadero. Como en la alternativa 2, tenemos que asumir que \sigma es conocido a fin de calcular esta cantidad fijando \sigma=s=1\,400 \text{ km}. Una empresa está empaquetando harina. La maquina ha sido programada para que llene 1\,000 gramms (g) en cada bolsa. Por supuesto, la probabilidad de que una bolsa contenga exactamente 1 kg, es cero (ya que el peso es una variable continua), aunque tomemos una medida de precision limitada, esperaremos cierta fluctuación alrededor del contenido deseado (y teórico) de un 1 kg a lo largo de la producción. Pero sin información apriori, no podemos estar seguros de si la media del peso de la producción es 1 kg. Afortunadamente, tenemos medios de contrastar esto estadísticamente. Denotamos por X el peso neto por bolsa. Estamos interesados en la esperanza de esta variable aleatoria, es decir, el peso medio neto por bolsa, E\left( X\right)=\mu. ?‘Está lo suficientemente cerca de \mu_{0}=1
\text{ kg}, la cantidad ideal que la máquina debería cargar en cada bolsa? Como la máquina tiene que ser reajustada cada cierto tiempo para que la carga sea lo suficientemente cercana a la deseada, el fabricante toma regularmente muestras para evaluar la precisión del empaquetado. Si la media de una de sus muestras difiere significativamente del valor hipotético \mu_{0}, la maquina se debe reajustar.

Hipótesis

El director está interesado en las desviaciones con respecto al peso ideal de \mu_{0}=1
\text{ kg} en ambas direcciones. Si se llena mucho no es efectivo desde un punto de vista de los costes, y si se llena poco puede provocar una demanda de organizaciones de consumidores, además de la publicidad negativa que esto genera. Po ello, lo indicado es realizar un test de dos colas:\text{H}_{0}:\mu
=\mu_{0}
\quad\text{ versus }\quad
\text{H}_{1}:\mu \neq\mu_{0},donde \mu_{0}= 1\,000 \text{ g}.

Tamaño muestral y nivel de significancia

Los investigadores deciden un contraste a un nivel del 0.05 y preguntan al técnico para extraer una muestra de n=25 bolsas. Como la población, es decir, toda la producción, es muy grande en comparación con la muestra, el investigador considera la muetra como una muetra aleatoria simple.

Estadístico de contrastte y su distribución; regiones de decisión

La función de estimación para la media poblacional desconocida E\left( X\right)=\mu es la media muestral \overline{X}. La experiencia muestra que el valor actual puede ser aproximado bastante bien mediante la distribución normal con desviación típica \sigma = 10
\text{ g}. El estimador \overline{X} tiene, entonces, distribución normal con desviación típica \sigma = 2
\text{ g}. Bajo \text{H}_{0}, es decir, dado que el valor del parámetro verdadero \mu es igual al valor hipótetico (deseado), \mu_{0}, \overline{X} tiene una distribución normal de parámetros \mu
= 1\,000 \text{ g} y \sigma = 2 \text{ g}:\overline{X}\overset{\text{H}_{0}}{\thicksim} \N
\left( 1\,000; \, 2 \right). El estadístico de contraste V como una estandarización de la media aritmética,V=\frac{\overline{X}-\mu_{0}}{\sigma}\, \sqrt{n},tiene distribución normal estandar:V\overset{\text{H}_{0}}{\thicksim}
\N \left( 0 ; \, 1 \right). Se puede obtener el valor crítico superior en la tabla de la distribucion acumulada normal estandar como c_{u}=z_{0.975}=1.96 que satisface P \left( V\leq c_{u}\right)=1-\alpha
/ 2 = 0.975. Usando la simetría de la función, c_{l}=-z_{1-\alpha / 2}=-1.96. Tenemos La región de aceptación de \text{H}_{0}: \left\{ v \, | \, -1.96
\leq v \leq 1.96 \right\} y la región de rechazo de \text{H}_{0}: \left\{ v \, | \, v <
-1.96 \, \text{ or  } \, v > 1.96 \right\}.

Es s2 51 f 4.gif

Región de rechazo \text{H}_0 | región de aceptación \text{H}_0 | región de rechazo \text{H}_0

Obtención de la muestra y cálculo del estadístico de contraste

Se seleccionan 25 bolsas aleatoriamente y se calcula su peso. La media aritmética de las mediciones es \overline{x}=996.4
\text{ g}. El valor del estadístico de contraste es v=\frac{996.4-1\,000}{2}=-1.8.

Decisión de contraste e interpretación

Como v=-1.8 está en la región de aceptación de \text{H}_{0}, la hipótesis no puede ser rechazada. Basandose en una muestra de tamaño n=25, el valor hipotético de la media \mu_{0}=1\,000
\text{ g} no difiere estadisticamente del valor del verdadero parámetro \mu, es decir, no podemos confirmar que el preceso de empaquetamiento es impreciso.

Potencia

No habiendo rechazado la hipótesis nula, estamos tomando el riesgo de cometer un error de tipo II:'\text{H}_{0}'\,|\,\text{H}_{1}, es decir, la hipótesis alternativa sea cierta. Por lo tanto, podemos evaluar la fiabilidad de nuestra decisión en términos de la probabilidad del error tipo II para diferentes valores paramétricos para la hipótesis nula, es decir, \mu
\neq
\mu_{0}. Están dadas por 1-P\left(
\mu
\right). Supongamos que 1\,002 \text{ g} es la verdadera media y la hipótesis alternativa es por lo tanto cierta. Como la potencia asigna probabilidades para decisiones ciertas para distintos parámetros verdaderos, P\left( 1\,002
\right) es la probabilidad de tomar la decisión correcta (rechazar correctamente la hipótesis nula):P\left(
'\text{H}_{1}'|\text{H}_{1}
\right)=1-\beta.Fijando \mu_{0}=1\,000, \alpha =0.05, \sigma = 10 y n=25 la fórmula de la potencia da el valor\begin{align}
 P\left( 1\,002
\right)&=1-\left[
P
\left( V\leq 1.96 - \frac{1\,002 - 1\,000}{2}\right) - P \left( V\leq
-1.96 - \frac{1\,002 - 1\,000}{2}\right) \right]\\&=1-\left[
P\left( V \leq 0.96\right) - P \left( V \leq
-2.96\right)\right]\\&=1-\left[ P\left( V \leq 0.96\right) -
\left( 1-P \left( V \leq 2.96\right)\right)\right]\\&=1-
\left[ 0.831472 - \left( 1-0.998462
\right)\right]\\&=1-0.829934\\&=0.17 = 1 - \beta.\end{align} La probabilidad de cometer un error tipo II si la media poblacional verdadera es 1\,002, es por lo tantoP\left( '\text{H}_{0}'|\text{H}_{1} \right)=\beta\left( 1\,002\right)=1-P\left( 1\,002\right)=0.83. Si el peso medio verdadero es 1\,002 , el 83 % de todas las pequeñas muestras de tamaño1 n=25 no nos llevan a la decisión correcta para un nivel de significación de \alpha=0.05. Considerando que 1\,002 - 1\,000 es una diferencia pequeña, la probabilidad del error tipo II parece bastante grande. Si, por el otro lado, 989 gramos es el valor verdadero, P\left( 989 \right) devuelve una probabilidad de realizar la decisión correcta de rechazar la hipótesis nula:P\left( '\text{H}_{1}'|\text{H}_{1}
\right)=1-\beta, y podemos calcular P\left( 989 \right) = 1-\beta = 0.9998 \, \text{ y }
\, \beta\left( 989\right)=0.0002. Sólo el 0.02 por ciento de todas las muestras suponen la aceptación de la hipótesis nula y por lo tanto tomar la decisión erronea. La probabilidad del error de tipo II es pequeña, porque la diferencia 989
- 1\,000 es grande en términos estadísticos.. La siguiente tabla muestra valores de P\left( \mu\right) y 1-P\left(
\mu\right) para valores de medias poblacionales verdaderas \mu, dada la superior \mu_{0}, \alpha y \sigma.

\mu Hipótesis cierta P\left( \mu\right) 1-P\left(
\mu\right)
988.00 \text{H}_{1} 0.999973=1-\beta 0.000027=\beta
990.40 \text{H}_{1} 0.997744=1-\beta 0.002256=\beta
992.80 \text{H}_{1} 0.949497=1-\beta 0.050503=\beta
995.20 \text{H}_{1} 0.670038=1-\beta 0.329962=\beta
997.60 \text{H}_{1} 0.224416=1-\beta 0.775584=\beta
1\,000.00 \text{H}_{0} 0.05=\alpha 0.95=1-\alpha
1\,002.40 \text{H}_{1} 0.224416=1-\beta 0.775584=\beta
1\,004.80 \text{H}_{1} 0.670038=1-\beta 0.329962=\beta
1\,007.20 \text{H}_{1} 0.949497=1-\beta 0.050503=\beta
1\,009.60 \text{H}_{1} 0.997744=1-\beta 0.002256=\beta
1\,012.00 \text{H}_{1} 0.999973=1-\beta 0.000027=\beta

El siguiente diagrama muestra el gráfico de la potencia.

Es s2 51 f 6.gif

Podemos alterar la potencia para un nivel de significación \alpha fijo en nuestro favor si se incrementa el tamaño muestral n. Vamos a ilustrar el efecto de cambiar el tamaño muestral para dos valores ‘hipotéticos’ del verdadero parámetro 1\,002 y 989. Los otros parámetros del contraste permanecen constante: \mu_{0}=1\,000, \alpha=0.05 y \sigma=10.

n=9 n=16 n=25 n=36
P\left(
1\,002\right)=1-\beta 0.0921 0.126 0.17 0.224
\beta\left( 1\,002\right) 0.9079 0.874 0.83 0.776
P\left( 989\right)=1-\beta 0.91 0.993 0.9998 0.999998
\beta\left( 989\right) 0.09 0.007 0.0002 0.000002

El siguiente diagrama muestra la potencia para un contraste de dos caras para 4 distintos tamaños muestrales.

Es s2 51 f 7.gif

Cuando existen razones para creer que la máquina produce con pequeñas desviaciones respecto al peso deseado, es aconseable un incremento del nivel de significación para revelar estas desviaciones de forma clara y así, minimizar el riesgo de error de tipo II —Los costes extras en que se ha incurrido se compensan con un incremento de la información disponible.

Formulación de hipótesis

Vamos a ilustrar el problema de la elección de la hipótesis adecuada adecuada (y por lo tanto, la alternativa) con un ejemplo real. Considerese una empresa que fabrica neumáticos. Se realizan ciertas alteraciones en la producción con el fin de aumentar la vida de las ruedas. Los competidores creen que la vida de las nuevas ruedas no ha aumentado respecto a las primeras, que tenían un valor de 38\,000 kilometros (km). La dirección de la empresa quiere justificar la inversión en un nuevo proceso de producción y la subsiguiente campaña publicitaria y pide a un científico, es decir, un estadístico, que realice una investigación. La variable de interés es la vida de cada neumático medida en km, denotada como X. Es una variable aleatoria, dado que sus fluctuaciones dependen de factores tanto conocidos como no, esto no se puede tener en cuenta (como la velocidad, peso de cada coche, condiciones meteorológicas, etc.). Antes de las ‘mejoras’ en el proceso de producción, la vida media de un rueda en particular era 38\,000 km; en términos teóricos, la esperanza era E\left( X
\right)=\mu_{0}=38\,000 \text{ km}. El valor medio bajo la nueva producción es desconocido, de hecho, es la cantidad que queremos comparar en términos estadísticos con \mu_{0}: El fabricante paga al estadístico para que muestre objetivamente que \mu
>\mu_{0}=38\,000 \text{ km}. Ver que denotamos la esperanza verdadera bajo la nueva situación como \mu, ya que es el parámetro que nos interesa estudiar y contrastar. La media ‘antigua’ \mu_{0} ‘sólo’ sirve para comparar, además, no se presta especial atención a la concentración de la producción actual (en particular respecto a la media). La afirmación de la dirección que el estadístico tiene que probar cientificamente, \mu
>\mu_{0}, parece mucho más facilmente contrastable como hipótesis nula. Pero como hemos dicho anteriormente, existe una crucial diferencia las afirmaciones de interés científico y la manera de contrastarlas mediante el establecimiento de una hipótesis nula adecuada para tomar la decisión correcta, es decir, una decisión que implique un error tipo I y II aceptables. Por lo tanto, ?‘Qué hipótesis vamos a contrastar? Parece claro que el problema es por una sola parte; sólo interesan desviaciones de la esperanza de vida nueva respecto a la antigua en una dirección. En el hecho de decidir si para contrastar como se ha formalizado como un contraste por la izquierda o contrastarlo como la negación, \mu
\leq\mu_{0}, por la derecha, nos tenemos que fijar en el objetivo de la investigación: la empresa de ruedas tratan de argumentar que \mu_{0} es mayor que \mu, y al mismo tiempo, que el riesgo de realizar una afirmación incorrecta sea pequeño a fin de considerar la decisión del contraste como estadísticamente probada. Este puede ser el caso de si es cierta que la afirmación inversa de que las nuevas ruedas duran menos puede ser rechazada con un aceptable (es decir, pequeño) nivel de significación, lo que implicaría que hay una probabilidad muy pequeña de que la hipótesis nula, \mu
\leq\mu_{0}, sea verdad y por tanto la hipótesis alternativa, \mu
>\mu_{0}, no sea verdad. Pero esto es exactamente el resultado que quieren ver los jefes de la empresa. Vamos por lo tanto a establecer la negación como la hipótesis nula (esperando rechazarla con un determinado nivel de significación):\text{H}_{0}:\mu
\leq\mu_{0} \quad\text{ versus }\quad \text{H}_{1}:\mu
>\mu_{0},con \mu_{0}= 38\,000 \text{ km}. Si la muestra de la longevidad de n nuevas ruedas lleva a rechazar la hipótesis nula \text{H}_{0} ('\text{H}_{1}'), se cometerá un error tipo I si la hipótesis nula es cierta. En nuestro ejemplo, este conjunto se puede escribir como '\text{H}_{1}'|\text{H}_{0}=\text{'la media de vida se ha incrementado'}|\text{en realidad, la vida media no se ha incrementado}. Si la hipótesis nula no es rechazada en base a la muestra disponible de tamaño n, la conjetura realizada todavía es cierta, en cuyo caso, el investigador (sin saberlo) ha cometido un error de tipo II. El es víctima de la siguiente situación '\text{H}_{0}'|\text{H}_{1}=\text{'la vida media no se ha incrementado'}|\text{en realidad, la vida media se ha incrementado}. Comparando las implicaciones del error tipo I y II para el ejemplo, se ve que el impacto del estudio en la fortuna del fabricante es el elemento crucial, para

  • los competidores pueden realizar investigaciones similares usando un test por la izquierda, que lleve a la refutación de los resultados del trabajo anterior realizado por el fabricante,
  • una futura investigación en las ruedas producidas a continuación podría revelar las propiedades de las ruedas actuales como una muestra de todas las comercializadas, provocando preguntas embarazosas sobre la integridad y credibilidad del fabricante.

Por estas razones, el fabricante de ruedas está bien aconsejado de mantener la probabilidad de error tipo I, P\left( '\text{H}_{1}'|\text{H}_{0}\right), pequeña, controlando el nivel de significación, por ejemplo, fijándolo en \alpha=0.05.

Regiones de decisión

Tanto para test de dos colas como de una, el tamaño de la o rechazo, cuando se contrasta \mu, depende de

  • el nivel de significación dado \alpha: manteniend todo igual, un incremento de \alpha aumenta la región de rechazo de \text{H}_{0}, reduciendo el tamaño de la región de aceptación (y viceversa),
  • el tamaño muestral n: ceteris paribus, cuanto más grande es el tamaño muestral, menor es la región de rechazo de \text{H}_{0}, y mayor la región de aceptación (y viceversa),
  • la dispersión \sigma de la variable en la población, y S en la muestra: manteniendo el resto de condiciones constantes, un incremento en la variabilidad \sigma (respectivamente S ) lleva a un incremento de la región de rechazo de \text{H}_{0}, reduciendo el tamaño de la región de aceptación (y viceversa).

Los valores críticos, y por consiguiente, las regiones de aceptación/rechazo de \text{H}_{0} se pueden calcular facilmente para la media muestral \overline{X}, si la varianza de la población \sigma es conocida. Lo realizaremos para un contraste de dos colas. Hemos derivado el estadístico de contraste V como una estandarización de la función de estimación \overline{X}:V=\frac{\overline{X}-\mu_{0}}{\sigma}\, \sqrt{n}, y, en términos de realizaciones x_{i}s de las variables muestrales X_{i}s:v=\frac{\overline{x}-\mu_{0}}{\sigma}\, \sqrt{n}. En un contraste de dos caras, la región de aceptación de \text{H}_{0} consiste en todas las realizaciones v de V mayores o iguales que -z_{1-\alpha /2} y menores o iguales que z_{1-\alpha /2}:\left\{ v|-z_{1-\alpha /2}\leq v \leq
z_{1-\alpha /2}\right\}. De esta forma, los valores críticos -z_{1-\alpha /2} y z_{1-\alpha /2} son posibles realizaciones del estadístico de contraste V. Están sujetos a la misma estandarización llevada a cabo para convertir \overline{X} en V a fin de expresarla en unidades compatibles con los cuantiles de la normal estandar:-z_{1-\alpha
/2}=\frac{\overline{X}_{l}-\mu_{0}}{\sigma}\, \sqrt{n} \, , \quad z_{1-\alpha
/2}=\frac{\overline{X}_{u}-\mu_{0}}{\sigma}\, \sqrt{n}. Como -z_{1-\alpha /2} es el valor crítico menor respecto a V, vamos a denotar el valor crítico menor menor para \overline{X} por \overline{X}_{l} (se aplica lo mismo para el límite superior, por lo que se usará el subindice u). Podemos aislar el extremo superior e inferior de la de \text{H}_{0} en términos de la media muestral:\overline{X}_{l}=\mu_{0}-z_{1-\alpha /2}\cdot \frac{\sigma}{\sqrt{n}} \, ,
\quad \overline{X}_{u}=\mu_{0}+z_{1-\alpha /2}\cdot \frac{\sigma}{\sqrt{n}}. La región de rechazo resultante de \text{H}_{0} en términos de \overline{X} is:\left\{ \overline{X}\, | \, \overline{X}_{l}\leq \overline{X} \leq \overline{X}_{u}
\right\}= \left\{ \overline{X} \, | \, \mu_{0}-z_{1-\alpha /2}\cdot
\frac{\sigma}{\sqrt{n}} \leq \overline{X} \leq \mu_{0}+z_{1-\alpha /2}\cdot
\frac{\sigma}{\sqrt{n}} \right\},y el rechazo asociado está dado por el complementario\left\{ \overline{X}\, | \, \overline{X} < \overline{X}_{l} \, \text{ or } \, \overline{X} > \overline{X}_{u} \right\}= \left\{ \overline{X} \, | \, \overline{X}
> \mu_{0}-z_{1-\alpha /2}\cdot \frac{\sigma}{\sqrt{n}} \, \text{ or } \, \overline{X} >
\mu_{0}+z_{1-\alpha /2}\cdot \frac{\sigma}{\sqrt{n}} \right\}. Para la estimación de test de una cola, se pueden realizar transformaciones similares.

Potencia

Vamos a derivar la función de potencia para un test de dos colas para media poblacional. La potencia se calcula como\begin{align}
P\left(
\mu\right)&=P\left( V \in \text{región de rechazo de H}_{0}\,|\,\mu \right)\\&=1-P\left( V \in \text{región de aceptación de H}_{0}\,|\,\mu \right).\end{align} Tomando \mu como el parámetro verdadero de la población, tenemos\begin{align}
P\left( \mu\right)&=1-P\left( -z_{1-\alpha /2} \leq V \leq
z_{1-\alpha /2} \, | \, \mu \right)\\&=1-P\left( -z_{1-\alpha /2} \leq
\frac{\overline{X}-\mu_{0}}{\sigma\, \sqrt{n}} \leq z_{1-\alpha /2} \, | \, \mu
\right).\end{align} Expandiendo el numerador del término central con \mu - \mu se obtiene\begin{align}
P\left( \mu\right)&=1-P\left( -z_{1-\alpha /2} \leq
\frac{\overline{X}-\mu_{0}+\mu - \mu}{\sigma\, \sqrt{n}} \leq z_{1-\alpha /2} \, | \,
\mu \right)\\&=1-P\left( -z_{1-\alpha /2} \leq \frac{\overline{X}-\mu}{\sigma\,
\sqrt{n}} + \frac{\mu -\mu_{0}}{\sigma\, \sqrt{n}} \leq z_{1-\alpha /2} \, | \, \mu
\right)\\&=1-P\left( -z_{1-\alpha /2} - \frac{\mu -\mu_{0}}{\sigma\, \sqrt{n}} \leq
\frac{\overline{X}-\mu}{\sigma\, \sqrt{n}} \leq z_{1-\alpha /2} - \frac{\mu
-\mu_{0}}{\sigma\, \sqrt{n}} \, | \, \mu \right)\\&=1-P\left( -z_{1-\alpha /2} -
\frac{\mu -\mu_{0}}{\sigma\, \sqrt{n}} \leq V \leq z_{1-\alpha /2} - \frac{\mu
-\mu_{0}}{\sigma\, \sqrt{n}} \, | \, \mu \right)
\\&=1-\left[P\left( V \leq z_{1-\alpha /2} -
\frac{\mu -\mu_{0}}{\sigma\, \sqrt{n}} \, | \, \mu \right) -
P\left( V \leq -z_{1-\alpha /2} - \frac{\mu -\mu_{0}}{\sigma\,
\sqrt{n}} \, | \, \mu \right)\right] .\end{align} La potencia para un contraste de una cola se puede obtener de forma similar. Desde un punto de vista teórico respecto a la decisión, es deseable que la probabilidad de rechazar correctamente la hipótesis nula se incremente de forma rápida cuando se aumenta la la distancia entre el verdadero parámetro \mu y el hipotético \mu_{0}, es decir, queremos que la gráfica de la potencia sea una función escalón que alcance el verdadero valor del parámetro. Existen dos posibles formas de perfeccionar la ‘forma’ de la potencia. 1) Increamentando el tamaño muestral n Leyendo la fórmula anterior de la potencia de un test de dos colas para la media, se ve que está relacionado positivamente con el tamaño muestral n. En general, manteniendo el resto constante, el gráfico de la potencia más suave incrementando n: Para un valor del parámetro verdadero en la región \text{H}_{1} , es decir, para un test de dos colas \mu \neq \mu_{0} , por la derecha \mu
> \mu_{0} y por la izquierda \mu < \mu_{0}, la probabilidad 1-\beta de rechazar la hipótesis nula,y por lo tanto, tomar la decisión correcta, se incrementa con n. Esto se produce por un descenso en la probabilidad \beta de cometer un error tipo II. Por lo tanto, la probabilidad de discriminar correctamente entre el valor del parámetro verdadero y el hipotético se incrementa cuando se aumenta el tamaño muestral. Dado un valor fijo para el nivel de significacón \alpha, la probabilidad del error tipo II se puede mejorar ‘simplemente’ incrementando la muestra. El siguiente diagrama muestra el gráfico de 4 funciones de potencia para cuatro tamaños muestrales distinto, con n_{1}< n_{2}< n_{3}< n_{4}.

Es s2 51 m 9.gif

2) Modificando el nivel de significación \alpha Ceteris paribus, permitiendo una mayor probabilidad de cometer un error de tipo I, es decir, incrementar el nivel de significación \alpha, esto supondrá un cambio en el gráfico de la función potencia hacia arriba. Esto significa que un incremento en \alpha lleva a un aumento de la probabilidad de rechazar la hipótesis nula para todos los posibles valores del parámetro verdadero \mu. Si el valor del parámetro verdadero está en la región asociada con la (\mu \neq \mu_{0} par un test de dos colas, \mu
> \mu_{0} para un por la derecha y \mu < \mu_{0} para uno por la izquierda), esta es la decisión correcta —la probabilidad 1-\beta de rechazar correctamente la hipótesis nula ha aumentado, la probabilidad \beta de cometer el error tipo II ha disminuido. Pero la probabilidad de rechazar la hipótesis nula también ha aumentado para valores del parámetro verdadero en la región \text{H}_{0}, incrementando la probabilidad del error tipo I. Por lo tanto, encontramos un trade-off entre las probabilidades de cometer un error tipo I y tipo II, un problema que no puede solucionarse de forma mecánica, pero que puede abordarse mediante un método teórico de decisión basado en la utilidad. En el diagrama inferior, se muestra la potencia de un test de dos colas, para un tamaño muestral fijo, de dos diferentes niveles de significación. La línea roja representa P\left( \mu\right) para \alpha=0.05, la azul P\left( \mu\right) para \alpha=0.10.

Es s2 51 m 10.gif