Probabilidad Condicionada e Independencia de Sucesos

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Probabilidad Condicionada

Sean y dos sucesos definidos en el espacio muestral . La probabilidad condicionada de dado , se define como La probabilidad condicionada supone que ha ocurrido y pregunta cual es la probabilidad de que ocurra .  Suponiendo que ha ocurrido , tenemos que definir un nuevo espacio muestral   y una nueva medida de probabilidad .. Si entonces se puede escribir También, podemos definir la probabilidad condicionada de dado :

Regla del Producto

Reconfigurando la definición de probabilidad condicionada, se puede extraer una fórmula para la probabilidad de la ocurrencia simultánea de Y : y, de forma análoga, Generalizando para los sucesos :

Sucesos Independientes

La noción subyacente al concepto de probabilidad condicionada es que la información a priori referente a la ocurrencia de sucesos generalmente influye en las probabilidades de otros sucesos.  (Por ejemplo, si uno sabe que alguien es un fumador, entonces se le puede asignar una probabilidad mayor de contraer cancer de pulmón).  En general,  se espera. El caso tiene una interpretación importante.  Si la probabilidad de que ocurra se mantiene igual, haya ocurrido o no el suceso , diremos que los dos sucesos son estadísticamente (o estocásticamente) independientes. (Por ejemplo, el hecho de conocer si una persona es alta o no, no afectará a la evaluación de que ese individuo desarrolle un cancer de pulmón.) Definimos la independencia estocástica de dos sucesos y mediante la condición que implica que las siguientes condiciones se cumplen La condición del producto definida para la independencia estadística de dos sucesos también es aplicable para sucesos independientes: Para establecer la independencia estadística de sucesos, se debe garantizar que la regla del producto se cumple para cualquier conjunto de sucesos. Esto es Es importante no confundir independencia estocástica con el concepto de exclusión mutua.. Por ejemplo, si dos sucesos y con y , son mutuamente excluyentes entonces , como y .  En cuyo caso . Un pequeño ejemplo puede clarificar la diferencia entre independencia y mutua exclusión (regata Cambridge contra Oxford): pincha en el símbolo del altavoz.

Tabla de Doble Entrada

En muchas aplicaciones el investigador está interesado en asociaciones entre dos variables categóricas. El caso más simple es cuando se observan dos variables binarias, es decir, Hay dos variables, cada una con dos posibles resultados.   Por ejemplo, que para un proceso de selección aleatorio en individuos se observa si fuma o no, y si tiene enfisema o no. Sea el resultado de que el individuo fume y el de que el individuo tenga enfisema.  Podemos construir espacios muestrales separados y .para cada una de las dos variables. De forma alternativa, podemos construir un espacio muestral de pares ordenados: En la tabulación de los datos de esta forma, simplemente se cuentan el número de individuos que corresponden a cada uno de los cuatro resultados básicos. no se pierde información respecto a las variables individuales porque siempre podemos obtener las frecuencias para las dos categorías de ambas variables mediante la suma de las catergorías de la otra variable.  Por ejemplo, para calcular el número de individuos que tienen enfisema, sumamos todos aquellos que tienen enfisema y fuman (es decir, ) y todos aquellos que no fuman y tienen enfisema (es decir, ).  Las frecuencias relativas para las categorías de las variables individuales se denominan frecuencias relativas marginales. Las frecuencias relativas que surgen de datos categóricos bivariantes se muestran normalmente mediante una tabla de doble entrada de las dos variables. Las frecuencias marginales se adjuntan mediante la suma de las columnas/filas que representan las categorías de cada variable.  La matriz resultante se denomina tabla de contingencia de , donde y se refiere al número de categorías observadas para cada variable. En nuestro ejemplo, para dos categorías por cada variable, tenemos una tabla de contingencia de . Vamos a resumir las probabilidades asociadas con cada resultado básico en una tabla similar:

Suma
Suma

La estructura de esta tabla es particularmente útil para contrastar la independencia entre sucesos. Recuerdese que la probabilidad conjunta de dos sucesos independientes se puede calcular como el producto de las probabilidades de los dos sucesos individuales. En este caso, queremos verificar si las probabilidades conjuntas del cuerpo principal de la tabla son iguales al producto de las probabilidades marginales.  Si no lo son, entonces los sucesos son independientes.  Por ejemplo, bajo independencia, tenemos Si se reemplazan las probabilidades de la tabla superior por sus frecuencias muestrales, entonces la independencia implica que las probabilidades conjuntas estimadas son aproximadamente iguales al producto de las probabilidades marginales estimadas.  Un procedimiento formal para contrastar la independencia se verá con posterioridad. En la tabla inferior se muestran las probabilidades de dos variables binarias. ?‘Son las variables representadas por los sucesos respectivamente (mutuamente) independientes?

Suma
Suma

Por la condición del producto que la independencia debe satisfacer, las celdas interiores de la tabla de contingencia deben ser iguales al producto de sus correspondientes probabilidades marginales. Esto es cierto para las cuatro celdas:

Suma
Suma

En este ejemplo especial con dos variables binarias no es necesario que verifique la validez de la regla del producto para cada una de las cuatro celdas. Como ya hemos visto, la independencia estadística de dos sucesos implica la independencia estadística de sus complementarios. Consecuentemente, si la condición del producto se mantiene para una de las cuatro celdas, también se debe de mantener para las restantes tres celdas. Esto sólo es cierto debido a que los dos sucesos considerados para las dos variables son complementarios. Un maestro y su aprendiz producen tornillos manualmente. Los siguientes datos se recogieron durante el año 1998:

Producción total: 2000 tornillos
Grupo 1 1400 tornillos
(el maestro) 1162 tornillos buenos
238 tornillos defectuosos
Grupo 2 600 tornillos
(el aprendiz) 378 tornillos buenos
222 tornillos defectuosos

?‘Cuál es la probabilidad de que un tornillo seleccionado aleatoriamente no tenga fallo dado que ha sido producido por el maestro? A fin de calcular esta probabilidad, usaremos la siguiente notación: = {el tornillo es bueno} = {tornillo producido por maestro} = {tornillo producido por el aprendiz} La situación se puede mostrar en un diagrama de Venn: Es folnode7 d k 1.gif Queremos calcular . Esta se define como . El suceso corresponde a seleccionar un tornillo bueno producido por el maestro. Para calcular la probabilidad , dividimos el número de tornillos con esta propiedad entre el total de tornillos: . La probabilidad puede ser calculada como la fracción del número de tornillos producidos por el maestro entre el número total de tornillos: . De esta manera obtenemos: Queremos mostrar que: Para un par de sucesos independientes y tenemos . Supongamos que los sucesos y son independientes. Entonces tenemos Es folnode7 d mi 1.gif De forma similar, podemos mostrar que . Después supongamos que queremos mostrar que esto implica la regla del producto, es decir, que y son independientes: Ciertamente, la independencia estadística puede ser definida equivalentemente de muchas formas.