Distribución binomial

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


La distribución binomial es el resultado de un experimento aleatorio en el cual podemos obtener un suceso A con probabilidad constante p, o el suceso complementario  \bar{A} con probabilidad 1-p. Supongamos que el experimento se repite n veces. La variable aleatoria discreta que contiene el numero de éxitos A después de n repeticiones del experimento, se distribuye de acuerdo a una distribución binomial de parámetros n y p. Su función de probabilidad: f(x;n,p) = \left\{
        \begin{array}{ll}
           \left(
             \begin{array}{c} n\\
              x
             \end{array} \right)
           \cdot p_x \cdot (1 - p)^{n-x} \quad & \text{para}\  x = 0,1, \dots
,n\\
           \\
           0 \quad & \text{en otro caso}
        \end{array} \right.

Se denota como:  X \sim B(n;p)

La función de distribución es: f(x;n,p) = \left\{
        \begin{array}{ll} \sum\limits_{k=0}^x
           \left(
             \begin{array}{c} n\\
              k
             \end{array} \right)
           \cdot p^k \cdot (1 - p)^{n-k} \quad & \text{para}\  x \geq 0\\
           \\
           0 \quad & \text{para}\ x < 0
        \end{array} \right.

El valor esperado y la varianza de la distribución Binomial B(n;p) son: E(X) = n \cdot p Var(X) = n \cdot p \cdot (1 - p)

Las propiedades de la distribución Binomial:

Propiedad reproductiva:

Si  X \sim B(n;p) e  Y \sim B(m;p) son variables aleatorias independientes, entonces la variable aleatoria Z = X + Y tiene una distribución Binomial de parámetros n+m y p, es decir, Z\sim B(n+m;p).

Simetría:

Si  X \sim B(n;p) e  Y = n - X entonces Y \sim B(n;1-p). La distribución Binomial está tabulada para determinados valores de los parámetros n y p ( p
\leq 0.5). La distribución binomial depende de dos parámetros n y p que influyen en - su forma - su localización, es decir, el valor esperado E(X) = np y - su varianza, en otras palabras, \sigma = \sqrt{np(1-p)} Este ejemplo interactivo te permitirá cambiar uno o los dos parámetros. El resultado es un gráfico que contiene la función de probabilidad de la distribución Binomial B(n;p). Recomendamos el cambiar sólo el valor de un parámetro en cada momento para ver cual es el efecto de este cambio en el dibujo de probabilidad. Además, se pueden calcular las probabilidades para valores dados de x.

Mejores oportunidades para las hamburgesas muy hechas

Un anuncio de TV de Hamburger-Land contiene la siguiente frase: Nuestra investigación muestra que el 75\% de las personas prefiere hamburgesas muy hechas. En el mismo anuncio de TV, el orador dice: “Si pregunta a cuatro clientes de Hamburger-Land, al menos uno de ellos elegirá las hamburgesas poco hechas” ?‘ Están estas dos frases diciendo exactamente lo mismo? Los supuestos del experimento de Bernoulli se satisfacen:
El resultado de cada experimento es uno de dos posibles sucesos:
A = {hamburgesa poco hecha } ; \bar{A} = { hamburgesa muy hecha } con probabilidades P(A) = 0.25 y P(\bar{A}) = 0.75. Como el grupo de clientes puede ser realmente muy grande. Por lo tanto, no es tan importante si la selección aleatoria ha sido realizada con o sin “reemplazamiento” Las probabilidades se pueden considerar constantes y los experimentos por si mismos independientes. Definamos la variable aleatoria X = \{ número de hamburgesas poco hechas en 4 decisiones \} que tiene una distribución binomial con parámetros n = 4, p = 0.25;
es decir  X \sim B(4;0.25)
Queremos calcular la probabilidad P(X
\leq 1)
que se puede cacular como
P(X \leq 1) =
P(X = 0) + P(X = 1) = F_B(1;4;0.25) La probabilidad de que el suceso “hamburgesa poco hecha” ocurre a lo sumo una vez es la suma de las probabilidades de que la “hamburgesa poco hecha” no sea elegida por ninguno de los clientes o sea elegida por sólo uno de los clientes de Hamburger-Land. Es decir, el valor de la función de distribución para x=1. La tabla de la distribución Binomial con n = 4 y p = 0,25:

x f_B(x;4;0.25) F_B(x;4;0.25)
0 0.3164 0.3164
1 0.4219 0.7383
2 0.2109 0.9492
3 0.0469 0.9961
4 0.0039 1.0000

Es s2 22 e1 2.gif La última columna de la tabla implica que F_B(1;4;0.25) = 0.7383. Suponiendo que las probabilidades P(hamburgesa muy hecha) = 0.75 y P(hamburgesa poco hecha) = 0.25 son correctas para este experimento de los clientes de Hamburger-Land, se obtiene que la afirmación del anuncio de TV es correcta con probabilidad 0.7383. Es s2 22 e 1.gif Los estudiantes de la universidad (HU Berlin) completaron un cuestionario. El 65% contestaron que tenían trabajo a tiempo parcial. ?‘Cuál es la probabilidad de a lo sumo 4 de 8 estudiantes tomados al azar en esta universidad tengan trabajo a tiempo parcial?. Los supuestos de un experimento de Bernoulli se satisfacen:
Cada “experimento” puede producir sólo dos resultados:
A = \{ estudiante con trabajo a tiempo parcial \} ; \bar{A} =
\{ estudiante sin trabajo a tiempo parcial \}, P(A) = 0.65 ; P(\bar{A}) = 0.35 .
Suponemos que el número de estudiantes n es grande comparándolo con el número total de estudiantes N, lo que hace posible que se pueda usar una distribución Binomial. Las probabilidades asociadas con los sucesos se puede considerar que son constantes y las respuestas de los estudiantes son independientes (la probabilidad de elegir el mismo estudiante dos veces está muy cerca de cero). El resultado del experimento es la variable aleatoria X = \{ número de estudiantes con trabajo a tiempo parcial\}. Esta variable aleatoria tiene una distribución Binomial: X \sim
B(n;p) = B(8;0.65).
Queremos calcular la probabilidad P(X \leq 4), es decir, la función de distribución F(4). El valor de la función de distribución B(8;0.65) no está tabulado. Como el cálculo de la función de distribución a mano puede ser bastante dificil, porque tenemos que calcular la suma de cinco probabilidades f(x), x = 0,1, \dots, 4, vamos a evaluar la función de distribución numericamente (ver la segunda columna de la tabla que se muestra a continuación).

x B(8;0.65) B(8;0.35)
0 0.0002 0.0319
1 0.0036 0.1691
2 0.0253 0.4278
3 0.1061 0.7064
4 0.2936 0.8939
5 0.5722 0.9747
6 0.8309 0.9964
7 0.9681 0.9998
8 1.0000 1.0000

Fig.1: Función de probabilidad B(8;0,35) y B(8;0,65) Es s2 22 e 2.gif Fig.2: Función de distribución B(8;0,35) y B(8;0,65) Es s2 22 e 3.gif La probabilidad de que a lo sumo 4 estudiantes de n=8 estudiantes elegidos aleatoriamente tengan trabajo a tiempo parcial es 0.2936. Si no eres capaz de evaluar la función de forma numérica, es posible que con los valores tabulados de la distribución Binomial y por la simetría de esta distribución puedas obtener la probabilidad buscada. X = \{ número de estudiantes con trabajo a tiempo parcial\}
\sim B(8;0,65), es decir, Y = \{ número de estudiantes sin trabajo a tiempo parcial \}\sim B(8;0,35).
X \leq 4, i.e. x = 0,1,2,3,4 corresponde a Y \geq 4, es decir,  y = 8,7,6,5,4.
En lugar de calcular la probabilidad P(X \leq 4) podemos calcular P(Y \geq 4) = 1 - P(X \geq 3). Usando la tabla de la distribución Binomial B(8;0,35) - encontramos en la tercera columna P(Y \leq 3) = 0,7064 que implica que
P(Y \leq 4) = 1 - 0.7064 = 0.2936. Hay 10 bolas en una caja, 3 bolas son blancas y 7 bolas son rojas. A = bola blanca ; \bar{A} = bola roja ; P(A) = 0.3
; P(\bar{A}) = 0.7 Tras cada extracción, se devuelve la bola a la caja. Realizamos cinco extracciones en total (n=5). Los supuestos del experimento de Bernoulli se verifican:

  • Existen sólo 2 posibles resultados en cada extracción
  • Las probabilidades son constantes, porque se devuelven las bolas a la caja
  • Las extracciones son mutuamente independientes

Queremos calcular la probabilidad de extraer dos bolas blancas, es decir P(X = 2). X_i = \{ número de bolas blancas en extracción i \} P(X_i = 1) = 0.3 ; P(X_i = 0) = 0.7 para todo i = 1,
\dots ,5 Realizando cinco repeticiones, obtenemos las siguientes variables aleatorias: X_1,X_2,X_3,X_4,X_5
X = \{ número de bolas blancas en n=5 extracciones \} X =  \sum\limits_i X_i X \sim B(n;p) = B(5;0.3) El número de todas las posibles permutaciones de las extracciones cuando extraemos 2 bolas blancas y 3 rojas: \left( \begin{array}{c}
                5\\
                2
           \end{array} \right) = \frac{5!}{2! \cdot 3!} = 10 La probabilidad es: P(X=2) = f_B(2;5;0.3) = \left( \begin{array}{c}
                5\\
                2
           \end{array} \right) \cdot 0.3^2 \cdot 0.7^3 = 0.3087 La siguiente tabla contiene la distribución de probabilidad y la función de distribución de la distribución Binomial B(5;0,3):

x  f_B(x;5;0.3)  F_B(x;5;0.3)
0 0.1681 0.1681
1 0.3601 0.5282
2 0.3087 0.8369
3 0.1323 0.9692
4 0.0284 0.9976
5 0.0024 1.0000

La siguiente figura muestra la función de distribución de probabilidad de B(5;0,3). Es s2 22 f 3.gif La probabilidad de un determinado suceso se puede calcular mediante la función de distribución:  f_B(2;5;0.3) = F_B(2;5;0.3) -
F_B(1;5;0.3)
 \quad
=0.8369 - 0.5282 = 0.3087 La probabilidad de extraer 2 bolas blancas en 5 pruebas es de 0.3087. Derivación de la distribución Binomial El experimento aleatorio se puede describir mediante las siguientes propiedades.

  • sólo dos sucesos, A y \bar{A}, son posibles
  • las probabilidades de estos sucesos son P(A) = p y P(\bar{A})=1 - p
  • el experimento se repite n veces, las repeticiones son mutuamente independientes y las probabilidades son constantes

Cada experimento aleatorio se llama experimento de Bernoulli. Para cada experimento de Bernoulli, definimos la variable aleatoria X_i (i=1,
\dots,n) que toma valores 0 (si tenemos el suceso \bar{A}) y 1 (para el suceso A). Las probabilidades de los sucesos en este experimento serán P(A) = p y P(\bar{A}) = 1 - p y la variable aleatoria X_i tiene la siguiente función de probabilidad (de una distribución de Bernoulli): f(x;p) = \left\{
        \begin{array}{ll}
          p^x(1 - p)^{1-x} \quad & \text{para } x = 0,1 \\
          0 \quad & \text{en otro caso}
        \end{array} \right. E(X_i) = p, Var(X_i) = p(1-p) Tras repetir el experimento de Bernoulli n veces, investigamos el número de veces que se ha producido el suceso A, es decir, observamos la variable aleatoria X=\{ número de ocurrencias del suceso A en n pruebas \}:  X = \sum\limits_{i=1}^n X_i X es una función (combinación lineal) de n variables aleatorias. El suceso X = x ocurre si y sólo si el suceso A ocurre exactamente x veces y el suceso \bar{A} es observado exactamente (n-x) veces en las n pruebas. Por ejemplo, A_1 \cap A_2 \cap \dots \cap A_x \cap \bar{A}_{x+1} \cap \bar{A}_{x+2} \cap
\dots \cap \bar{A}_{n} |\quad x-veces A \quad | \quad (n-x)-veces \bar{A} \quad | El índice de los sucesos muestra el número de la prueba en que se realizó. La independencia de los experimentos de Bernoulli implica que la probabilidad de X=x es

f(x) = P(X=x) = P(A_1 \cap A_2 \cap \dots \cap A_x \cap \bar{A}_{x+1}
\cap \bar{A}_{x+2} \cap \dots \cap \bar{A}_{n})
P(A_1) \cdot P(A_2) \cdot \dots \cdot P(A_x) \cdot P(\bar{A}_x+1) \cdot
P(\bar{A}_x+2) \cdot \dots \cdot P(\bar{A}_n)
= p \cdot p \cdot \dots \cdot p \cdot (1-p) \cdot (1-p) \cdot \dots \cdot
(1-p)
= p^x \cdot (1-p)^{n-x}

Esta probabilidad es calculada sólo para el caso de un ordenamiento específico del suceso A. La probabilidad de este ordenamiento especíco es f(x)
= p^x
\cdot (1-p)^{n-x}.
El número de diferentes ordenaciones de los sucesos se denota como el coeficiente binomial y se calcula como un número de combinaciones (sin tener en cuenta el orden) con repetición: \left(
    \begin{array}{c}
        n \\
        x
     \end{array}
    \right) = \frac{n!}{x! (n-x)!} Observar que los distintos ordenes son sucesos disjuntos. Por lo tanto, obtenemos la siguiente función de probabilidad: P(X =x) = f(x) = \left(
    \begin{array}{c}
        n \\
        x
     \end{array}
    \right) \cdot p^x \cdot (1-p)^{n-x} La distribución Binomial es discreta, la función de probabilidad se puede mostrar mediante un histograma y la función de distribución mediante una función escalón. Los siguientes diagramas muestran la función de densidad para distintos valores de p manteniendo constante n. Para p < 0.5, la distribución está sesgada hacia la izquierda. La asimetría es mayor cuanto más pequeño es p. La distribución es simétrica para p - 0.5 donde np es el centro de simetría. Para p > 0.5 los gráficos muestran una asimetría hacia la derecha. Para valores altos de n, se puede aproximar esta función de densidad utilizando una distribución normal con parámetros \mu = np y \sigma^2 =
np(1-p). La calidad de la aproximación será mejor cuanto más cercano esté p del valor 0.5. Esta aproximación es posible mediante el Teorema Central del Límite.