Verteilung des Stichprobenanteilswertes/Beispiel: Urne

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Urne

Aus einer Urne mit N Kugeln, unter denen ein Anteil \pi roter Kugeln ist, werden Stichproben im Umfang n ohne Zurücklegen gezogen.

Bestimmen Sie die Wahrscheinlichkeiten, in den Stichproben Anteilswerte roter Kugeln zwischen p_1 und p_2 zu finden.

Grundgesamtheit vom Umfang N=5

Aus einer Grundgesamtheit mit dem Umfang N = 5 und \pi = 0,4 wird eine uneingeschränkte Zufallsstichprobe vom Umfang n = 3 entnommen.

Die Zufallsvariable X\; als Summe der 3 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable \widehat{\pi}= \frac{X }{n} den Anteil der roten Kugeln in der Stichprobe.

Da die Grundgesamtheit endlich ist und bei einer uneingeschränkten Zufallsstichprobe die Elemente ohne Zurücklegen entnommen werden, ist die Stichprobenfunktion X\; hypergeometrisch verteilt:

X \sim H ( N; M; n ) = H ( 5;2;3 )\;, wobei M = 0,4 \cdot 5 = 2 ist.

Die gesuchte Wahrscheinlichkeit ist P( \frac{1}{3} \leq \widehat{\pi} \leq \frac{2}{3} ).

Wegen X = n\cdot \widehat{\pi} und somit x_1 = 3 \cdot \frac{1}{3}  = 1 und x_2 = 3 \cdot \frac{2}{3} = 2 entspricht dies der Wahrscheinlichkeit P( 1 \leq X \leq 2 ).

P( 1 \leq X \leq 2 ) = f(1) + f(2) = 0,6 +0,3 = 0,9.

<R output="display">

pdf(rpdf, width=7, height=7)

x=c(0:2) H1 <- dhyper(x, n=3, m=2, k=3) layout(1:2) plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 2), ylim=c(0.0, 0.6)) axis(side=1, at=c(0,1,2)) axis(side=2, at=c(0,0.2,0.4,0.6), las=1) lines(c(0:2), H1, type="h", lwd=2, col="BLUE") plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 3), ylim=c(0.0, 1)) axis(side=1, at=c(0,1,2,3)) axis(side=2, at=c(0.1,0.4,0.7,1), las=1) lines(c(0, 1), c(0.1, 0.1), type="l", lwd=2, col="RED") lines(c(1, 2), c(0.7, 0.7), type="l", lwd=2, col="RED") lines(c(2, 3), c(1.0, 1.0), type="l", lwd=2, col="RED")

</R>

Grundgesamtheit vom Umfang N=1000

Aus einer Grundgesamtheit mit dem Umfang N = 1000 und \pi = 0,2 wird eine uneingeschränkte Zufallsstichprobe vom Umfang n = 4 entnommen.

Die Zufallsvariable X\; als Summe der 4 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable \widehat{\pi}= \frac{X}{n} den Anteil der roten Kugeln in der Stichprobe.

Da eine uneingeschränkte Zufallsstichprobe gezogen wird und die Grundgesamtheit endlich ist, ist die Zufallsvariable hypergeometrisch verteilt: X \sim H ( 1000; 200 ; 4 )\;.

Da aber zum einen der Umfang der Grundgesamtheit sehr groß und zum anderen der Auswahlsatz \frac{n}{ N} = 0,004 < 0,05 ist, kann die Endlichkeit der Grundgesamtheit vernachlässigt und approximativ die Binomialverteilung mit \pi = \frac{M}{N} = 0,2 verwendet werden, so dass gilt: X \approx B ( 4; 0,2 )

Die gesuchte Wahrscheinlichkeit ist P( 0,25 \leq \widehat{\pi} \leq 0,75 ).

Wegen X = n \cdot \widehat{\pi} und somit x_1 = 4 \cdot 0,25 = 1 und x_2 = 4 \cdot 0,75 = 3 entspricht dies der Wahrscheinlichkeit P( 1 \leq X \leq 3 ).

P( 1 \leq X \leq 3 ) = F_B( 3 ) - F_B( 0 ) = 0,9984 - 0,4096 = 0,5888

F_B( 3 ) und F_B( 0 ) findet man in der Tabelle der Verteilungsfunktion der Binomialverteilung B ( 4; 0,2 ).

<R output="display">

pdf(rpdf, width=7, height=7)

x=c(0:4) H1 <- dbinom(x, size=4, prob=0.2) layout(1:2) plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 4), ylim=c(0.0, 0.41)) axis(side=1, at=c(0,1,2,3,4)) axis(side=2, at=c(0,0.1,0.2,0.3, 0.4), las=1) lines(c(0:4), H1, type="h", lwd=2, col="BLUE") plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 5), ylim=c(0.4, 1)) axis(side=1, at=c(0,1,2, 3, 4, 5)) axis(side=2, at=c(0.4,0.6,0.8,1), las=1) lines(c(0, 1), c(0.4096, 0.4096), type="l", lwd=2, col="RED") lines(c(1, 2), c(0.8192, 0.8192), type="l", lwd=2, col="RED") lines(c(2, 3), c(0.95, 0.95), type="l", lwd=2, col="RED") lines(c(3, 4), c(0.97, 0.97), type="l", lwd=2, col="RED") lines(c(4, 5), c(1.0, 1.0), type="l", lwd=2, col="RED")


</R>

Grundgesamtheit vom Umfang N=2500

Aus einer Grundgesamtheit mit dem Umfang N = 2500 und \pi = 0,2 wird eine uneingeschränkte Zufallsstichprobe vom Umfang n = 100 entnommen.

Die Zufallsvariable X\; als Summe der 100 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable \widehat{\pi}= \frac{X }{n} den Anteil der roten Kugeln in der Stichprobe.

Da die Grundgesamtheit endlich ist und eine uneingeschränkte Zufallsstichprobe gezogen wird, ist die Zufallsvariable X hypergeometrisch verteilt: X \sim H ( 2500 ; 500 ; 100 )\;.

Da der Stichprobenumfang n = 100 groß ist und die Kriterien

n \cdot \frac{M}{N} = 100 \cdot 0,2 = 20 \geq 5

n \cdot ( 1 - \frac{M}{N} ) = 80 \geq 5 und

\frac{n}{N} = 0,04 < 0,05

erfüllt sind, kann approximativ die Normalverteilung verwendet werden.

Es sind:

E \left[ \widehat{\pi} \right] = \pi = 0,2

Var ( \widehat{\pi}) =\frac{ \pi \cdot ( 1 - \pi )}{ n }\cdot \frac{ N -n }{ N -1 } = 0,001537

\sigma( \widehat{\pi}) = 0,039 \approx 0,04.

Somit wird die hypergeometrische Verteilung durch die N ( 0,2 ; 0,04 ) approximiert.

Dabei wird zur Vereinfachung auf die Stetigkeitskorrektur verzichtet.

Die gesuchte Wahrscheinlichkeit ist P( 0,14 \leq \widehat{\pi}\leq 0,3 ):

Wegen z_2 = \frac{0,3 - 0,2 }{0,04} = 2,5 und z_1= \frac{0,14 - 0,2}{ 0,04} = - 1,5 gilt:

P( 0,14 \leq \widehat{\pi}\leq 0,3 ) =\Phi (2,5) - \Phi (- 1,5) = \Phi (2,5) - ( 1 - \Phi (1,5) ) = 0,99379 - (1 - 0,933193) = 0,9269.

\Phi(2,5) und \Phi(1,5) findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung.

<R output="display">

pdf(rpdf, width=7, height=7)

layout(1:2) curve(from=-10, to=10, dnorm(x, mean=0, sd=1), col="black", ylim=c(0,10), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n") curve(from=-10, to=10, dnorm(x, mean=0, sd=0.04), col="blue",lty=1, lwd=2, font.lab=2, bty="l",, add=T) axis(side=1, at=c(-10, 0, 10)) axis(side=2, at=c(0, 5, 10), las=1) curve(from=-10, to=10, pnorm(x, mean=0, sd=1), col="black", ylim=c(0,1), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n") curve(from=-10, to=10, pnorm(x, mean=0, sd=0.04), col="red",lty=1, lwd=2, font.lab=2, bty="l",, add=T) axis(side=1, at=c(-10, 0, 10)) axis(side=2, at=c(0, 0.5, 1), las=1)

</R>