Verteilung des Stichprobenanteilswertes: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
 
(2 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
 
{{Stichprobentheorie}}
 
{{Stichprobentheorie}}
{{SubpageToc|Haushaltsgröße|Urnen}}
+
{{SubpageToc|Beispiel: Haushaltsgröße|Beispiel: Urne}}
  
 
=={{Vorlage:Überschrift}}==
 
=={{Vorlage:Überschrift}}==
Zeile 142: Zeile 142:
  
 
: Für eine bessere [[Approximation]] sollte die [[Stetigkeitskorrektur]] berücksichtigt werden.
 
: Für eine bessere [[Approximation]] sollte die [[Stetigkeitskorrektur]] berücksichtigt werden.
 
=={{Vorlage:Beispiele}}==
 
 
===Haushaltsgröße===
 
 
Laut Angaben des Statistischen Bundesamtes der Bundesrepublik Deutschland gab es im April 1996 in Deutschland 37,3 Millionen Privathaushalte, von denen rund 35% Einpersonenhaushalte waren.
 
 
====Stichprobe vom Umfang n=10====
 
 
Aus dieser [[Grundgesamtheit]] wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n=10</math> entnommen.
 
 
* Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der Einpersonenhaushalte in der [[Stichprobe]]?
 
* Geben Sie [[Erwartungswert]], [[Varianz (stochastisch)|Varianz]] und [[Standardabweichung (stochastisch)|Standardabweichung]] für diese [[Verteilung (stochastisch)|Verteilung]] an.
 
* Wie groß ist die [[Wahrscheinlichkeit]], dass der Anteil der Einpersonenhaushalte in der [[Stichprobe]] größer als 0,2, jedoch kleiner gleich 0,5 ist?
 
 
Es liegt eine endliche [[Grundgesamtheit]] von <math>N = 37,3</math> Mio. Privathaushalten vor, von denen <math>M = 13,055</math> Mio. Einpersonenhaushalte sind.
 
 
Bei zehnmaliger Ziehung von [[Statistisches Element|Elementen]] aus der [[Grundgesamtheit]] erhält man 10 [[Zufallsvariable]]n ([[Stichprobenvariable]]n) <math>X_{i}\; (i = 1,..., 10)</math>, die den Wert <math>X_{i}=1</math> annehmen, wenn ein Einpersonenhaushalt auftritt, und den Wert <math>X_{i} = 0</math> annehmen, wenn ein Mehrpersonenhaushalt auftritt.
 
 
Die [[Zufallsvariable]] <math>X\;</math> als Summe der 10 [[Stichprobenvariable]]n beinhaltet die Anzahl der Einpersonenhaushalte in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}=\frac{X}{n}</math> den Anteil der Einpersonenhaushalte in der [[Stichprobe]].
 
 
Da bei einer [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]] die [[Statistisches Element|Elemente]] [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] entnommen werden, ist die [[Stichprobenfunktion]] <math>X\;</math> [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]:
 
 
<math>X \sim H(N;M;n)=H(37,3 \mbox{ Mio. };\;13,055\mbox{ Mio. };\;10)</math>.
 
 
Die [[Stichprobenfunktion]] <math>\widehat{\pi}</math> weist die gleiche [[Wahrscheinlichkeitsfunktion]] wie <math>X = n \cdot \widehat{\pi}</math> auf.
 
 
Da zum einen der [[Umfang der Grundgesamtheit]] sehr groß und zum anderen der [[Auswahlsatz]] <math>\frac{n}{N}=\frac{10}{37,3 \mbox{ Mio.}}<0,05</math> ist, kann die Endlichkeit der [[Grundgesamtheit]] vernachlässigt und [[Approximation|approximativ]] die [[Binomialverteilung]] mit <math>\pi = \frac{M}{N}=0,35</math> verwendet werden, so dass gilt: <math>X\approx B(n;\;\pi)=B(10;0,35)</math>.
 
 
Für <math>\widehat{\pi}</math> gilt die gleiche [[Wahrscheinlichkeitsverteilung]].
 
 
[[Erwartungswert]], [[Varianz (stochastisch)|Varianz]] und [[Standardabweichung (stochastisch)|Standardabweichung]]:
 
 
{|style="width:70%"
 
|<math>E[X]=10\cdot0,35=3,5</math>
 
|<math>Var(X)=10\cdot0,35\cdot0,65=2,275</math>
 
|<math>\,\sigma(X)=1,5083</math>
 
|-
 
|<math>E\left[\widehat{\pi}\right]=0,35</math>
 
|<math>Var(\widehat{\pi})=\frac{0,35\cdot0,65}{10}=0,02275</math>
 
|<math>\sigma(\widehat{\pi})=0,1508</math>
 
|}
 
 
Die gesuchte [[Wahrscheinlichkeit]] ist <math>P(0,2<\widehat{\pi}<0,5)</math>.
 
 
Wegen <math>X=n \cdot\widehat{\pi}</math> und somit <math>x_{1}=10\cdot0,2=2</math> und <math>x_{2}=10\cdot0,5=5</math>, entspricht dies der [[Wahrscheinlichkeit]] <math>P(2<X<5)</math>.
 
 
<math>P(2<X<5)=P(X\leq4)-P(X\leq2)=F_{B}(4)-F_{B}(2)=0,7515-0,2616=0,4899</math>
 
 
<math>F_{B}(4)</math> und <math>F_{B}(2)</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Binomialverteilung]] <math>B(10;0,35)</math>.
 
 
====Stichprobe vom Umfang n=2000====
 
 
Aus der angegebenen [[Grundgesamtheit]] wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 2000</math> entnommen.
 
 
* Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der Einpersonenhaushalte in der [[Stichprobe]]?
 
* Geben Sie [[Erwartungswert]], [[Varianz (stochastisch)|Varianz]] und [[Standardabweichung (stochastisch)|Standardabweichung]] für diese [[Verteilung (stochastisch)|Verteilung]] an.
 
* Wie groß ist die [[Wahrscheinlichkeit]], dass die Anzahl der Einpersonenhaushalte in der [[Stichprobe]] größer gleich 700, aber kleiner gleich 725 ist, d.h. <math>700\leq X \leq 725</math>?
 
 
Die [[Stichprobenfunktion]]en <math>X\;</math> und <math>\widehat{\pi}</math> sind wie bei der 1. Problemstellung definiert.
 
 
Da die [[Grundgesamtheit]] wie vorher sehr groß und der [[Auswahlsatz]] sehr klein ist, spielt es keine Rolle, ob die [[Statistisches Element|Elemente]] [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] oder [[Zufallsauswahlmodell mit Zurücklegen|mit Zurücklegen]] entnommen werden, so dass [[Approximation|approximativ]] von einer [[Binomialverteilung]] ausgegangen werden kann.
 
 
[[Erwartungswert]], [[Varianz (stochastisch)|Varianz]] und [[Standardabweichung (stochastisch)|Standardabweichung]]: sind:
 
 
{|style="width:70%"
 
|<math>E[X]=2000\cdot0,35=700</math>
 
|<math>Var(X)=2000\cdot0,35\cdot0,65=455</math>
 
|<math>\,\sigma(X)=21,33</math>
 
|-
 
|<math>E\left[\widehat{\pi}\right]=0,35</math>
 
|<math>Var(\widehat{\pi})=\frac{0,35\cdot0,65}{2000}=0,000114</math>
 
|<math>\sigma(\widehat{\pi})=0,01067</math>
 
|}
 
 
Für eine <math>B(2000;0,35)</math> liegen keine Tabellen zur Bestimmung von [[Wahrscheinlichkeit]]en vor. Per Computer wurde ermittelt:
 
 
<math>P(700\leq X\leq725)=P(X\leq725)-P(X<700)=F_{B}(725)-F_{B}(699)=0,8839-0,4916=0,3923</math>
 
 
Da der [[Stichprobenumfang]] <math>n=2000</math> jedoch sehr groß ist und die Kriterien <math>n\cdot \pi=2000\cdot0,35=700\geq5</math> und <math>n\cdot (1-\pi)=2000\cdot0,65=1300\geq 5</math> erfüllt sind, kann statt der [[Binomialverteilung]] [[Approximation|approximativ]] die [[Normalverteilung]] verwendet werden:
 
 
<math>X\approx N(700;21,33)\,,\qquad\widehat{\pi}\approx N(0,35;0,01067)</math>
 
 
Mit
 
 
<math>z_{1}=\frac{700-0,5-700}{21,33}=-0,02344</math>
 
 
<math>z_{2}=\frac{725+0,5-700}{21,33}=1,1955</math>
 
 
folgt
 
 
 
<math>P(700\leq X\leq725)\approx\Phi(1,1955)-\Phi(-0,02344)=\Phi(1,1955)-(1-\Phi(0,02344))</math>
 
 
<math>=0,884054-(1-0,509351)=0,3934</math>
 
 
Im Vergleich zur Berechnung der [[Wahrscheinlichkeit]] über die exakte [[Verteilung (stochastisch)|Verteilung]] ergibt sich durch die [[Approximation]] über die [[Normalverteilung]] ein vernachlässigbarer Fehler.
 
 
===Urne===
 
 
Aus einer Urne mit <math>N</math> Kugeln, unter denen ein Anteil <math>\pi</math> roter Kugeln ist, werden [[Stichprobe]]n im [[Stichprobenumfang|Umfang]] <math>n</math> [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] gezogen.
 
 
Bestimmen Sie die [[Wahrscheinlichkeit]]en, in den [[Stichprobe]]n Anteilswerte roter Kugeln zwischen <math>p_1</math> und <math>p_2</math> zu finden.
 
 
====Grundgesamtheit vom Umfang N=5====
 
 
Aus einer [[Grundgesamtheit]] mit dem [[Stichprobenumfang|Umfang]] <math>N = 5</math> und <math>\pi = 0,4</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 3</math> entnommen.
 
 
Die [[Zufallsvariable]] <math>X\;</math> als Summe der 3 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X }{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
 
 
* Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
 
* Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen <math>\frac{1}{3}</math> und <math>\frac{2}{3}</math> zu finden ?
 
 
Da die [[Grundgesamtheit]] endlich ist und bei einer [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]] die [[Element]]e [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] entnommen werden, ist die [[Stichprobenfunktion]] <math>X\;</math> [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]:
 
 
<math>X \sim H ( N; M; n ) = H ( 5;2;3 )\;</math>, wobei <math>M = 0,4 \cdot 5 = 2</math> ist.
 
 
Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( \frac{1}{3} \leq \widehat{\pi} \leq \frac{2}{3} )</math>.
 
 
Wegen <math>X = n\cdot \widehat{\pi} </math> und somit <math>x_1 = 3 \cdot \frac{1}{3}  = 1</math> und <math>x_2 = 3 \cdot \frac{2}{3} = 2</math> entspricht dies der [[Wahrscheinlichkeit]] <math>P( 1 \leq X \leq 2 )</math>.
 
 
<math>P( 1 \leq X \leq 2 ) = f(1) + f(2) = 0,6 +0,3 = 0,9</math>.
 
 
{|
 
|<R output="display">
 
pdf(rpdf, width=7, height=7)
 
 
x=c(0:2)
 
H1 <- dhyper(x, n=3, m=2, k=3)
 
layout(1:2)
 
plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 2), ylim=c(0.0, 0.6))
 
axis(side=1, at=c(0,1,2))
 
axis(side=2, at=c(0,0.2,0.4,0.6), las=1)
 
lines(c(0:2), H1, type="h", lwd=2, col="BLUE")
 
plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 3), ylim=c(0.0, 1))
 
axis(side=1, at=c(0,1,2,3))
 
axis(side=2, at=c(0.1,0.4,0.7,1), las=1)
 
lines(c(0, 1), c(0.1, 0.1), type="l", lwd=2, col="RED")
 
lines(c(1, 2), c(0.7, 0.7), type="l", lwd=2, col="RED")
 
lines(c(2, 3), c(1.0, 1.0), type="l", lwd=2, col="RED")
 
 
</R>
 
|}
 
 
====Grundgesamtheit vom Umfang N=1000====
 
 
Aus einer [[Grundgesamtheit]] mit dem [[Umfang der Grundgesamtheit|Umfang]] <math>N = 1000</math> und <math>\pi = 0,2</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 4</math> entnommen.
 
 
Die [[Zufallsvariable]] <math>X\;</math> als Summe der 4 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X}{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
 
 
* Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
 
* Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen 0,25 und 0,75 zu finden?
 
 
Da eine [[uneingeschränkte Zufallsstichprobe]] gezogen wird und die [[Grundgesamtheit]] endlich ist, ist die [[Zufallsvariable]] [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]: <math>X \sim H ( 1000; 200 ; 4 )\;</math>.
 
 
Da aber zum einen der [[Umfang der Grundgesamtheit]] sehr groß und zum anderen der [[Auswahlsatz]] <math>\frac{n}{ N} = 0,004 < 0,05</math> ist, kann die Endlichkeit der [[Grundgesamtheit]] vernachlässigt und [[Approximation|approximativ]] die [[Binomialverteilung]] mit <math>\pi = \frac{M}{N} = 0,2</math> verwendet werden, so dass gilt: <math>X \approx B ( 4; 0,2 )</math>
 
 
Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( 0,25 \leq \widehat{\pi} \leq 0,75 )</math>.
 
 
Wegen <math>X = n \cdot \widehat{\pi}</math> und somit <math>x_1 = 4 \cdot 0,25 = 1</math> und <math>x_2 = 4 \cdot 0,75 = 3</math> entspricht dies der [[Wahrscheinlichkeit]] <math>P( 1 \leq X \leq 3 )</math>.
 
 
<math>P( 1 \leq X \leq 3 ) = F_B( 3 ) - F_B( 0 ) = 0,9984 - 0,4096 = 0,5888</math>
 
 
<math>F_B( 3 )</math> und <math>F_B( 0 )</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Binomialverteilung]] <math>B ( 4; 0,2 )</math>.
 
 
{|
 
|<R output="display">
 
pdf(rpdf, width=7, height=7)
 
 
x=c(0:4)
 
H1 <- dbinom(x, size=4, prob=0.2)
 
layout(1:2)
 
plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 4), ylim=c(0.0, 0.41))
 
axis(side=1, at=c(0,1,2,3,4))
 
axis(side=2, at=c(0,0.1,0.2,0.3, 0.4), las=1)
 
lines(c(0:4), H1, type="h", lwd=2, col="BLUE")
 
plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 5), ylim=c(0.4, 1))
 
axis(side=1, at=c(0,1,2, 3, 4, 5))
 
axis(side=2, at=c(0.4,0.6,0.8,1), las=1)
 
lines(c(0, 1), c(0.4096, 0.4096), type="l", lwd=2, col="RED")
 
lines(c(1, 2), c(0.8192, 0.8192), type="l", lwd=2, col="RED")
 
lines(c(2, 3), c(0.95, 0.95), type="l", lwd=2, col="RED")
 
lines(c(3, 4), c(0.97, 0.97), type="l", lwd=2, col="RED")
 
lines(c(4, 5), c(1.0, 1.0), type="l", lwd=2, col="RED")
 
 
 
</R>
 
|}
 
<!--
 
[[Bild:STAT-S2_32_e_2.gif]]
 
-->
 
 
====Grundgesamtheit vom Umfang N=2500====
 
 
Aus einer [[Grundgesamtheit]] mit dem [[Umfang der Grundgesamtheit|Umfang]] <math>N = 2500</math> und <math>\pi = 0,2</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 100</math> entnommen.
 
 
Die [[Zufallsvariable]] <math>X\;</math> als Summe der 100 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X }{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
 
 
* Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
 
* Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen 0,14 und 0,3 zu finden ?
 
 
Da die [[Grundgesamtheit]] endlich ist und eine [[uneingeschränkte Zufallsstichprobe]] gezogen wird, ist die [[Zufallsvariable]] <math>X</math> [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]: <math>X \sim H ( 2500 ; 500 ; 100 )\;</math>.
 
 
Da der [[Stichprobenumfang]] <math>n = 100</math> groß ist und die Kriterien
 
 
<math>n \cdot \frac{M}{N} = 100 \cdot 0,2 = 20 \geq 5</math>
 
 
<math>n \cdot ( 1 - \frac{M}{N} ) = 80 \geq 5</math> und
 
 
<math>\frac{n}{N} = 0,04 < 0,05</math>
 
 
erfüllt sind, kann [[Approximation|approximativ]] die [[Normalverteilung]] verwendet werden.
 
 
Es sind:
 
 
<math>E \left[ \widehat{\pi} \right] = \pi = 0,2</math>
 
 
<math>Var ( \widehat{\pi}) =\frac{ \pi \cdot ( 1 - \pi )}{ n }\cdot \frac{ N -n }{ N -1 } = 0,001537</math>
 
 
<math>\sigma( \widehat{\pi}) = 0,039 \approx 0,04</math>.
 
 
Somit wird die [[hypergeometrische Verteilung]] durch die <math>N ( 0,2 ; 0,04 )</math> [[Approximation|approximiert]].
 
 
Dabei wird zur Vereinfachung auf die [[Stetigkeitskorrektur]] verzichtet.
 
 
Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( 0,14 \leq \widehat{\pi}\leq 0,3 )</math>:
 
 
Wegen <math>z_2 = \frac{0,3 - 0,2 }{0,04} = 2,5</math> und <math>z_1= \frac{0,14 - 0,2}{ 0,04} = - 1,5</math> gilt:
 
 
<math>P( 0,14 \leq \widehat{\pi}\leq 0,3 ) =\Phi (2,5) - \Phi (- 1,5) = \Phi (2,5) - ( 1 - \Phi (1,5) ) = 0,99379 - (1 - 0,933193) = 0,9269</math>.
 
 
<math>\Phi(2,5)</math> und <math>\Phi(1,5)</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]].
 
 
{|
 
|<R output="display">
 
pdf(rpdf, width=7, height=7)
 
 
layout(1:2)
 
curve(from=-10, to=10, dnorm(x, mean=0, sd=1), col="black", ylim=c(0,10), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n")
 
curve(from=-10, to=10, dnorm(x, mean=0, sd=0.04), col="blue",lty=1, lwd=2, font.lab=2, bty="l",, add=T)
 
axis(side=1, at=c(-10, 0, 10))
 
axis(side=2, at=c(0, 5, 10), las=1)
 
curve(from=-10, to=10, pnorm(x, mean=0, sd=1), col="black", ylim=c(0,1), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n")
 
curve(from=-10, to=10, pnorm(x, mean=0, sd=0.04), col="red",lty=1, lwd=2, font.lab=2, bty="l",, add=T)
 
axis(side=1, at=c(-10, 0, 10))
 
axis(side=2, at=c(0, 0.5, 1), las=1)
 
 
</R>
 
|}
 

Aktuelle Version vom 23. Januar 2019, 16:34 Uhr

Stichprobentheorie

Stichprobentheorie • Stichprobe • Verteilung der Grundgesamtheit • Stichprobenvariable • Stichprobenfunktion • Zufallsauswahlmodelle • Stichprobenmittelwert • Schwaches Gesetz der großen Zahlen • Verteilung des Stichprobenmittelwertes • Verteilung der Stichprobenvarianz • Verteilung des Stichprobenanteilswertes • Multiple Choice • Video • Aufgaben • Lösungen
Anteilswert der Grundgesamtheit • Auswahlsatz • Einfache Zufallsauswahl • Einfache Zufallsstichprobe • Erwartungswert der Grundgesamtheit • Erwartungswert des Stichprobenmittelwertes • Induktiver Schluss • Mittelwert der Grundgesamtheit • Parameter der Grundgesamtheit • Parameter des Stichprobenmittelwertes • Standardabweichung des Stichprobenmittelwertes • Standardfehler • Statistisches Element • Stichprobenanteilswert • Stichprobengröße • Stichprobenumfang • Stichprobenwerte • Stichprobenvarianz • Stichprobenverteilung • Uneingeschränkte Zufallsauswahl • Uneingeschränkte Zufallsstichprobe • Varianz der Grundgesamtheit • Varianz des Stichprobenmittelwertes • Varianzhomogenität • Varianzheterogenität • Verteilung einer Stichprobenfunktion • Zufallsauswahl • Zufallsauswahlmodell mit Zurücklegen • Zufallsauswahlmodell ohne Zurücklegen • Zufallsstichprobe

Grundbegriffe

Stichprobenanteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein Anteil von Elementen eine Eigenschaft aufweist und ein Anteil diese Eigenschaft nicht besitzt.

Die zufällige Entnahme eines Elementes aus dieser Grundgesamtheit führt zu einer Zufallsvariablen, die den Wert Eins annimmt, wenn das gezogene Element die Eigenschaft aufweist, und den Wert Null annimmt, wenn das gezogene Element diese Eigenschaft nicht hat.

Bei -maliger Ziehung von Elementen erhält man Zufallsvariablen (Stichprobenvariablen), die alle nur die Werte Eins oder Null annehmen können.

Es bezeichne die Anzahl, also die absolute Häufigkeit der Elemente mit der Eigenschaft in einer Zufallsstichprobe vom Umfang :

Dann ist

der Stichprobenanteilswert, also die relative Häufigkeit der Elemente mit der Eigenschaft in einer Zufallsstichprobe vom Umfang .

Nach der Ziehung der Stichprobe liegt eine konkrete Anzahl von Elementen mit der Eigenschaft in der Stichprobe vor und der Stichprobenanteilswert hat sich zu einem Stichprobenwert realisiert.

Verteilung des Stichprobenanteilswertes

und variieren von Stichprobe zu Stichprobe (gleichen Umfangs).

Sie sind Stichprobenfunktionen, da sie als Funktionen von Stichprobenvariablen definiert sind, und damit Zufallsvariablen.

Für diese Stichprobenfunktionen sind ihre Verteilung mit Erwartungswert und die Varianz, d.h. die Stichprobenverteilungen, zu bestimmen.

Die Stichprobenverteilungen hängen entscheidend davon ab,

Einfache Zufallsstichprobe (Ziehen mit Zurücklegen)

Wird eine einfache Zufallsstichprobe aus der oben beschriebenen Grundgesamtheit gezogen, dann entspricht das einem Bernoulli-Experiment.

Alle Stichprobenvariablen haben die Verteilung

mit Erwartungswert und .

Unter diesen Bedingungen weist die Stichprobenfunktion eine Binomialverteilung mit den Parametern und auf, :

für die gilt:

Da die Beziehung besteht und darin eine Konstante ist, gilt für den Stichprobenanteilswert die gleiche Wahrscheinlichkeitsfunktion.

Für den Erwartungswert und die Varianz von folgt:

Uneingeschränkte Zufallsstichprobe (Ziehen ohne Zurücklegen)

Das Zufallsauswahlmodell ohne Zurücklegen ist nur für eine endliche Grundgesamtheit von Bedeutung.

Es sei der Umfang der Grundgesamtheit, die Anzahl der Elemente mit der Eigenschaft und der Stichprobenumfang.

Dann ist der Anteil der Elemente mit der Eigenschaft in der Grundgesamtheit. Die Stichprobenfunktionen und sind wie zuvor definiert.

Bei der Stichprobenentnahme ohne Zurücklegen folgt einer hypergeometrischen Verteilung mit den Parametern , und ; :

Erwartungswert und Varianz der hypergeometrisch verteilten Stichprobenfunktion sind:

Die Stichprobenfunktion weist die gleiche Wahrscheinlichkeitsfunktion wie auf.

Für den Erwartungswert und die Varianz von folgt:

Zusatzinformationen

Approximation der Verteilung des Stichprobenmittelwertes

Einfache Zufallsstichprobe

Entsprechend dem zentralen Grenzwertsatzes kann für einen genügend großen Stichprobenumfang die Binomialverteilung durch eine Normalverteilung approximiert werden:

bzw.

.

Der Stichprobenumfang wird als genügend groß angesehen, wenn und sind.

Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden, d.h. für die Bestimmung der Wahrscheinlichkeit über die Normalverteilung sollte

und für die Bestimmung der Wahrscheinlichkeit

verwendet werden.

Uneingeschränkte Zufallsstichprobe

relativ gut approximiert werden.
Als Faustregel gilt: .
bzw.
Der Stichprobenumfang wird als genügend groß angesehen, wenn , und sind.
Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden.