Verteilung des Stichprobenanteilswertes/Beispiel: Haushaltsgröße

Aus MM*Stat

< Verteilung des Stichprobenanteilswertes
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Beispiele

Haushaltsgröße

Laut Angaben des Statistischen Bundesamtes der Bundesrepublik Deutschland gab es im April 1996 in Deutschland 37,3 Millionen Privathaushalte, von denen rund 35% Einpersonenhaushalte waren.

Stichprobe vom Umfang n=10

Aus dieser Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe vom Umfang n=10 entnommen.

Es liegt eine endliche Grundgesamtheit von N = 37,3 Mio. Privathaushalten vor, von denen M = 13,055 Mio. Einpersonenhaushalte sind.

Bei zehnmaliger Ziehung von Elementen aus der Grundgesamtheit erhält man 10 Zufallsvariablen (Stichprobenvariablen) X_{i}\; (i = 1,..., 10), die den Wert X_{i}=1 annehmen, wenn ein Einpersonenhaushalt auftritt, und den Wert X_{i} = 0 annehmen, wenn ein Mehrpersonenhaushalt auftritt.

Die Zufallsvariable X\; als Summe der 10 Stichprobenvariablen beinhaltet die Anzahl der Einpersonenhaushalte in der Stichprobe und die Zufallsvariable \widehat{\pi}=\frac{X}{n} den Anteil der Einpersonenhaushalte in der Stichprobe.

Da bei einer uneingeschränkten Zufallsstichprobe die Elemente ohne Zurücklegen entnommen werden, ist die Stichprobenfunktion X\; hypergeometrisch verteilt:

X \sim H(N;M;n)=H(37,3 \mbox{ Mio. };\;13,055\mbox{ Mio. };\;10).

Die Stichprobenfunktion \widehat{\pi} weist die gleiche Wahrscheinlichkeitsfunktion wie X = n \cdot \widehat{\pi} auf.

Da zum einen der Umfang der Grundgesamtheit sehr groß und zum anderen der Auswahlsatz \frac{n}{N}=\frac{10}{37,3 \mbox{ Mio.}}<0,05 ist, kann die Endlichkeit der Grundgesamtheit vernachlässigt und approximativ die Binomialverteilung mit \pi = \frac{M}{N}=0,35 verwendet werden, so dass gilt: X\approx B(n;\;\pi)=B(10;0,35).

Für \widehat{\pi} gilt die gleiche Wahrscheinlichkeitsverteilung.

Erwartungswert, Varianz und Standardabweichung:

E[X]=10\cdot0,35=3,5 Var(X)=10\cdot0,35\cdot0,65=2,275 \,\sigma(X)=1,5083
E\left[\widehat{\pi}\right]=0,35 Var(\widehat{\pi})=\frac{0,35\cdot0,65}{10}=0,02275 \sigma(\widehat{\pi})=0,1508

Die gesuchte Wahrscheinlichkeit ist P(0,2<\widehat{\pi}<0,5).

Wegen X=n \cdot\widehat{\pi} und somit x_{1}=10\cdot0,2=2 und x_{2}=10\cdot0,5=5, entspricht dies der Wahrscheinlichkeit P(2<X<5).

P(2<X<5)=P(X\leq4)-P(X\leq2)=F_{B}(4)-F_{B}(2)=0,7515-0,2616=0,4899

F_{B}(4) und F_{B}(2) findet man in der Tabelle der Verteilungsfunktion der Binomialverteilung B(10;0,35).

Stichprobe vom Umfang n=2000

Aus der angegebenen Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe vom Umfang n = 2000 entnommen.

Die Stichprobenfunktionen X\; und \widehat{\pi} sind wie bei der 1. Problemstellung definiert.

Da die Grundgesamtheit wie vorher sehr groß und der Auswahlsatz sehr klein ist, spielt es keine Rolle, ob die Elemente ohne Zurücklegen oder mit Zurücklegen entnommen werden, so dass approximativ von einer Binomialverteilung ausgegangen werden kann.

Erwartungswert, Varianz und Standardabweichung: sind:

E[X]=2000\cdot0,35=700 Var(X)=2000\cdot0,35\cdot0,65=455 \,\sigma(X)=21,33
E\left[\widehat{\pi}\right]=0,35 Var(\widehat{\pi})=\frac{0,35\cdot0,65}{2000}=0,000114 \sigma(\widehat{\pi})=0,01067

Für eine B(2000;0,35) liegen keine Tabellen zur Bestimmung von Wahrscheinlichkeiten vor. Per Computer wurde ermittelt:

P(700\leq X\leq725)=P(X\leq725)-P(X<700)=F_{B}(725)-F_{B}(699)=0,8839-0,4916=0,3923

Da der Stichprobenumfang n=2000 jedoch sehr groß ist und die Kriterien n\cdot \pi=2000\cdot0,35=700\geq5 und n\cdot (1-\pi)=2000\cdot0,65=1300\geq 5 erfüllt sind, kann statt der Binomialverteilung approximativ die Normalverteilung verwendet werden:

X\approx N(700;21,33)\,,\qquad\widehat{\pi}\approx N(0,35;0,01067)

Mit

z_{1}=\frac{700-0,5-700}{21,33}=-0,02344

z_{2}=\frac{725+0,5-700}{21,33}=1,1955

folgt


P(700\leq X\leq725)\approx\Phi(1,1955)-\Phi(-0,02344)=\Phi(1,1955)-(1-\Phi(0,02344))

=0,884054-(1-0,509351)=0,3934

Im Vergleich zur Berechnung der Wahrscheinlichkeit über die exakte Verteilung ergibt sich durch die Approximation über die Normalverteilung ein vernachlässigbarer Fehler.