Verteilung des Stichprobenanteilswertes

Aus MM*Stat

Version vom 23. Januar 2019, 17:34 Uhr von Siskosth (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Stichprobentheorie

Stichprobentheorie • Stichprobe • Verteilung der Grundgesamtheit • Stichprobenvariable • Stichprobenfunktion • Zufallsauswahlmodelle • Stichprobenmittelwert • Schwaches Gesetz der großen Zahlen • Verteilung des Stichprobenmittelwertes • Verteilung der Stichprobenvarianz • Verteilung des Stichprobenanteilswertes • Multiple Choice • Video • Aufgaben • Lösungen
Anteilswert der Grundgesamtheit • Auswahlsatz • Einfache Zufallsauswahl • Einfache Zufallsstichprobe • Erwartungswert der Grundgesamtheit • Erwartungswert des Stichprobenmittelwertes • Induktiver Schluss • Mittelwert der Grundgesamtheit • Parameter der Grundgesamtheit • Parameter des Stichprobenmittelwertes • Standardabweichung des Stichprobenmittelwertes • Standardfehler • Statistisches Element • Stichprobenanteilswert • Stichprobengröße • Stichprobenumfang • Stichprobenwerte • Stichprobenvarianz • Stichprobenverteilung • Uneingeschränkte Zufallsauswahl • Uneingeschränkte Zufallsstichprobe • Varianz der Grundgesamtheit • Varianz des Stichprobenmittelwertes • Varianzhomogenität • Varianzheterogenität • Verteilung einer Stichprobenfunktion • Zufallsauswahl • Zufallsauswahlmodell mit Zurücklegen • Zufallsauswahlmodell ohne Zurücklegen • Zufallsstichprobe

Grundbegriffe

Stichprobenanteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein Anteil \pi von Elementen eine Eigenschaft A aufweist und ein Anteil 1 - \pi diese Eigenschaft nicht besitzt.

Die zufällige Entnahme eines Elementes aus dieser Grundgesamtheit führt zu einer Zufallsvariablen, die den Wert Eins annimmt, wenn das gezogene Element die Eigenschaft A aufweist, und den Wert Null annimmt, wenn das gezogene Element diese Eigenschaft nicht hat.

Bei n-maliger Ziehung von Elementen erhält man n Zufallsvariablen X_{1},\ldots,X_{n} (Stichprobenvariablen), die alle nur die Werte Eins oder Null annehmen können.

Es bezeichne X\; die Anzahl, also die absolute Häufigkeit der Elemente mit der Eigenschaft A in einer Zufallsstichprobe vom Umfang n:

X = \sum\limits_{i=1}^{n} X_{i}

Dann ist

\widehat{\pi} = \frac{X}{n} = \frac{1}{n}\cdot \sum\limits_{i=1}^{n} X_{i}

der Stichprobenanteilswert, also die relative Häufigkeit der Elemente mit der Eigenschaft A in einer Zufallsstichprobe vom Umfang n.

Nach der Ziehung der Stichprobe liegt eine konkrete Anzahl x von Elementen mit der Eigenschaft A in der Stichprobe vor und der Stichprobenanteilswert hat sich zu einem Stichprobenwert p = \frac{x}{n} realisiert.

Verteilung des Stichprobenanteilswertes

X\; und \widehat{\pi} variieren von Stichprobe zu Stichprobe (gleichen Umfangs).

Sie sind Stichprobenfunktionen, da sie als Funktionen von Stichprobenvariablen definiert sind, und damit Zufallsvariablen.

Für diese Stichprobenfunktionen sind ihre Verteilung mit Erwartungswert und die Varianz, d.h. die Stichprobenverteilungen, zu bestimmen.

Die Stichprobenverteilungen hängen entscheidend davon ab,

Einfache Zufallsstichprobe (Ziehen mit Zurücklegen)

Wird eine einfache Zufallsstichprobe aus der oben beschriebenen Grundgesamtheit gezogen, dann entspricht das einem Bernoulli-Experiment.

Alle Stichprobenvariablen haben die Verteilung

f(x_{i},\pi)=\begin{cases}\pi^{x_{i}}\cdot (1-\pi)^{1-x_{i}}\quad & \mbox{, wenn }\; x_{i}=0,\;1\\
0 & \mbox{, sonst}\end{cases}

mit Erwartungswert E\left[X_{i}\right]=\pi und Var(X_{i})=\pi\cdot(1-\pi).

Unter diesen Bedingungen weist die Stichprobenfunktion X\; eine Binomialverteilung mit den Parametern n und \pi auf, X\sim B(n;\pi)\;:

f_{B}(x|n;\pi)=\begin{cases} {n\choose x}\cdot\pi^{x}\cdot (1-\pi)^{n-x} & \mbox{, wenn }\; x=0,1,\ldots,n\\
0 & \mbox{, sonst}\end{cases}

für die gilt:

E\left[ X \right]=n\cdot\pi,\ \quad Var(X)=\sigma^{2}(X)=n\cdot\pi\cdot(1-\pi)

Da die Beziehung \widehat{\pi}=\frac{X}{n} besteht und darin \frac{1}{n} eine Konstante ist, gilt für den Stichprobenanteilswert \widehat{\pi} die gleiche Wahrscheinlichkeitsfunktion.

Für den Erwartungswert und die Varianz von \widehat{\pi} folgt:

E\left[\widehat{\pi}\right]=E\left[\frac{X}{n}\right]=\frac{E[X]}{n}=\frac{n{\cdot\pi}}{n}=\pi

Var(\widehat{\pi})=\sigma^{2}(\widehat{\pi})=Var\left(\frac{X}{n}\right)=\frac{Var(X)}{n^{2}}=\frac{n{\cdot\pi\cdot(1-\pi)}}{n^{2}}=\frac{\pi\cdot(1-\pi)}{n}

Uneingeschränkte Zufallsstichprobe (Ziehen ohne Zurücklegen)

Das Zufallsauswahlmodell ohne Zurücklegen ist nur für eine endliche Grundgesamtheit von Bedeutung.

Es sei N der Umfang der Grundgesamtheit, M die Anzahl der Elemente mit der Eigenschaft A und n der Stichprobenumfang.

Dann ist \pi =\frac{M}{N} der Anteil der Elemente mit der Eigenschaft in der Grundgesamtheit. Die Stichprobenfunktionen X\; und \widehat{\pi} sind wie zuvor definiert.

Bei der Stichprobenentnahme ohne Zurücklegen folgt X\; einer hypergeometrischen Verteilung mit den Parametern N, M und N; X\sim H(N,M,n)\;:

F_{H}(x;N,M,n)=\begin{cases}\cfrac{{M\choose x}{N-M\choose n-x}}{{N\choose n}}\quad & \mbox{, wenn }\; x=\max\left(0,n-(N-M)\right),\ldots,\min(n,M)\\
0 & \mbox{, sonst}\end{cases}

Erwartungswert und Varianz der hypergeometrisch verteilten Stichprobenfunktion X\; sind:

E[X]=n\cdot\frac{M}{N}=n\cdot \pi

Var(X)=\sigma^{2}(X)=n\cdot \pi\cdot (1-\pi)\frac{N-n}{N-1}=n\cdot\frac{M}{N}\cdot\frac{N-M}{N}\cdot\frac{N-n}{N-1}

Die Stichprobenfunktion \widehat{\pi} weist die gleiche Wahrscheinlichkeitsfunktion wie X = n \cdot \widehat{\pi} auf.

Für den Erwartungswert und die Varianz von \widehat{\pi} folgt:

E\left[ \widehat{\pi}\right] =\frac{1}{n}\cdot E[X]=\pi

Var(\widehat{\pi})=\sigma^{2}(\widehat{\pi})=\frac{1}{n^{2}}\cdot \sigma^{2}(X)=\frac{\pi\cdot (1-\pi)}{n}\cdot\frac{N-n}{N-1}

Zusatzinformationen

Approximation der Verteilung des Stichprobenmittelwertes

Einfache Zufallsstichprobe

Entsprechend dem zentralen Grenzwertsatzes kann für einen genügend großen Stichprobenumfang die Binomialverteilung durch eine Normalverteilung approximiert werden:

X\approx N(\mu,\sigma^{2})\; \mbox{ mit }\; \mu=E[X]=n\cdot\pi\;\mbox{ und }\; \sigma^{2}=\sigma^{2}(X)=n\cdot\pi\cdot(1-\pi)

bzw.

\widehat{\pi}\approx N(\mu,\sigma^2)\; \mbox{ mit }\; \mu=E[\widehat{\pi}]=\pi\;\mbox{ und }\;\sigma^{2}=\sigma^{2}(\widehat{\pi})=\frac{\pi\cdot(1-\pi)}{n}.

Der Stichprobenumfang wird als genügend groß angesehen, wenn n\cdot\pi\geq5 und n\cdot(1-\pi)\geq5 sind.

Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden, d.h. für die Bestimmung der Wahrscheinlichkeit P(x_{1}\leq X\leq x_{2}) über die Normalverteilung sollte

z_{1}=\frac{x_{1}-0.5-n\cdot p}{\sqrt{n\cdot p\cdot (1-p)}}\qquad z_{2}=\frac{x_{2}+0.5-n\cdot p}{\sqrt{n\cdot p\cdot (1-p)}}

und für die Bestimmung der Wahrscheinlichkeit P(p_{1}\leq\widehat{\pi}\leq p_{2})

z_{1}=\frac{\frac{n\cdot p_{1}-0.5}{n}-\pi}{\sqrt{\frac{\pi\cdot (1-\pi)}{n}}}=\frac{p_{1}-\frac{1}{2n}-\pi}{\sqrt{\frac{\pi\cdot (1-\pi)}{n}}}

z_{2}=\frac{\frac{n\cdot p_{2}-0.5}{n}-\pi}{\sqrt{\frac{\pi\cdot (1-\pi)}{n}}}=\frac{p_{2}-\frac{1}{2n}-\pi}{\sqrt{\frac{\pi\cdot (1-\pi)}{n}}}

verwendet werden.

Uneingeschränkte Zufallsstichprobe

\pi =\frac{M}{N} relativ gut approximiert werden.
Als Faustregel gilt: \frac{n}{N} \leq 0,05.
X\approx N(\mu,\sigma)\mbox{ mit } \mu=E[X]=n\cdot\pi \mbox{ und }\sigma =\sigma(X)
bzw.
\widehat{\pi}\approx N(\mu,\;\sigma) \mbox{ mit } \mu=E[\widehat{\pi}]=\pi \mbox{ und }\sigma=\sigma(\widehat{\pi})
Der Stichprobenumfang wird als genügend groß angesehen, wenn n\cdot \frac{M}{N} \geq 5, n\cdot(1-\frac{M}{N})\geq5 und \frac{n}{N}\leq 0,05 sind.
Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden.