Verteilung des Stichprobenanteilswertes
Aus MM*Stat
Unterseiten |
Grundbegriffe
Stichprobenanteilswert
Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein Anteil von Elementen eine Eigenschaft aufweist und ein Anteil diese Eigenschaft nicht besitzt.
Die zufällige Entnahme eines Elementes aus dieser Grundgesamtheit führt zu einer Zufallsvariablen, die den Wert Eins annimmt, wenn das gezogene Element die Eigenschaft aufweist, und den Wert Null annimmt, wenn das gezogene Element diese Eigenschaft nicht hat.
Bei -maliger Ziehung von Elementen erhält man Zufallsvariablen (Stichprobenvariablen), die alle nur die Werte Eins oder Null annehmen können.
Es bezeichne die Anzahl, also die absolute Häufigkeit der Elemente mit der Eigenschaft in einer Zufallsstichprobe vom Umfang :
Dann ist
der Stichprobenanteilswert, also die relative Häufigkeit der Elemente mit der Eigenschaft in einer Zufallsstichprobe vom Umfang .
Nach der Ziehung der Stichprobe liegt eine konkrete Anzahl von Elementen mit der Eigenschaft in der Stichprobe vor und der Stichprobenanteilswert hat sich zu einem Stichprobenwert realisiert.
Verteilung des Stichprobenanteilswertes
und variieren von Stichprobe zu Stichprobe (gleichen Umfangs).
Sie sind Stichprobenfunktionen, da sie als Funktionen von Stichprobenvariablen definiert sind, und damit Zufallsvariablen.
Für diese Stichprobenfunktionen sind ihre Verteilung mit Erwartungswert und die Varianz, d.h. die Stichprobenverteilungen, zu bestimmen.
Die Stichprobenverteilungen hängen entscheidend davon ab,
- auf welche Art die Zufallsstichprobe gezogen wird (Zufallsauswahlmodell mit oder ohne Zurücklegen) und
- welchen Umfang die Grundgesamtheit hat.
Einfache Zufallsstichprobe (Ziehen mit Zurücklegen)
Wird eine einfache Zufallsstichprobe aus der oben beschriebenen Grundgesamtheit gezogen, dann entspricht das einem Bernoulli-Experiment.
Alle Stichprobenvariablen haben die Verteilung
mit Erwartungswert und .
Unter diesen Bedingungen weist die Stichprobenfunktion eine Binomialverteilung mit den Parametern und auf, :
für die gilt:
Da die Beziehung besteht und darin eine Konstante ist, gilt für den Stichprobenanteilswert die gleiche Wahrscheinlichkeitsfunktion.
Für den Erwartungswert und die Varianz von folgt:
Uneingeschränkte Zufallsstichprobe (Ziehen ohne Zurücklegen)
Das Zufallsauswahlmodell ohne Zurücklegen ist nur für eine endliche Grundgesamtheit von Bedeutung.
Es sei der Umfang der Grundgesamtheit, die Anzahl der Elemente mit der Eigenschaft und der Stichprobenumfang.
Dann ist der Anteil der Elemente mit der Eigenschaft in der Grundgesamtheit. Die Stichprobenfunktionen und sind wie zuvor definiert.
Bei der Stichprobenentnahme ohne Zurücklegen folgt einer hypergeometrischen Verteilung mit den Parametern , und ; :
Erwartungswert und Varianz der hypergeometrisch verteilten Stichprobenfunktion sind:
Die Stichprobenfunktion weist die gleiche Wahrscheinlichkeitsfunktion wie auf.
Für den Erwartungswert und die Varianz von folgt:
Zusatzinformationen
Approximation der Verteilung des Stichprobenmittelwertes
Einfache Zufallsstichprobe
Entsprechend dem zentralen Grenzwertsatzes kann für einen genügend großen Stichprobenumfang die Binomialverteilung durch eine Normalverteilung approximiert werden:
bzw.
.
Der Stichprobenumfang wird als genügend groß angesehen, wenn und sind.
Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden, d.h. für die Bestimmung der Wahrscheinlichkeit über die Normalverteilung sollte
und für die Bestimmung der Wahrscheinlichkeit
verwendet werden.
Uneingeschränkte Zufallsstichprobe
- Für große und sowie einen kleinen Auswahlsatz kann bei einer uneingeschränkten Zufallsstichprobe die hypergeometrische Verteilung durch eine Binomialverteilung mit
- relativ gut approximiert werden.
- Als Faustregel gilt: .
- Entsprechend dem zentralen Grenzwertsatzes kann auch bei einer uneingeschränkten Zufallsstichprobe für einen genügend großen Stichprobenumfang die hypergeometrische Verteilung durch eine Normalverteilung approximiert werden:
- bzw.
- Der Stichprobenumfang wird als genügend groß angesehen, wenn , und sind.
- Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden.
Beispiele
Haushaltsgröße
Laut Angaben des Statistischen Bundesamtes der Bundesrepublik Deutschland gab es im April 1996 in Deutschland 37,3 Millionen Privathaushalte, von denen rund 35% Einpersonenhaushalte waren.
Stichprobe vom Umfang n=10
Aus dieser Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe vom Umfang entnommen.
- Welcher Verteilung genügt die Anzahl bzw. der Anteil der Einpersonenhaushalte in der Stichprobe?
- Geben Sie Erwartungswert, Varianz und Standardabweichung für diese Verteilung an.
- Wie groß ist die Wahrscheinlichkeit, dass der Anteil der Einpersonenhaushalte in der Stichprobe größer als 0,2, jedoch kleiner gleich 0,5 ist?
Es liegt eine endliche Grundgesamtheit von Mio. Privathaushalten vor, von denen Mio. Einpersonenhaushalte sind.
Bei zehnmaliger Ziehung von Elementen aus der Grundgesamtheit erhält man 10 Zufallsvariablen (Stichprobenvariablen) , die den Wert annehmen, wenn ein Einpersonenhaushalt auftritt, und den Wert annehmen, wenn ein Mehrpersonenhaushalt auftritt.
Die Zufallsvariable als Summe der 10 Stichprobenvariablen beinhaltet die Anzahl der Einpersonenhaushalte in der Stichprobe und die Zufallsvariable den Anteil der Einpersonenhaushalte in der Stichprobe.
Da bei einer uneingeschränkten Zufallsstichprobe die Elemente ohne Zurücklegen entnommen werden, ist die Stichprobenfunktion hypergeometrisch verteilt:
.
Die Stichprobenfunktion weist die gleiche Wahrscheinlichkeitsfunktion wie auf.
Da zum einen der Umfang der Grundgesamtheit sehr groß und zum anderen der Auswahlsatz ist, kann die Endlichkeit der Grundgesamtheit vernachlässigt und approximativ die Binomialverteilung mit verwendet werden, so dass gilt: .
Für gilt die gleiche Wahrscheinlichkeitsverteilung.
Erwartungswert, Varianz und Standardabweichung:
Die gesuchte Wahrscheinlichkeit ist .
Wegen und somit und , entspricht dies der Wahrscheinlichkeit .
und findet man in der Tabelle der Verteilungsfunktion der Binomialverteilung .
Stichprobe vom Umfang n=2000
Aus der angegebenen Grundgesamtheit wird eine uneingeschränkte Zufallsstichprobe vom Umfang entnommen.
- Welcher Verteilung genügt die Anzahl bzw. der Anteil der Einpersonenhaushalte in der Stichprobe?
- Geben Sie Erwartungswert, Varianz und Standardabweichung für diese Verteilung an.
- Wie groß ist die Wahrscheinlichkeit, dass die Anzahl der Einpersonenhaushalte in der Stichprobe größer gleich 700, aber kleiner gleich 725 ist, d.h. ?
Die Stichprobenfunktionen und sind wie bei der 1. Problemstellung definiert.
Da die Grundgesamtheit wie vorher sehr groß und der Auswahlsatz sehr klein ist, spielt es keine Rolle, ob die Elemente ohne Zurücklegen oder mit Zurücklegen entnommen werden, so dass approximativ von einer Binomialverteilung ausgegangen werden kann.
Erwartungswert, Varianz und Standardabweichung: sind:
Für eine liegen keine Tabellen zur Bestimmung von Wahrscheinlichkeiten vor. Per Computer wurde ermittelt:
Da der Stichprobenumfang jedoch sehr groß ist und die Kriterien und erfüllt sind, kann statt der Binomialverteilung approximativ die Normalverteilung verwendet werden:
Mit
folgt
Im Vergleich zur Berechnung der Wahrscheinlichkeit über die exakte Verteilung ergibt sich durch die Approximation über die Normalverteilung ein vernachlässigbarer Fehler.
Urne
Aus einer Urne mit Kugeln, unter denen ein Anteil roter Kugeln ist, werden Stichproben im Umfang ohne Zurücklegen gezogen.
Bestimmen Sie die Wahrscheinlichkeiten, in den Stichproben Anteilswerte roter Kugeln zwischen und zu finden.
Grundgesamtheit vom Umfang N=5
Aus einer Grundgesamtheit mit dem Umfang und wird eine uneingeschränkte Zufallsstichprobe vom Umfang entnommen.
Die Zufallsvariable als Summe der 3 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable den Anteil der roten Kugeln in der Stichprobe.
- Welcher Verteilung genügt die Anzahl bzw. der Anteil der roten Kugeln in der Stichprobe?
- Wie groß ist die Wahrscheinlichkeit, in der Stichprobe Anteilswerte zwischen und zu finden ?
Da die Grundgesamtheit endlich ist und bei einer uneingeschränkten Zufallsstichprobe die Elemente ohne Zurücklegen entnommen werden, ist die Stichprobenfunktion hypergeometrisch verteilt:
, wobei ist.
Die gesuchte Wahrscheinlichkeit ist .
Wegen und somit und entspricht dies der Wahrscheinlichkeit .
.
<R output="display">
pdf(rpdf, width=7, height=7) x=c(0:2) H1 <- dhyper(x, n=3, m=2, k=3) layout(1:2) plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 2), ylim=c(0.0, 0.6)) axis(side=1, at=c(0,1,2)) axis(side=2, at=c(0,0.2,0.4,0.6), las=1) lines(c(0:2), H1, type="h", lwd=2, col="BLUE") plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 3), ylim=c(0.0, 1)) axis(side=1, at=c(0,1,2,3)) axis(side=2, at=c(0.1,0.4,0.7,1), las=1) lines(c(0, 1), c(0.1, 0.1), type="l", lwd=2, col="RED") lines(c(1, 2), c(0.7, 0.7), type="l", lwd=2, col="RED") lines(c(2, 3), c(1.0, 1.0), type="l", lwd=2, col="RED") </R> |
Grundgesamtheit vom Umfang N=1000
Aus einer Grundgesamtheit mit dem Umfang und wird eine uneingeschränkte Zufallsstichprobe vom Umfang entnommen.
Die Zufallsvariable als Summe der 4 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable den Anteil der roten Kugeln in der Stichprobe.
- Welcher Verteilung genügt die Anzahl bzw. der Anteil der roten Kugeln in der Stichprobe?
- Wie groß ist die Wahrscheinlichkeit, in der Stichprobe Anteilswerte zwischen 0,25 und 0,75 zu finden?
Da eine uneingeschränkte Zufallsstichprobe gezogen wird und die Grundgesamtheit endlich ist, ist die Zufallsvariable hypergeometrisch verteilt: .
Da aber zum einen der Umfang der Grundgesamtheit sehr groß und zum anderen der Auswahlsatz ist, kann die Endlichkeit der Grundgesamtheit vernachlässigt und approximativ die Binomialverteilung mit verwendet werden, so dass gilt:
Die gesuchte Wahrscheinlichkeit ist .
Wegen und somit und entspricht dies der Wahrscheinlichkeit .
und findet man in der Tabelle der Verteilungsfunktion der Binomialverteilung .
<R output="display">
pdf(rpdf, width=7, height=7) x=c(0:4) H1 <- dbinom(x, size=4, prob=0.2) layout(1:2) plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 4), ylim=c(0.0, 0.41)) axis(side=1, at=c(0,1,2,3,4)) axis(side=2, at=c(0,0.1,0.2,0.3, 0.4), las=1) lines(c(0:4), H1, type="h", lwd=2, col="BLUE") plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 5), ylim=c(0.4, 1)) axis(side=1, at=c(0,1,2, 3, 4, 5)) axis(side=2, at=c(0.4,0.6,0.8,1), las=1) lines(c(0, 1), c(0.4096, 0.4096), type="l", lwd=2, col="RED") lines(c(1, 2), c(0.8192, 0.8192), type="l", lwd=2, col="RED") lines(c(2, 3), c(0.95, 0.95), type="l", lwd=2, col="RED") lines(c(3, 4), c(0.97, 0.97), type="l", lwd=2, col="RED") lines(c(4, 5), c(1.0, 1.0), type="l", lwd=2, col="RED")
|
Grundgesamtheit vom Umfang N=2500
Aus einer Grundgesamtheit mit dem Umfang und wird eine uneingeschränkte Zufallsstichprobe vom Umfang entnommen.
Die Zufallsvariable als Summe der 100 Stichprobenvariablen beinhaltet die Anzahl der roten Kugeln in der Stichprobe und die Zufallsvariable den Anteil der roten Kugeln in der Stichprobe.
- Welcher Verteilung genügt die Anzahl bzw. der Anteil der roten Kugeln in der Stichprobe?
- Wie groß ist die Wahrscheinlichkeit, in der Stichprobe Anteilswerte zwischen 0,14 und 0,3 zu finden ?
Da die Grundgesamtheit endlich ist und eine uneingeschränkte Zufallsstichprobe gezogen wird, ist die Zufallsvariable hypergeometrisch verteilt: .
Da der Stichprobenumfang groß ist und die Kriterien
und
erfüllt sind, kann approximativ die Normalverteilung verwendet werden.
Es sind:
.
Somit wird die hypergeometrische Verteilung durch die approximiert.
Dabei wird zur Vereinfachung auf die Stetigkeitskorrektur verzichtet.
Die gesuchte Wahrscheinlichkeit ist :
Wegen und gilt:
.
und findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung.
<R output="display">
pdf(rpdf, width=7, height=7) layout(1:2) curve(from=-10, to=10, dnorm(x, mean=0, sd=1), col="black", ylim=c(0,10), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n") curve(from=-10, to=10, dnorm(x, mean=0, sd=0.04), col="blue",lty=1, lwd=2, font.lab=2, bty="l",, add=T) axis(side=1, at=c(-10, 0, 10)) axis(side=2, at=c(0, 5, 10), las=1) curve(from=-10, to=10, pnorm(x, mean=0, sd=1), col="black", ylim=c(0,1), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n") curve(from=-10, to=10, pnorm(x, mean=0, sd=0.04), col="red",lty=1, lwd=2, font.lab=2, bty="l",, add=T) axis(side=1, at=c(-10, 0, 10)) axis(side=2, at=c(0, 0.5, 1), las=1) </R> |