|
|
Zeile 142: |
Zeile 142: |
| | | |
| : Für eine bessere [[Approximation]] sollte die [[Stetigkeitskorrektur]] berücksichtigt werden. | | : Für eine bessere [[Approximation]] sollte die [[Stetigkeitskorrektur]] berücksichtigt werden. |
− |
| |
− | ===Urne===
| |
− |
| |
− | Aus einer Urne mit <math>N</math> Kugeln, unter denen ein Anteil <math>\pi</math> roter Kugeln ist, werden [[Stichprobe]]n im [[Stichprobenumfang|Umfang]] <math>n</math> [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] gezogen.
| |
− |
| |
− | Bestimmen Sie die [[Wahrscheinlichkeit]]en, in den [[Stichprobe]]n Anteilswerte roter Kugeln zwischen <math>p_1</math> und <math>p_2</math> zu finden.
| |
− |
| |
− | ====Grundgesamtheit vom Umfang N=5====
| |
− |
| |
− | Aus einer [[Grundgesamtheit]] mit dem [[Stichprobenumfang|Umfang]] <math>N = 5</math> und <math>\pi = 0,4</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 3</math> entnommen.
| |
− |
| |
− | Die [[Zufallsvariable]] <math>X\;</math> als Summe der 3 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X }{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
| |
− |
| |
− | * Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
| |
− | * Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen <math>\frac{1}{3}</math> und <math>\frac{2}{3}</math> zu finden ?
| |
− |
| |
− | Da die [[Grundgesamtheit]] endlich ist und bei einer [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]] die [[Element]]e [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] entnommen werden, ist die [[Stichprobenfunktion]] <math>X\;</math> [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]:
| |
− |
| |
− | <math>X \sim H ( N; M; n ) = H ( 5;2;3 )\;</math>, wobei <math>M = 0,4 \cdot 5 = 2</math> ist.
| |
− |
| |
− | Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( \frac{1}{3} \leq \widehat{\pi} \leq \frac{2}{3} )</math>.
| |
− |
| |
− | Wegen <math>X = n\cdot \widehat{\pi} </math> und somit <math>x_1 = 3 \cdot \frac{1}{3} = 1</math> und <math>x_2 = 3 \cdot \frac{2}{3} = 2</math> entspricht dies der [[Wahrscheinlichkeit]] <math>P( 1 \leq X \leq 2 )</math>.
| |
− |
| |
− | <math>P( 1 \leq X \leq 2 ) = f(1) + f(2) = 0,6 +0,3 = 0,9</math>.
| |
− |
| |
− | {|
| |
− | |<R output="display">
| |
− | pdf(rpdf, width=7, height=7)
| |
− |
| |
− | x=c(0:2)
| |
− | H1 <- dhyper(x, n=3, m=2, k=3)
| |
− | layout(1:2)
| |
− | plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 2), ylim=c(0.0, 0.6))
| |
− | axis(side=1, at=c(0,1,2))
| |
− | axis(side=2, at=c(0,0.2,0.4,0.6), las=1)
| |
− | lines(c(0:2), H1, type="h", lwd=2, col="BLUE")
| |
− | plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 3), ylim=c(0.0, 1))
| |
− | axis(side=1, at=c(0,1,2,3))
| |
− | axis(side=2, at=c(0.1,0.4,0.7,1), las=1)
| |
− | lines(c(0, 1), c(0.1, 0.1), type="l", lwd=2, col="RED")
| |
− | lines(c(1, 2), c(0.7, 0.7), type="l", lwd=2, col="RED")
| |
− | lines(c(2, 3), c(1.0, 1.0), type="l", lwd=2, col="RED")
| |
− |
| |
− | </R>
| |
− | |}
| |
− |
| |
− | ====Grundgesamtheit vom Umfang N=1000====
| |
− |
| |
− | Aus einer [[Grundgesamtheit]] mit dem [[Umfang der Grundgesamtheit|Umfang]] <math>N = 1000</math> und <math>\pi = 0,2</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 4</math> entnommen.
| |
− |
| |
− | Die [[Zufallsvariable]] <math>X\;</math> als Summe der 4 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X}{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
| |
− |
| |
− | * Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
| |
− | * Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen 0,25 und 0,75 zu finden?
| |
− |
| |
− | Da eine [[uneingeschränkte Zufallsstichprobe]] gezogen wird und die [[Grundgesamtheit]] endlich ist, ist die [[Zufallsvariable]] [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]: <math>X \sim H ( 1000; 200 ; 4 )\;</math>.
| |
− |
| |
− | Da aber zum einen der [[Umfang der Grundgesamtheit]] sehr groß und zum anderen der [[Auswahlsatz]] <math>\frac{n}{ N} = 0,004 < 0,05</math> ist, kann die Endlichkeit der [[Grundgesamtheit]] vernachlässigt und [[Approximation|approximativ]] die [[Binomialverteilung]] mit <math>\pi = \frac{M}{N} = 0,2</math> verwendet werden, so dass gilt: <math>X \approx B ( 4; 0,2 )</math>
| |
− |
| |
− | Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( 0,25 \leq \widehat{\pi} \leq 0,75 )</math>.
| |
− |
| |
− | Wegen <math>X = n \cdot \widehat{\pi}</math> und somit <math>x_1 = 4 \cdot 0,25 = 1</math> und <math>x_2 = 4 \cdot 0,75 = 3</math> entspricht dies der [[Wahrscheinlichkeit]] <math>P( 1 \leq X \leq 3 )</math>.
| |
− |
| |
− | <math>P( 1 \leq X \leq 3 ) = F_B( 3 ) - F_B( 0 ) = 0,9984 - 0,4096 = 0,5888</math>
| |
− |
| |
− | <math>F_B( 3 )</math> und <math>F_B( 0 )</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Binomialverteilung]] <math>B ( 4; 0,2 )</math>.
| |
− |
| |
− | {|
| |
− | |<R output="display">
| |
− | pdf(rpdf, width=7, height=7)
| |
− |
| |
− | x=c(0:4)
| |
− | H1 <- dbinom(x, size=4, prob=0.2)
| |
− | layout(1:2)
| |
− | plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 4), ylim=c(0.0, 0.41))
| |
− | axis(side=1, at=c(0,1,2,3,4))
| |
− | axis(side=2, at=c(0,0.1,0.2,0.3, 0.4), las=1)
| |
− | lines(c(0:4), H1, type="h", lwd=2, col="BLUE")
| |
− | plot(H1, col="white", xlab="", ylab="", xaxt="n", yaxt="n", xpd=TRUE, xlim= c(0, 5), ylim=c(0.4, 1))
| |
− | axis(side=1, at=c(0,1,2, 3, 4, 5))
| |
− | axis(side=2, at=c(0.4,0.6,0.8,1), las=1)
| |
− | lines(c(0, 1), c(0.4096, 0.4096), type="l", lwd=2, col="RED")
| |
− | lines(c(1, 2), c(0.8192, 0.8192), type="l", lwd=2, col="RED")
| |
− | lines(c(2, 3), c(0.95, 0.95), type="l", lwd=2, col="RED")
| |
− | lines(c(3, 4), c(0.97, 0.97), type="l", lwd=2, col="RED")
| |
− | lines(c(4, 5), c(1.0, 1.0), type="l", lwd=2, col="RED")
| |
− |
| |
− |
| |
− | </R>
| |
− | |}
| |
− | <!--
| |
− | [[Bild:STAT-S2_32_e_2.gif]]
| |
− | -->
| |
− |
| |
− | ====Grundgesamtheit vom Umfang N=2500====
| |
− |
| |
− | Aus einer [[Grundgesamtheit]] mit dem [[Umfang der Grundgesamtheit|Umfang]] <math>N = 2500</math> und <math>\pi = 0,2</math> wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 100</math> entnommen.
| |
− |
| |
− | Die [[Zufallsvariable]] <math>X\;</math> als Summe der 100 [[Stichprobenvariable]]n beinhaltet die Anzahl der roten Kugeln in der [[Stichprobe]] und die [[Zufallsvariable]] <math>\widehat{\pi}= \frac{X }{n}</math> den Anteil der roten Kugeln in der [[Stichprobe]].
| |
− |
| |
− | * Welcher [[Verteilung (stochastisch)|Verteilung]] genügt die Anzahl bzw. der Anteil der roten Kugeln in der [[Stichprobe]]?
| |
− | * Wie groß ist die [[Wahrscheinlichkeit]], in der [[Stichprobe]] Anteilswerte zwischen 0,14 und 0,3 zu finden ?
| |
− |
| |
− | Da die [[Grundgesamtheit]] endlich ist und eine [[uneingeschränkte Zufallsstichprobe]] gezogen wird, ist die [[Zufallsvariable]] <math>X</math> [[Hypergeometrische Verteilung|hypergeometrisch verteilt]]: <math>X \sim H ( 2500 ; 500 ; 100 )\;</math>.
| |
− |
| |
− | Da der [[Stichprobenumfang]] <math>n = 100</math> groß ist und die Kriterien
| |
− |
| |
− | <math>n \cdot \frac{M}{N} = 100 \cdot 0,2 = 20 \geq 5</math>
| |
− |
| |
− | <math>n \cdot ( 1 - \frac{M}{N} ) = 80 \geq 5</math> und
| |
− |
| |
− | <math>\frac{n}{N} = 0,04 < 0,05</math>
| |
− |
| |
− | erfüllt sind, kann [[Approximation|approximativ]] die [[Normalverteilung]] verwendet werden.
| |
− |
| |
− | Es sind:
| |
− |
| |
− | <math>E \left[ \widehat{\pi} \right] = \pi = 0,2</math>
| |
− |
| |
− | <math>Var ( \widehat{\pi}) =\frac{ \pi \cdot ( 1 - \pi )}{ n }\cdot \frac{ N -n }{ N -1 } = 0,001537</math>
| |
− |
| |
− | <math>\sigma( \widehat{\pi}) = 0,039 \approx 0,04</math>.
| |
− |
| |
− | Somit wird die [[hypergeometrische Verteilung]] durch die <math>N ( 0,2 ; 0,04 )</math> [[Approximation|approximiert]].
| |
− |
| |
− | Dabei wird zur Vereinfachung auf die [[Stetigkeitskorrektur]] verzichtet.
| |
− |
| |
− | Die gesuchte [[Wahrscheinlichkeit]] ist <math>P( 0,14 \leq \widehat{\pi}\leq 0,3 )</math>:
| |
− |
| |
− | Wegen <math>z_2 = \frac{0,3 - 0,2 }{0,04} = 2,5</math> und <math>z_1= \frac{0,14 - 0,2}{ 0,04} = - 1,5</math> gilt:
| |
− |
| |
− | <math>P( 0,14 \leq \widehat{\pi}\leq 0,3 ) =\Phi (2,5) - \Phi (- 1,5) = \Phi (2,5) - ( 1 - \Phi (1,5) ) = 0,99379 - (1 - 0,933193) = 0,9269</math>.
| |
− |
| |
− | <math>\Phi(2,5)</math> und <math>\Phi(1,5)</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]].
| |
− |
| |
− | {|
| |
− | |<R output="display">
| |
− | pdf(rpdf, width=7, height=7)
| |
− |
| |
− | layout(1:2)
| |
− | curve(from=-10, to=10, dnorm(x, mean=0, sd=1), col="black", ylim=c(0,10), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n")
| |
− | curve(from=-10, to=10, dnorm(x, mean=0, sd=0.04), col="blue",lty=1, lwd=2, font.lab=2, bty="l",, add=T)
| |
− | axis(side=1, at=c(-10, 0, 10))
| |
− | axis(side=2, at=c(0, 5, 10), las=1)
| |
− | curve(from=-10, to=10, pnorm(x, mean=0, sd=1), col="black", ylim=c(0,1), lty=1, lwd=2, xlim= c(-10, 10), xlab="", ylab="", xaxt="n", yaxt="n")
| |
− | curve(from=-10, to=10, pnorm(x, mean=0, sd=0.04), col="red",lty=1, lwd=2, font.lab=2, bty="l",, add=T)
| |
− | axis(side=1, at=c(-10, 0, 10))
| |
− | axis(side=2, at=c(0, 0.5, 1), las=1)
| |
− |
| |
− | </R>
| |
− | |}
| |
Grundbegriffe
Stichprobenanteilswert
Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein Anteil
von Elementen eine Eigenschaft
aufweist und ein Anteil
diese Eigenschaft nicht besitzt.
Die zufällige Entnahme eines Elementes aus dieser Grundgesamtheit führt zu einer Zufallsvariablen, die den Wert Eins annimmt, wenn das gezogene Element die Eigenschaft
aufweist, und den Wert Null annimmt, wenn das gezogene Element diese Eigenschaft nicht hat.
Bei
-maliger Ziehung von Elementen erhält man
Zufallsvariablen
(Stichprobenvariablen), die alle nur die Werte Eins oder Null annehmen können.
Es bezeichne
die Anzahl, also die absolute Häufigkeit der Elemente mit der Eigenschaft
in einer Zufallsstichprobe vom Umfang
:
Dann ist
der Stichprobenanteilswert, also die relative Häufigkeit der Elemente mit der Eigenschaft
in einer Zufallsstichprobe vom Umfang
.
Nach der Ziehung der Stichprobe liegt eine konkrete Anzahl
von Elementen mit der Eigenschaft
in der Stichprobe vor und der Stichprobenanteilswert hat sich zu einem Stichprobenwert
realisiert.
Verteilung des Stichprobenanteilswertes
und
variieren von Stichprobe zu Stichprobe (gleichen Umfangs).
Sie sind Stichprobenfunktionen, da sie als Funktionen von Stichprobenvariablen definiert sind, und damit Zufallsvariablen.
Für diese Stichprobenfunktionen sind ihre Verteilung mit Erwartungswert und die Varianz, d.h. die Stichprobenverteilungen, zu bestimmen.
Die Stichprobenverteilungen hängen entscheidend davon ab,
Einfache Zufallsstichprobe (Ziehen mit Zurücklegen)
Wird eine einfache Zufallsstichprobe aus der oben beschriebenen Grundgesamtheit gezogen, dann entspricht das einem Bernoulli-Experiment.
Alle Stichprobenvariablen haben die Verteilung
mit Erwartungswert
und
.
Unter diesen Bedingungen weist die Stichprobenfunktion
eine Binomialverteilung mit den Parametern
und
auf,
:
für die gilt:
Da die Beziehung
besteht und darin
eine Konstante ist, gilt für den Stichprobenanteilswert
die gleiche Wahrscheinlichkeitsfunktion.
Für den Erwartungswert und die Varianz von
folgt:
Uneingeschränkte Zufallsstichprobe (Ziehen ohne Zurücklegen)
Das Zufallsauswahlmodell ohne Zurücklegen ist nur für eine endliche Grundgesamtheit von Bedeutung.
Es sei
der Umfang der Grundgesamtheit,
die Anzahl der Elemente mit der Eigenschaft
und
der Stichprobenumfang.
Dann ist
der Anteil der Elemente mit der Eigenschaft in der Grundgesamtheit. Die Stichprobenfunktionen
und
sind wie zuvor definiert.
Bei der Stichprobenentnahme ohne Zurücklegen folgt
einer hypergeometrischen Verteilung mit den Parametern
,
und
;
:
Erwartungswert und Varianz der hypergeometrisch verteilten Stichprobenfunktion
sind:
Die Stichprobenfunktion
weist die gleiche Wahrscheinlichkeitsfunktion wie
auf.
Für den Erwartungswert und die Varianz von
folgt:
Zusatzinformationen
Approximation der Verteilung des Stichprobenmittelwertes
Einfache Zufallsstichprobe
Entsprechend dem zentralen Grenzwertsatzes kann für einen genügend großen Stichprobenumfang die Binomialverteilung
durch eine Normalverteilung approximiert werden:
bzw.
.
Der Stichprobenumfang wird als genügend groß angesehen, wenn
und
sind.
Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden, d.h. für die Bestimmung der Wahrscheinlichkeit
über die Normalverteilung sollte
und für die Bestimmung der Wahrscheinlichkeit
verwendet werden.
Uneingeschränkte Zufallsstichprobe
relativ gut approximiert werden.
- Als Faustregel gilt:
.
![{\displaystyle X\approx N(\mu ,\sigma ){\mbox{ mit }}\mu =E[X]=n\cdot \pi {\mbox{ und }}\sigma =\sigma (X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/79710464f82c37f289d9c5b7c268256307ff2225)
- bzw.
![{\displaystyle {\widehat {\pi }}\approx N(\mu ,\;\sigma ){\mbox{ mit }}\mu =E[{\widehat {\pi }}]=\pi {\mbox{ und }}\sigma =\sigma ({\widehat {\pi }})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c8b5d027c13fd14fce6f3dc35caeaf02b6e1ebfb)
- Der Stichprobenumfang wird als genügend groß angesehen, wenn
,
und
sind.
- Für eine bessere Approximation sollte die Stetigkeitskorrektur berücksichtigt werden.