Verteilung des Stichprobenmittelwertes: Unterschied zwischen den Versionen

Aktuelle Version vom 22. November 2018, 15:26 Uhr

Stichprobentheorie

Stichprobentheorie • Stichprobe • Verteilung der Grundgesamtheit • Stichprobenvariable • Stichprobenfunktion • Zufallsauswahlmodelle • Stichprobenmittelwert • Schwaches Gesetz der großen Zahlen • Verteilung des Stichprobenmittelwertes • Verteilung der Stichprobenvarianz • Verteilung des Stichprobenanteilswertes • Multiple Choice • Video • Aufgaben • Lösungen

Anteilswert der Grundgesamtheit • Auswahlsatz • Einfache Zufallsauswahl • Einfache Zufallsstichprobe • Erwartungswert der Grundgesamtheit • Erwartungswert des Stichprobenmittelwertes • Induktiver Schluss • Mittelwert der Grundgesamtheit • Parameter der Grundgesamtheit • Parameter des Stichprobenmittelwertes • Standardabweichung des Stichprobenmittelwertes • Standardfehler • Statistisches Element • Stichprobenanteilswert • Stichprobengröße • Stichprobenumfang • Stichprobenwerte • Stichprobenvarianz • Stichprobenverteilung • Uneingeschränkte Zufallsauswahl • Uneingeschränkte Zufallsstichprobe • Varianz der Grundgesamtheit • Varianz des Stichprobenmittelwertes • Varianzhomogenität • Varianzheterogenität • Verteilung einer Stichprobenfunktion • Zufallsauswahl • Zufallsauswahlmodell mit Zurücklegen • Zufallsauswahlmodell ohne Zurücklegen • Zufallsstichprobe

Unterseiten

Beispiele

Grundbegriffe

Verteilung des Stichprobenmittelwertes

Entscheidend für Aussagen über die Verteilung $F({\bar {X}})$ des Stichprobenmittelwertes ist die Verteilung $F(x)$ der Zufallsvariablen $X\;$ in der Grundgesamtheit und ob darüber Kenntnisse existieren oder nicht.

Normalverteilte Zufallsvariable in der Grundgesamtheit

Es wird angenommen, dass die Zufallsvariable $X\;$ in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert $\mu$ und der Varianz $\sigma ^{2}$ folgt:

$X\sim N(\mu ,\,\sigma ^{2})$

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist bekannt

Ist das Merkmal $X\;$ der Grundgesamtheit $N(\mu ,\;\sigma )$ -verteilt und ist $\sigma ^{2}$ bekannt, so ist bei einer einfachen Zufallsstichprobe die Stichprobenfunktion ${\bar {X}}$ normalverteilt:

${\bar {X}}\sim N(\mu ,\;\sigma ({\bar {X}}))$

und die standardisierte Zufallsvariable

$Z={\frac {{\bar {X}}-\mu }{\sigma ({\bar {X}})}}={\frac {{\bar {X}}-\mu }{\sigma }}\cdot {\sqrt {n}}$

standardnormalverteilt: $Z\sim N(0;1)\;$ .

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist unbekannt

Wenn $\sigma ^{2}$ der Grundgesamtheit unbekannt ist, muss sie unter Verwendung der Stichprobenfunktion

$S^{2}={\frac {1}{n-1}}\cdot \sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}$

aus der Stichprobe geschätzt werden.

Dann ist jedoch keine Aussage über die Verteilung von ${\bar {X}}$ möglich, sondern nur noch über die Verteilung der standardisierten Zufallsvariable

$T={\frac {{\bar {X}}-\mu }{S}}\cdot {\sqrt {n}}$

Die Zufallsvariable $T\;$ folgt bei einer einfachen Zufallsstichprobe einer t-Verteilung mit dem Parameter $f=n-1$ :

$T\sim t\;(f=n-1)\;$

Der Parameter $f$ ist die Anzahl der Freiheitsgrade der Zufallsvariablen $T$ .

Die t-Verteilung konvergiert für $f\rightarrow \infty$ gegen die Standardnormalverteilung.

Für $f>30$ wird bereits eine relativ gute Näherung an die Standardnormalverteilung erreicht, so dass anstatt der t-Verteilung approximativ die Standardnormalverteilung verwendet werden kann:

$T\sim N(0;1)\;$ für $f>30$ .

Beliebig verteilte Zufallsvariable in der Grundgesamtheit

Hierbei handelt es sich um den für die empirische Wirtschaftsforschung wesentlich relevanteren Fall, da viele interessierende Merkmale der Grundgesamtheit nicht einmal annähernd normalverteilt sind bzw. Unkenntnis über die Verteilung $F(x)$ der Zufallsvariablen $X\;$ in der Grundgesamtheit besteht.

Gegeben seien $n$ identisch, jedoch unbekannt verteilte Stichprobenvariablen $X_{i}\;(i=1,\dots ,n)$ mit $E[X_{i}]=\mu$ und $Var(X_{i})=\sigma ^{2}$ .

Auf Grund des zentralen Grenzwertsatzes können folgende Aussagen getroffen werden:

Sind die Stichprobenvariablen unabhängig (Ziehung einer einfachen Zufallsstichprobe) und ist $\sigma ^{2}$ bekannt, dann ist die Zufallsvariable

Z={\frac {{\bar {X}}-\mu }{\sigma }}\cdot {\sqrt {n}}

für genügend großen Stichprobenumfang

n

approximativ standardnormalverteilt.

Sind die Stichprobenvariablen unabhängig und ist $\sigma ^{2}$ unbekannt, dann ist die Zufallsvariable

T={\frac {{\bar {x}}-\mu }{s}}\cdot {\sqrt {n}}

für genügend großen Stichprobenumfang

n

approximativ standardnormalverteilt.

Sind die Stichprobenvariablen abhängig (Ziehung einer uneingeschränkten Zufallsstichprobe), dann ist die Zufallsvariable

Z={\cfrac {{\bar {X}}-\mu }{{\cfrac {\sigma }{\sqrt {n}}}\cdot {\sqrt {\cfrac {N-n}{N-1}}}}}

bzw.

Z={\cfrac {{\bar {X}}-\mu }{{\cfrac {S}{\sqrt {n}}}\cdot {\sqrt {\cfrac {N-n}{N-1}}}}}

für hinreichend großen Umfang

N

der Grundgesamtheit und genügend großen Stichprobenumfang

n

approximativ standardnormalverteilt.

Als Faustregel für die Verwendung der Normalverteilung gilt:

n>30

.

Zusatzinformationen

Berechnung von Wahrscheinlichkeiten

Ist ${\bar {X}}$ normalverteilt und sind $\mu$ und $\sigma ^{2}$ bekannt, so lässt sich die Wahrscheinlichkeit,

dass ${\bar {X}}$ Werte kleiner oder gleich einem vorgegebenen Wert ${\bar {x}}$ annimmt, berechnen als:

\,P({\bar {X}}\leq {\bar {x}})=\phi \left({\frac {{\bar {x}}-\mu }{\sigma ({\bar {X}})}}\right)=\phi \left({\frac {{\bar {x}}-\mu }{\sigma }}{\sqrt {n}}\right)=\phi (z)

dass ${\bar {X}}$ Werte in einem Intervall $[{\bar {x_{1}}},\;{\bar {x_{2}}}]$ annimmt, berechnen als:

\,P({\bar {x_{1}}}\leq {\bar {X}}\leq {\bar {x_{2}}})=\phi \left({\frac {{\bar {x_{2}}}-\mu }{\sigma ({\bar {X}})}}\right)-\phi \left({\frac {{\bar {x_{1}}}-\mu }{\sigma ({\bar {X}})}}\right)=\phi (z_{2})-\phi (z_{1}),

wobei

\phi \;

die Verteilungsfunktion der Standardnormalverteilung kennzeichnet.

Diese Wahrscheinlichkeitsberechnungen gelten approximativ, wenn

X\;

beliebig verteilt und der Stichprobenumfang

n

hinreichend groß ist.

Zentrales Schwankungsintervall

Ein zentrales Schwankungsintervall um den bekannten Erwartungswert $\mu$ des Stichprobenmittelwertes ist ein Bereich mit festen Grenzen

$\left[\mu -c\leq {\bar {X}}\leq \mu +c\right]$ ,

in dem ${\bar {X}}$ Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit $1-\alpha$ annimmt:

$P\left[\mu -c\leq {\bar {X}}\leq \mu +c\right]=1-\alpha$

Mit dem Übergang zur standardisierten Zufallsvariablen $Z$ folgt:

$P\left(\mu -c\leq {\bar {X}}\leq \mu +c\right)$	$\,=1-\alpha$
$P\left(-c\leq {\bar {X}}-\mu \leq c\right)$	$\,=1-\alpha$
$P\left({\frac {-c}{\sigma ({\bar {X}})}}\leq {\frac {{\bar {X}}-\mu }{\sigma ({\bar {X}})}}\leq {\frac {c}{\sigma ({\bar {X}})}}\right)$	$\,=1-\alpha$
$P\left({\frac {-c}{\sigma ({\bar {X}})}}\leq Z\leq {\frac {c}{\sigma ({\bar {X}})}}\right)$	$\,=1-\alpha$
$P\left(-z_{1-{\frac {\alpha }{2}}}\leq Z\leq z_{1-{\frac {\alpha }{2}}}\right)$	$\,=1-\alpha$

und

${\frac {c}{\sigma ({\bar {X}})}}$	$=z_{1-{\frac {\alpha }{2}}}$
$\,c$	$=z_{1-{\frac {\alpha }{2}}}\cdot \sigma ({\bar {X}})$

Die Abweichung $c$ von $\mu$ wird somit als Vielfaches der Standardabweichung $\sigma ({\bar {X}})$ bestimmt.

Setzt man $\sigma ({\bar {X}})$ ein, so erhält man für das zentrale Schwankungsintervall

$\left[\mu -z_{1-{\frac {\alpha }{2}}}\cdot {\frac {\sigma }{\sqrt {n}}}\leq {\bar {X}}\leq \mu +z_{1-{\frac {\alpha }{2}}}\cdot {\frac {\sigma }{\sqrt {n}}}\right]$ mit der Sicherheitswahrscheinlichkeit

$P\left(\mu -z_{1-{\frac {\alpha }{2}}}\cdot {\frac {\sigma }{\sqrt {n}}}\leq {\bar {X}}\leq \mu +z_{1-{\frac {\alpha }{2}}}\cdot {\frac {\sigma }{\sqrt {n}}}\right)=1-\alpha$

Sind $\mu$ und $\sigma$ bekannt und ist die Zufallsvariable $X\;$ in der Grundgesamtheit normalverteilt, so kann das zentrale Schwankungsintervall zur vorgegebenen Sicherheitswahrscheinlichkeit $1-\alpha$ bestimmt werden, indem $z_{1-{\frac {\alpha }{2}}}$ aus der Tabelle der Verteilungsfunktion der $N(0;1)$ entnommen wird.

Die Wahrscheinlichkeit $1-\alpha$ gilt approximativ, wenn $X\;$ beliebig verteilt und der Stichprobenumfang $n$ genügend groß ist.

Herleitung bei normalverteilter Zufallsvariable in der Grundgesamtheit

Es sei eine Grundgesamtheit mit der Verteilung $F(x)$ , dem Erwartungswert $E[X]=\mu$ und der Varianz $Var(X)=\sigma ^{2}$ vorausgesetzt.

Die Stichprobenvariablen $X_{i}\;(i=1,\ldots ,n)$ besitzen alle die gleiche Verteilung $F(x_{i})=F(x)$ , den Erwartungswert $E[X_{i}]=\mu$ und die Varianz $Var(X_{i})=\sigma ^{2}$ .

Es wird angenommen, dass die Zufallsvariable $X\;$ in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert $\mu$ und der Varianz $\sigma ^{2}$ folgt:

$X\sim N(\mu ,\;\sigma ^{2})$ .

Dann sind die Stichprobenvariablen $X_{i}\;(i=1,\ldots ,n)$ ebenfalls identisch normalverteilt:

$X_{i}\sim N(\mu ,\sigma ^{2})\;$ für alle $i=1,\ldots ,n$ .

Die Summe von $n$ unabhängigen, normalverteilten Zufallsvariablen ist aufgrund der Reproduktivitätseigenschaft der Normalverteilung auch normalverteilt:

$\sum \limits _{i=1}^{n}X_{i}\sim N(n\cdot \mu ,{\sqrt {n\cdot \sigma ^{2}}})\;$

Der Stichprobenmittelwert ${\bar {X}}$ unterscheidet sich nur um den konstanten Faktor ${\frac {1}{n}}$ von der Summe $\sum \nolimits _{i}X_{i}$ , so dass er ebenfalls normalverteilt ist:

${\bar {X}}\sim N(\mu ,\sigma ({\bar {X}}))\;$ .

Da jedoch nur die Standardnormalverteilung tabelliert vorliegt, geht man zur standardisierten Zufallsvariablen

$z={\frac {{\bar {x}}-\mu }{\sigma ({\bar {x}})}}={\sqrt {n}}\cdot {\frac {{\bar {x}}-\mu }{\sigma }}$

über, die dann standardnormalverteilt ist: $Z\sim N(0,1)\;$ .

Wie ersichtlich, setzt die Verwendung der Standardnormalverteilung die Kenntnis der Varianz $\sigma ^{2}$ der Grundgesamtheit voraus, um die standardisierte Zufallsvariable $Z\;$ bestimmen zu können.

Die Varianz $\sigma ^{2}$ der Grundgesamtheit ist unbekannt:

Die unbekannte Varianz $\sigma ^{2}$ der Grundgesamtheit wird mittels der Stichprobenfunktion

$s^{2}={\frac {\sum \limits _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n-1}}$

geschätzt. Dividiert man beide Seiten durch $\sigma ^{2}$ , folgt

${\frac {s^{2}}{\sigma ^{2}}}={\frac {1}{\sigma ^{2}}}\cdot {\frac {\sum \limits _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n-1}}$

Dies ist äquivalent zu:

${\frac {n-1}{\sigma ^{2}}}\cdot s^{2}=\sum \limits _{i=1}^{n}\left({\frac {x_{i}-{\bar {x}}}{\sigma }}\right)^{2}$

Zur Vereinfachung sei $y={\frac {(n-1)\cdot s^{2}}{\sigma ^{2}}}$ gesetzt.

Bei einer einfachen Zufallsstichprobe sind die Stichprobenvariablen $X_{i}\;(i=1,\ldots ,n)$ unabhängig voneinander, so dass $Y\;$ die Summe von quadrierten unabhängigen standardnormalverteilten Zufallsvariablen ist.

Eine derartig definierte Zufallsvariable folgt einer Chi-Quadrat-Verteilung mit dem Parameter $f=n-1$ .

Bildet man unter Verwendung der obigen standardisierten Zufallsvariablen $Z\;$ das Verhältnis

$T={\cfrac {Z}{\sqrt {\cfrac {Y}{f}}}}$ ,

so folgt die Zufallsvariable $T\;$ einer t-Verteilung mit dem Parameter $f=n-1$ , da im Zähler eine standardnormalverteilte Zufallsvariable und im Nenner eine von $Z\;$ unabhängige Chi-Quadrat-verteilte Zufallsvariable gegeben ist.

Nach Einsetzen von $Z\;$ , $Y\;$ und $f$ sowie einigen Umformungen erhält man:

$T={\cfrac {{\sqrt {n}}\cdot {\cfrac {{\bar {X}}-\mu }{\sigma }}}{\sqrt {{\cfrac {1}{n-1}}\cdot \left({\cfrac {n-1}{\sigma ^{2}}}\cdot S^{2}\right)}}}={\sqrt {n}}\cdot {\cfrac {{\bar {X}}-\mu }{S}}$

Verteilung des Stichprobenmittelwertes: Unterschied zwischen den Versionen

Aus MM*Stat

Aktuelle Version vom 22. November 2018, 15:26 Uhr

Inhaltsverzeichnis

Grundbegriffe

Verteilung des Stichprobenmittelwertes

Normalverteilte Zufallsvariable in der Grundgesamtheit

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist bekannt

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist unbekannt

Beliebig verteilte Zufallsvariable in der Grundgesamtheit

Zusatzinformationen

Berechnung von Wahrscheinlichkeiten

Zentrales Schwankungsintervall

Herleitung bei normalverteilter Zufallsvariable in der Grundgesamtheit

@@ Zeile 1: / Zeile 1: @@
 {{Stichprobentheorie}}
+{{SubpageToc|Beispiele}}
 =={{Vorlage:Überschrift}}==
@@ Zeile 214: / Zeile 215: @@
 <math>T=\cfrac{\sqrt{n}\cdot \cfrac{\bar{X}-\mu}{\sigma}}{\sqrt{\cfrac{1}{n-1}\cdot \left(\cfrac{n-1}{\sigma^{2}}\cdot S^{2}\right)
 }}=\sqrt{n}\cdot \cfrac{\bar{X}-\mu}{S}</math>
-=={{Vorlage:Beispiele}}==
-===Bruttostundenverdienst===
-Dieses Beispiel dient der formalen Erläuterung der [[Verteilung (stochastisch)|Verteilung]], des [[Erwartungswert des Stichprobenmittelwertes|Erwartungswert]]es und der [[Varianz des Stichprobenmittelwertes|Varianz]] des [[Stichprobenmittelwert]]es.
-Zu diesem Zweck müssen gewisse Informationen über die [[Grundgesamtheit]] gegeben sein, was bei tatsächlichen praktischen [[Stichprobenerhebung]]en natürlich nicht der Fall ist.
-Es sei nun angenommen: Der durchschnittliche Bruttostundenverdienst aller 5000 Arbeiter eines Unternehmens betrage 27,30 € mit einer [[Standardabweichung (stochastisch)|Standardabweichung]] von 5,90 €.
-====Einfache Zufallsstichprobe vom Umfang n====
-Es sei angenommen, dass die [[Zufallsvariable]] <math>X = </math> "Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen [[Normalverteilung|normalverteilt]] ist.
-Entsprechend diesen Informationen ist <math>X\sim N(27,3;5,9)\;</math>.
-Aus der [[Grundgesamtheit]] der Arbeiter dieses Unternehmens wird eine [[einfache Zufallsstichprobe]] vom Umfang <math>n</math> gezogen.
-Der [[Stichprobenmittelwert]] <math>\bar{X}</math> gibt damit den mittleren Bruttostundenverdienst für eine [[einfache Zufallsstichprobe]] von Arbeitern aus diesem Unternehmen an.
-Bestimmen Sie den [[Erwartungswert]], die [[Varianz (stochastisch)|Varianz]], die [[Standardabweichung (stochastisch)|Standardabweichung]] und die Form der [[Verteilung (stochastisch)|Verteilung]] von <math>\bar{X}</math> , wenn der [[Stichprobenumfang]]
-* <math>n = 10</math>,
-* <math>n = 50</math> und
-* <math>n = 200</math> ist.
-<U>Erwartungswert</U>
-Für alle [[Einfache Zufallsstichprobe|einfachen Zufallsstichproben]], gleichgültig welchen [[Stichprobenumfang]] sie haben, ergibt sich für den [[Erwartungswert des Stichprobenmittelwertes]]:
-<math>E\left[\bar{X}\right] = \mu = 27,30 \; \euro</math>
-<U>Varianz und Standardabweichung</U>
-Da eine [[einfache Zufallsstichprobe]] ([[Zufallsauswahlmodell mit Zurücklegen|Zufallsauswahl mit Zurücklegen]]) gezogen wird, ergibt sich die [[Varianz des Stichprobenmittelwertes]] gemäß <math>Var(\bar{X}) = \sigma^2  (\bar{X}) = \frac{\sigma^2 }{n}.</math>
-Somit ist
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 10</math>
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{10} = \frac{34,81}{10} = 3,481</math>
-: <math>\sigma (\bar{X}) = 1,8657 \; \euro</math>
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 50</math>
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{50} = \frac{34,81}{50} = 0,6962</math>
-: <math>\sigma (\bar{X}) = 0,8344 \; \euro</math>
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 200</math>
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{200} = \frac{34,81}{200} = 0,17405</math>
-: <math>\sigma (\bar{X}) = 0,4172 \; \euro</math>
-Deutlich wird, dass die [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\bar{X}</math> kleiner ist als die [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>X\;</math> in der [[Grundgesamtheit]].
-Weiterhin ist zu beobachten, dass der Wert der [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\bar{X}</math> von 1,8657 auf 0,8344 und dann auf 0,4172 fällt, wenn der [[Stichprobenumfang]] von 10 auf 50 und weiter auf 200 erhöht wird.
-Der fünffache [[Stichprobenumfang]] führt zu einer Verringerung der [[Standardabweichung (stochastisch)|Standardabweichung]] auf etwas unter die Hälfte.
-Eine zwanzigfach größere [[Stichprobe]] reduziert die [[Standardabweichung (stochastisch)|Standardabweichung]] auf unter 1/4.
-<U>Verteilung des Stichprobenmittelwertes</U>
-Da vorausgesetzt wurde, dass <math>X\;</math> in der [[Grundgesamtheit]] [[Normalverteilung|normalverteilt]] und die [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>X\;</math> bekannt ist, ist auch der [[Stichprobenmittelwert]] <math>\bar{X}</math> für alle [[Einfache Zufallsstichprobe|einfachen Zufallsstichproben]] mit den gegebenen [[Stichprobenumfang|Stichprobenumfängen]] [[Normalverteilung|normalverteilt]] mit dem [[Erwartungswert]] <math>E (\bar{X})</math> und der [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma ( \bar{X})</math>.
-Somit folgt:
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 10</math>
-: <math>\bar{X} \sim N ( 27,3 ; 1,8657 )</math>
-: In der Grafik entspricht die rote Kurve der [[Verteilung der Grundgesamtheit|Verteilung von <math>X\;</math> in der Grundgesamtheit]] und die blaue Kurve der Verteilung des Stichprobenmittelwertes.
-:{|
-|<R output="display">
-pdf(rpdf,width=7,height=7)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=1.8657), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-par(new=TRUE)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)
-</R>
-|}
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 50</math>
-: <math>\bar{X} \sim N ( 27,3 ; 0,8344 )</math>
-:{|
-|<R output="display">
-pdf(rpdf,height=7,width=7)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.8344), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-par(new=TRUE)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)
-</R>
-|}
-* für eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 200</math>
-: <math>\bar{X} \sim N ( 27,3 ; 0,4172 )</math>
-:{|
-|<R output="display">
-pdf(rpdf,width=7,height=7)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.4172), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-par(new=TRUE)
-curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
-legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)
-</R>
-|}
-====Uneingeschränkte Zufallsstichprobe vom Umfang n====
-Es sei angenommen, dass die [[Zufallsvariable]] <math>X =</math> „Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen [[Normalverteilung|normalverteilt]] ist.
-Entsprechend diesen Informationen ist
-<math>X \sim N ( 27,3 ; 5,9 )\;</math>.
-Aus der [[Grundgesamtheit]] der Arbeiter dieses Unternehmens wird eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> gezogen.
-Der [[Stichprobenmittelwert]] <math>\bar{X}</math> gibt damit den mittleren Bruttostundenverdienst für eine [[uneingeschränkte Zufallsstichprobe]] von Arbeitern aus diesem Unternehmen an.
-Bestimmen Sie den [[Erwartungswert]], die [[Varianz (stochastisch)|Varianz]] und die [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\bar{X}</math> , wenn der [[Stichprobenumfang]]
-* <math>n = 10</math>,
-* <math>n = 50</math> und
-* <math>n = 1000</math> ist.
-<U>Erwartungswert</U>
-Für alle [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]]n, gleichgültig welchen [[Stichprobenumfang]] sie haben, ergibt sich für den [[Erwartungswert des Stichprobenmittelwertes]] das gleiche Ergebnis wie bei der 1. Problemstellung:
-<math>E\left[ \bar{X}\right] = \mu = 27,30 \; \euro</math>
-<U>Varianz und Standardabweichung</U>
-Da eine [[uneingeschränkte Zufallsstichprobe]] ([[Zufallsauswahlmodell ohne Zurücklegen|Zufallsauswahl ohne Zurücklegen]]) gezogen wird, ergibt sich die [[Varianz des Stichprobenmittelwertes]] gemäß <math>\bar{X}</math>.
-Die [[Endlichkeitskorrektur]] kann jedoch bei einem [[Auswahlsatz]] von <math>\frac{n}{N} \leq 0,05</math> vernachlässigt werden.
-Somit ist
-* für eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 10</math>
-: Der [[Auswahlsatz]] beträgt  <math>\frac{n}{N} = \frac{10}{5000} = 0,002 < 0,05</math>, so dass näherungsweise die [[Varianz (stochastisch)|Varianz]] und die [[Standardabweichung (stochastisch)|Standardabweichung]] unter Verwendung der Formel
-: <math>Var (\bar{X} ) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{ n}</math>
-: berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{10} = \frac{34,81}{10} = 3,481</math>
-: <math>\sigma (\bar{X}) = 1,8657 \; \euro</math>
-: Zum Vergleich: Die Berechnung mit Berücksichtigung der [[Endlichkeitskorrektur]] ergibt
-: <math>Var (\bar{X}) = \sigma^2 ( \bar{X}) = 3,4747</math>  und  <math>\sigma (\bar{X}) = 1,8641 \; \euro</math>, was die vernachlässigbaren Differenzen verdeutlicht.
-* für eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 50</math>
-: Der [[Auswahlsatz]] beträgt <math>\frac{n }{N} = \frac{50}{5000} = 0,01 < 0,05</math>, so dass auch hier näherungsweise die [[Varianz (stochastisch)|Varianz]] und die [[Standardabweichung (stochastisch)|Standardabweichung]] unter Verwendung der Formel
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{n}</math>
-: berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{50} = \frac{34,81}{50} = 0,6962</math>
-: <math>\sigma ( \bar{X}) = 0,8344 \; \euro</math>
-: Zum Vergleich: Die Berechnung mit Berücksichtigung der [[Endlichkeitskorrektur]] ergibt
-: <math>Var (\bar{X}) = \sigma^2 ( \bar{X}) = 0,6894</math>   und <math>\sigma (\bar{X}) = 0,8303 \; \euro</math> .
-* für eine [[uneingeschränkte Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 1000</math>
-: Der [[Auswahlsatz]] beträgt <math>\frac{n }{N} = \frac{1000 }{ 5000} = 0,2 > 0,05</math>, so dass [[Varianz (stochastisch)|Varianz]] und [[Standardabweichung (stochastisch)|Standardabweichung]] mit Berücksichtigung der [[Endlichkeitskorrektur]] ermittelt werden müssen:
-: <math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^{2}}{n}\cdot\frac{N-n}{N-1} = \frac{5,9^2}{1000} \cdot \frac{5000 - 1000}{5000 - 1} = \frac{34,81}{1000} \cdot 0,80016 = 0,0279</math>
-: und <math>\sigma(\bar{X}) = 0,1669 \; \euro.</math>
-====Zufallsstichprobe vom Umfang n====
-Es wird nun der realistischere Fall angenommen, dass die [[Verteilung (stochastisch)|Verteilung]] der [[Zufallsvariable]]n <math>X = </math>„Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen unbekannt ist.
-Entsprechend den verfügbaren Informationen ist <math>E[ X ] = \mu = 27,30 \; \euro</math> und <math>\sigma ( X ) = 5,90 \; \euro</math>
-Aus der [[Grundgesamtheit]] der Arbeiter dieses Unternehmens wird eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> gezogen.
-Der [[Stichprobenmittelwert]] <math>\bar{X}</math> gibt damit den mittleren Bruttostundenverdienst für eine [[Zufallsstichprobe]] von Arbeitern aus diesem Unternehmen an.
-Bestimmen Sie den [[Erwartungswert]], die [[Varianz (stochastisch)|Varianz]], die [[Standardabweichung (stochastisch)|Standardabweichung]] und die Form der [[Verteilung (stochastisch)|Verteilung]] von <math>\bar{X}</math> , wenn der [[Stichprobenumfang]]
-* <math>n = 10</math>,
-* <math>n = 50</math> und
-* <math>n = 200</math> ist.
-<U>Erwartungswert</U>
-Die Berechnung des [[Erwartungswert]]es <math>E\left[\bar{X}\right]</math> hängt nicht von der [[Verteilung der Grundgesamtheit|Verteilung von <math>X\;</math> in der Grundgesamtheit]] ab.
-Es ergeben sich deshalb keine neuen Aspekte. Die Ergebnisse sind wie bei der 1. und 2. Problemstellung:
-<math>E \left[ \bar{X} \right]= \mu = 27,30 \; \euro</math>
-<U>Varianz und Standardabweichung</U>
-Die Berechnung der [[Varianz (stochastisch)|Varianz]] und der [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\bar{X}</math> hängt nicht von der [[Verteilung der Grundgesamtheit|Verteilung von <math>X\;</math> in der Grundgesamtheit]] ab, jedoch von der Art und dem [[Stichprobenumfang|Umfang]] der [[Zufallsstichprobe]].
-Bei der 3. Problemstellung wurde die Art der [[Zufallsstichprobe]] offen gelassen. Bei allen drei angegebenen [[Stichprobenumfang|Stichprobenumfängen]] ist jedoch der [[Auswahlsatz]] <math>\frac{n}{N} < 0,05</math>, so dass selbst bei einer [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]] näherungsweise mit der Formel
-<math>Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{n}</math>
-gearbeitet werden kann.
-* für <math>n = 10</math>:
-: <math>Var (\bar{X}) = \sigma^2(\bar{X}) = 3,481 </math>
-: <math>\sigma ( \bar{X}) = 1,8657 \; \euro</math>
-* für <math>n = 50</math>:
-: <math>Var (\bar{X}) = \sigma^2(\bar{X}) = 0,6962  </math>
-: <math>\sigma ( \bar{X}) = 0,8344 \; \euro</math>
-* für <math>n = 200</math>:
-: <math>Var (\bar{X}) = \sigma^2(\bar{X}) = 0,17405 </math>
-: <math>\sigma ( \bar{X}) = 0,4172 \; \euro</math>
-<U>Verteilung des Stichprobenmittelwertes</U>
-Da die [[Verteilung der Grundgesamtheit|Verteilung von <math>X\;</math> in der Grundgesamtheit]] unbekannt ist, kann keine exakte Aussage über die [[Verteilung der Grundgesamtheit|Verteilung]]  von <math>\bar{X}</math> getroffen werden.
-Aufgrund des [[Zentraler Grenzwertsatz|zentralen Grenzwertsatzes]] folgt jedoch, dass die [[Standardisierung|standardisiert]]e [[Zufallsvariable]] <math>Z\;</math>
-<math>Z= \frac{\bar{X}-\mu}{\sigma} \cdot \sqrt{n}</math>  bzw.  <math> Z=\frac{\bar{X}-\mu}{\sigma \cdot \sqrt{\cfrac{N-n}{N-1}}} \cdot \sqrt{n}</math>
-[[Approximation|approximativ]] [[Standardnormalverteilung|standardnormalverteilt]] ist, wenn der [[Stichprobenumfang]] <math>n > 30</math> und bei einer [[uneingeschränkte Zufallsstichprobe|uneingeschränkten Zufallsstichprobe]] der Umfang <math>N</math> der [[Grundgesamtheit]] hinreichend groß.
-Dies gilt für die Fälle <math>n = 50</math> und <math>n = 200</math>.

Verteilung des Stichprobenmittelwertes: Unterschied zwischen den Versionen

Aus MM*Stat

Aktuelle Version vom 22. November 2018, 15:26 Uhr

Grundbegriffe

Verteilung des Stichprobenmittelwertes

Normalverteilte Zufallsvariable in der Grundgesamtheit

Die Varianz der Grundgesamtheit σ2{\displaystyle \sigma ^{2}} ist bekannt

Die Varianz der Grundgesamtheit σ2{\displaystyle \sigma ^{2}} ist unbekannt

Beliebig verteilte Zufallsvariable in der Grundgesamtheit

Zusatzinformationen

Berechnung von Wahrscheinlichkeiten

Zentrales Schwankungsintervall

Herleitung bei normalverteilter Zufallsvariable in der Grundgesamtheit

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist bekannt

Die Varianz der Grundgesamtheit $\sigma ^{2}$ ist unbekannt