Verteilung des Stichprobenmittelwertes/Beispiele

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Bruttostundenverdienst

Dieses Beispiel dient der formalen Erläuterung der Verteilung, des Erwartungswertes und der Varianz des Stichprobenmittelwertes.

Zu diesem Zweck müssen gewisse Informationen über die Grundgesamtheit gegeben sein, was bei tatsächlichen praktischen Stichprobenerhebungen natürlich nicht der Fall ist.

Es sei nun angenommen: Der durchschnittliche Bruttostundenverdienst aller 5000 Arbeiter eines Unternehmens betrage 27,30 € mit einer Standardabweichung von 5,90 €.

Einfache Zufallsstichprobe vom Umfang n

Es sei angenommen, dass die Zufallsvariable X = "Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen normalverteilt ist.

Entsprechend diesen Informationen ist X\sim N(27,3;5,9)\;.

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine einfache Zufallsstichprobe vom Umfang n gezogen.

Der Stichprobenmittelwert \bar{X} gibt damit den mittleren Bruttostundenverdienst für eine einfache Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz, die Standardabweichung und die Form der Verteilung von \bar{X} , wenn der Stichprobenumfang

  • n = 10,
  • n = 50 und
  • n = 200 ist.

Erwartungswert

Für alle einfachen Zufallsstichproben, gleichgültig welchen Stichprobenumfang sie haben, ergibt sich für den Erwartungswert des Stichprobenmittelwertes:

E\left[\bar{X}\right] = \mu = 27,30 \; \euro

Varianz und Standardabweichung

Da eine einfache Zufallsstichprobe (Zufallsauswahl mit Zurücklegen) gezogen wird, ergibt sich die Varianz des Stichprobenmittelwertes gemäß Var(\bar{X}) = \sigma^2  (\bar{X}) = \frac{\sigma^2 }{n}.

Somit ist

Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{10} = \frac{34,81}{10} = 3,481
\sigma (\bar{X}) = 1,8657 \; \euro
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{50} = \frac{34,81}{50} = 0,6962
\sigma (\bar{X}) = 0,8344 \; \euro
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{200} = \frac{34,81}{200} = 0,17405
\sigma (\bar{X}) = 0,4172 \; \euro

Deutlich wird, dass die Standardabweichung von \bar{X} kleiner ist als die Standardabweichung von X\; in der Grundgesamtheit.

Weiterhin ist zu beobachten, dass der Wert der Standardabweichung von \bar{X} von 1,8657 auf 0,8344 und dann auf 0,4172 fällt, wenn der Stichprobenumfang von 10 auf 50 und weiter auf 200 erhöht wird.

Der fünffache Stichprobenumfang führt zu einer Verringerung der Standardabweichung auf etwas unter die Hälfte.

Eine zwanzigfach größere Stichprobe reduziert die Standardabweichung auf unter 1/4.

Verteilung des Stichprobenmittelwertes

Da vorausgesetzt wurde, dass X\; in der Grundgesamtheit normalverteilt und die Standardabweichung von X\; bekannt ist, ist auch der Stichprobenmittelwert \bar{X} für alle einfachen Zufallsstichproben mit den gegebenen Stichprobenumfängen normalverteilt mit dem Erwartungswert E (\bar{X}) und der Standardabweichung \sigma ( \bar{X}).

Somit folgt:

\bar{X} \sim N ( 27,3 ; 1,8657 )
In der Grafik entspricht die rote Kurve der Verteilung von X\; in der Grundgesamtheit und die blaue Kurve der Verteilung des Stichprobenmittelwertes.
<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=1.8657), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

\bar{X} \sim N ( 27,3 ; 0,8344 )
<R output="display">

pdf(rpdf,height=7,width=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.8344), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

\bar{X} \sim N ( 27,3 ; 0,4172 )
<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.4172), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

Uneingeschränkte Zufallsstichprobe vom Umfang n

Es sei angenommen, dass die Zufallsvariable X = „Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen normalverteilt ist.

Entsprechend diesen Informationen ist

X \sim N ( 27,3 ; 5,9 )\;.

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine uneingeschränkte Zufallsstichprobe vom Umfang n gezogen.

Der Stichprobenmittelwert \bar{X} gibt damit den mittleren Bruttostundenverdienst für eine uneingeschränkte Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz und die Standardabweichung von \bar{X} , wenn der Stichprobenumfang

  • n = 10,
  • n = 50 und
  • n = 1000 ist.

Erwartungswert

Für alle uneingeschränkten Zufallsstichproben, gleichgültig welchen Stichprobenumfang sie haben, ergibt sich für den Erwartungswert des Stichprobenmittelwertes das gleiche Ergebnis wie bei der 1. Problemstellung:

E\left[ \bar{X}\right] = \mu = 27,30 \; \euro

Varianz und Standardabweichung

Da eine uneingeschränkte Zufallsstichprobe (Zufallsauswahl ohne Zurücklegen) gezogen wird, ergibt sich die Varianz des Stichprobenmittelwertes gemäß \bar{X}.

Die Endlichkeitskorrektur kann jedoch bei einem Auswahlsatz von \frac{n}{N} \leq 0,05 vernachlässigt werden.

Somit ist

Der Auswahlsatz beträgt \frac{n}{N} = \frac{10}{5000} = 0,002 < 0,05, so dass näherungsweise die Varianz und die Standardabweichung unter Verwendung der Formel
Var (\bar{X} ) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{ n}
berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{10} = \frac{34,81}{10} = 3,481
\sigma (\bar{X}) = 1,8657 \; \euro
Zum Vergleich: Die Berechnung mit Berücksichtigung der Endlichkeitskorrektur ergibt
Var (\bar{X}) = \sigma^2 ( \bar{X}) = 3,4747 und \sigma (\bar{X}) = 1,8641 \; \euro, was die vernachlässigbaren Differenzen verdeutlicht.
Der Auswahlsatz beträgt \frac{n }{N} = \frac{50}{5000} = 0,01 < 0,05, so dass auch hier näherungsweise die Varianz und die Standardabweichung unter Verwendung der Formel
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{n}
berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{5,9^2}{50} = \frac{34,81}{50} = 0,6962
\sigma ( \bar{X}) = 0,8344 \; \euro
Zum Vergleich: Die Berechnung mit Berücksichtigung der Endlichkeitskorrektur ergibt
Var (\bar{X}) = \sigma^2 ( \bar{X}) = 0,6894 und \sigma (\bar{X}) = 0,8303 \; \euro .
Der Auswahlsatz beträgt \frac{n }{N} = \frac{1000 }{ 5000} = 0,2 > 0,05, so dass Varianz und Standardabweichung mit Berücksichtigung der Endlichkeitskorrektur ermittelt werden müssen:
Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^{2}}{n}\cdot\frac{N-n}{N-1} = \frac{5,9^2}{1000} \cdot \frac{5000 - 1000}{5000 - 1} = \frac{34,81}{1000} \cdot 0,80016 = 0,0279
und \sigma(\bar{X}) = 0,1669 \; \euro.

Zufallsstichprobe vom Umfang n

Es wird nun der realistischere Fall angenommen, dass die Verteilung der Zufallsvariablen X = „Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen unbekannt ist.

Entsprechend den verfügbaren Informationen ist E[ X ] = \mu = 27,30 \; \euro und \sigma ( X ) = 5,90 \; \euro

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine Zufallsstichprobe vom Umfang n gezogen.

Der Stichprobenmittelwert \bar{X} gibt damit den mittleren Bruttostundenverdienst für eine Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz, die Standardabweichung und die Form der Verteilung von \bar{X} , wenn der Stichprobenumfang

  • n = 10,
  • n = 50 und
  • n = 200 ist.

Erwartungswert

Die Berechnung des Erwartungswertes E\left[\bar{X}\right] hängt nicht von der Verteilung von X\; in der Grundgesamtheit ab.

Es ergeben sich deshalb keine neuen Aspekte. Die Ergebnisse sind wie bei der 1. und 2. Problemstellung:

E \left[ \bar{X} \right]= \mu = 27,30 \; \euro

Varianz und Standardabweichung

Die Berechnung der Varianz und der Standardabweichung von \bar{X} hängt nicht von der Verteilung von X\; in der Grundgesamtheit ab, jedoch von der Art und dem Umfang der Zufallsstichprobe.

Bei der 3. Problemstellung wurde die Art der Zufallsstichprobe offen gelassen. Bei allen drei angegebenen Stichprobenumfängen ist jedoch der Auswahlsatz \frac{n}{N} < 0,05, so dass selbst bei einer uneingeschränkten Zufallsstichprobe näherungsweise mit der Formel

Var (\bar{X}) = \sigma^2 (\bar{X}) = \frac{\sigma^2}{n}

gearbeitet werden kann.

  • für n = 10:
Var (\bar{X}) = \sigma^2(\bar{X}) = 3,481
\sigma ( \bar{X}) = 1,8657 \; \euro
  • für n = 50:
Var (\bar{X}) = \sigma^2(\bar{X}) = 0,6962
\sigma ( \bar{X}) = 0,8344 \; \euro
  • für n = 200:
Var (\bar{X}) = \sigma^2(\bar{X}) = 0,17405
\sigma ( \bar{X}) = 0,4172 \; \euro

Verteilung des Stichprobenmittelwertes

Da die Verteilung von X\; in der Grundgesamtheit unbekannt ist, kann keine exakte Aussage über die Verteilung von \bar{X} getroffen werden.

Aufgrund des zentralen Grenzwertsatzes folgt jedoch, dass die standardisierte Zufallsvariable Z\;

Z= \frac{\bar{X}-\mu}{\sigma} \cdot \sqrt{n} bzw.  Z=\frac{\bar{X}-\mu}{\sigma \cdot \sqrt{\cfrac{N-n}{N-1}}} \cdot \sqrt{n}

approximativ standardnormalverteilt ist, wenn der Stichprobenumfang n > 30 und bei einer uneingeschränkten Zufallsstichprobe der Umfang N der Grundgesamtheit hinreichend groß.

Dies gilt für die Fälle n = 50 und n = 200.