Verteilung des Stichprobenmittelwertes

Aus MM*Stat

Version vom 18. Mai 2018, 13:42 Uhr von Jacobdan (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Stichprobentheorie}} =={{Vorlage:Überschrift}}== ===Verteilung des Stichprobenmittelwertes=== Entscheidend für Aussagen über die ''Verteilung <math>F(\…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Stichprobentheorie

Stichprobentheorie • Stichprobe • Verteilung der Grundgesamtheit • Stichprobenvariable • Stichprobenfunktion • Zufallsauswahlmodelle • Stichprobenmittelwert • Schwaches Gesetz der großen Zahlen • Verteilung des Stichprobenmittelwertes • Verteilung der Stichprobenvarianz • Verteilung des Stichprobenanteilswertes • Multiple Choice • Video • Aufgaben • Lösungen
Anteilswert der Grundgesamtheit • Auswahlsatz • Einfache Zufallsauswahl • Einfache Zufallsstichprobe • Erwartungswert der Grundgesamtheit • Erwartungswert des Stichprobenmittelwertes • Induktiver Schluss • Mittelwert der Grundgesamtheit • Parameter der Grundgesamtheit • Parameter des Stichprobenmittelwertes • Standardabweichung des Stichprobenmittelwertes • Standardfehler • Statistisches Element • Stichprobenanteilswert • Stichprobengröße • Stichprobenumfang • Stichprobenwerte • Stichprobenvarianz • Stichprobenverteilung • Uneingeschränkte Zufallsauswahl • Uneingeschränkte Zufallsstichprobe • Varianz der Grundgesamtheit • Varianz des Stichprobenmittelwertes • Varianzhomogenität • Varianzheterogenität • Verteilung einer Stichprobenfunktion • Zufallsauswahl • Zufallsauswahlmodell mit Zurücklegen • Zufallsauswahlmodell ohne Zurücklegen • Zufallsstichprobe

Grundbegriffe

Verteilung des Stichprobenmittelwertes

Entscheidend für Aussagen über die Verteilung des Stichprobenmittelwertes ist die Verteilung der Zufallsvariablen in der Grundgesamtheit und ob darüber Kenntnisse existieren oder nicht.

Normalverteilte Zufallsvariable in der Grundgesamtheit

Es wird angenommen, dass die Zufallsvariable in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert und der Varianz folgt:

Die Varianz der Grundgesamtheit ist bekannt

Ist das Merkmal der Grundgesamtheit -verteilt und ist bekannt, so ist bei einer einfachen Zufallsstichprobe die Stichprobenfunktion normalverteilt:

und die standardisierte Zufallsvariable

standardnormalverteilt: .

Die Varianz der Grundgesamtheit ist unbekannt

Wenn der Grundgesamtheit unbekannt ist, muss sie unter Verwendung der Stichprobenfunktion

aus der Stichprobe geschätzt werden.

Dann ist jedoch keine Aussage über die Verteilung von möglich, sondern nur noch über die Verteilung der standardisierten Zufallsvariable

Die Zufallsvariable folgt bei einer einfachen Zufallsstichprobe einer t-Verteilung mit dem Parameter :

Der Parameter ist die Anzahl der Freiheitsgrade der Zufallsvariablen .

Die t-Verteilung konvergiert für gegen die Standardnormalverteilung.

Für wird bereits eine relativ gute Näherung an die Standardnormalverteilung erreicht, so dass anstatt der t-Verteilung approximativ die Standardnormalverteilung verwendet werden kann:

für .

Beliebig verteilte Zufallsvariable in der Grundgesamtheit

Hierbei handelt es sich um den für die empirische Wirtschaftsforschung wesentlich relevanteren Fall, da viele interessierende Merkmale der Grundgesamtheit nicht einmal annähernd normalverteilt sind bzw. Unkenntnis über die Verteilung der Zufallsvariablen in der Grundgesamtheit besteht.

Gegeben seien identisch, jedoch unbekannt verteilte Stichprobenvariablen mit und .

Auf Grund des zentralen Grenzwertsatzes können folgende Aussagen getroffen werden:

für genügend großen Stichprobenumfang approximativ standardnormalverteilt.
für genügend großen Stichprobenumfang approximativ standardnormalverteilt.
bzw.
für hinreichend großen Umfang der Grundgesamtheit und genügend großen Stichprobenumfang approximativ standardnormalverteilt.
Als Faustregel für die Verwendung der Normalverteilung gilt: .

Zusatzinformationen

Berechnung von Wahrscheinlichkeiten

Ist normalverteilt und sind und bekannt, so lässt sich die Wahrscheinlichkeit,

  • dass Werte kleiner oder gleich einem vorgegebenen Wert annimmt, berechnen als:
  • dass Werte in einem Intervall annimmt, berechnen als:
wobei die Verteilungsfunktion der Standardnormalverteilung kennzeichnet.
Diese Wahrscheinlichkeitsberechnungen gelten approximativ, wenn beliebig verteilt und der Stichprobenumfang hinreichend groß ist.

Zentrales Schwankungsintervall

Ein zentrales Schwankungsintervall um den bekannten Erwartungswert des Stichprobenmittelwertes ist ein Bereich mit festen Grenzen

,

in dem Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit annimmt:

Mit dem Übergang zur standardisierten Zufallsvariablen folgt:

und

Die Abweichung von wird somit als Vielfaches der Standardabweichung bestimmt.

Setzt man ein, so erhält man für das zentrale Schwankungsintervall

mit der Sicherheitswahrscheinlichkeit

Sind und bekannt und ist die Zufallsvariable in der Grundgesamtheit normalverteilt, so kann das zentrale Schwankungsintervall zur vorgegebenen Sicherheitswahrscheinlichkeit bestimmt werden, indem aus der Tabelle der Verteilungsfunktion der entnommen wird.

Die Wahrscheinlichkeit gilt approximativ, wenn beliebig verteilt und der Stichprobenumfang genügend groß ist.

Herleitung bei normalverteilter Zufallsvariable in der Grundgesamtheit

Es sei eine Grundgesamtheit mit der Verteilung , dem Erwartungswert und der Varianz vorausgesetzt.

Die Stichprobenvariablen besitzen alle die gleiche Verteilung , den Erwartungswert und die Varianz .

Es wird angenommen, dass die Zufallsvariable in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert und der Varianz folgt:

.

Dann sind die Stichprobenvariablen ebenfalls identisch normalverteilt:

für alle .

Die Summe von unabhängigen, normalverteilten Zufallsvariablen ist aufgrund der Reproduktivitätseigenschaft der Normalverteilung auch normalverteilt:

Der Stichprobenmittelwert unterscheidet sich nur um den konstanten Faktor von der Summe , so dass er ebenfalls normalverteilt ist:

.

Da jedoch nur die Standardnormalverteilung tabelliert vorliegt, geht man zur standardisierten Zufallsvariablen

über, die dann standardnormalverteilt ist: .

Wie ersichtlich, setzt die Verwendung der Standardnormalverteilung die Kenntnis der Varianz der Grundgesamtheit voraus, um die standardisierte Zufallsvariable bestimmen zu können.

Die Varianz der Grundgesamtheit ist unbekannt:

Die unbekannte Varianz der Grundgesamtheit wird mittels der Stichprobenfunktion

geschätzt. Dividiert man beide Seiten durch , folgt

Dies ist äquivalent zu:

Zur Vereinfachung sei gesetzt.

Bei einer einfachen Zufallsstichprobe sind die Stichprobenvariablen unabhängig voneinander, so dass die Summe von quadrierten unabhängigen standardnormalverteilten Zufallsvariablen ist.

Eine derartig definierte Zufallsvariable folgt einer Chi-Quadrat-Verteilung mit dem Parameter .

Bildet man unter Verwendung der obigen standardisierten Zufallsvariablen das Verhältnis

,

so folgt die Zufallsvariable einer t-Verteilung mit dem Parameter , da im Zähler eine standardnormalverteilte Zufallsvariable und im Nenner eine von unabhängige Chi-Quadrat-verteilte Zufallsvariable gegeben ist.

Nach Einsetzen von , und sowie einigen Umformungen erhält man:

Beispiele

Bruttostundenverdienst

Dieses Beispiel dient der formalen Erläuterung der Verteilung, des Erwartungswertes und der Varianz des Stichprobenmittelwertes.

Zu diesem Zweck müssen gewisse Informationen über die Grundgesamtheit gegeben sein, was bei tatsächlichen praktischen Stichprobenerhebungen natürlich nicht der Fall ist.

Es sei nun angenommen: Der durchschnittliche Bruttostundenverdienst aller 5000 Arbeiter eines Unternehmens betrage 27,30 € mit einer Standardabweichung von 5,90 €.

Einfache Zufallsstichprobe vom Umfang n

Es sei angenommen, dass die Zufallsvariable "Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen normalverteilt ist.

Entsprechend diesen Informationen ist .

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine einfache Zufallsstichprobe vom Umfang gezogen.

Der Stichprobenmittelwert gibt damit den mittleren Bruttostundenverdienst für eine einfache Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz, die Standardabweichung und die Form der Verteilung von , wenn der Stichprobenumfang

  • ,
  • und
  • ist.

Erwartungswert

Für alle einfachen Zufallsstichproben, gleichgültig welchen Stichprobenumfang sie haben, ergibt sich für den Erwartungswert des Stichprobenmittelwertes:

Varianz und Standardabweichung

Da eine einfache Zufallsstichprobe (Zufallsauswahl mit Zurücklegen) gezogen wird, ergibt sich die Varianz des Stichprobenmittelwertes gemäß

Somit ist

Deutlich wird, dass die Standardabweichung von kleiner ist als die Standardabweichung von in der Grundgesamtheit.

Weiterhin ist zu beobachten, dass der Wert der Standardabweichung von von 1,8657 auf 0,8344 und dann auf 0,4172 fällt, wenn der Stichprobenumfang von 10 auf 50 und weiter auf 200 erhöht wird.

Der fünffache Stichprobenumfang führt zu einer Verringerung der Standardabweichung auf etwas unter die Hälfte.

Eine zwanzigfach größere Stichprobe reduziert die Standardabweichung auf unter 1/4.

Verteilung des Stichprobenmittelwertes

Da vorausgesetzt wurde, dass in der Grundgesamtheit normalverteilt und die Standardabweichung von bekannt ist, ist auch der Stichprobenmittelwert für alle einfachen Zufallsstichproben mit den gegebenen Stichprobenumfängen normalverteilt mit dem Erwartungswert und der Standardabweichung .

Somit folgt:

In der Grafik entspricht die rote Kurve der Verteilung von in der Grundgesamtheit und die blaue Kurve der Verteilung des Stichprobenmittelwertes.
<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=1.8657), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.25), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

<R output="display">

pdf(rpdf,height=7,width=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.8344), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,0.5), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

<R output="display">

pdf(rpdf,width=7,height=7)

curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=0.4172), ylab="",xlab="Bruttostundenverdienst", col="blue", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") par(new=TRUE) curve(from=7.3, to=47.3, dnorm(x, mean=27.3, sd=5.9), ylab="", xlab="Bruttostundenverdienst", col="red", ylim=c(0.00,1), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") legend("topright", lwd=4, col=c("red","blue"),c("Verteilung von X", "Stichprobenverteilung"), bty="n", cex=1.2)

</R>

Uneingeschränkte Zufallsstichprobe vom Umfang n

Es sei angenommen, dass die Zufallsvariable „Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen normalverteilt ist.

Entsprechend diesen Informationen ist

.

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine uneingeschränkte Zufallsstichprobe vom Umfang gezogen.

Der Stichprobenmittelwert gibt damit den mittleren Bruttostundenverdienst für eine uneingeschränkte Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz und die Standardabweichung von , wenn der Stichprobenumfang

  • ,
  • und
  • ist.

Erwartungswert

Für alle uneingeschränkten Zufallsstichproben, gleichgültig welchen Stichprobenumfang sie haben, ergibt sich für den Erwartungswert des Stichprobenmittelwertes das gleiche Ergebnis wie bei der 1. Problemstellung:

Varianz und Standardabweichung

Da eine uneingeschränkte Zufallsstichprobe (Zufallsauswahl ohne Zurücklegen) gezogen wird, ergibt sich die Varianz des Stichprobenmittelwertes gemäß .

Die Endlichkeitskorrektur kann jedoch bei einem Auswahlsatz von vernachlässigt werden.

Somit ist

Der Auswahlsatz beträgt , so dass näherungsweise die Varianz und die Standardabweichung unter Verwendung der Formel
berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
Zum Vergleich: Die Berechnung mit Berücksichtigung der Endlichkeitskorrektur ergibt
und , was die vernachlässigbaren Differenzen verdeutlicht.
Der Auswahlsatz beträgt , so dass auch hier näherungsweise die Varianz und die Standardabweichung unter Verwendung der Formel
berechnet wird. Damit ergibt sich das gleiche Ergebnis wie bei der 1. Problemstellung:
Zum Vergleich: Die Berechnung mit Berücksichtigung der Endlichkeitskorrektur ergibt
und .
Der Auswahlsatz beträgt , so dass Varianz und Standardabweichung mit Berücksichtigung der Endlichkeitskorrektur ermittelt werden müssen:
und

Zufallsstichprobe vom Umfang n

Es wird nun der realistischere Fall angenommen, dass die Verteilung der Zufallsvariablen „Bruttostundenverdienst eines Arbeiters" in diesem Unternehmen unbekannt ist.

Entsprechend den verfügbaren Informationen ist und

Aus der Grundgesamtheit der Arbeiter dieses Unternehmens wird eine Zufallsstichprobe vom Umfang gezogen.

Der Stichprobenmittelwert gibt damit den mittleren Bruttostundenverdienst für eine Zufallsstichprobe von Arbeitern aus diesem Unternehmen an.

Bestimmen Sie den Erwartungswert, die Varianz, die Standardabweichung und die Form der Verteilung von , wenn der Stichprobenumfang

  • ,
  • und
  • ist.

Erwartungswert

Die Berechnung des Erwartungswertes hängt nicht von der Verteilung von in der Grundgesamtheit ab.

Es ergeben sich deshalb keine neuen Aspekte. Die Ergebnisse sind wie bei der 1. und 2. Problemstellung:

Varianz und Standardabweichung

Die Berechnung der Varianz und der Standardabweichung von hängt nicht von der Verteilung von in der Grundgesamtheit ab, jedoch von der Art und dem Umfang der Zufallsstichprobe.

Bei der 3. Problemstellung wurde die Art der Zufallsstichprobe offen gelassen. Bei allen drei angegebenen Stichprobenumfängen ist jedoch der Auswahlsatz , so dass selbst bei einer uneingeschränkten Zufallsstichprobe näherungsweise mit der Formel

gearbeitet werden kann.

  • für :
  • für :
  • für :

Verteilung des Stichprobenmittelwertes

Da die Verteilung von in der Grundgesamtheit unbekannt ist, kann keine exakte Aussage über die Verteilung von getroffen werden.

Aufgrund des zentralen Grenzwertsatzes folgt jedoch, dass die standardisierte Zufallsvariable

bzw.

approximativ standardnormalverteilt ist, wenn der Stichprobenumfang und bei einer uneingeschränkten Zufallsstichprobe der Umfang der Grundgesamtheit hinreichend groß.

Dies gilt für die Fälle und .