Grundbegriffe
Verteilung des Stichprobenmittelwertes
Entscheidend für Aussagen über die Verteilung des Stichprobenmittelwertes ist die Verteilung der Zufallsvariablen in der Grundgesamtheit und ob darüber Kenntnisse existieren oder nicht.
Normalverteilte Zufallsvariable in der Grundgesamtheit
Es wird angenommen, dass die Zufallsvariable in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert und der Varianz folgt:
Die Varianz der Grundgesamtheit ist bekannt
Ist das Merkmal der Grundgesamtheit -verteilt und ist bekannt, so ist bei einer einfachen Zufallsstichprobe die Stichprobenfunktion normalverteilt:
und die standardisierte Zufallsvariable
standardnormalverteilt: .
Die Varianz der Grundgesamtheit ist unbekannt
Wenn der Grundgesamtheit unbekannt ist, muss sie unter Verwendung der Stichprobenfunktion
aus der Stichprobe geschätzt werden.
Dann ist jedoch keine Aussage über die Verteilung von möglich, sondern nur noch über die Verteilung der standardisierten Zufallsvariable
Die Zufallsvariable folgt bei einer einfachen Zufallsstichprobe einer t-Verteilung mit dem Parameter :
Der Parameter ist die Anzahl der Freiheitsgrade der Zufallsvariablen .
Die t-Verteilung konvergiert für gegen die Standardnormalverteilung.
Für wird bereits eine relativ gute Näherung an die Standardnormalverteilung erreicht, so dass anstatt der t-Verteilung approximativ die Standardnormalverteilung verwendet werden kann:
für .
Beliebig verteilte Zufallsvariable in der Grundgesamtheit
Hierbei handelt es sich um den für die empirische Wirtschaftsforschung wesentlich relevanteren Fall, da viele interessierende Merkmale der Grundgesamtheit nicht einmal annähernd normalverteilt sind bzw. Unkenntnis über die Verteilung der Zufallsvariablen in der Grundgesamtheit besteht.
Gegeben seien identisch, jedoch unbekannt verteilte Stichprobenvariablen mit und .
Auf Grund des zentralen Grenzwertsatzes können folgende Aussagen getroffen werden:
- für genügend großen Stichprobenumfang approximativ standardnormalverteilt.
- für genügend großen Stichprobenumfang approximativ standardnormalverteilt.
- bzw.
- für hinreichend großen Umfang der Grundgesamtheit und genügend großen Stichprobenumfang approximativ standardnormalverteilt.
- Als Faustregel für die Verwendung der Normalverteilung gilt: .
Zusatzinformationen
Berechnung von Wahrscheinlichkeiten
Ist normalverteilt und sind und bekannt, so lässt sich die Wahrscheinlichkeit,
- dass Werte kleiner oder gleich einem vorgegebenen Wert annimmt, berechnen als:
- dass Werte in einem Intervall annimmt, berechnen als:
- wobei die Verteilungsfunktion der Standardnormalverteilung kennzeichnet.
- Diese Wahrscheinlichkeitsberechnungen gelten approximativ, wenn beliebig verteilt und der Stichprobenumfang hinreichend groß ist.
Zentrales Schwankungsintervall
Ein zentrales Schwankungsintervall um den bekannten Erwartungswert des Stichprobenmittelwertes ist ein Bereich mit festen
Grenzen
,
in dem Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit annimmt:
Mit dem Übergang zur standardisierten Zufallsvariablen folgt:
|
|
|
|
|
|
|
|
|
|
und
|
|
|
|
Die Abweichung von wird somit als Vielfaches der Standardabweichung bestimmt.
Setzt man ein, so erhält man für das zentrale Schwankungsintervall
mit der Sicherheitswahrscheinlichkeit
Sind und bekannt und ist die Zufallsvariable in der Grundgesamtheit normalverteilt, so kann das zentrale Schwankungsintervall zur vorgegebenen
Sicherheitswahrscheinlichkeit bestimmt werden, indem aus der Tabelle der Verteilungsfunktion der entnommen wird.
Die Wahrscheinlichkeit gilt approximativ, wenn beliebig verteilt und der Stichprobenumfang genügend groß ist.
Herleitung bei normalverteilter Zufallsvariable in der Grundgesamtheit
Es sei eine Grundgesamtheit mit der Verteilung , dem Erwartungswert und der Varianz vorausgesetzt.
Die Stichprobenvariablen besitzen alle die gleiche Verteilung , den Erwartungswert und die Varianz .
Es wird angenommen, dass die Zufallsvariable in der Grundgesamtheit einer Normalverteilung mit dem Erwartungswert und der Varianz folgt:
.
Dann sind die Stichprobenvariablen ebenfalls identisch normalverteilt:
für alle .
Die Summe von unabhängigen, normalverteilten Zufallsvariablen ist aufgrund der Reproduktivitätseigenschaft der Normalverteilung auch normalverteilt:
Der Stichprobenmittelwert unterscheidet sich nur um den konstanten Faktor von der Summe , so dass er ebenfalls normalverteilt ist:
.
Da jedoch nur die Standardnormalverteilung tabelliert vorliegt, geht man zur standardisierten Zufallsvariablen
über, die dann standardnormalverteilt ist: .
Wie ersichtlich, setzt die Verwendung der Standardnormalverteilung die Kenntnis der Varianz der Grundgesamtheit voraus, um die standardisierte Zufallsvariable bestimmen zu können.
Die Varianz der Grundgesamtheit ist unbekannt:
Die unbekannte Varianz der Grundgesamtheit wird mittels der Stichprobenfunktion
geschätzt. Dividiert man beide Seiten durch , folgt
Dies ist äquivalent zu:
Zur Vereinfachung sei gesetzt.
Bei einer einfachen Zufallsstichprobe sind die Stichprobenvariablen unabhängig voneinander, so dass die Summe von quadrierten unabhängigen standardnormalverteilten Zufallsvariablen ist.
Eine derartig definierte Zufallsvariable folgt einer Chi-Quadrat-Verteilung mit dem Parameter .
Bildet man unter Verwendung der obigen standardisierten Zufallsvariablen das Verhältnis
,
so folgt die Zufallsvariable einer t-Verteilung mit dem Parameter , da im Zähler eine standardnormalverteilte Zufallsvariable und im Nenner eine von unabhängige
Chi-Quadrat-verteilte Zufallsvariable gegeben ist.
Nach Einsetzen von , und sowie einigen Umformungen erhält man: