Konfidenzintervall für den Erwartungswert bei unbekannter Varianz
Aus MM*Stat
Unterseiten |
Grundbegriffe
Konfidenzintervall für den Erwartungswert bei Normalverteilung der Grundgesamtheit
Es gilt:
.
Weiterhin sei die Standardabweichung als Wurzel aus der Stichprobenvarianz und das -Quantil der t-Verteilung.
Dann ist
ein Konfidenzintervall für den unbekannten Parameter der normalverteilten Zufallsvariablen mit unbekannter Varianz zum Konfidenzniveau
Wurde die Stichprobe gezogen und liegen die Stichprobenwerte vor, dann lassen sich daraus
- die Punktschätzwerte und
- und das Schätzintervall
- bestimmen.
Da die t-Verteilung mit wachsender Anzahl der Freiheitsgrade und somit mit wachsendem Stichprobenumfang gegen die konvergiert, kann bei genügend großem Stichprobenumfang approximativ die Standardnormalverteilung und statt verwendet werden. Man erhält dann ein approximatives Konfidenzintervall.
Konfidenzintervall für den Erwartungswert bei unbekannter Verteilung der Grundgesamtheit
Wenn die Zufallsvariable in der Grundgesamtheit nicht normalverteilt und die Varianz unbekannt ist, kann unter der Voraussetzung eines großen Stichprobenumfanges das Konfidenzintervall
verwendet werden, das näherungsweise das Konfidenzniveau
hat.
Dies lässt sich darauf zurückführen, dass
- bei beliebig verteilter Grundgesamtheit die standardisierte Zufallsvariable bei großem Stichprobenumfang approximativ standardnormalverteilt ist (Anwendung des zentralen Grenzwertsatzes);
- die Schätzfunktion eine konsistente Schätzfunktion für ist und somit auch konsistent ist, d.h. es kann bei sehr großem Stichprobenumfang davon ausgegangen werden, dass hinreichend wenig um den wahren Wert streut;
- die Zufallsvariable , in der durch ersetzt wurde, ebenfalls bei genügend großem Stichprobenumfang approximativ standardnormalverteilt ist.
Zusatzinformationen
Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit
Es gilt:
.
Die standardisierte Zufallsvariable lässt sich jedoch nicht mehr bestimmen, da nunmehr unbekannt ist.
Die Varianz muss aus der Stichprobe geschätzt werden. Eine geeignete Schätzfunktion ist die Stichprobenvarianz
Die Standardabweichung als Wurzel aus wird für die Standardisierung verwendet:
Die Zufallsvariable folgt bei einer einfachen Zufallsstichprobe vom Umfang einer t-Verteilung mit der Anzahl der Freiheitsgrade :
Für die standardisierte Zufallsvariable lässt sich ein zentrales Schwankungsintervall angeben, in dem Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit
annimmt.
Dabei ist das -Quantil und das -Quantil der t-Verteilung.
Aufgrund der Symmetrie der t-Verteilung gilt:
und
Damit folgt:
Für die Wahrscheinlichkeit findet man in der Tabelle der t-Verteilung.
Die Verteilung ist somit bekannt und sie hängt nicht von dem unbekannten Parameter ab, so dass man nach Einsetzen von und einfachen Umformungen der Ungleichung ein Konfidenzintervall
zum Konfidenzniveau
erhält.
Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit
- Das Konfidenzintervall ist ein bezüglich der Wahrscheinlichkeit symmetrisches Konfidenzintervall.
- Das Konfidenzintervall ist symmetrisch bezüglich der Punktschätzung. Die Grenzen des Intervalls haben zu den gleichen Abstand.
- Die Länge des Konfidenzintervalls und der Schätzfehler
- hängen über von den Stichprobenvariablen ab und sind somit Zufallsvariablen.
- Bei gegebenem Stichprobenumfang und Konfidenzniveau ergeben sich von Stichprobe zu Stichprobe unterschiedliche Schätzintervalle, die auch verschiedene Länge bzw. verschiedenen Schätzfehler aufweisen können.
- Die Länge des Konfidenzintervalls und der Schätzfehler hängen vom Stichprobenumfang und über vom vorgegebenen Konfidenzniveau ab.
- Da die Quantile aus der t-Verteilung größer sind als die Quantile aus der Standardnormalverteilung, sind die Konfidenzintervalle bei unbekannter Varianz der Grundgesamtheit breiter als bei bekannter Varianz, wodurch diese fehlende Information zum Ausdruck kommt.
- Die zusätzliche Unsicherheit bezüglich ist in die t-Verteilung "eingearbeitet".