Konfidenzintervall für die Varianz
Aus MM*Stat
Grundbegriffe
Konfidenzintervall für die Varianz
Es wird ein Konfidenzintervall für die unbekannte Varianz einer Grundgesamtheit unter folgenden Annahmen hergeleitet:
- Die Grundgesamtheit ist normalverteilt: .
- Der Erwartungswert der Grundgesamtheit ist ebenfalls unbekannt.
- Aus dieser Grundgesamtheit wird eine einfache Zufallsstichprobe vom Umfang gezogen, womit die Stichprobenvariablen unabhängig und identisch normalverteilt sind.
Eine erwartungstreue Schätzfunktion für die unbekannte Varianz ist (vgl. Eigenschaften von Schätzfunktionen)
Es wurde bereits gezeigt (siehe Abschnitt Verteilung der Stichprobenvarianz), dass die normierte Form von
einer Chi-Quadrat-Verteilung mit der Anzahl der Freiheitsgrade folgt.
Mit Hilfe der Verteilung von können Wahrscheinlichkeitsaussagen über die Stichprobenfunktion getroffen werden.
Speziell kann ein zentrales Schwankungsintervall für mit der Sicherheitswahrscheinlichkeit
angegeben werden.
Dabei ist das -Quantil und das -Quantil der Chi-Quadrat-Verteilung mit Freiheitsgraden
Durch einfache Umformungen der Ungleichung lässt sich daraus das Konfidenzniveau gewinnen:
Das zugehörige Konfidenzintervall ist
Für eine konkrete Stichprobe mit den Stichprobenwerten und dem Punktschätzwert erhält man einen Schätzwert für die unbekannte Varianz der Grundgesamtheit.
und das Schätzintervall
Die Interpretation ist analoger Weise wie für die anderen Konfidenzintervalle zu führen.
Zusatzinformationen
Charakteristika des Konfidenzintervalls
- Das angegebene Konfidenzintervall ist ein bezüglich der Wahrscheinlichkeit symmetrisches Konfidenzintervall, denn es gilt:
- Das Konfidenzintervall ist jedoch nicht symmetrisch bezüglich der Punktschätzung , da die Chi-Quadrat-Verteilung keine symmetrische Verteilung ist.
- hängt von den Stichprobenvariablen ab und ist eine Zufallsvariable.
- Die Länge des Intervalls hängt außerdem vom Stichprobenumfang und vom vorgegebenen Konfidenzniveau ab.
Beispiele
Haushaltsnettoeinkommen
Für eine Grundgesamtheit von Privathaushalten sei die Zufallsvariable das Haushaltsnettoeinkommen (in €).
Es sei bekannt, dass normalverteilt ist, jedoch sind die beiden Parameter der Normalverteilung und die Varianz der Grundgesamtheit unbekannt.
Somit gilt:
.
Wie für das unbekannte mittlere Haushaltnettoeinkommen der Grundgesamtheit ein Konfidenzintervall bestimmt werden kann, wurde bereits im Abschnitt "Konfidenzintervall für den Erwartungswert" gezeigt.
Hier gilt das Augenmerk der unbekannten Varianz , für die ein Konfidenzintervall zum Konfidenzniveau ermittelt werden soll.
Eine einfache Zufallsstichprobe vom Umfang Privathaushalten aus der oben genannten Grundgesamtheit liefert die folgenden Stichprobenwerte (der Größe nach geordnet):
Haushaltsnettoeinkommen (€) | Haushaltsnettoeinkommen (€) | ||
1 | 800 | 11 | 2500 |
2 | 1200 | 12 | 2500 |
3 | 1400 | 13 | 2500 |
4 | 1500 | 14 | 2700 |
5 | 1500 | 15 | 2850 |
6 | 1500 | 16 | 3300 |
7 | 1800 | 17 | 3650 |
8 | 1800 | 18 | 3700 |
9 | 2300 | 19 | 4100 |
10 | 2400 | 20 | 4300 |
Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt:
und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.
Als Punktschätzwert für die unbekannte Varianz erhält man aus der Stichprobe:
Aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung findet man:
und
Damit ergibt sich das Schätzintervall zu:
Aufgrund des hohen Konfidenzniveaus vertraut man nun darauf, ein Schätzintervall erhalten zu haben, dass die unbekannte Varianz einschließt.