Konfidenzintervall für die Varianz

Aus MM*Stat

Version vom 18. Mai 2018, 15:39 Uhr von Jacobdan (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Schaetztheorie}} =={{Vorlage:Überschrift}}== ===Konfidenzintervall für die Varianz=== Es wird ein Konfidenzintervall für die unbekannte Varianz…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall


Grundbegriffe

Konfidenzintervall für die Varianz

Es wird ein Konfidenzintervall für die unbekannte Varianz \sigma^{2} einer Grundgesamtheit unter folgenden Annahmen hergeleitet:

  • Die Grundgesamtheit ist normalverteilt: X\sim N(\mu;\sigma^{2})\;.

Eine erwartungstreue Schätzfunktion für die unbekannte Varianz \sigma^{2} ist (vgl. Eigenschaften von Schätzfunktionen)

S^{2}=\frac{1}{n-1}\cdot\sum\limits_{i=1}^{n}(X_{i}-\bar{X})^{2}

Es wurde bereits gezeigt (siehe Abschnitt Verteilung der Stichprobenvarianz), dass die normierte Form von S^{2}

\frac{(n-1)\cdot S^{2}}{\sigma^{2}}=\frac{1}{\sigma^{2}}\cdot\sum\limits_{i=1}^{n}(X_{i}-\bar{X})^{2}=\sum\limits_{i=1}^{n}\left(\frac{X_{i}-\bar{X}}{\sigma }\right)^{2}

einer Chi-Quadrat-Verteilung mit der Anzahl der Freiheitsgrade f = n - 1 folgt.

Mit Hilfe der Verteilung von (n - 1)\cdot\frac{S^{2}}{\sigma^{2}} können Wahrscheinlichkeitsaussagen über die Stichprobenfunktion S^{2}\; getroffen werden.

Speziell kann ein zentrales Schwankungsintervall für S^{2}\; mit der Sicherheitswahrscheinlichkeit

P\left(\frac{\sigma^{2}\cdot\chi_{\frac{\alpha}{2};n-1}^{2}}{n-1}\leq S^{2}\leq\frac{\sigma^{2}\cdot\chi_{1-\frac{\alpha}{2};n-1}^{2}}{n-1}\right)=1-\alpha

angegeben werden.

Dabei ist \chi_{\frac{\alpha}{2};n-1}^{2} das \frac{\alpha}{2}-Quantil und \chi_{1-\frac{\alpha}{2};n-1}^{2} das \left(1 -\frac{\alpha}{2}\right)-Quantil der Chi-Quadrat-Verteilung mit f = n- 1 Freiheitsgraden

Durch einfache Umformungen der Ungleichung lässt sich daraus das Konfidenzniveau gewinnen:

P\left(\frac{(n-1)\cdot S^{2}}{\chi_{1-\frac{\alpha}{2};n-1}^{2}}\leq\sigma^{2}\leq\frac{(n-1)\cdot S^{2}}{\chi_{\frac{\alpha}{2};n-1}^{2}}\right)=1-\alpha

Das zugehörige Konfidenzintervall ist

\left[\frac{(n-1)\cdot S^{2}}{\chi_{1-\frac{\alpha}{2};n-1}^{2}},\; \frac {(n-1)\cdot S^{2}}{\chi_{\frac{\alpha}{2};n-1}^{2}}\right]

Für eine konkrete Stichprobe mit den Stichprobenwerten x_{1},\ldots,x_{n} und dem Punktschätzwert \bar{x} erhält man einen Schätzwert für die unbekannte Varianz \sigma^{2} der Grundgesamtheit.

s^{2}=\frac{1}{n-1}\cdot\sum\limits_{i=1}^{n}(x_{i}-\bar{x})^{2}

und das Schätzintervall

\left[\frac{(n-1)\cdot S^{2}}{\chi_{1-\frac{\alpha}{2};n-1}^{2}},\; \frac {(n-1)\cdot S^{2}}{\chi_{\frac{\alpha}{2};n-1}^{2}}\right]

Die Interpretation ist analoger Weise wie für die anderen Konfidenzintervalle zu führen.

Zusatzinformationen

Charakteristika des Konfidenzintervalls

P\left(\sigma^{2}<\frac{(n-1)\cdot S^{2}}{\chi_{1-\frac{\alpha}{2};n-1}^{2}}\right)=\frac{\alpha}{2},\quad P\left(  \frac{(n-1)\cdot S^{2}}{\chi_{\frac{\alpha}{2};n-1}^{2}}<\sigma^{2}\right)
=\frac{\alpha}{2}
(n-1)\cdot S^{2}\cdot\left(\frac{1}{\chi_{\frac{\alpha}{2};n-1}^{2}}-\frac{1}{\chi_{1-\frac{\alpha}{2};n-1}^{2}}\right)
hängt von den Stichprobenvariablen X_{1},\ldots,X_{n} ab und ist eine Zufallsvariable.
Die Länge des Intervalls hängt außerdem vom Stichprobenumfang n und vom vorgegebenen Konfidenzniveau 1-\alpha ab.

Beispiele

Haushaltsnettoeinkommen

Für eine Grundgesamtheit von N = 2000 Privathaushalten sei die Zufallsvariable X\; das Haushaltsnettoeinkommen (in €).

Es sei bekannt, dass X normalverteilt ist, jedoch sind die beiden Parameter der Normalverteilung E[X] = \mu und die Varianz \sigma^{2} der Grundgesamtheit unbekannt.

Somit gilt:

X\sim N(\mu ;\sigma^{2})\;.

Wie für das unbekannte mittlere Haushaltnettoeinkommen \mu der Grundgesamtheit ein Konfidenzintervall bestimmt werden kann, wurde bereits im Abschnitt "Konfidenzintervall für den Erwartungswert" gezeigt.

Hier gilt das Augenmerk der unbekannten Varianz \sigma^{2}, für die ein Konfidenzintervall zum Konfidenzniveau 1-\alpha = 0,95 ermittelt werden soll.

Eine einfache Zufallsstichprobe vom Umfang n = 20 Privathaushalten aus der oben genannten Grundgesamtheit liefert die folgenden Stichprobenwerte (der Größe nach geordnet):

i Haushaltsnettoeinkommen (€) x_{i} i Haushaltsnettoeinkommen (€) x_{i}
1 800 11 2500
2 1200 12 2500
3 1400 13 2500
4 1500 14 2700
5 1500 15 2850
6 1500 16 3300
7 1800 17 3650
8 1800 18 3700
9 2300 19 4100
10 2400 20 4300

Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt:

\bar{x}=\frac{48300}{20}=2415

und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Als Punktschätzwert für die unbekannte Varianz \sigma^{2} erhält man aus der Stichprobe:

s^{2}=1002131,58

Aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung findet man:

\chi_{\frac{\alpha}{2};n-1}^{2}=\chi_{0,025;19}^{2}=8,91 und \chi_{1-\frac{\alpha}{2};n-1}^{2}=\chi_{0,975;19}^{2}=32,85

Damit ergibt sich das Schätzintervall zu:

\left[\frac{19\cdot1002131,58}{32,85},\quad\frac{19\cdot1002131,58}{8,91}\right]=[579619,48,\quad2136980,92]

Aufgrund des hohen Konfidenzniveaus vertraut man nun darauf, ein Schätzintervall erhalten zu haben, dass die unbekannte Varianz \sigma^{2} einschließt.