Konfidenzintervall für den Erwartungswert bei unbekannter Varianz

Aus MM*Stat

Version vom 23. Januar 2019, 17:30 Uhr von Siskosth (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall für den Erwartungswert bei Normalverteilung der Grundgesamtheit

Es gilt:

X \sim N(\mu;\sigma),\; X_{i} \sim N(\mu;\sigma) \; \forall \, i \, ,\; \bar{X} \sim N\left(\mu; \sigma\left(\bar{X}\right)\right).

Weiterhin sei S die Standardabweichung als Wurzel aus der Stichprobenvarianz S^{2} und t_{n-1;1-\frac{\alpha}{2}} das \left(1 -\frac{\alpha}{2}\right)-Quantil der t-Verteilung.

Dann ist

\left[\bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}};\quad\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right]

ein Konfidenzintervall für den unbekannten Parameter \mu der normalverteilten Zufallsvariablen X\; mit unbekannter Varianz \sigma^{2} zum Konfidenzniveau

P\left(\bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\leq\mu\leq\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right)=1-\alpha

Wurde die Stichprobe gezogen und liegen die Stichprobenwerte x_{1},\ldots,x_{n} vor, dann lassen sich daraus

\left[ \bar{x}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{s}{\sqrt{n}}\leq\mu \leq\bar{x}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{s}{\sqrt{n}}\right]
bestimmen.

Da die t-Verteilung mit wachsender Anzahl der Freiheitsgrade und somit mit wachsendem Stichprobenumfang n gegen die N(0; 1) konvergiert, kann bei genügend großem Stichprobenumfang (n > 30) approximativ die Standardnormalverteilung und z_{1-\frac{\alpha}{2}} statt t_{n - 1; 1 - \frac{\alpha}{2}} verwendet werden. Man erhält dann ein approximatives Konfidenzintervall.

Konfidenzintervall für den Erwartungswert bei unbekannter Verteilung der Grundgesamtheit

Wenn die Zufallsvariable X\; in der Grundgesamtheit nicht normalverteilt und die Varianz \sigma^{2} unbekannt ist, kann unter der Voraussetzung eines großen Stichprobenumfanges n das Konfidenzintervall

\left[ \bar{X} -z_{1-\frac{\alpha}{2}}\frac{S}{\sqrt{n}};\bar{X}+z_{1-\frac{\alpha}{2}}\frac{S}{\sqrt{n}}\right]

verwendet werden, das näherungsweise das Konfidenzniveau

P\left( \bar{X} - z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}} \leq\mu \leq \bar
{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right) = 1- \alpha

hat.

Dies lässt sich darauf zurückführen, dass

Zusatzinformationen

Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Es gilt:

X \sim N(\mu;\sigma),\; X_{i} \sim N(\mu;\sigma) \; \forall \, i \, ,\; \bar{X} \sim N\left(\mu; \sigma\left(\bar{X}\right)\right).

Die standardisierte Zufallsvariable Z lässt sich jedoch nicht mehr bestimmen, da \sigma^{2} nunmehr unbekannt ist.

Die Varianz \sigma^{2} muss aus der Stichprobe geschätzt werden. Eine geeignete Schätzfunktion ist die Stichprobenvarianz

S^{2}=\frac{1}{n-1}\cdot\sum\limits_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}

Die Standardabweichung S als Wurzel aus S^{2} wird für die Standardisierung verwendet:

T=\sqrt{n}\cdot\frac{\bar{X}-\mu}{S}

Die Zufallsvariable T\; folgt bei einer einfachen Zufallsstichprobe vom Umfang n einer t-Verteilung mit der Anzahl der Freiheitsgrade f = n - 1:

T\sim t(n-1)\;

Für die standardisierte Zufallsvariable T\; lässt sich ein zentrales Schwankungsintervall angeben, in dem T\; Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit

P\left(t_{f;\frac{\alpha}{2}} \leq T \leq t_{f;1-\frac{\alpha}{2}}\right)=1-\alpha

annimmt.

Dabei ist t_{f;\frac{\alpha}{2}} das \frac{\alpha}{2}-Quantil und t_{f; 1-\frac{\alpha}{2}} das \left(1 -\frac{\alpha}{2}\right)-Quantil der t-Verteilung.

Aufgrund der Symmetrie der t-Verteilung gilt:

|t_{f;\frac{\alpha}{2}}|=|t_{f;1-\frac{\alpha}{2}}| und  t_{f;\frac{\alpha}{2}} =-t_{f;1-\frac{\alpha}{2}}

Damit folgt:

P\left(-t_{f;1-\frac{\alpha}{2}}\leq T\leq t_{f;1-\frac{\alpha}{2}}\right)=1-\alpha

Für die Wahrscheinlichkeit 1-\alpha findet man t_{f;1-\frac{\alpha}{2}} in der Tabelle der t-Verteilung.

Die Verteilung ist somit bekannt und sie hängt nicht von dem unbekannten Parameter \mu ab, so dass man nach Einsetzen von T und einfachen Umformungen der Ungleichung ein Konfidenzintervall

\left[\bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}};\quad\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right]

zum Konfidenzniveau

P\left(\bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\leq\mu\leq\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right)=1-\alpha

erhält.

Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit

L= 2t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\quad E= t_{n-1; 1-\frac{\alpha}{2}}\cdot \frac{S}{\sqrt{n}}
hängen über S von den Stichprobenvariablen X_{1},\ldots, X_{n} ab und sind somit Zufallsvariablen.
Bei gegebenem Stichprobenumfang n und Konfidenzniveau 1-\alpha ergeben sich von Stichprobe zu Stichprobe unterschiedliche Schätzintervalle, die auch verschiedene Länge bzw. verschiedenen Schätzfehler aufweisen können.
Die zusätzliche Unsicherheit bezüglich \sigma^{2} ist in die t-Verteilung "eingearbeitet".