Intervallschätzung

Aus MM*Stat

(Weitergeleitet von Konfidenzniveau)
Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall


Grundbegriffe

Intervallschätzung

Bei einer Punktschätzung erhält man für den unbekannten Parameter \vartheta einen Schätzwert \widehat{\vartheta} als Realisation einer Zufallsvariablen.

Selbst wenn die Schätzfunktion "gute" Eigenschaften aufweist, ist die Wahrscheinlichkeit, dass der Schätzwert mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmt, im Allgemeinen klein, wenn die Zufallsvariable X\; in der Grundgesamtheit diskret ist, und sie ist Null, wenn die Zufallsvariable X\; stetig ist.

Um diese Unzulänglichkeit abzuschwächen und die Genauigkeit des Schätzverfahrens einzubeziehen, geht man im Allgemeinen zu einer Intervallschätzung über.

Mit einer Intervallschätzung wird ein unbekannter Parameter \vartheta der Grundgesamtheit derart geschätzt, dass

Konfidenzintervall oder Zufallsintervall, Grenzen des Konfidenzintervalls

Ein Intervall als Ergebnis einer Intervallschätzung wird als Konfidenzintervall bezeichnet.

Die Bestimmung des Konfidenzintervalls basiert

V_{u}=g_{u}(X_{1},\ldots,X_{n}) und V_{o}=g_{o}(X_{1},\ldots,X_{n})
für die untere und obere Intervallgrenze.

Vor der Ziehung der Stichprobe sind die untere und obere Intervallgrenze Zufallsvariablen.

Da V_{u}\; und V_{o}\; Funktionen der Stichprobenvariablen (d.h. Funktionen von Zufallsvariablen) sind, sind sie ebenfalls Zufallsvariablen.

Das Konfidenzintervall \left[V_{u};V_{o}\right] ist somit ein Zufallsintervall, über das Wahrscheinlichkeitsaussagen möglich sind.

Realisiertes Konfidenzintervall oder Schätzintervall, Grenzen des Schätzintervalls

Nach der Ziehung der Stichprobe liegen für die Stichprobenvariablen konkrete Realisationen x_{1},\ldots ,x_{n} vor.

Einsetzen dieser Stichprobenwerte in die Stichprobenfunktionen V_{u}\; und V_{o}\; führt zu Realisationen v_{u} = g_{1}(x_{1},\ldots, x_{n}) und v_{o} = g_{2}(x_{1}, \ldots, x_{n}) und damit zu einem realisierten Konfidenzintervall oder Schätzintervall [v_{u};v_{o}].

Die Grenzen des Schätzintervalls v_{u} und v_{o} sind nunmehr feste Größen und Wahrscheinlichkeitsaussagen nicht mehr möglich.

Entweder liegt der unbekannte Wert des Parameters \vartheta in dem Schätzintervall oder nicht.

Konfidenzniveau, Konfidenzwahrscheinlichkeit, Vertrauenswahrscheinlichkeit und Irrtumswahrscheinlichkeit

Erfüllen die beiden Stichprobenfunktionen die Bedingungen

dann heißt \left[V_{u};V_{o}\right] ein Konfidenzintervall für \vartheta zum Konfidenzniveau 1-\alpha.

Das Konfidenzniveau 1-\alpha wird auch als Vertrauenswahrscheinlichkeit, Konfidenzwahrscheinlichkeit oder Sicherheitswahrscheinlichkeit bezeichnet.

Zur Interpretation:

1 - \alpha ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters \vartheta der Grundgesamtheit enthalten.

Anders ausgedrückt: Das Konfidenzniveau gibt den Anteil aller möglichen Schätzintervalle [v_{u};v_{o}] an, die den unbekannten Wert des Parameters \vartheta überdecken.

\alpha ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters \vartheta der Grundgesamtheit nicht enthalten, d.h. \alpha gibt den Anteil aller möglichen Schätzintervalle \left[v_{u};v_{o}\right] an, die den unbekannten Wert des Parameters \vartheta nicht einschließen.

\alpha nennt man in diesem Sinne Irrtumswahrscheinlichkeit.

Wird also das Verfahren der Intervallschätzung sehr oft wiederholt, dann erhält man in (1 - \alpha)\cdot 100% der Fälle ein Schätzintervall, das \vartheta enthält, und in \alpha \cdot 100% der Fälle ein Schätzintervall, das \vartheta nicht enthält.

Dieses Konfidenzniveau 1 - \alpha wird vom Anwender dem Sachverhalt entsprechend festgelegt. Im Allgemeinen wählt man diese Wahrscheinlichkeit sehr hoch, z.B. 0,90, 0,95 oder 0,99.

Da das Konfidenzniveau 1 - \alpha nahe bei Eins gewählt wird, vertraut man darauf, für die konkrete Stichprobe ein Schätzintervall erhalten zu haben, dass \vartheta einschließt. Ob im Einzelfall diese Annahme richtig oder falsch ist, kann nicht gesagt werden.

Einseitiges Konfidenzintervall

Wird bei einem Konfidenzintervall eine der beiden Intervallgrenzen von vornherein als unbeschränkt festgelegt, so erhält man einseitige Konfidenzintervalle:

Derartige einseitige Konfidenzintervalle sind von Interesse, wenn entsprechend der gegebenen Problemstellung die Abweichung nur in eine Richtung von Bedeutung ist.

Zweiseitiges Konfidenzintervall, Länge bzw. Breite des Konfidenzintervalls, Schätzfehler

In allen anderen Fällen erhält man zweiseitige Konfidenzintervalle [V_{u};V_{o}], bei denen Abweichungen sowohl nach unten als auch nach oben zu praktischen Konsequenzen führen.

Bei zweiseitigen Konfidenzintervallen wird die Differenz V_{o} -V_{u} als Länge oder Breite des Konfidenzintervalls L bzw. l bezeichnet.

Die halbe Länge des Intervalls nennt man Schätzfehler und sei mit E bzw. e symbolisiert.

Bei vielen Anwendungen hängt die Länge des Konfidenzintervalls bzw. der Schätzfehler vom Konfidenzniveau 1 - \alpha und vom Stichprobenumfang ab.

Hält man den Stichprobenumfang n konstant, dann führt eine Erhöhung des Konfidenzniveaus 1 - \alpha im Allgemeinen zu einem breiteren Konfidenzintervall und somit zu einem höheren Schätzfehler.

Größere Sicherheit, dass der unbekannte Wert des Parameters \vartheta in dem Intervall enthalten ist, ist somit mit einer unpräziseren Aussage über seine Lage verbunden.

Hält man das Konfidenzniveau 1-\alpha konstant, dann führt eine Vergrößerung des Stichprobenumfangs n im Allgemeinen zu einer kleineren Länge des Konfidenzintervalls und somit zu einem geringeren Schätzfehler, womit die Präzision der Aussage erhöht wird.

Symmetrisches (zentrales) Konfidenzintervall

Spezielle zweiseitige Konfidenzintervalle sind die symmetrischen (oder zentralen) Konfidenzintervalle.

Sie zeichnen sich dadurch aus, dass die Wahrscheinlichkeit, dass der unbekannte Wert des Parameters \vartheta nach unten aus dem Intervall herausfällt, gleich der Wahrscheinlichkeit ist, dass \vartheta über der oberen Intervallgrenze liegt.

Da die Wahrscheinlichkeit, dass \vartheta außerhalb des Intervalls [V_{u};V_{o}] liegt, insgesamt gleich der Irrtumswahrscheinlichkeit \alpha ist, folgt:

P(\vartheta<V_{u})=\frac{\alpha}{2} und P(V_{o}<\vartheta)=\frac{\alpha}{2}

und somit

P(\vartheta<V_{u})+P(V_{o}<\vartheta)=\frac{\alpha}{2}+\frac{\alpha}{2}=\alpha.

Man beachte, dass sich diese Eigenschaft der Symmetrie auf die Wahrscheinlichkeiten bezieht und nicht auf V_{u} und V_{o}.

Zusatzinformationen

Bestimmung der Grenzen des Konfidenzintervalls

Die weitere Behandlung von Konfidenzintervallen wird auf symmetrische Konfidenzintervalle eingeschränkt.

In vielen Fällen wird zur Bestimmung der Grenzen des Konfidenzintervalls von der Schätzfunktion \widehat{\theta} ausgegangen, die bereits für die Punktschätzung verwendet wurde.

Die Präzision des Schätzverfahrens wird über die Standardabweichung der Schätzfunktion \sigma(\widehat{\theta}) und das vorgegebene Konfidenzniveau 1 - \alpha über ein Vielfaches dieser Standardabweichung in die Konstruktion des Konfidenzintervalls einbezogen.

Bezeichnen c_{\frac{\alpha}{2}} und c_{1- \frac{\alpha}{2}} das jeweilige Vielfache der Standardabweichung der Schätzfunktion und gilt c_{\frac{\alpha}{2}} \neq 0 und c_{1 - \frac{\alpha}{2}}\neq 0, so ergibt sich das Konfidenzintervall zu

\left[ V_{u},V_{o} \right]=\left[\widehat{\theta}-|c_{\frac{\alpha}{2}}|\cdot\sigma(\widehat{\theta}),\widehat{\theta}+|c_{1- \frac{\alpha}{2}}|\cdot\sigma(\widehat{\theta})\right]

mit dem zugehörigen Konfidenzniveau

P\left(V_{u}\leq\vartheta\leq V_{o}\right)=P\left(\widehat{\theta}-|c_{\frac{\alpha}{2}}|\cdot\sigma\left(\widehat{\theta}\right)\leq\vartheta\leq\widehat{\theta}+|c_{1-\frac{\alpha}{2}}|\cdot\sigma\left(\widehat{\theta}\right)\right)=1-\alpha

Bei derartig konstruierten Konfidenzintervallen hängen die Grenzen V_{u} und V_{o} ab:

Dies setzt jedoch voraus, dass die Verteilung der Schätzfunktion bekannt ist bzw. begründete Annahmen über sie getroffen werden können.
Da die Verteilung der Schätzfunktion von der Verteilung der Stichprobenvariablen X_{1}, \ldots, X_{n} und im Allgemeinen die Verteilung der Stichprobenvariablen von der Verteilung der Zufallsvariablen X in der Grundgesamtheit abhängt, benötigt man letztendlich Informationen über die Verteilung in der Grundgesamtheit.

(Zentrales) Konfidenzintervall und (zentrales) Schwankungsintervall

In verschiedenen vorausgegangenen Abschnitten (z.B. bei der Behandlung der Tschebyschev-Ungleichung, der Normalverteilung, der Stichprobenverteilungen) wurde bereits über ein zentrales Schwankungsintervall für eine Zufallsvariable gesprochen.

Wenn die Zufallsvariable nunmehr eine Schätzfunktion \widehat{\theta} für den unbekannten Parameter \vartheta der Grundgesamtheit ist, stellt sich die Frage, warum nicht ein solches zentrales Schwankungsintervall als Intervallschätzung verwendet werden kann.

Dazu sei die Definition eines zentralen Schwankungsintervalls im Kontext der Schätzfunktionen in Erinnerung gerufen.

Ein zentrales Schwankungsintervall für eine Schätzfunktion \widehat{\theta} ist ein Bereich mit festen Grenzen um den Parameter \vartheta, in dem die Zufallsvariable \widehat{\theta} Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit 1 - \alpha annimmt und den beiden Bereichen außerhalb der Grenzen des Intervalls jeweils die gleiche Wahrscheinlichkeit \frac{\alpha}{2} zugeordnet ist:

[\vartheta-k; \theta + k]

mit der Sicherheitswahrscheinlichkeit

P\left( \vartheta -k \leq \widehat{\theta}\leq \vartheta +k\right) = 1 -\alpha

wobei

P\left( \widehat{\theta}\leq \vartheta - k \right) = P\left( \vartheta + k \leq\widehat{\theta}\right) = \frac{\alpha}{2}

und

P\left( \widehat{\theta}\leq \vartheta - k \right) + P\left( \vartheta + k \leq\widehat{\theta}\right) = \alpha

sind.

Das Schwankungsintervall kann somit bestimmt werden, wenn die Verteilung der Zufallsvariablen \widehat{\theta} einschließlich des Parameters \vartheta bekannt ist.

Zwei Charakteristika des Schwankungsintervalls sind konträr zu einem gesuchten Konfidenzintervall:

Durch einfache Umformungen der Ungleichung im Wahrscheinlichkeitsausdruck lässt sich jedoch ein zentrales Konfidenzintervall finden.

Zunächst wird \vartheta und dann \widehat{\theta} auf allen Seiten der Ungleichung subtrahiert:

P\left( \vartheta -k \leq \widehat{\theta}\leq \vartheta +k\right) = 1 -\alpha

P\left( -k \leq \widehat{\theta} - \vartheta \leq  +k\right) = 1 - \alpha

P\left(-\widehat{\theta} - k \leq - \vartheta \leq  -\widehat{\theta}+k\right) = 1 - \alpha

Da in der Mitte der Ungleichung der negative Wert von \vartheta steht, werden alle Seiten mit (-1) multipliziert, wodurch sich die Ungleichungszeichen umkehren:

P\left(\widehat{\theta} + k \geq  \vartheta \geq  \widehat{\theta} - k\right)= 1 - \alpha

Als letztes wird die gewohnte Schreibweise der Ungleichung wieder hergestellt:

P\left(\widehat{\theta} - k \leq  \vartheta \leq  \widehat{\theta} + k\right)= 1 - \alpha

womit das Konfidenzniveau spezifiziert ist, zu dem das zentrale Konfidenzintervall

\left[\widehat{\theta} - k,  \widehat{\theta} + k\right]

gehört.

Im Gegensatz zum Schwankungsintervall, bei dem die Grenzen feste Größen sind, sind die Grenzen des Konfidenzintervalls Zufallsvariablen, da sie \widehat{\theta} als Zufallsvariable enthalten.