Intervallschätzung

Aus MM*Stat

(Weitergeleitet von Schätzfehler)
Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall


Grundbegriffe

Intervallschätzung

Bei einer Punktschätzung erhält man für den unbekannten Parameter einen Schätzwert als Realisation einer Zufallsvariablen.

Selbst wenn die Schätzfunktion "gute" Eigenschaften aufweist, ist die Wahrscheinlichkeit, dass der Schätzwert mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmt, im Allgemeinen klein, wenn die Zufallsvariable in der Grundgesamtheit diskret ist, und sie ist Null, wenn die Zufallsvariable stetig ist.

Um diese Unzulänglichkeit abzuschwächen und die Genauigkeit des Schätzverfahrens einzubeziehen, geht man im Allgemeinen zu einer Intervallschätzung über.

Mit einer Intervallschätzung wird ein unbekannter Parameter der Grundgesamtheit derart geschätzt, dass

Konfidenzintervall oder Zufallsintervall, Grenzen des Konfidenzintervalls

Ein Intervall als Ergebnis einer Intervallschätzung wird als Konfidenzintervall bezeichnet.

Die Bestimmung des Konfidenzintervalls basiert

und
für die untere und obere Intervallgrenze.

Vor der Ziehung der Stichprobe sind die untere und obere Intervallgrenze Zufallsvariablen.

Da und Funktionen der Stichprobenvariablen (d.h. Funktionen von Zufallsvariablen) sind, sind sie ebenfalls Zufallsvariablen.

Das Konfidenzintervall ist somit ein Zufallsintervall, über das Wahrscheinlichkeitsaussagen möglich sind.

Realisiertes Konfidenzintervall oder Schätzintervall, Grenzen des Schätzintervalls

Nach der Ziehung der Stichprobe liegen für die Stichprobenvariablen konkrete Realisationen vor.

Einsetzen dieser Stichprobenwerte in die Stichprobenfunktionen und führt zu Realisationen und und damit zu einem realisierten Konfidenzintervall oder Schätzintervall .

Die Grenzen des Schätzintervalls und sind nunmehr feste Größen und Wahrscheinlichkeitsaussagen nicht mehr möglich.

Entweder liegt der unbekannte Wert des Parameters in dem Schätzintervall oder nicht.

Konfidenzniveau, Konfidenzwahrscheinlichkeit, Vertrauenswahrscheinlichkeit und Irrtumswahrscheinlichkeit

Erfüllen die beiden Stichprobenfunktionen die Bedingungen

  • für alle möglichen realisierbaren Stichproben und
  • , wobei die Wahrscheinlichkeit tatsächlich (bzw. approximativ) und ohne Kenntnis des wahren Wertes des Parameters bestimmbar sein muss,

dann heißt ein Konfidenzintervall für zum Konfidenzniveau .

Das Konfidenzniveau wird auch als Vertrauenswahrscheinlichkeit, Konfidenzwahrscheinlichkeit oder Sicherheitswahrscheinlichkeit bezeichnet.

Zur Interpretation:

ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters der Grundgesamtheit enthalten.

Anders ausgedrückt: Das Konfidenzniveau gibt den Anteil aller möglichen Schätzintervalle an, die den unbekannten Wert des Parameters überdecken.

ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters der Grundgesamtheit nicht enthalten, d.h. gibt den Anteil aller möglichen Schätzintervalle an, die den unbekannten Wert des Parameters nicht einschließen.

nennt man in diesem Sinne Irrtumswahrscheinlichkeit.

Wird also das Verfahren der Intervallschätzung sehr oft wiederholt, dann erhält man in der Fälle ein Schätzintervall, das enthält, und in der Fälle ein Schätzintervall, das nicht enthält.

Dieses Konfidenzniveau wird vom Anwender dem Sachverhalt entsprechend festgelegt. Im Allgemeinen wählt man diese Wahrscheinlichkeit sehr hoch, z.B. 0,90, 0,95 oder 0,99.

Da das Konfidenzniveau nahe bei Eins gewählt wird, vertraut man darauf, für die konkrete Stichprobe ein Schätzintervall erhalten zu haben, dass einschließt. Ob im Einzelfall diese Annahme richtig oder falsch ist, kann nicht gesagt werden.

Einseitiges Konfidenzintervall

Wird bei einem Konfidenzintervall eine der beiden Intervallgrenzen von vornherein als unbeschränkt festgelegt, so erhält man einseitige Konfidenzintervalle:

  • mit für alle möglichen Stichproben mit dem zugehörigen Konfidenzniveau bzw.
  • mit für alle möglichen Stichproben mit dem zugehörigen Konfidenzniveau .

Derartige einseitige Konfidenzintervalle sind von Interesse, wenn entsprechend der gegebenen Problemstellung die Abweichung nur in eine Richtung von Bedeutung ist.

Zweiseitiges Konfidenzintervall, Länge bzw. Breite des Konfidenzintervalls, Schätzfehler

In allen anderen Fällen erhält man zweiseitige Konfidenzintervalle , bei denen Abweichungen sowohl nach unten als auch nach oben zu praktischen Konsequenzen führen.

Bei zweiseitigen Konfidenzintervallen wird die Differenz als Länge oder Breite des Konfidenzintervalls bzw. bezeichnet.

Die halbe Länge des Intervalls nennt man Schätzfehler und sei mit bzw. symbolisiert.

Bei vielen Anwendungen hängt die Länge des Konfidenzintervalls bzw. der Schätzfehler vom Konfidenzniveau und vom Stichprobenumfang ab.

Hält man den Stichprobenumfang konstant, dann führt eine Erhöhung des Konfidenzniveaus im Allgemeinen zu einem breiteren Konfidenzintervall und somit zu einem höheren Schätzfehler.

Größere Sicherheit, dass der unbekannte Wert des Parameters in dem Intervall enthalten ist, ist somit mit einer unpräziseren Aussage über seine Lage verbunden.

Hält man das Konfidenzniveau konstant, dann führt eine Vergrößerung des Stichprobenumfangs im Allgemeinen zu einer kleineren Länge des Konfidenzintervalls und somit zu einem geringeren Schätzfehler, womit die Präzision der Aussage erhöht wird.

Symmetrisches (zentrales) Konfidenzintervall

Spezielle zweiseitige Konfidenzintervalle sind die symmetrischen (oder zentralen) Konfidenzintervalle.

Sie zeichnen sich dadurch aus, dass die Wahrscheinlichkeit, dass der unbekannte Wert des Parameters nach unten aus dem Intervall herausfällt, gleich der Wahrscheinlichkeit ist, dass über der oberen Intervallgrenze liegt.

Da die Wahrscheinlichkeit, dass außerhalb des Intervalls liegt, insgesamt gleich der Irrtumswahrscheinlichkeit ist, folgt:

und

und somit

Man beachte, dass sich diese Eigenschaft der Symmetrie auf die Wahrscheinlichkeiten bezieht und nicht auf und .

Zusatzinformationen

Bestimmung der Grenzen des Konfidenzintervalls

Die weitere Behandlung von Konfidenzintervallen wird auf symmetrische Konfidenzintervalle eingeschränkt.

In vielen Fällen wird zur Bestimmung der Grenzen des Konfidenzintervalls von der Schätzfunktion ausgegangen, die bereits für die Punktschätzung verwendet wurde.

Die Präzision des Schätzverfahrens wird über die Standardabweichung der Schätzfunktion und das vorgegebene Konfidenzniveau über ein Vielfaches dieser Standardabweichung in die Konstruktion des Konfidenzintervalls einbezogen.

Bezeichnen und das jeweilige Vielfache der Standardabweichung der Schätzfunktion und gilt und , so ergibt sich das Konfidenzintervall zu

mit dem zugehörigen Konfidenzniveau

Bei derartig konstruierten Konfidenzintervallen hängen die Grenzen und ab:

Dies setzt jedoch voraus, dass die Verteilung der Schätzfunktion bekannt ist bzw. begründete Annahmen über sie getroffen werden können.
Da die Verteilung der Schätzfunktion von der Verteilung der Stichprobenvariablen und im Allgemeinen die Verteilung der Stichprobenvariablen von der Verteilung der Zufallsvariablen in der Grundgesamtheit abhängt, benötigt man letztendlich Informationen über die Verteilung in der Grundgesamtheit.

(Zentrales) Konfidenzintervall und (zentrales) Schwankungsintervall

In verschiedenen vorausgegangenen Abschnitten (z.B. bei der Behandlung der Tschebyschev-Ungleichung, der Normalverteilung, der Stichprobenverteilungen) wurde bereits über ein zentrales Schwankungsintervall für eine Zufallsvariable gesprochen.

Wenn die Zufallsvariable nunmehr eine Schätzfunktion für den unbekannten Parameter der Grundgesamtheit ist, stellt sich die Frage, warum nicht ein solches zentrales Schwankungsintervall als Intervallschätzung verwendet werden kann.

Dazu sei die Definition eines zentralen Schwankungsintervalls im Kontext der Schätzfunktionen in Erinnerung gerufen.

Ein zentrales Schwankungsintervall für eine Schätzfunktion ist ein Bereich mit festen Grenzen um den Parameter , in dem die Zufallsvariable Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit annimmt und den beiden Bereichen außerhalb der Grenzen des Intervalls jeweils die gleiche Wahrscheinlichkeit zugeordnet ist:

mit der Sicherheitswahrscheinlichkeit

wobei

und

sind.

Das Schwankungsintervall kann somit bestimmt werden, wenn die Verteilung der Zufallsvariablen einschließlich des Parameters bekannt ist.

Zwei Charakteristika des Schwankungsintervalls sind konträr zu einem gesuchten Konfidenzintervall:

  • Der Parameter der Grundgesamtheit muss bekannt sein, was bei der Intervallschätzung gerade nicht der Fall ist.

Durch einfache Umformungen der Ungleichung im Wahrscheinlichkeitsausdruck lässt sich jedoch ein zentrales Konfidenzintervall finden.

Zunächst wird und dann auf allen Seiten der Ungleichung subtrahiert:

Da in der Mitte der Ungleichung der negative Wert von steht, werden alle Seiten mit multipliziert, wodurch sich die Ungleichungszeichen umkehren:

Als letztes wird die gewohnte Schreibweise der Ungleichung wieder hergestellt:

womit das Konfidenzniveau spezifiziert ist, zu dem das zentrale Konfidenzintervall

gehört.

Im Gegensatz zum Schwankungsintervall, bei dem die Grenzen feste Größen sind, sind die Grenzen des Konfidenzintervalls Zufallsvariablen, da sie als Zufallsvariable enthalten.