Intervallschätzung

Bei einer Punktschätzung erhält man für den unbekannten Parameter $\vartheta$ einen Schätzwert ${\widehat {\vartheta }}$ als Realisation einer Zufallsvariablen.

Selbst wenn die Schätzfunktion "gute" Eigenschaften aufweist, ist die Wahrscheinlichkeit, dass der Schätzwert mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmt, im Allgemeinen klein, wenn die Zufallsvariable $X\;$ in der Grundgesamtheit diskret ist, und sie ist Null, wenn die Zufallsvariable $X\;$ stetig ist.

Um diese Unzulänglichkeit abzuschwächen und die Genauigkeit des Schätzverfahrens einzubeziehen, geht man im Allgemeinen zu einer Intervallschätzung über.

Mit einer Intervallschätzung wird ein unbekannter Parameter $\vartheta$ der Grundgesamtheit derart geschätzt, dass

im Ergebnis ein Intervall resultiert,
die Wahrscheinlichkeit, mit der das Schätzverfahren ein Intervall ergibt, das den wahren Parameterwert $\vartheta$ der Grundgesamtheit enthält, einem vorgegebenen Wert $1-\alpha$ entspricht.

Konfidenzintervall oder Zufallsintervall, Grenzen des Konfidenzintervalls

Ein Intervall als Ergebnis einer Intervallschätzung wird als Konfidenzintervall bezeichnet.

Die Bestimmung des Konfidenzintervalls basiert

auf einer einfachen Zufallsstichprobe vom Umfang $n$ mit den Stichprobenvariablen $X_{1},\ldots ,X_{n}$ ,
auf der Festlegung zweier Stichprobenfunktionen

V_{u}=g_{u}(X_{1},\ldots ,X_{n})

und

V_{o}=g_{o}(X_{1},\ldots ,X_{n})

für die untere und obere Intervallgrenze.

Vor der Ziehung der Stichprobe sind die untere und obere Intervallgrenze Zufallsvariablen.

Da $V_{u}\;$ und $V_{o}\;$ Funktionen der Stichprobenvariablen (d.h. Funktionen von Zufallsvariablen) sind, sind sie ebenfalls Zufallsvariablen.

Das Konfidenzintervall $\left[V_{u};V_{o}\right]$ ist somit ein Zufallsintervall, über das Wahrscheinlichkeitsaussagen möglich sind.

Realisiertes Konfidenzintervall oder Schätzintervall, Grenzen des Schätzintervalls

Nach der Ziehung der Stichprobe liegen für die Stichprobenvariablen konkrete Realisationen $x_{1},\ldots ,x_{n}$ vor.

Einsetzen dieser Stichprobenwerte in die Stichprobenfunktionen $V_{u}\;$ und $V_{o}\;$ führt zu Realisationen $v_{u}=g_{1}(x_{1},\ldots ,x_{n})$ und $v_{o}=g_{2}(x_{1},\ldots ,x_{n})$ und damit zu einem realisierten Konfidenzintervall oder Schätzintervall $[v_{u};v_{o}]$ .

Die Grenzen des Schätzintervalls $v_{u}$ und $v_{o}$ sind nunmehr feste Größen und Wahrscheinlichkeitsaussagen nicht mehr möglich.

Entweder liegt der unbekannte Wert des Parameters $\vartheta$ in dem Schätzintervall oder nicht.

Konfidenzniveau, Konfidenzwahrscheinlichkeit, Vertrauenswahrscheinlichkeit und Irrtumswahrscheinlichkeit

Erfüllen die beiden Stichprobenfunktionen die Bedingungen

$V_{u}\leq V_{o}$ für alle möglichen realisierbaren Stichproben $x_{1},\ldots ,x_{n}$ und
$P\left(V_{u}\leq \vartheta \leq V_{o}\right)=1-\alpha$ , wobei die Wahrscheinlichkeit tatsächlich (bzw. approximativ) und ohne Kenntnis des wahren Wertes des Parameters $\vartheta$ bestimmbar sein muss,

dann heißt $\left[V_{u};V_{o}\right]$ ein Konfidenzintervall für $\vartheta$ zum Konfidenzniveau $1-\alpha$ .

Das Konfidenzniveau $1-\alpha$ wird auch als Vertrauenswahrscheinlichkeit, Konfidenzwahrscheinlichkeit oder Sicherheitswahrscheinlichkeit bezeichnet.

Zur Interpretation:

$1-\alpha$ ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters $\vartheta$ der Grundgesamtheit enthalten.

Anders ausgedrückt: Das Konfidenzniveau gibt den Anteil aller möglichen Schätzintervalle $[v_{u};v_{o}]$ an, die den unbekannten Wert des Parameters $\vartheta$ überdecken.

$\alpha$ ist die Wahrscheinlichkeit, dass das Schätzverfahren zu Intervallen führt, die den wahren Wert des Parameters $\vartheta$ der Grundgesamtheit nicht enthalten, d.h. $\alpha$ gibt den Anteil aller möglichen Schätzintervalle $\left[v_{u};v_{o}\right]$ an, die den unbekannten Wert des Parameters $\vartheta$ nicht einschließen.

$\alpha$ nennt man in diesem Sinne Irrtumswahrscheinlichkeit.

Wird also das Verfahren der Intervallschätzung sehr oft wiederholt, dann erhält man in $(1-\alpha )\cdot 100\%$ der Fälle ein Schätzintervall, das $\vartheta$ enthält, und in $\alpha \cdot 100\%$ der Fälle ein Schätzintervall, das $\vartheta$ nicht enthält.

Dieses Konfidenzniveau $1-\alpha$ wird vom Anwender dem Sachverhalt entsprechend festgelegt. Im Allgemeinen wählt man diese Wahrscheinlichkeit sehr hoch, z.B. 0,90, 0,95 oder 0,99.

Da das Konfidenzniveau $1-\alpha$ nahe bei Eins gewählt wird, vertraut man darauf, für die konkrete Stichprobe ein Schätzintervall erhalten zu haben, dass $\vartheta$ einschließt. Ob im Einzelfall diese Annahme richtig oder falsch ist, kann nicht gesagt werden.

Einseitiges Konfidenzintervall

Wird bei einem Konfidenzintervall eine der beiden Intervallgrenzen von vornherein als unbeschränkt festgelegt, so erhält man einseitige Konfidenzintervalle:

$\left(-\infty ,V_{o}\right]$ mit $V_{u}=-\infty$ für alle möglichen Stichproben $x_{1},\ldots ,x_{n}$ mit dem zugehörigen Konfidenzniveau $P\left(\vartheta \leq V_{o}\right)=1-\alpha$ bzw.

$\left[V_{u},+\infty \right)$ mit $V_{o}=+\infty$ für alle möglichen Stichproben $x_{1},\ldots ,x_{n}$ mit dem zugehörigen Konfidenzniveau $P\left(V_{u}\leq \vartheta \right)=1-\alpha$ .

Derartige einseitige Konfidenzintervalle sind von Interesse, wenn entsprechend der gegebenen Problemstellung die Abweichung nur in eine Richtung von Bedeutung ist.

Zweiseitiges Konfidenzintervall, Länge bzw. Breite des Konfidenzintervalls, Schätzfehler

In allen anderen Fällen erhält man zweiseitige Konfidenzintervalle $[V_{u};V_{o}]$ , bei denen Abweichungen sowohl nach unten als auch nach oben zu praktischen Konsequenzen führen.

Bei zweiseitigen Konfidenzintervallen wird die Differenz $V_{o}-V_{u}$ als Länge oder Breite des Konfidenzintervalls $L$ bzw. $l$ bezeichnet.

Die halbe Länge des Intervalls nennt man Schätzfehler und sei mit $E$ bzw. $e$ symbolisiert.

Bei vielen Anwendungen hängt die Länge des Konfidenzintervalls bzw. der Schätzfehler vom Konfidenzniveau $1-\alpha$ und vom Stichprobenumfang ab.

Hält man den Stichprobenumfang $n$ konstant, dann führt eine Erhöhung des Konfidenzniveaus $1-\alpha$ im Allgemeinen zu einem breiteren Konfidenzintervall und somit zu einem höheren Schätzfehler.

Größere Sicherheit, dass der unbekannte Wert des Parameters $\vartheta$ in dem Intervall enthalten ist, ist somit mit einer unpräziseren Aussage über seine Lage verbunden.

Hält man das Konfidenzniveau $1-\alpha$ konstant, dann führt eine Vergrößerung des Stichprobenumfangs $n$ im Allgemeinen zu einer kleineren Länge des Konfidenzintervalls und somit zu einem geringeren Schätzfehler, womit die Präzision der Aussage erhöht wird.

Symmetrisches (zentrales) Konfidenzintervall

Spezielle zweiseitige Konfidenzintervalle sind die symmetrischen (oder zentralen) Konfidenzintervalle.

Sie zeichnen sich dadurch aus, dass die Wahrscheinlichkeit, dass der unbekannte Wert des Parameters $\vartheta$ nach unten aus dem Intervall herausfällt, gleich der Wahrscheinlichkeit ist, dass $\vartheta$ über der oberen Intervallgrenze liegt.

Da die Wahrscheinlichkeit, dass $\vartheta$ außerhalb des Intervalls $[V_{u};V_{o}]$ liegt, insgesamt gleich der Irrtumswahrscheinlichkeit $\alpha$ ist, folgt:

$P(\vartheta <V_{u})={\frac {\alpha }{2}}$ und $P(V_{o}<\vartheta )={\frac {\alpha }{2}}$

und somit

$P(\vartheta <V_{u})+P(V_{o}<\vartheta )={\frac {\alpha }{2}}+{\frac {\alpha }{2}}=\alpha .$

Man beachte, dass sich diese Eigenschaft der Symmetrie auf die Wahrscheinlichkeiten bezieht und nicht auf $V_{u}$ und $V_{o}$ .

Zusatzinformationen

Bestimmung der Grenzen des Konfidenzintervalls

Die weitere Behandlung von Konfidenzintervallen wird auf symmetrische Konfidenzintervalle eingeschränkt.

In vielen Fällen wird zur Bestimmung der Grenzen des Konfidenzintervalls von der Schätzfunktion ${\widehat {\theta }}$ ausgegangen, die bereits für die Punktschätzung verwendet wurde.

Die Präzision des Schätzverfahrens wird über die Standardabweichung der Schätzfunktion $\sigma ({\widehat {\theta }})$ und das vorgegebene Konfidenzniveau $1-\alpha$ über ein Vielfaches dieser Standardabweichung in die Konstruktion des Konfidenzintervalls einbezogen.

Bezeichnen $c_{\frac {\alpha }{2}}$ und $c_{1-{\frac {\alpha }{2}}}$ das jeweilige Vielfache der Standardabweichung der Schätzfunktion und gilt $c_{\frac {\alpha }{2}}\neq 0$ und $c_{1-{\frac {\alpha }{2}}}\neq 0$ , so ergibt sich das Konfidenzintervall zu

$\left[V_{u},V_{o}\right]=\left[{\widehat {\theta }}-|c_{\frac {\alpha }{2}}|\cdot \sigma ({\widehat {\theta }}),{\widehat {\theta }}+|c_{1-{\frac {\alpha }{2}}}|\cdot \sigma ({\widehat {\theta }})\right]$

mit dem zugehörigen Konfidenzniveau

$P\left(V_{u}\leq \vartheta \leq V_{o}\right)=P\left({\widehat {\theta }}-|c_{\frac {\alpha }{2}}|\cdot \sigma \left({\widehat {\theta }}\right)\leq \vartheta \leq {\widehat {\theta }}+|c_{1-{\frac {\alpha }{2}}}|\cdot \sigma \left({\widehat {\theta }}\right)\right)=1-\alpha$

Bei derartig konstruierten Konfidenzintervallen hängen die Grenzen $V_{u}$ und $V_{o}$ ab:

von den Stichprobenvariablen $X_{1},\ldots ,X_{n}$ , da die Schätzfunktion ${\widehat {\theta }}$ eine Funktion dieser Stichprobenvariablen ist.
von der Standardabweichung der Schätzfunktion $\sigma \left({\widehat {\theta }}\right)$ . Je größer (kleiner) die Standardabweichung der Schätzfunktion ist, desto breiter (schmaler) ist unter sonst gleichen Bedingungen das Konfidenzintervall.
über $c_{\frac {\alpha }{2}}$ und $c_{1-{\frac {\alpha }{2}}}$ von dem festgelegten Konfidenzniveau $1-\alpha$ . Je größer (kleiner) das Konfidenzniveau gewählt wird, um so breiter (schmaler) ist im allgemeinen unter sonst gleichen Bedingungen das Konfidenzintervall.
von der Verteilung der Schätzfunktion, denn die Werte $c_{\frac {\alpha }{2}}$ und $c_{1-{\frac {\alpha }{2}}}$ werden entsprechend der vorgegebenen Wahrscheinlichkeit $1-\alpha$ aus der Tabelle der betreffenden Verteilung abgelesen.

Dies setzt jedoch voraus, dass die Verteilung der Schätzfunktion bekannt ist bzw. begründete Annahmen über sie getroffen werden können.

Da die Verteilung der Schätzfunktion von der Verteilung der Stichprobenvariablen

X_{1},\ldots ,X_{n}

und im Allgemeinen die Verteilung der Stichprobenvariablen von der Verteilung der Zufallsvariablen

X

in der Grundgesamtheit abhängt, benötigt man letztendlich Informationen über die Verteilung in der Grundgesamtheit.

(Zentrales) Konfidenzintervall und (zentrales) Schwankungsintervall

In verschiedenen vorausgegangenen Abschnitten (z.B. bei der Behandlung der Tschebyschev-Ungleichung, der Normalverteilung, der Stichprobenverteilungen) wurde bereits über ein zentrales Schwankungsintervall für eine Zufallsvariable gesprochen.

Wenn die Zufallsvariable nunmehr eine Schätzfunktion ${\widehat {\theta }}$ für den unbekannten Parameter $\vartheta$ der Grundgesamtheit ist, stellt sich die Frage, warum nicht ein solches zentrales Schwankungsintervall als Intervallschätzung verwendet werden kann.

Dazu sei die Definition eines zentralen Schwankungsintervalls im Kontext der Schätzfunktionen in Erinnerung gerufen.

Ein zentrales Schwankungsintervall für eine Schätzfunktion ${\widehat {\theta }}$ ist ein Bereich mit festen Grenzen um den Parameter $\vartheta$ , in dem die Zufallsvariable ${\widehat {\theta }}$ Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit $1-\alpha$ annimmt und den beiden Bereichen außerhalb der Grenzen des Intervalls jeweils die gleiche Wahrscheinlichkeit ${\frac {\alpha }{2}}$ zugeordnet ist:

$[\vartheta -k;\theta +k]$

mit der Sicherheitswahrscheinlichkeit

$P\left(\vartheta -k\leq {\widehat {\theta }}\leq \vartheta +k\right)=1-\alpha$

wobei

$P\left({\widehat {\theta }}\leq \vartheta -k\right)=P\left(\vartheta +k\leq {\widehat {\theta }}\right)={\frac {\alpha }{2}}$

und

$P\left({\widehat {\theta }}\leq \vartheta -k\right)+P\left(\vartheta +k\leq {\widehat {\theta }}\right)=\alpha$

sind.

Das Schwankungsintervall kann somit bestimmt werden, wenn die Verteilung der Zufallsvariablen ${\widehat {\theta }}$ einschließlich des Parameters $\vartheta$ bekannt ist.

Zwei Charakteristika des Schwankungsintervalls sind konträr zu einem gesuchten Konfidenzintervall:

Der Parameter $\vartheta$ der Grundgesamtheit muss bekannt sein, was bei der Intervallschätzung gerade nicht der Fall ist.

Das Schwankungsintervall ist ein Bereich, in dem die Schätzfunktion ${\widehat {\theta }}$ Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit $1-\alpha$ annimmt, während beim Konfidenzintervall ein Bereich bestimmt werden soll, in dem der unbekannte Parameter $\vartheta$ mit einer vorgegebenen Sicherheitswahrscheinlichkeit liegt.

Durch einfache Umformungen der Ungleichung im Wahrscheinlichkeitsausdruck lässt sich jedoch ein zentrales Konfidenzintervall finden.

Zunächst wird $\vartheta$ und dann ${\widehat {\theta }}$ auf allen Seiten der Ungleichung subtrahiert:

$P\left(\vartheta -k\leq {\widehat {\theta }}\leq \vartheta +k\right)=1-\alpha$

$P\left(-k\leq {\widehat {\theta }}-\vartheta \leq +k\right)=1-\alpha$

$P\left(-{\widehat {\theta }}-k\leq -\vartheta \leq -{\widehat {\theta }}+k\right)=1-\alpha$

Da in der Mitte der Ungleichung der negative Wert von $\vartheta$ steht, werden alle Seiten mit $(-1)$ multipliziert, wodurch sich die Ungleichungszeichen umkehren:

$P\left({\widehat {\theta }}+k\geq \vartheta \geq {\widehat {\theta }}-k\right)=1-\alpha$

Als letztes wird die gewohnte Schreibweise der Ungleichung wieder hergestellt:

$P\left({\widehat {\theta }}-k\leq \vartheta \leq {\widehat {\theta }}+k\right)=1-\alpha$

womit das Konfidenzniveau spezifiziert ist, zu dem das zentrale Konfidenzintervall

$\left[{\widehat {\theta }}-k,{\widehat {\theta }}+k\right]$

gehört.

Im Gegensatz zum Schwankungsintervall, bei dem die Grenzen feste Größen sind, sind die Grenzen des Konfidenzintervalls Zufallsvariablen, da sie ${\widehat {\theta }}$ als Zufallsvariable enthalten.

Intervallschätzung

Aus MM*Stat

Inhaltsverzeichnis

Grundbegriffe