Konfidenzintervall für den Anteilswert

Aus MM*Stat

Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall für den Anteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein unbekannter Anteil von Elementen eine Eigenschaft A aufweist und ein Anteil 1 - \pi diese Eigenschaft nicht besitzt.

Es soll eine Intervallschätzung für \pi durchgeführt, d.h. ein Konfidenzintervall für den unbekannten Anteilswert \pi der Grundgesamtheit konstruiert werden.

Aus dieser Grundgesamtheit wird eine einfache Zufallsstichprobe vom Umfang n gezogen, so dass die Stichprobenvariablen X_{1},\ldots,X_{n} unabhängig und identisch Bernoulli-verteilt sind (siehe im Abschnitt Binomialverteilung).

Es wurde bereits gezeigt, dass der Stichprobenanteilswert

\widehat{\pi}=\frac{X}{n}= \frac{1}{n}\cdot\sum\limits_{i=1}^{n}X_{i}

mit dem Erwartungswert

E\left[\widehat{\pi}\right]=\pi

und der Varianz

Var(\widehat{\pi})= \sigma^{2}(\widehat{\pi})=\frac{\pi\cdot(1-\pi)}{n}

eine erwartungstreue und konsistente Schätzfunktion für \pi ist (siehe Abschnitt Eigenschaften von Schätzfunktionen).

Da für kleine Stichprobenumfänge die Konstruktion von Konfidenzintervallen sehr aufwendig ist, wird hier nur die Situation betrachtet, dass der Stichprobenumfang n hinreichend groß ist, so dass die standardisierte Zufallsvariable

Z=\frac{\widehat{\pi}-\pi}{\sigma(\widehat{\pi})}=\frac{\widehat{\pi}-\pi}{\sqrt{\frac{\pi\cdot(1-\pi)}{n}}}

aufgrund des zentralen Grenzwertsatzes approximativ standardnormalverteilt ist: Z\sim N(0;1)\;.

Somit gilt die Wahrscheinlichkeitsaussage

P\left(  -z_{1-\frac{\alpha}{2}}\leq\frac{\widehat{\pi}-\pi}{\sigma(\widehat{\pi})}\leq z_{1-\frac{\alpha}{2}}\right)  \approx1-\alpha

wobei man z_{1-\frac{\alpha}{2}} aus der Verteilungsfunktion der Standardnormalverteilung zur vorgegebenen Wahrscheinlichkeit 1 - \alpha erhält.

Hieraus lässt sich noch kein geeignetes Konfidenzintervall für \pi gewinnen, denn bei unbekanntem \pi ist auch die Varianz der Schätzfunktion \widehat{\pi} unbekannt.

Diese Varianz muss ebenfalls aus der Stichprobe geschätzt werden.

Ersetzt man in Var(\widehat{\pi}) den unbekannten Anteilswert \pi durch die Schätzfunktion \widehat{\pi}, dann erhält man eine konsistente Schätzfunktion für die Varianz von \widehat{\pi}:

\widehat{\sigma^{2}}(\widehat{\pi})=\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}

Aus

P\left(  -z_{1-\frac{\alpha}{2}}\leq\frac{\widehat{\pi}-\pi}{\hat{\sigma}(\widehat{\pi})}\leq z_{1-\frac{\alpha}{2}}\right)  \approx1-\alpha

lässt sich nunmehr durch elementare Umformungen das Konfidenzniveau herleiten:

P\left(  \widehat{\pi}-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}\;\leq\;\pi\;\leq\;\widehat{\pi}+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}\right)  \approx1-\alpha

Damit ist für sehr große Stichprobenumfänge ein approximatives Konfidenzintervall für den unbekannten Anteilswert \pi einer dichotomen Grundgesamtheit gegeben durch

\left[  \widehat{\pi}-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}},\quad\widehat{\pi}+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}\right]

Für eine ausreichende Approximation an die Normalverteilung muss der Stichprobenumfang n \geq 30 sein, sollte jedoch möglichst größer gewählt werden, etwa n\geq 100.

Für eine konkrete Stichprobe erhält man das Schätzintervall

\left[P -z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{p\cdot(1-p)}{n}};\;P+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{p\cdot(1-p)}{n}}\right],

worin p = \frac{x}{n} die relative Häufigkeit des Auftretens von Elementen mit der Eigenschaft A in der Stichprobe und x deren Anzahl in der Stichprobe sind.

Zusatzinformationen

Charakteristika des Konfidenzintervalls

P\left(  \pi<\widehat{\pi}-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}\right)  \approx\frac{\alpha}{2} \approx P\left(  \widehat{\pi}+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}<\pi\right)
L=2\cdot z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}, \quad E=z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}
sind Zufallsvariablen, da sie über \widehat{\pi} vom Stichprobenergebnis abhängen.

Information zur Schätzung der Varianz des Anteilswertes

Die Varianz der Schätzfunktion \widehat{\pi}

Var (\widehat{\pi})= \sigma^{2} (\widehat{\pi}) = \frac{\pi\cdot(1-\pi)}{n}

ist unbekannt, da sie den unbekannten Anteilswert \pi enthält.

Diese Varianz muss ebenfalls aus der Stichprobe geschätzt werden, indem \pi durch den Schätzer \widehat{\pi} ersetzt wird.

Die Rechtfertigung für die Substituierung ist durch die Tatsache gegeben, dass der Erwartungswert von \widehat{\pi}\cdot (1 - \widehat{\pi}) mit größer werdendem Stichprobenumfang n gegen \pi\cdot (1 - \pi) strebt:

\lim_{n \rightarrow \infty} E [\widehat{\pi}\cdot(1-\widehat{\pi})] = \pi \cdot(1 - \pi).

Dies lässt sich in der folgenden Weise zeigen. Es ist zunächst

E\left[\widehat{\pi}\cdot(1-\widehat{\pi})\right] = E \left[ \frac{X}{n}\cdot \left( 1-\frac {X}{n}\right) \right] \cdot \frac {1} {n} \cdot E[X]- \frac{1}{n^{2}}\cdot E\left[X^{2}\right]

Aufgrund des Verschiebungssatzes gilt

Var(X) = E\left[X^{2}\right] - \left(E\left[X\right]\right)^{2} und somit E\left[{X}^{2}\right]= Var(X) + \left(E\left[X\right]\right)^{2}.

X\; als die Anzahl des Eintretens von A in der Stichprobe ist binomialverteilt mit E\left[X\right] =n\cdot\pi und

Var(X) = N\cdot\pi\cdot(1-\pi), so dass folgt:

E\left[X^{2}\right] = Var(X) + \left(E\left[X\right]\right)^{2}= n\cdot\pi\cdot(1- \pi) + (n\cdot\pi)^{2}

Diese Ergebnisse werden für die weitere Herleitung genutzt:

E[\widehat{\pi}\cdot(1-\widehat{\pi})] = E\left[\frac{X}{n} \cdot\left(1-\frac{X}{n}\right)\right] = \frac{1}{n} \cdot E[X] -\frac {1}{n^{2}}\cdot E\left[X^{2}\right]
= \frac {1}{n}\cdot n\cdot\pi - \frac {1} {n^{2}}\cdot \left[ n\cdot\pi\cdot\left(1-\pi\right) + \left(n\cdot\pi\right)^{2}\right]
= \frac {1}{n}\cdot\left[ n\cdot\pi - \frac {1} {n}\cdot\left( n\cdot\pi -n\cdot\pi^{2} + n^{2}\cdot\pi^{2}\right)\right]
= \frac {1}{n}\cdot\left( n\cdot\pi - \pi + \pi^{2} - n\cdot\pi^{2}\right)
=\frac{\pi}{n}\cdot\left(n-1+ \pi -n\cdot \pi\right)
= \frac {\pi}{n}\cdot\left( n - 1\right)\cdot \left(1- \pi\right) = \frac{n-1}{n}\cdot \pi\cdot \left(1- \pi\right)

Für n \rightarrow\infty geht \frac{n - 1}{n} gegen 1, so dass gilt:

\lim_{n \rightarrow\infty} \frac{n-1}{n}\cdot \pi \cdot(1- \pi) = \pi\cdot(1-\pi)

Beispiele

Sonntagsfrage

Der Generalsekretär der Partei F möchte wegen der 5%-Klausel wissen, wie die Chancen seiner Partei sind, bei der nächsten Wahl in den Bundestag einzuziehen.

Er beauftragt ein Meinungsforschungsinstitut mit einer Umfrage. Dieses Meinungsforschungsinstitut wählt zufällig n = 2000 wahlberechtigte Bürger aus und stellt ihnen die Frage:

"Wenn am kommenden Sonntag Bundestagswahl wäre, welcher Partei würden sie ihre Stimme geben?"

Im Ergebnis der Umfrage entschieden sich 103 Befragte für die Partei F.

Auf einem Konfidenzniveau von 1 - \alpha = 0,95 soll ein Konfidenzintervall für den Anteil p der Wähler der Partei F bestimmt werden.

Aus statistischer Sicht ergeben sich folgende Überlegungen:

  • Da das Interesse auf die Partei F gerichtet ist, wird das Ereignis A als "Wähle die Partei F" und das Komplementärereignis \bar{A} als "Wähle nicht die Partei F" definiert.
Es gibt somit nur zwei mögliche Ereignisse bei der Befragung. Die Grundgesamtheit ist dichotom. Der Anteil der Wähler der Partei F in der Grundgesamtheit ist \pi = P(A).
\left[  \widehat{\pi}-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}},\quad\widehat{\pi}+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\widehat{\pi}\cdot(1-\widehat{\pi})}{n}}\right]
berechnet werden, das näherungsweise das Konfidenzniveau von 1 - \alpha = 0,95 aufweist.
Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für 1 - \frac{\alpha}{2} = 0,975 den Wert z_{0,975} = 1,96.

Mit dem Ergebnis der Stichprobe ergibt sich ein Stichprobenanteilswert von

p = \frac{103}{2000} = 0,0515

und ein Schätzintervall von

\left[  0,0515-1,96\cdot\sqrt{\frac{0,0515\cdot0,9485}{2000}},\; 0,0515+1,96\cdot\sqrt{\frac{0,0515\cdot0,9485}{2000}}\right]=[4,18%;\;6,12%]

Das Schätzintervall [4,18%;\;6,12%] überdeckt die 5%, die zum Einzug einer Partei in den Bundestag erforderlich sind.

Bei einem näherungsweisen Konfidenzniveau von 95% ist nicht gesichert, dass die Partei F im nächsten Bundestag vertreten sein wird.