Konfidenzintervall für den Anteilswert

Aus MM*Stat

Version vom 18. Mai 2018, 14:37 Uhr von Jacobdan (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Schaetztheorie}} =={{Vorlage:Überschrift}}== ===Konfidenzintervall für den Anteilswert=== Vorausgesetzt wird eine dichotome Gru…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall für den Anteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein unbekannter Anteil von Elementen eine Eigenschaft aufweist und ein Anteil diese Eigenschaft nicht besitzt.

Es soll eine Intervallschätzung für durchgeführt, d.h. ein Konfidenzintervall für den unbekannten Anteilswert der Grundgesamtheit konstruiert werden.

Aus dieser Grundgesamtheit wird eine einfache Zufallsstichprobe vom Umfang gezogen, so dass die Stichprobenvariablen unabhängig und identisch Bernoulli-verteilt sind (siehe im Abschnitt Binomialverteilung).

Es wurde bereits gezeigt, dass der Stichprobenanteilswert

mit dem Erwartungswert

und der Varianz

eine erwartungstreue und konsistente Schätzfunktion für ist (siehe Abschnitt Eigenschaften von Schätzfunktionen).

Da für kleine Stichprobenumfänge die Konstruktion von Konfidenzintervallen sehr aufwendig ist, wird hier nur die Situation betrachtet, dass der Stichprobenumfang hinreichend groß ist, so dass die standardisierte Zufallsvariable

aufgrund des zentralen Grenzwertsatzes approximativ standardnormalverteilt ist: .

Somit gilt die Wahrscheinlichkeitsaussage

wobei man aus der Verteilungsfunktion der Standardnormalverteilung zur vorgegebenen Wahrscheinlichkeit erhält.

Hieraus lässt sich noch kein geeignetes Konfidenzintervall für gewinnen, denn bei unbekanntem ist auch die Varianz der Schätzfunktion unbekannt.

Diese Varianz muss ebenfalls aus der Stichprobe geschätzt werden.

Ersetzt man in den unbekannten Anteilswert Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \pi} durch die Schätzfunktion , dann erhält man eine konsistente Schätzfunktion für die Varianz von Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \widehat{\pi}} :

Aus

lässt sich nunmehr durch elementare Umformungen das Konfidenzniveau herleiten:

Damit ist für sehr große Stichprobenumfänge ein approximatives Konfidenzintervall für den unbekannten Anteilswert einer dichotomen Grundgesamtheit gegeben durch

Für eine ausreichende Approximation an die Normalverteilung muss der Stichprobenumfang sein, sollte jedoch möglichst größer gewählt werden, etwa .

Für eine konkrete Stichprobe erhält man das Schätzintervall

,

worin die relative Häufigkeit des Auftretens von Elementen mit der Eigenschaft in der Stichprobe und deren Anzahl in der Stichprobe sind.

Zusatzinformationen

Charakteristika des Konfidenzintervalls

  • Das Konfidenzintervall ist symmetrisch bezüglich der Punktschätzung. Die Grenzen des Intervalls haben zu Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \hat{\pi}} den gleichen Abstand.
sind Zufallsvariablen, da sie über vom Stichprobenergebnis abhängen.

Information zur Schätzung der Varianz des Anteilswertes

Die Varianz der Schätzfunktion

ist unbekannt, da sie den unbekannten Anteilswert enthält.

Diese Varianz muss ebenfalls aus der Stichprobe geschätzt werden, indem durch den Schätzer ersetzt wird.

Die Rechtfertigung für die Substituierung ist durch die Tatsache gegeben, dass der Erwartungswert von mit größer werdendem Stichprobenumfang gegen strebt:

Dies lässt sich in der folgenden Weise zeigen. Es ist zunächst

Aufgrund des Verschiebungssatzes gilt

und somit .

als die Anzahl des Eintretens von in der Stichprobe ist binomialverteilt mit und

, so dass folgt:

Diese Ergebnisse werden für die weitere Herleitung genutzt:

Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle = \frac {1}{n}\cdot n\cdot\pi - \frac {1} {n^{2}}\cdot \left[ n\cdot\pi\cdot\left(1-\pi\right) + \left(n\cdot\pi\right)^{2}\right]}
Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle = \frac {1}{n}\cdot\left( n\cdot\pi - \pi + \pi^{2} - n\cdot\pi^{2}\right)}

Für geht gegen 1, so dass gilt:

Beispiele

Sonntagsfrage

Der Generalsekretär der Partei F möchte wegen der 5%-Klausel wissen, wie die Chancen seiner Partei sind, bei der nächsten Wahl in den Bundestag einzuziehen.

Er beauftragt ein Meinungsforschungsinstitut mit einer Umfrage. Dieses Meinungsforschungsinstitut wählt zufällig wahlberechtigte Bürger aus und stellt ihnen die Frage:

"Wenn am kommenden Sonntag Bundestagswahl wäre, welcher Partei würden sie ihre Stimme geben?"

Im Ergebnis der Umfrage entschieden sich 103 Befragte für die Partei F.

Auf einem Konfidenzniveau von soll ein Konfidenzintervall für den Anteil der Wähler der Partei F bestimmt werden.

Aus statistischer Sicht ergeben sich folgende Überlegungen:

  • Da das Interesse auf die Partei F gerichtet ist, wird das Ereignis als "Wähle die Partei F" und das Komplementärereignis als "Wähle nicht die Partei F" definiert.
Es gibt somit nur zwei mögliche Ereignisse bei der Befragung. Die Grundgesamtheit ist dichotom. Der Anteil der Wähler der Partei F in der Grundgesamtheit ist Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \pi = P(A)} .
berechnet werden, das näherungsweise das Konfidenzniveau von aufweist.
Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man für den Wert .

Mit dem Ergebnis der Stichprobe ergibt sich ein Stichprobenanteilswert von

und ein Schätzintervall von

Das Schätzintervall überdeckt die 5%, die zum Einzug einer Partei in den Bundestag erforderlich sind.

Bei einem näherungsweisen Konfidenzniveau von 95% ist nicht gesichert, dass die Partei F im nächsten Bundestag vertreten sein wird.