Konfidenzintervall für den Erwartungswert bei bekannter Varianz: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
(Eine dazwischenliegende Version von einem anderen Benutzer wird nicht angezeigt)
Zeile 1: Zeile 1:
{{Schaetztheorie}}
{{Schaetztheorie}}
{{SubpageToc|Haushaltsnettoeinkommen}}
{{SubpageToc|Beispiel: Haushaltsnettoeinkommen}}
=={{Vorlage:Überschrift}}==
=={{Vorlage:Überschrift}}==


Zeile 147: Zeile 147:


: Im Zusammenspiel von [[Konfidenzniveau]] und [[Stichprobenumfang]] lässt sich somit eine Steuerung für das [[Konfidenzintervall]] erreichen.
: Im Zusammenspiel von [[Konfidenzniveau]] und [[Stichprobenumfang]] lässt sich somit eine Steuerung für das [[Konfidenzintervall]] erreichen.
=={{Vorlage:Beispiele}}==
===Haushaltsnettoeinkommen===
Für eine [[Grundgesamtheit]] von <math>N = 2000</math> Privathaushalten sei die [[Zufallsvariable]] <math>X\;</math> das Haushaltsnettoeinkommen (in €).
Das mittlere Haushaltsnettoeinkommen dieser [[Grundgesamtheit]], d.h. der [[Erwartungswert der Grundgesamtheit|Erwartungswert]] <math>E[X] = \mu</math>, ist unbekannt und soll geschätzt werden.
Über die [[Punktschätzung]] hinaus soll ein [[Konfidenzintervall]] zum [[Konfidenzniveau]] <math>1-\alpha=0,95</math> und für die konkreten [[Stichprobe]]n das [[Schätzintervall]] angegeben werden.
Zur [[Schätzung]] von <math>\mu</math> wird der [[Stichprobenmittelwert]]
<math>\bar{X}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}X_{i}</math>
als [[Schätzfunktion]] verwendet.
Eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> liefert die [[Stichprobenwerte]] <math>x_{1},\ldots, x_{n}</math>.
Nach Einsetzen dieser [[Stichprobenwerte]] in die [[Schätzfunktion]] erhält man einen [[Schätzwert]]
<math>\bar{x}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}x_{i}</math>
als [[Punktschätzung]] für das mittlere Haushaltsnettoeinkommen der [[Grundgesamtheit]].
Die Angabe des [[Konfidenzintervall]]s wird entscheidend von den Informationen, die über die [[Grundgesamtheit]] vorliegen, bestimmt.
Es sei bekannt, dass die [[Zufallsvariable]] <math>X\;</math> (Haushaltsnettoeinkommen) in der [[Grundgesamtheit]] einer [[Normalverteilung]] mit der [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma = 1012,8 \,\euro</math>  folgt:
<math>X\sim N(\mu; 1012,8)\;</math>.
Aufgrund dieser Informationen ist
<math>\left[\bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}},\;\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right]</math>
ein [[Konfidenzintervall]] für den unbekannten [[Parameter]] <math>\mu</math> der [[Zufallsvariable]]n <math>X\;</math> (Haushaltnettoeinkommen) zum [[Konfidenzniveau]]
<math>P\left(  \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\leq\mu\leq\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right)  =1-\alpha</math>
Zum vorgegebenen [[Konfidenzniveau]] <math>1 - \alpha = 0,95</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] <math>N(0; 1):</math>
<math>z_{1-\frac{\alpha}{2}} = z_{0,975} = 1,96</math>
Nach Einsetzen von <math>\sigma</math> und <math>z_{0,975}</math> ergibt sich:
<math>P\left(\bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}}\leq\mu\leq\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right)  =0,95</math>
und
<math>\left[\bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}},\;\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right]</math>
Nach der Ziehung der [[Stichprobe]] ist
<math>\left[  \bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}},\;\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right]</math>
das sich für die [[Stichprobe]] ergebende [[Schätzintervall]], in dem nur noch der Punkt[[schätzwert]] <math>\bar{X}</math> und <math>n</math> einzusetzen sind.
Eine [[einfache Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 20</math> Privathaushalten aus der oben genannten [[Grundgesamtheit]] liefert die folgenden [[Stichprobenwerte]].
Tabelle 1: [[Stichprobenwerte]] des Haushaltsnettoeinkommens einer [[Stichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 20</math> (der Größe nach geordnet)
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
|align="center"|<math> i</math>
|align="center"|Haushaltsnettoeinkommen (€) <math>x_{i}</math>
|align="center"|<math>i</math>
|align="center"|Haushaltsnettoeinkommen (€) <math>x_{i}</math>
|-
|align="center"|1
|align="center"|800
|align="center"|11
|align="center"|2500
|-
|align="center"|2
|align="center"|1200
|align="center"|12
|align="center"|2500
|-
|align="center"|3
|align="center"|1400
|align="center"|13
|align="center"|2500
|-
|align="center"|4
|align="center"|1500
|align="center"|14
|align="center"|2700
|-
|align="center"|5
|align="center"|1500
|align="center"|15
|align="center"|2850
|-
|align="center"|6
|align="center"|1500
|align="center"|16
|align="center"|3300
|-
|align="center"|7
|align="center"|1800
|align="center"|17
|align="center"|3650
|-
|align="center"|8
|align="center"|1800
|align="center"|18
|align="center"|3700
|-
|align="center"|9
|align="center"|2300
|align="center"|19
|align="center"|4100
|-
|align="center"|10
|align="center"|2400
|align="center"|20
|align="center"|4300
|}
Das mittlere Haushaltsnettoeinkommen dieser [[Stichprobe]] beträgt
<math>\bar{x}=\frac{48300}{20}=2415 \,\euro</math>
und ist ein [[Schätzwert]] für das mittlere Haushaltsnettoeinkommen der [[Grundgesamtheit]].
Als [[Schätzintervall]] für diese [[Stichprobe]] ergibt sich:
{|
|<math>\left[  2415-1,96\cdot\frac{1012,8}{\sqrt{20}};\; 2415+1,96\cdot\frac{1012,8}{\sqrt{20}}\right]</math>
|<math>=[2415-443,88;\; 2415+443,88]</math>
|-
|
|<math> =[1971,12;\; 2858,88]</math>
|}
Für dieses [[Schätzintervall]] kann nichts darüber ausgesagt werden, ob der wahre Wert <math>\mu</math> des mittleren Haushaltsnettoeinkommens der [[Grundgesamtheit]] in dem [[Konfidenzintervall|Intervall]] enthalten ist oder nicht.
Da jedoch für das [[Schätzverfahren]] eine [[Sicherheitswahrscheinlichkeit]] von 0,95 (d.h. recht nahe bei Eins) gewählt wurde, unterstellt man, eines der [[Schätzintervall]]e zum [[Stichprobenumfang]] <math>n = 20</math> erhalten zu haben, dass den wahren Wert <math>\mu</math> enthält.
Um die Problematik von [[Konfidenzintervall]]en zu demonstrieren, werden 24 weitere [[Zufallsstichprobe]]n vom [[Stichprobenumfang|Umfang]] <math>n = 20</math> aus der gleichen [[Grundgesamtheit]] gezogen und das mittlere Haushaltsnettoeinkommen <math>\bar{X}</math> und ein [[Schätzintervall]] für jede [[Stichprobe]] berechnet, die in der folgenden Tabelle für alle 25 Zufallsstichproben enthalten sind.
Tabelle 2: Mittleres Haushaltsnettoeinkommen (€) und [[Schätzintervall]] für 25 [[Zufallsstichprobe]]n vom [[Stichprobenumfang|Umfang]] <math>n = 20</math>
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
|align="center"|<math>i\;</math>
|align="center"|<math>\bar{x}</math>
|align="center"|<math>v_{u}\;</math>
|align="center"|<math>v_{o}\;</math>
|align="center"|<math>i\;</math>
|align="center"|<math>\bar{x}</math>
|align="center"|<math>v_{u}\;</math>
|align="center"|<math>v_{o}\;</math>
|-
|align="center"|1
|align="center"|2413,40
|align="center"|1969,52
|align="center"|2857,28
|align="center"|14
|align="center"|2126,50
|align="center"|1682,62
|align="center"|2570,38
|-
|align="center"|2
|align="center"|2317,00
|align="center"|1873,12
|align="center"|2760,88
|align="center"|15
|align="center"|2243,15
|align="center"|1799,27
|align="center"|2687,03
|-
|align="center"|3
|align="center"|2567,50
|align="center"|2123,62
|align="center"|3011,38
|align="center"|16
|align="center"|2361,25
|align="center"|1917,37
|align="center"|2805,13
|-
|align="center"|4
|align="center"|2060,90
|align="center"|1617,02
|align="center"|2504,78
|align="center"|17
|align="center"|2607,5
|align="center"|2163,37
|align="center"|3051,13
|-
|align="center"|5
|align="center"|2363,50
|align="center"|1919,62
|align="center"|2807,38
|align="center"|18
|align="center"|2319,55
|align="center"|1875,67
|align="center"|2763,43
|-
|align="center"|6
|align="center"|2774,30
|align="center"|2330,42
|align="center"|3218,18
|align="center"|19
|align="center"|2203,85
|align="center"|1759,97
|align="center"|2647,73
|-
|align="center"|7
|align="center"|2298,80
|align="center"|1854,92
|align="center"|2742,68
|align="center"|20
|align="center"|2395,25
|align="center"|1951,37
|align="center"|2839,13
|-
|align="center"|8
|align="center"|2241,15
|align="center"|1797,27
|align="center"|2685,03
|align="center"|21
|align="center"|2659,00
|align="center"|2215,12
|align="center"|3102,88
|-
|align="center"|9
|align="center"|1915,30
|align="center"|1471,42
|align="center"|2359,18
|align="center"|22
|align="center"|2168,50
|align="center"|1724,62
|align="center"|2612,38
|-
|align="center"|10
|align="center"|2062,15
|align="center"|1618,27
|align="center"|2506,03
|align="center"|23
|align="center"|2110,30
|align="center"|1666,42
|align="center"|2554,18
|-
|align="center"|11
|align="center"|2267,75
|align="center"|1823,87
|align="center"|2711,63
|align="center"|24
|align="center"|1884,90
|align="center"|1441,02
|align="center"|2328,78
|-
|align="center"|12
|align="center"|2163,10
|align="center"|1719,22
|align="center"|2606,98
|align="center"|25
|align="center"|2415,00
|align="center"|1971,12
|align="center"|2858,88
|-
|align="center"|13
|align="center"|2635,00
|align="center"|2191,12
|align="center"|3078,88
|align="center"|
|align="center"|
|align="center"|
|align="center"|
|}
Die folgende Abbildung zeigt die 25 Punkt[[schätzwert]]e und [[Schätzintervall]]e.
Einzig und allein zum Zweck der Veranschaulichung ist der wahre [[Mittelwert der Grundgesamtheit|Mittelwert <math>\mu</math> der Grundgesamtheit]] als gepunktete Linie in der Grafik enthalten.
<iframe k="wiwi" p="examples/stat_Konfidenzintervall_Konfidenzintervall_varianz_bekannt_R00480004800000000000000_plot.html" />
Anhand dieser Ergebnisse werden verschiedene Charakteristika von [[Konfidenzintervall]]en deutlich:
* Die Grenzen <math>V_{u}</math> und <math>vV_{o}</math> eines [[Konfidenzintervall]]s sind [[Zufallsvariable]]n, die von [[Stichprobe]] zu [[Stichprobe]] aufgrund der verschiedenen [[Stichprobenwerte]] <math>x_{i}\quad (i = 1,\ldots, 20)</math> und der daraus resultierenden [[Schätzwert]]e <math>\bar{X}</math> unterschiedliche Werte annehmen können.
* 23 [[Schätzintervall]]e (92%) schließen den wahren Wert <math>\mu</math> ein und 2 [[Schätzintervall]]e (Stichprobe Nr. 9 und Nr. 24; 8%) schließen ihn nicht ein.
: Widerspricht dies dem festgelegten [[Konfidenzniveau]] von 0,95?
: Die Antwort ist nein, denn das [[Konfidenzniveau]] bezieht sich auf eine sehr große Anzahl von [[Stichprobe]]n und 25 [[Stichprobe]]n ist wirklich keine große Anzahl.
* Da die [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma</math> der [[Grundgesamtheit]] als bekannt vorausgesetzt wurde, haben alle 25 [[Schätzintervall]]e die gleiche [[Länge des Konfidenzintervalls|Länge]] von 887,76 bzw. den gleichen [[Schätzfehler]] von 443,88.

Aktuelle Version vom 23. Januar 2019, 16:30 Uhr

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall bei Normalverteilung der Grundgesamtheit

Die Zufallsvariable in der Grundgesamtheit sei normalverteilt mit und :

Dann ist

ein Konfidenzintervall für den unbekannten Parameter der normalverteilten Zufallsvariablen mit bekannter Varianz zum Konfidenzniveau

Wurde die Stichprobe gezogen und liegen die Stichprobenwerte vor, dann ist

das arithmetische Mittel dieser Stichprobe (als eine Realisation von ) und

das sich für diese Stichprobe ergebende Schätzintervall.

Die allgemein gegebene Interpretation von Konfidenzintervallen bleibt uneingeschränkt gültig.

Konfidenzintervall bei unbekannter Verteilung der Grundgesamtheit

Wenn die Verteilung der Zufallsvariablen in der Grundgesamtheit unbekannt ist, d.h. beliebig verteilt ist, dann lässt sich keine exakte Aussage über die Verteilung der Schätzfunktion treffen.

Aus vorhergehenden Betrachtungen über den Zentralen Grenzwertsatz ist jedoch bekannt, dass die Verteilung von mit wachsendem Stichprobenumfang gegen eine Normalverteilung strebt.

Somit gilt:

Bei genügend großen Stichprobenumfang ist die Schätzfunktion approximativ normalverteilt:

und die standardisierte Zufallsvariable ist approximativ standardnormalverteilt:

.

Als Faustregel für einen genügend großen Stichprobenumfang gilt .

Dann ist

ein Konfidenzintervall für den unbekannten Parameter , das approximativ das Konfidenzniveau

hat.

Zusatzinformationen

Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Die Zufallsvariable in der Grundgesamtheit sei normalverteilt mit und :

Während die Varianz bekannt sei, ist der Erwartungswert unbekannt und soll unter Verwendung einer einfachen Zufallsstichprobe vom Umfang geschätzt werden.

Die Stichprobenvariablen sind dann unabhängig und ebenfalls normalverteilt mit und :

Daraus folgt, dass auch die Schätzfunktion normalverteilt ist mit dem Erwartungswert und der Varianz :

Die standardisierte Zufallsvariable

ist standardnormalverteilt: .

Für die standardisierte Zufallsvariable lässt sich ein zentrales Schwankungsintervall angeben, in dem Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit

annimmt.

Dabei ist das -Quantil und das -Quantil der Standardnormalverteilung.

Aufgrund der Symmetrie der Standardnormalverteilung gilt:

und

Damit folgt:

Für die Wahrscheinlichkeit findet man in der Tabelle der Standardnormalverteilung.

Nach Einsetzen von und einigen elementaren Umformungen der Ungleichung erhält man:

Mit dem letzten Ausdruck ist das Konfidenzniveau für ein Konfidenzintervall für gegeben.

Der Faktor als Vielfaches der Standardabweichung der Schätzfunktion ergibt sich zu: .

Die Bedingungen für ein Konfidenzintervall sind erfüllt, denn die Verteilung ist bekannt (Standardnormalverteilung) und sie hängt nicht von dem unbekannten Parameter ab.

Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Die Grenzen des Intervalls haben zu den gleichen Abstand. Dieser Abstand, d.h. die halbe Länge des Intervalls, wird in diesem Fall auch als Schätzfehler bezeichnet und mit symbolisiert.
und der Schätzfehler hängen nicht von den Stichprobenvariablen ab.
Bei gegebenen , und ergeben sich von Stichprobe zu Stichprobe unterschiedliche Schätzintervalle, die aber alle die gleiche feste Länge bzw. den gleichen festen Schätzfehler aufweisen.
Je größer (kleiner) die Standardabweichung ist, desto breiter (schmaler) ist unter sonst gleichen Bedingungen das Intervall.
Je größer (kleiner) das Konfidenzniveau ist, um so größer (kleiner) ist und umso breiter (schmaler) ist unter sonst gleichen Bedingungen das Intervall.
Je größer (kleiner) der Stichprobenumfang ist, desto schmaler (breiter) ist unter sonst gleichen Bedingungen das Intervall.
Im Zusammenspiel von Konfidenzniveau und Stichprobenumfang lässt sich somit eine Steuerung für das Konfidenzintervall erreichen.