Konfidenzintervall für den Erwartungswert bei bekannter Varianz/Beispiel: Haushaltsnettoeinkommen

Aus MM*Stat

< Konfidenzintervall für den Erwartungswert bei bekannter Varianz
Version vom 3. Dezember 2018, 18:13 Uhr von Haberema (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „=={{Vorlage:Beispiele}}== ===Haushaltsnettoeinkommen=== Für eine Grundgesamtheit von <math>N = 2000</math> Privathaushalten sei die Zufallsvariable…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Beispiele

Haushaltsnettoeinkommen

Für eine Grundgesamtheit von N = 2000 Privathaushalten sei die Zufallsvariable X\; das Haushaltsnettoeinkommen (in €).

Das mittlere Haushaltsnettoeinkommen dieser Grundgesamtheit, d.h. der Erwartungswert E[X] = \mu, ist unbekannt und soll geschätzt werden.

Über die Punktschätzung hinaus soll ein Konfidenzintervall zum Konfidenzniveau 1-\alpha=0,95 und für die konkreten Stichproben das Schätzintervall angegeben werden.

Zur Schätzung von \mu wird der Stichprobenmittelwert

\bar{X}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}X_{i}

als Schätzfunktion verwendet.

Eine Zufallsstichprobe vom Umfang n liefert die Stichprobenwerte x_{1},\ldots, x_{n}.

Nach Einsetzen dieser Stichprobenwerte in die Schätzfunktion erhält man einen Schätzwert

\bar{x}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}x_{i}

als Punktschätzung für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Die Angabe des Konfidenzintervalls wird entscheidend von den Informationen, die über die Grundgesamtheit vorliegen, bestimmt.

Es sei bekannt, dass die Zufallsvariable X\; (Haushaltsnettoeinkommen) in der Grundgesamtheit einer Normalverteilung mit der Standardabweichung \sigma = 1012,8 \,\euro folgt:

X\sim N(\mu; 1012,8)\;.

Aufgrund dieser Informationen ist

\left[\bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}},\;\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right]

ein Konfidenzintervall für den unbekannten Parameter \mu der Zufallsvariablen X\; (Haushaltnettoeinkommen) zum Konfidenzniveau

P\left(  \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\leq\mu\leq\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{\sigma}{\sqrt{n}}\right)  =1-\alpha

Zum vorgegebenen Konfidenzniveau 1 - \alpha = 0,95 findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung N(0; 1):

z_{1-\frac{\alpha}{2}} = z_{0,975} = 1,96

Nach Einsetzen von \sigma und z_{0,975} ergibt sich:

P\left(\bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}}\leq\mu\leq\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right)  =0,95

und

\left[\bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}},\;\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right]

Nach der Ziehung der Stichprobe ist

\left[  \bar{X}-1,96\cdot\frac{1012,8}{\sqrt{n}},\;\bar{X}+1,96\cdot\frac{1012,8}{\sqrt{n}}\right]

das sich für die Stichprobe ergebende Schätzintervall, in dem nur noch der Punktschätzwert \bar{X} und n einzusetzen sind.

Eine einfache Zufallsstichprobe vom Umfang n = 20 Privathaushalten aus der oben genannten Grundgesamtheit liefert die folgenden Stichprobenwerte.

Tabelle 1: Stichprobenwerte des Haushaltsnettoeinkommens einer Stichprobe vom Umfang n = 20 (der Größe nach geordnet)

 i Haushaltsnettoeinkommen (€) x_{i} i Haushaltsnettoeinkommen (€) x_{i}
1 800 11 2500
2 1200 12 2500
3 1400 13 2500
4 1500 14 2700
5 1500 15 2850
6 1500 16 3300
7 1800 17 3650
8 1800 18 3700
9 2300 19 4100
10 2400 20 4300

Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt

\bar{x}=\frac{48300}{20}=2415 \,\euro

und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Als Schätzintervall für diese Stichprobe ergibt sich:

\left[  2415-1,96\cdot\frac{1012,8}{\sqrt{20}};\; 2415+1,96\cdot\frac{1012,8}{\sqrt{20}}\right] =[2415-443,88;\; 2415+443,88]
 =[1971,12;\; 2858,88]

Für dieses Schätzintervall kann nichts darüber ausgesagt werden, ob der wahre Wert \mu des mittleren Haushaltsnettoeinkommens der Grundgesamtheit in dem Intervall enthalten ist oder nicht.

Da jedoch für das Schätzverfahren eine Sicherheitswahrscheinlichkeit von 0,95 (d.h. recht nahe bei Eins) gewählt wurde, unterstellt man, eines der Schätzintervalle zum Stichprobenumfang n = 20 erhalten zu haben, dass den wahren Wert \mu enthält.

Um die Problematik von Konfidenzintervallen zu demonstrieren, werden 24 weitere Zufallsstichproben vom Umfang n = 20 aus der gleichen Grundgesamtheit gezogen und das mittlere Haushaltsnettoeinkommen \bar{X} und ein Schätzintervall für jede Stichprobe berechnet, die in der folgenden Tabelle für alle 25 Zufallsstichproben enthalten sind.

Tabelle 2: Mittleres Haushaltsnettoeinkommen (€) und Schätzintervall für 25 Zufallsstichproben vom Umfang n = 20

i\; \bar{x} v_{u}\; v_{o}\; i\; \bar{x} v_{u}\; v_{o}\;
1 2413,40 1969,52 2857,28 14 2126,50 1682,62 2570,38
2 2317,00 1873,12 2760,88 15 2243,15 1799,27 2687,03
3 2567,50 2123,62 3011,38 16 2361,25 1917,37 2805,13
4 2060,90 1617,02 2504,78 17 2607,5 2163,37 3051,13
5 2363,50 1919,62 2807,38 18 2319,55 1875,67 2763,43
6 2774,30 2330,42 3218,18 19 2203,85 1759,97 2647,73
7 2298,80 1854,92 2742,68 20 2395,25 1951,37 2839,13
8 2241,15 1797,27 2685,03 21 2659,00 2215,12 3102,88
9 1915,30 1471,42 2359,18 22 2168,50 1724,62 2612,38
10 2062,15 1618,27 2506,03 23 2110,30 1666,42 2554,18
11 2267,75 1823,87 2711,63 24 1884,90 1441,02 2328,78
12 2163,10 1719,22 2606,98 25 2415,00 1971,12 2858,88
13 2635,00 2191,12 3078,88

Die folgende Abbildung zeigt die 25 Punktschätzwerte und Schätzintervalle.

Einzig und allein zum Zweck der Veranschaulichung ist der wahre Mittelwert \mu der Grundgesamtheit als gepunktete Linie in der Grafik enthalten.

Anhand dieser Ergebnisse werden verschiedene Charakteristika von Konfidenzintervallen deutlich:

Widerspricht dies dem festgelegten Konfidenzniveau von 0,95?
Die Antwort ist nein, denn das Konfidenzniveau bezieht sich auf eine sehr große Anzahl von Stichproben und 25 Stichproben ist wirklich keine große Anzahl.