Konfidenzintervall für den Erwartungswert bei bekannter Varianz: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Schaetztheorie}} =={{Vorlage:Überschrift}}== ===Konfidenzintervall bei Normalverteilung der Grundgesamtheit=== Die Zufallsvariable <math>X\;</math> i…“)
 
Keine Bearbeitungszusammenfassung
Zeile 420: Zeile 420:
Einzig und allein zum Zweck der Veranschaulichung ist der wahre [[Mittelwert der Grundgesamtheit|Mittelwert <math>\mu</math> der Grundgesamtheit]] als gepunktete Linie in der Grafik enthalten.
Einzig und allein zum Zweck der Veranschaulichung ist der wahre [[Mittelwert der Grundgesamtheit|Mittelwert <math>\mu</math> der Grundgesamtheit]] als gepunktete Linie in der Grafik enthalten.


{|
<iframe k="wiwi" p="examples/stat_Konfidenzintervall_Konfidenzintervall_varianz_bekannt_R00480004800000000000000_plot.html" />
|<R output="display">
pdf(rpdf, width=9, height=7)
x <- c(2415)
y <- c(1:25)
plot(y, col="white", ylim=c(0, 25), xlim=c(0, 2000), axes=FALSE, xlab="Haushaltsnettoeinkommen", ylab="Stichproben-Nr.",sub="Abb. 1: Punktsch\u00E4tzwerte und Sch\u00E4tzintervalle von 25 Zufallsstichproben des Stichprobenumfangs n = 20")
axis(side=1, at=c(0, 500, 1000, 1500, 2000), labels=c(1300, 1800, 2300, 2800, 3300))
axis(side=2, at=c(25:0), las=1)
lines(c(670, 1550), c(1,1), col="red")
points(1113, 1, pch=16, col="blue")
lines(c(573, 1461), c(2,2), col="red")
points(1017, 2, pch=16, col="blue")
lines(c(823, 1711), c(3,3), col="red")
points(1267, 3, pch=16, col="blue")
lines(c(317, 1204), c(4,4), col="red")
points(760, 4, pch=16, col="blue")
lines(c(619, 1507), c(5,5), col="red")
points(1063, 5, pch=16, col="blue")
lines(c(1030, 1918), c(6,6), col="red")
points(1474, 6, pch=16, col="blue")
lines(c(554, 1442), c(7,7), col="red")
points(1000, 7, pch=16, col="blue")
lines(c(497, 1385), c(8,8), col="red")
points(941, 8, pch=16, col="blue")
lines(c(171, 1059), c(9,9), col="red")
points(615, 9, pch=16, col="blue")
lines(c(318, 1206), c(10,10), col="red")
points(762, 10, pch=16, col="blue")
lines(c(523, 1419), c(11,11), col="red")
points(967, 11, pch=16, col="blue")
lines(c(419, 1306), c(12,12), col="red")
points(863, 12, pch=16, col="blue")
lines(c(891, 1778), c(13,13), col="red")
points(1365, 13, pch=16, col="blue")
lines(c(382, 1270), c(14,14), col="red")
points(826, 14, pch=16, col="blue")
lines(c(499, 1387), c(15,15), col="red")
points(943, 15, pch=16, col="blue")
lines(c(617, 1505), c(16,16), col="red")
points(1061, 16, pch=16, col="blue")
lines(c(863, 1751), c(17,17), col="red")
points(1307, 17, pch=16, col="blue")
lines(c(459, 1347), c(18,18), col="red")
points(1019, 18, pch=16, col="blue")
lines(c(1459, 1347), c(19,19), col="red")
points(903, 19, pch=16, col="blue")
lines(c(651, 1539), c(20,20), col="red")
points(1095, 20, pch=16, col="blue")
lines(c(915, 1802), c(21,21), col="red")
points(1359, 21, pch=16, col="blue")
lines(c(424, 1312), c(22,22), col="red")
points(868, 22, pch=16, col="blue")
lines(c(366, 1254), c(23,23), col="red")
points(810, 23, pch=16, col="blue")
lines(c(141, 1028), c(24,24), col="red")
points(584, 24, pch=16, col="blue")
lines(c(671, 1558), c(25,25), col="red")
points(1116, 25, pch=16, col="blue")
abline(v=1115, lty=4, lwd=2)
legend(1550, 25, bty="n", legend = "Stichprobenmittelwert", col="blue", pch=16, cex=0.8)
legend(1550, 24, bty="n", legend = "Konfidenzintervall", pch="-", col="red", cex=0.8)
 
</R>
|}


Anhand dieser Ergebnisse werden verschiedene Charakteristika von [[Konfidenzintervall]]en deutlich:
Anhand dieser Ergebnisse werden verschiedene Charakteristika von [[Konfidenzintervall]]en deutlich:

Version vom 29. Mai 2018, 14:17 Uhr

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall bei Normalverteilung der Grundgesamtheit

Die Zufallsvariable in der Grundgesamtheit sei normalverteilt mit und :

Dann ist

ein Konfidenzintervall für den unbekannten Parameter der normalverteilten Zufallsvariablen mit bekannter Varianz zum Konfidenzniveau

Wurde die Stichprobe gezogen und liegen die Stichprobenwerte vor, dann ist

das arithmetische Mittel dieser Stichprobe (als eine Realisation von ) und

das sich für diese Stichprobe ergebende Schätzintervall.

Die allgemein gegebene Interpretation von Konfidenzintervallen bleibt uneingeschränkt gültig.

Konfidenzintervall bei unbekannter Verteilung der Grundgesamtheit

Wenn die Verteilung der Zufallsvariablen in der Grundgesamtheit unbekannt ist, d.h. beliebig verteilt ist, dann lässt sich keine exakte Aussage über die Verteilung der Schätzfunktion treffen.

Aus vorhergehenden Betrachtungen über den Zentralen Grenzwertsatz ist jedoch bekannt, dass die Verteilung von mit wachsendem Stichprobenumfang gegen eine Normalverteilung strebt.

Somit gilt:

Bei genügend großen Stichprobenumfang ist die Schätzfunktion approximativ normalverteilt:

und die standardisierte Zufallsvariable ist approximativ standardnormalverteilt:

.

Als Faustregel für einen genügend großen Stichprobenumfang gilt .

Dann ist

ein Konfidenzintervall für den unbekannten Parameter , das approximativ das Konfidenzniveau

hat.

Zusatzinformationen

Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Die Zufallsvariable in der Grundgesamtheit sei normalverteilt mit und :

Während die Varianz bekannt sei, ist der Erwartungswert unbekannt und soll unter Verwendung einer einfachen Zufallsstichprobe vom Umfang geschätzt werden.

Die Stichprobenvariablen sind dann unabhängig und ebenfalls normalverteilt mit und :

Daraus folgt, dass auch die Schätzfunktion normalverteilt ist mit dem Erwartungswert und der Varianz :

Die standardisierte Zufallsvariable

ist standardnormalverteilt: .

Für die standardisierte Zufallsvariable lässt sich ein zentrales Schwankungsintervall angeben, in dem Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit

annimmt.

Dabei ist das -Quantil und das -Quantil der Standardnormalverteilung.

Aufgrund der Symmetrie der Standardnormalverteilung gilt:

und

Damit folgt:

Für die Wahrscheinlichkeit findet man in der Tabelle der Standardnormalverteilung.

Nach Einsetzen von und einigen elementaren Umformungen der Ungleichung erhält man:

Mit dem letzten Ausdruck ist das Konfidenzniveau für ein Konfidenzintervall für gegeben.

Der Faktor als Vielfaches der Standardabweichung der Schätzfunktion ergibt sich zu: .

Die Bedingungen für ein Konfidenzintervall sind erfüllt, denn die Verteilung ist bekannt (Standardnormalverteilung) und sie hängt nicht von dem unbekannten Parameter ab.

Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Die Grenzen des Intervalls haben zu den gleichen Abstand. Dieser Abstand, d.h. die halbe Länge des Intervalls, wird in diesem Fall auch als Schätzfehler bezeichnet und mit symbolisiert.
und der Schätzfehler hängen nicht von den Stichprobenvariablen ab.
Bei gegebenen , und ergeben sich von Stichprobe zu Stichprobe unterschiedliche Schätzintervalle, die aber alle die gleiche feste Länge bzw. den gleichen festen Schätzfehler aufweisen.
Je größer (kleiner) die Standardabweichung ist, desto breiter (schmaler) ist unter sonst gleichen Bedingungen das Intervall.
Je größer (kleiner) das Konfidenzniveau ist, um so größer (kleiner) ist und umso breiter (schmaler) ist unter sonst gleichen Bedingungen das Intervall.
Je größer (kleiner) der Stichprobenumfang ist, desto schmaler (breiter) ist unter sonst gleichen Bedingungen das Intervall.
Im Zusammenspiel von Konfidenzniveau und Stichprobenumfang lässt sich somit eine Steuerung für das Konfidenzintervall erreichen.

Beispiele

Haushaltsnettoeinkommen

Für eine Grundgesamtheit von Privathaushalten sei die Zufallsvariable das Haushaltsnettoeinkommen (in €).

Das mittlere Haushaltsnettoeinkommen dieser Grundgesamtheit, d.h. der Erwartungswert , ist unbekannt und soll geschätzt werden.

Über die Punktschätzung hinaus soll ein Konfidenzintervall zum Konfidenzniveau und für die konkreten Stichproben das Schätzintervall angegeben werden.

Zur Schätzung von wird der Stichprobenmittelwert

als Schätzfunktion verwendet.

Eine Zufallsstichprobe vom Umfang liefert die Stichprobenwerte .

Nach Einsetzen dieser Stichprobenwerte in die Schätzfunktion erhält man einen Schätzwert

als Punktschätzung für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Die Angabe des Konfidenzintervalls wird entscheidend von den Informationen, die über die Grundgesamtheit vorliegen, bestimmt.

Es sei bekannt, dass die Zufallsvariable (Haushaltsnettoeinkommen) in der Grundgesamtheit einer Normalverteilung mit der Standardabweichung folgt:

.

Aufgrund dieser Informationen ist

ein Konfidenzintervall für den unbekannten Parameter der Zufallsvariablen (Haushaltnettoeinkommen) zum Konfidenzniveau

Zum vorgegebenen Konfidenzniveau findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung

Nach Einsetzen von und ergibt sich:

und

Nach der Ziehung der Stichprobe ist

das sich für die Stichprobe ergebende Schätzintervall, in dem nur noch der Punktschätzwert und einzusetzen sind.

Eine einfache Zufallsstichprobe vom Umfang Privathaushalten aus der oben genannten Grundgesamtheit liefert die folgenden Stichprobenwerte.

Tabelle 1: Stichprobenwerte des Haushaltsnettoeinkommens einer Stichprobe vom Umfang (der Größe nach geordnet)

Haushaltsnettoeinkommen (€) Haushaltsnettoeinkommen (€)
1 800 11 2500
2 1200 12 2500
3 1400 13 2500
4 1500 14 2700
5 1500 15 2850
6 1500 16 3300
7 1800 17 3650
8 1800 18 3700
9 2300 19 4100
10 2400 20 4300

Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt

und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Als Schätzintervall für diese Stichprobe ergibt sich:

Für dieses Schätzintervall kann nichts darüber ausgesagt werden, ob der wahre Wert des mittleren Haushaltsnettoeinkommens der Grundgesamtheit in dem Intervall enthalten ist oder nicht.

Da jedoch für das Schätzverfahren eine Sicherheitswahrscheinlichkeit von 0,95 (d.h. recht nahe bei Eins) gewählt wurde, unterstellt man, eines der Schätzintervalle zum Stichprobenumfang erhalten zu haben, dass den wahren Wert enthält.

Um die Problematik von Konfidenzintervallen zu demonstrieren, werden 24 weitere Zufallsstichproben vom Umfang aus der gleichen Grundgesamtheit gezogen und das mittlere Haushaltsnettoeinkommen und ein Schätzintervall für jede Stichprobe berechnet, die in der folgenden Tabelle für alle 25 Zufallsstichproben enthalten sind.

Tabelle 2: Mittleres Haushaltsnettoeinkommen (€) und Schätzintervall für 25 Zufallsstichproben vom Umfang

1 2413,40 1969,52 2857,28 14 2126,50 1682,62 2570,38
2 2317,00 1873,12 2760,88 15 2243,15 1799,27 2687,03
3 2567,50 2123,62 3011,38 16 2361,25 1917,37 2805,13
4 2060,90 1617,02 2504,78 17 2607,5 2163,37 3051,13
5 2363,50 1919,62 2807,38 18 2319,55 1875,67 2763,43
6 2774,30 2330,42 3218,18 19 2203,85 1759,97 2647,73
7 2298,80 1854,92 2742,68 20 2395,25 1951,37 2839,13
8 2241,15 1797,27 2685,03 21 2659,00 2215,12 3102,88
9 1915,30 1471,42 2359,18 22 2168,50 1724,62 2612,38
10 2062,15 1618,27 2506,03 23 2110,30 1666,42 2554,18
11 2267,75 1823,87 2711,63 24 1884,90 1441,02 2328,78
12 2163,10 1719,22 2606,98 25 2415,00 1971,12 2858,88
13 2635,00 2191,12 3078,88

Die folgende Abbildung zeigt die 25 Punktschätzwerte und Schätzintervalle.

Einzig und allein zum Zweck der Veranschaulichung ist der wahre Mittelwert der Grundgesamtheit als gepunktete Linie in der Grafik enthalten.

Anhand dieser Ergebnisse werden verschiedene Charakteristika von Konfidenzintervallen deutlich:

Widerspricht dies dem festgelegten Konfidenzniveau von 0,95?
Die Antwort ist nein, denn das Konfidenzniveau bezieht sich auf eine sehr große Anzahl von Stichproben und 25 Stichproben ist wirklich keine große Anzahl.