Grundbegriffe der Schätztheorie: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
{{Schätztheorie}}
{{Schaetztheorie}}


=={{Vorlage:Überschrift}}==
=={{Vorlage:Überschrift}}==

Version vom 18. Mai 2018, 14:30 Uhr

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Schätzung und Schätzverfahren

Gegeben sei eine Grundgesamtheit mit der Verteilung und zugehörigen Parametern (wie z.B. Erwartungswert , Varianz oder Anteilswert ).

Wenn keine Totalerhebung durchgeführt wurde, sind die Verteilung und die Parameter im Allgemeinen unbekannt.

Wie in vorherigen Abschnitten bereits erläutert, können Informationen über die Grundgesamtheit durch (Zufalls-)Stichproben gewonnen werden.

Der Rückschluss von den Ergebnissen der Stichprobe auf die Grundgesamtheit wird als induktiver Schluss bezeichnet.

Die Aussage eines induktiven Schlusses kann nicht mit Sicherheit getroffen werden, sie ist mit dem Risiko eines Fehlers behaftet.

Der Grad der Unsicherheit kann unter bestimmten Voraussetzungen mittels des Instrumentariums der Wahrscheinlichkeitsrechnung gemessen werden.

Die näherungsweise Bestimmung der Verteilung oder von Parametern der Grundgesamtheit auf der Basis von Stichproben wird in der Statistik als Schätzung und die Vorschrift zur Schätzung als Schätzverfahren bezeichnet.

Parameterschätzung

Eine Schätzung der unbekannten Parameter der Grundgesamtheit auf der Basis von Stichproben wird als Parameterschätzung bezeichnet.

bezeichne allgemein einen Parameter der Grundgesamtheit. Der Wert dieses Parameters ist unbekannt und soll mittels einer Zufallsstichprobe geschätzt werden.

Dabei unterscheidet man zwei Arten von Schätzungen: Punktschätzung und Intervallschätzung.

Zunächst wird die Punktschätzung und in einem späteren Unterkapitel die Intervallschätzung erläutert.

Punktschätzung und Schätzwert

Als Punktschätzung wird die Ermittlung eines einzelnen Schätzwertes aufgrund der Ergebnisse einer Zufallsstichprobe bezeichnet. Durch die Punktschätzung erhält man für den unbekannten Parameter der Grundgesamtheit einen Schätzwert als Realisation einer Zufallsvariablen.

Dieser Schätzwert soll ein "möglichst guter" Näherungswert für den unbekannten Parameter der Grundgesamtheit sein.

Grundlage für die Schätzung ist eine einfache Zufallsstichprobe vom Umfang mit den Stichprobenvariablen .

Die Bestimmung der zum unbekannten Parameter der Grundgesamtheit analogen Maßzahl in der Stichprobe beinhaltet die Festlegung einer geeigneten Funktion der Stichprobenvariablen , d.h. die Auswahl einer Stichprobenfunktion.

Schätzfunktion oder Schätzer

Eine Stichprobenfunktion

die aufgrund ihrer Eigenschaften zur Schätzung eines Parameters der Grundgesamtheit geeignet ist, heißt Schätzfunktion oder Schätzer.

Eine Stichprobenfunktion ist eine Funktion von Zufallsvariablen (den Stichprobenvariablen ) und damit selbst wieder eine Zufallsvariable. Daraus folgt, dass auch jede Schätzfunktion eine Zufallsvariable ist.

Für jede konkrete Zufallsstichprobe mit den Stichprobenwerten ergibt sich eine Realisation der Schätzfunktion :

wird als Schätzwert bezeichnet und ist eine Punktschätzung für den unbekannten Parameter der Grundgesamtheit.

Eine Punktschätzung hängt somit vom Stichprobenumfang und den Realisationen der Stichprobenvariablen ab.

Punktschätzungen als Realisationen einer Zufallsvariablen werden nur selten mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmen.

Bei wiederholter Durchführung der Stichprobenziehung erhält man verschiedene Realisationen der Stichprobenvariablen und somit auch verschiedene Schätzwerte, die mehr oder weniger nahe am wahren Wert des Parameters liegen werden.

Das entscheidende Problem der Punktschätzung ist die Wahl des besten Schätzers.

Als Schätzer wird vielfach diejenige Stichprobenfunktion verwendet, die dem zu schätzenden Parameter in der Grundgesamtheit entspricht und bestimmte wünschenswerte Eigenschaften aufweist.

Wie noch zu begründen sein wird, kann z.B. für die Schätzung des unbekannten Erwartungswertes der Grundgesamtheit der Stichprobenmittelwert als arithmetisches Mittel der Stichprobenvariablen

verwendet werden.

Beispiele

Haushaltsnettoeinkommen

Für eine Grundgesamtheit von Privathaushalten sei die Zufallsvariable das Haushaltsnettoeinkommen (in €).

Das mittlere Haushaltsnettoeinkommen dieser Grundgesamtheit, d.h. der Erwartungswert , ist unbekannt und soll geschätzt werden.

Zur Schätzung von wird der Stichprobenmittelwert

als Schätzfunktion verwendet.

Eine Zufallsstichprobe vom Umfang liefert die Stichprobenwerte .

Nach Einsetzen dieser Stichprobenwerte in die Schätzfunktion erhält man einen Schätzwert

als Punktschätzung für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Zufallsstichproben vom Umfang n = 20

Eine Zufallsstichprobe vom Umfang aus der oben genannten Grundgesamtheit (Privathaushalte) liefert die folgenden Stichprobenwerte.

Tabelle 1: Stichprobenwerte des Haushaltsnettoeinkommens einer Stichprobe vom Umfang (der Größe nach geordnet)

Haushaltsnettoeinkommen Haushaltsnettoeinkommen
1 800 11 2500
2 1200 12 2500
3 1400 13 2500
4 1500 14 2700
5 1500 15 2850
6 1500 16 3300
7 1800 17 3650
8 1800 18 3700
9 2300 19 4100
10 2400 20 4300

Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt:

.

und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Wie leicht zu erkennen, ist die Berechnung identisch mit dem arithmetischen Mittel, das bereits in der deskriptiven Statistik verwendet wurde. In der deskriptiven Statistik ist jedoch die Arbeit mit der Aussage

"Das mittlere Haushaltsnettoeinkommen der 20 beobachteten Privathaushalte beträgt 2415 €"

beendet.

Hier wird das Ergebnis der Stichprobe jedoch darüber hinaus verwendet, um auf das mittlere Haushaltsnettoeinkommen aller 2000 Privathaushalte zu schließen, indem als Schätzwert für verwendet wird.

Wie aussagekräftig, d.h. wie genau dieser Schätzwert den wahren Mittelwert der Grundgesamtheit trifft, bleibt an dieser Stelle zunächst noch offen.

Um die Problematik von Punktschätzungen zu demonstrieren, werden 24 weitere Zufallsstichproben vom Umfang aus der gleichen Grundgesamtheit gezogen und das mittlere Haushaltsnettoeinkommen in jeder Stichprobe berechnet.

Die folgende Tabelle enthält das mittlere Haushaltsnettoeinkommen aller 25 Zufallsstichproben.

Tabelle 2: Mittleres Haushaltsnettoeinkommen (€) in 25 Zufallsstichproben vom Umfang (der Größe nach geordnet)

Stichprobe Stichprobe Stichprobe
1 1884,90 10 2241,15 18 2395,25
2 1915,30 11 2243,15 19 2413,40
3 2060,90 12 2267,75 20 2415,00
4 2062,15 13 2298,80 21 2567,50
5 2110,30 14 2317,00 22 2607,25
6 2126,50 15 2319,55 23 2635,00
7 2163,10 16 2361,25 24 2659,00
8 2168,50 17 2363,50 25 2774,30
9 2203,85

Anhand dieser Ergebnisse wird der Zufallscharakter des Schätzverfahrens deutlich. Die Schätzfunktion ist eine Zufallsvariable, da von Stichprobe zu Stichprobe aufgrund der verschiedenen Stichprobenwerte ein anderer Schätzwert resultiert.

Folglich wird dem Parameter der Grundgesamtheit durch eine Punktschätzung ein Schätzwert zugewiesen, der von der konkreten Stichprobe abhängig ist und fast immer vom wahren Wert des Parameters (dem mittleren Haushaltsnettoeinkommen der 2000 Privathaushalte) verschieden sein wird.

Die Konsequenz ist, dass Punktschätzungen durch die Angabe der Präzision des Schätzverfahrens (z.B. die Standardabweichung des Schätzers) oder durch andere Schätzverfahren ergänzt werden müssen.

Die folgenden Grafiken enthalten die Schätzwerte der 25 Zufallsstichproben als Punkte.

Um die Abweichung der Schätzwerte vom wahren Mittelwert der Grundgesamtheit zu verdeutlichen, wurde der tatsächliche Wert als gestrichelte Linie in die Graphiken eingetragen.

<R output="display">

pdf(rpdf,width=7,height=7)

Einkommen <-c(1884.90,1915.30,2060.90,2062.15,2110.30,2126.50,2163.10,2168.50,2203.85,2241.15,2243.15,2267.75,2298.80,2317.00,2319.55,2361.25, 2363.50,2395.25,2413.40,2415.00,2567.50,2607.25,2635.00,2659.00,2774.30) Nr <- c(1:25) Einkommen2 <- sample(Einkommen) mean <- mean(Einkommen)

par(las=1) plot(Einkommen2, Nr, pch=16, col="blue", xlab="mittleres Haushaltsnettoeinkommen", "bty"="l", font.lab=2, ylab="Nr. der Stichprobe", xaxt="n", xlim=c(1800, 2800), "xaxs"="i", ylim=c(0,26), yaxp=c(0, 26, 13), "yaxs"="i", sub="Abb. 1: Sch\u00E4tzwerte von 25 Zufallsstichproben des Stichprobenumfangs n = 20") axis(at=c(1800, 2000, 2200, 2400, 2600, 2800), side=1, tick=TRUE, labels=TRUE, lwd.ticks=2) abline(v=2365, lwd=6, lty=2)

</R>

<R output="display">

pdf(rpdf,width=7,height=7)

Einkommen <-c(1884.90,1915.30,2060.90,2062.15,2110.30,2126.50,2163.10,2168.50,2203.85,2241.15,2243.15,2267.75,2298.80,2317.00,2319.55,2361.25, 2363.50,2395.25,2413.40,2415.00,2567.50,2607.25,2635.00,2659.00,2774.30) Nr <- c(1:25) Einkommen2 <- sample(Einkommen) mean <- mean(Einkommen)

par(las=1) plot(Einkommen2, Nr, pch=16, col="blue", xlab="mittleres Haushaltsnettoeinkommen", "bty"="l", font.lab=2, ylab="Nr. der Stichprobe", xaxt="n", xlim=c(1, 5000), "xaxs"="i", ylim=c(0,26), yaxp=c(0, 26, 13), "yaxs"="i", sub="Abb. 2: Sch\u00E4tzwerte von 25 Zufallsstichproben des Stichprobenumfangs n = 20") axis(at=seq(500,5000,500), side=1, tick=TRUE, labels=TRUE, lwd.ticks=2) abline(v=2365, lwd=6, lty=2)

</R>

Zufallsstichproben vom Umfang n = 100

Es wurden aus der gleichen Grundgesamtheit 100 Zufallsstichproben vom Umfang gezogen und das mittlere Haushaltsnettoeinkommen in jeder Stichprobe berechnet. Auf die Angabe der numerischen Resultate wird hier verzichtet.

Die nachstehenden Grafiken enthalten die Schätzwerte der 100 Zufallsstichproben als Punkte. Es wurde wiederum der tatsächliche Wert als gestrichelte Linie in die Grafiken eingetragen.

<R output="display">

pdf(rpdf,width=7,height=7)

set.seed(1) Einkommen <- rnorm(100, 2362, 150) Nr <- c(1:100)

par(las=1) plot(Einkommen, Nr, pch=16, col="blue", xlab="mittleres Haushaltsnettoeinkommen", font.lab=2, bty="l", ylab="Nr. der Stichprobe", xaxt="n", xlim=c(2000, 2800), "xaxs"="i", ylim=c(0,110), yaxp=c(0, 110, 11), "yaxs"="i", sub="Abb. 3: Sch\u00E4tzwerte von 100 Zufallsstichproben des Stichprobenumfangs n = 100") axis(at=c(2000, 2200, 2400, 2600, 2800), side=1, tick=TRUE, labels=TRUE, lwd.ticks=2) abline(v=2362, lwd=6, lty=2)

</R>

<R output="display">

pdf(rpdf,width=7,height=7)

set.seed(1) Einkommen <- rnorm(100, 2362, 150) Nr <- c(1:100)

par(las=1) plot(Einkommen, Nr, pch=16, col="blue", xlab="mittleres Haushaltsnettoeinkommen", font.lab=2, bty="l", ylab="Nr. der Stichprobe", xaxt="n", xlim=c(1, 5000), "xaxs"="i", ylim=c(0,110), yaxp=c(0, 110, 11), "yaxs"="i", sub="Abb. 4: Sch\u00E4tzwerte von 100 Zufallsstichproben des Stichprobenumfangs n = 100") axis(at=seq(500,5000,500), side=1, tick=TRUE, labels=TRUE, lwd.ticks=2) abline(v=2362, lwd=6, lty=2)

</R>