Grundbegriffe der Schätztheorie: Unterschied zwischen den Versionen
Aus MM*Stat
Keine Bearbeitungszusammenfassung |
|||
Zeile 269: | Zeile 269: | ||
<iframe k="wiwi" p="examples/stat_GrundbegriffeSchaetztheorie_Schaetzwerte_Haushalt_R00480004801536915833556_plot.html" /> | <iframe k="wiwi" p="examples/stat_GrundbegriffeSchaetztheorie_Schaetzwerte_Haushalt_R00480004801536915833556_plot.html" /> | ||
<iframe k="wiwi" p="examples/ | <iframe k="wiwi" p="examples/stat_GrundbegriffeSchaetztheorie_Schaetzwerte_Haushalt_2_R00480004801536916022351_plot.html" /> | ||
====Zufallsstichproben vom Umfang n = 100==== | ====Zufallsstichproben vom Umfang n = 100==== | ||
Zeile 276: | Zeile 276: | ||
Die nachstehenden Grafiken enthalten die [[Schätzwert]]e <math>\bar{x}</math> der 100 [[Zufallsstichprobe]]n als Punkte. Es wurde wiederum der tatsächliche Wert <math>\mu</math> als gestrichelte Linie in die Grafiken eingetragen. | Die nachstehenden Grafiken enthalten die [[Schätzwert]]e <math>\bar{x}</math> der 100 [[Zufallsstichprobe]]n als Punkte. Es wurde wiederum der tatsächliche Wert <math>\mu</math> als gestrichelte Linie in die Grafiken eingetragen. | ||
<iframe k="wiwi" p="examples/ | <iframe k="wiwi" p="examples/stat_GrundbegriffeSchaetztheorie_Schaetzwerte_Haushalt_3_100_R00480004801536916137332_plot.html" /> | ||
<iframe k="wiwi" p="examples/ | <iframe k="wiwi" p="examples/stat_GrundbegriffeSchaetztheorie_Schaetzwerte_Haushalt_4_100_R00480004801536916165591_plot.html" /> | ||
<!--===Nettoeinkommen und Alter=== | <!--===Nettoeinkommen und Alter=== |
Aktuelle Version vom 14. September 2018, 10:09 Uhr
Grundbegriffe
Schätzung und Schätzverfahren
Gegeben sei eine Grundgesamtheit mit der Verteilung und zugehörigen Parametern (wie z.B. Erwartungswert , Varianz oder Anteilswert ).
Wenn keine Totalerhebung durchgeführt wurde, sind die Verteilung und die Parameter im Allgemeinen unbekannt.
Wie in vorherigen Abschnitten bereits erläutert, können Informationen über die Grundgesamtheit durch (Zufalls-)Stichproben gewonnen werden.
Der Rückschluss von den Ergebnissen der Stichprobe auf die Grundgesamtheit wird als induktiver Schluss bezeichnet.
Die Aussage eines induktiven Schlusses kann nicht mit Sicherheit getroffen werden, sie ist mit dem Risiko eines Fehlers behaftet.
Der Grad der Unsicherheit kann unter bestimmten Voraussetzungen mittels des Instrumentariums der Wahrscheinlichkeitsrechnung gemessen werden.
Die näherungsweise Bestimmung der Verteilung oder von Parametern der Grundgesamtheit auf der Basis von Stichproben wird in der Statistik als Schätzung und die Vorschrift zur Schätzung als Schätzverfahren bezeichnet.
Parameterschätzung
Eine Schätzung der unbekannten Parameter der Grundgesamtheit auf der Basis von Stichproben wird als Parameterschätzung bezeichnet.
bezeichne allgemein einen Parameter der Grundgesamtheit. Der Wert dieses Parameters ist unbekannt und soll mittels einer Zufallsstichprobe geschätzt werden.
Dabei unterscheidet man zwei Arten von Schätzungen: Punktschätzung und Intervallschätzung.
Zunächst wird die Punktschätzung und in einem späteren Unterkapitel die Intervallschätzung erläutert.
Punktschätzung und Schätzwert
Als Punktschätzung wird die Ermittlung eines einzelnen Schätzwertes aufgrund der Ergebnisse einer Zufallsstichprobe bezeichnet. Durch die Punktschätzung erhält man für den unbekannten Parameter der Grundgesamtheit einen Schätzwert als Realisation einer Zufallsvariablen.
Dieser Schätzwert soll ein "möglichst guter" Näherungswert für den unbekannten Parameter der Grundgesamtheit sein.
Grundlage für die Schätzung ist eine einfache Zufallsstichprobe vom Umfang mit den Stichprobenvariablen .
Die Bestimmung der zum unbekannten Parameter der Grundgesamtheit analogen Maßzahl in der Stichprobe beinhaltet die Festlegung einer geeigneten Funktion der Stichprobenvariablen , d.h. die Auswahl einer Stichprobenfunktion.
Schätzfunktion oder Schätzer
Eine Stichprobenfunktion
die aufgrund ihrer Eigenschaften zur Schätzung eines Parameters der Grundgesamtheit geeignet ist, heißt Schätzfunktion oder Schätzer.
Eine Stichprobenfunktion ist eine Funktion von Zufallsvariablen (den Stichprobenvariablen ) und damit selbst wieder eine Zufallsvariable. Daraus folgt, dass auch jede Schätzfunktion eine Zufallsvariable ist.
Für jede konkrete Zufallsstichprobe mit den Stichprobenwerten ergibt sich eine Realisation der Schätzfunktion :
wird als Schätzwert bezeichnet und ist eine Punktschätzung für den unbekannten Parameter der Grundgesamtheit.
Eine Punktschätzung hängt somit vom Stichprobenumfang und den Realisationen der Stichprobenvariablen ab.
Punktschätzungen als Realisationen einer Zufallsvariablen werden nur selten mit dem wahren Wert des Parameters in der Grundgesamtheit übereinstimmen.
Bei wiederholter Durchführung der Stichprobenziehung erhält man verschiedene Realisationen der Stichprobenvariablen und somit auch verschiedene Schätzwerte, die mehr oder weniger nahe am wahren Wert des Parameters liegen werden.
Das entscheidende Problem der Punktschätzung ist die Wahl des besten Schätzers.
Als Schätzer wird vielfach diejenige Stichprobenfunktion verwendet, die dem zu schätzenden Parameter in der Grundgesamtheit entspricht und bestimmte wünschenswerte Eigenschaften aufweist.
Wie noch zu begründen sein wird, kann z.B. für die Schätzung des unbekannten Erwartungswertes der Grundgesamtheit der Stichprobenmittelwert als arithmetisches Mittel der Stichprobenvariablen
verwendet werden.
Beispiele
Haushaltsnettoeinkommen
Für eine Grundgesamtheit von Privathaushalten sei die Zufallsvariable das Haushaltsnettoeinkommen (in €).
Das mittlere Haushaltsnettoeinkommen dieser Grundgesamtheit, d.h. der Erwartungswert , ist unbekannt und soll geschätzt werden.
Zur Schätzung von wird der Stichprobenmittelwert
als Schätzfunktion verwendet.
Eine Zufallsstichprobe vom Umfang liefert die Stichprobenwerte .
Nach Einsetzen dieser Stichprobenwerte in die Schätzfunktion erhält man einen Schätzwert
als Punktschätzung für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.
Zufallsstichproben vom Umfang n = 20
Eine Zufallsstichprobe vom Umfang aus der oben genannten Grundgesamtheit (Privathaushalte) liefert die folgenden Stichprobenwerte.
Tabelle 1: Stichprobenwerte des Haushaltsnettoeinkommens einer Stichprobe vom Umfang (der Größe nach geordnet)
Haushaltsnettoeinkommen | Haushaltsnettoeinkommen | ||
1 | 800 | 11 | 2500 |
2 | 1200 | 12 | 2500 |
3 | 1400 | 13 | 2500 |
4 | 1500 | 14 | 2700 |
5 | 1500 | 15 | 2850 |
6 | 1500 | 16 | 3300 |
7 | 1800 | 17 | 3650 |
8 | 1800 | 18 | 3700 |
9 | 2300 | 19 | 4100 |
10 | 2400 | 20 | 4300 |
Das mittlere Haushaltsnettoeinkommen dieser Stichprobe beträgt:
.
und ist ein Schätzwert für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.
Wie leicht zu erkennen, ist die Berechnung identisch mit dem arithmetischen Mittel, das bereits in der deskriptiven Statistik verwendet wurde. In der deskriptiven Statistik ist jedoch die Arbeit mit der Aussage
"Das mittlere Haushaltsnettoeinkommen der 20 beobachteten Privathaushalte beträgt 2415 €"
beendet.
Hier wird das Ergebnis der Stichprobe jedoch darüber hinaus verwendet, um auf das mittlere Haushaltsnettoeinkommen aller 2000 Privathaushalte zu schließen, indem als Schätzwert für verwendet wird.
Wie aussagekräftig, d.h. wie genau dieser Schätzwert den wahren Mittelwert der Grundgesamtheit trifft, bleibt an dieser Stelle zunächst noch offen.
Um die Problematik von Punktschätzungen zu demonstrieren, werden 24 weitere Zufallsstichproben vom Umfang aus der gleichen Grundgesamtheit gezogen und das mittlere Haushaltsnettoeinkommen in jeder Stichprobe berechnet.
Die folgende Tabelle enthält das mittlere Haushaltsnettoeinkommen aller 25 Zufallsstichproben.
Tabelle 2: Mittleres Haushaltsnettoeinkommen (€) in 25 Zufallsstichproben vom Umfang (der Größe nach geordnet)
Stichprobe | Stichprobe | Stichprobe | |||
1 | 1884,90 | 10 | 2241,15 | 18 | 2395,25 |
2 | 1915,30 | 11 | 2243,15 | 19 | 2413,40 |
3 | 2060,90 | 12 | 2267,75 | 20 | 2415,00 |
4 | 2062,15 | 13 | 2298,80 | 21 | 2567,50 |
5 | 2110,30 | 14 | 2317,00 | 22 | 2607,25 |
6 | 2126,50 | 15 | 2319,55 | 23 | 2635,00 |
7 | 2163,10 | 16 | 2361,25 | 24 | 2659,00 |
8 | 2168,50 | 17 | 2363,50 | 25 | 2774,30 |
9 | 2203,85 |
Anhand dieser Ergebnisse wird der Zufallscharakter des Schätzverfahrens deutlich. Die Schätzfunktion ist eine Zufallsvariable, da von Stichprobe zu Stichprobe aufgrund der verschiedenen Stichprobenwerte ein anderer Schätzwert resultiert.
Folglich wird dem Parameter der Grundgesamtheit durch eine Punktschätzung ein Schätzwert zugewiesen, der von der konkreten Stichprobe abhängig ist und fast immer vom wahren Wert des Parameters (dem mittleren Haushaltsnettoeinkommen der 2000 Privathaushalte) verschieden sein wird.
Die Konsequenz ist, dass Punktschätzungen durch die Angabe der Präzision des Schätzverfahrens (z.B. die Standardabweichung des Schätzers) oder durch andere Schätzverfahren ergänzt werden müssen.
Die folgenden Grafiken enthalten die Schätzwerte der 25 Zufallsstichproben als Punkte.
Um die Abweichung der Schätzwerte vom wahren Mittelwert der Grundgesamtheit zu verdeutlichen, wurde der tatsächliche Wert als gestrichelte Linie in die Graphiken eingetragen.
Zufallsstichproben vom Umfang n = 100
Es wurden aus der gleichen Grundgesamtheit 100 Zufallsstichproben vom Umfang gezogen und das mittlere Haushaltsnettoeinkommen in jeder Stichprobe berechnet. Auf die Angabe der numerischen Resultate wird hier verzichtet.
Die nachstehenden Grafiken enthalten die Schätzwerte der 100 Zufallsstichproben als Punkte. Es wurde wiederum der tatsächliche Wert als gestrichelte Linie in die Grafiken eingetragen.