|
|
(3 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) |
Zeile 1: |
Zeile 1: |
| {{Schaetztheorie}} | | {{Schaetztheorie}} |
| | {{SubpageToc|Beispiel: Haushaltsnettoeinkommen|Beispiel: Glühlampen}} |
|
| |
|
| =={{Vorlage:Überschrift}}== | | =={{Vorlage:Überschrift}}== |
Zeile 119: |
Zeile 120: |
|
| |
|
| : Die zusätzliche Unsicherheit bezüglich <math>\sigma^{2}</math> ist in die [[t-Verteilung]] "eingearbeitet". | | : Die zusätzliche Unsicherheit bezüglich <math>\sigma^{2}</math> ist in die [[t-Verteilung]] "eingearbeitet". |
|
| |
| =={{Vorlage:Beispiele}}==
| |
|
| |
| ===Haushaltsnettoeinkommen===
| |
|
| |
| Für eine [[Grundgesamtheit]] von <math>N = 2000</math> Privathaushalten sei die [[Zufallsvariable]] <math>X\;</math> das Haushaltsnettoeinkommen (in €).
| |
|
| |
| Das mittlere Haushaltsnettoeinkommen dieser [[Grundgesamtheit]], d.h. der [[Erwartungswert der Grundgesamtheit|Erwartungswert]] <math>E[X] = \mu</math>, ist unbekannt und soll geschätzt werden.
| |
|
| |
| Über die [[Punktschätzung]] hinaus soll ein [[Konfidenzintervall]] zum [[Konfidenzniveau]] <math>1-\alpha=0,95</math> und für die konkreten [[Stichprobe]]n das [[Schätzintervall]] angegeben werden.
| |
|
| |
| Zur [[Schätzung]] von <math>\mu</math> wird der [[Stichprobenmittelwert]]
| |
|
| |
| <math>\bar{X}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}X_{i}</math>
| |
|
| |
| als [[Schätzfunktion]] verwendet.
| |
|
| |
| Eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> liefert die [[Stichprobenwerte]] <math>x_{1},\ldots, x_{n}</math>.
| |
|
| |
| Nach Einsetzen dieser [[Stichprobenwerte]] in die [[Schätzfunktion]] erhält man einen [[Schätzwert]]
| |
|
| |
| <math>\bar{x}=\frac{1}{n}\cdot\sum\limits_{i=1}^{n}x_{i}</math>
| |
|
| |
| als [[Punktschätzung]] für das mittlere Haushaltsnettoeinkommen der [[Grundgesamtheit]].
| |
|
| |
| Die Angabe des [[Konfidenzintervall]]s wird entscheidend von den Informationen, die über die [[Grundgesamtheit]] vorliegen, bestimmt.
| |
|
| |
| ====Konfidenzintervall bei normalverteilter Grundgesamtheit====
| |
|
| |
| Es wird wiederum davon ausgegangen, dass die [[Zufallsvariable]] <math>X\;</math> (Haushaltsnettoeinkommen) in der [[Grundgesamtheit]] [[Normalverteilung|normalverteilt]] ist, jedoch sei nunmehr die [[Standardabweichung (stochastisch)|Standardabweichung]] unbekannt: <math>X\sim N(\mu;\sigma)\;</math>.
| |
|
| |
| Für die Bestimmung eines [[Konfidenzintervall]]s für <math>\mu</math> muß die [[Varianz der Grundgesamtheit|Varianz]] <math>\sigma^{2}</math> [[Schätzung|geschätzt]] werden, was mittels der [[Schätzfunktion]] <math>S^{2}</math> erfolgt.
| |
|
| |
| Aufgrund dieser Informationen ist
| |
|
| |
| <math>\left[ \bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}};\;\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right]</math>
| |
|
| |
| ein [[Konfidenzintervall]] für den unbekannten [[Parameter]] <math>\mu</math> der [[Zufallsvariable]]n <math>X\;</math> (Haushaltnettoeinkommen) zum [[Konfidenzniveau]]
| |
|
| |
| <math>P\left( \bar{X}-t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\leq\mu\leq\bar{X}+t_{n-1;1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right) =1-\alpha</math>
| |
|
| |
| Zum vorgegebenen [[Konfidenzniveau]] <math>1-\alpha=0.95</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[t-Verteilung]]:
| |
|
| |
| <math>t_{n-1;1-\frac{\alpha}{2}}=t_{19;0,975}=2,093</math>.
| |
|
| |
| Nach der Ziehung der [[Stichprobe]] ist
| |
|
| |
| <math>\left[ \bar{x}-2,093\cdot\frac{s}{\sqrt{n}};\;\bar{x}+2,093\cdot\frac{s}{\sqrt {n}}\right]</math>
| |
|
| |
| das sich für die [[Stichprobe]] ergebende [[Schätzintervall]], in dem die Punkt[[schätzwert]]e <math>\bar{x}</math> und <math>s</math> sowie <math>n</math> einzusetzen sind.
| |
|
| |
| Um diese Veränderung in der Bestimmung des [[Konfidenzintervall]]s zu veranschaulichen, wird von den gleichen 25 [[Einfache Zufallsstichprobe|einfachen Zufallsstichproben]] vom [[Stichprobenumfang|Umfang]] <math>n = 20</math> wie unter Punkt 1.1. ausgegangen.
| |
|
| |
| Für die [[Stichprobe]] Nr. 25, deren [[Stichprobenwerte]] in der Tabelle 1 enthalten sind, ergibt sich ein mittleres Haushaltsnettoeinkommen von
| |
|
| |
| <math>\bar{x}=\frac{48300}{20}=2415\,\euro</math>
| |
|
| |
| und eine [[Standardabweichung (stochastisch)|Standardabweichung]]
| |
|
| |
| <math>s=1001,065\,\euro</math>
| |
|
| |
| und damit das [[Schätzintervall]]
| |
|
| |
| {|
| |
| |<math>\left[ 2415-2,093\cdot\frac{1001,065}{\sqrt{20}};\; 2415+2,093\cdot\frac{1001,065}{\sqrt{20}}\right]</math>
| |
| |<math>=[2415-468,51;\; 2415+468,51]</math>
| |
| |-
| |
| |
| |
| |<math>=[1946,49;\; 2883,51]</math>
| |
| |}
| |
|
| |
| Die Interpretation dieses [[Schätzintervall]]s ist wie vorher.
| |
|
| |
| Tabelle 3 enthält das mittlere Haushaltsnettoeinkommen <math>\bar{x}</math>, die [[Standardabweichung (stochastisch)|Standardabweichung]] <math>s</math>, das [[Schätzintervall]] sowie den [[Schätzfehler]] <math>e</math> für die 25 [[Zufallsstichprobe]]n.
| |
|
| |
| Tabelle 3: Mittleres Haushaltsnettoeinkommen (€) <math>\bar{x}</math>, [[Standardabweichung (stochastisch)|Standardabweichung]] <math>s</math>, [[Schätzintervall]] und [[Schätzfehler]] <math>e</math> für 25 [[Zufallsstichprobe]]n vom [[Stichprobenumfang|Umfang]] <math>n = 20</math>
| |
|
| |
| {| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center"|<math>i\;</math>
| |
| |align="center"|<math>\bar{x}</math>
| |
| |align="center"|<math>s\;</math>
| |
| |align="center"|<math>v_{u}\;</math>
| |
| |align="center"|<math>v_{o}\;</math>
| |
| |align="center"|<math>e\;</math>
| |
| |-
| |
| |align="center"|1
| |
| |align="center"|2413,40
| |
| |align="center"|1032,150
| |
| |align="center"|1930,34
| |
| |align="center"|2896,46
| |
| |align="center"|966,12
| |
| |-
| |
| |align="center"|2
| |
| |align="center"|2317,00
| |
| |align="center"|872,325
| |
| |align="center"|1908,74
| |
| |align="center"|2825,26
| |
| |align="center"|816,52
| |
| |-
| |
| |align="center"|3
| |
| |align="center"|2567,50
| |
| |align="center"|1002,008
| |
| |align="center"|2098,55
| |
| |align="center"|3036,45
| |
| |align="center"|937,90
| |
| |-
| |
| |align="center"|4
| |
| |align="center"|2060,90
| |
| |align="center"|812,365
| |
| |align="center"|1680,71
| |
| |align="center"|2441,09
| |
| |align="center"|760,38
| |
| |-
| |
| |align="center"|5
| |
| |align="center"|2363,50
| |
| |align="center"|1376,648
| |
| |align="center"|1719,22
| |
| |align="center"|3007,78
| |
| |align="center"|1288,56
| |
| |-
| |
| |align="center"|6
| |
| |align="center"|2774,30
| |
| |align="center"|1213,779
| |
| |align="center"|2206,24
| |
| |align="center"|3342,63
| |
| |align="center"|1136,12
| |
| |-
| |
| |align="center"|7
| |
| |align="center"|2298,80
| |
| |align="center"|843,736
| |
| |align="center"|1903,92
| |
| |align="center"|2693,68
| |
| |align="center"|789,76
| |
| |-
| |
| |align="center"|8
| |
| |align="center"|2241,15
| |
| |align="center"|1116,827
| |
| |align="center"|1718,46
| |
| |align="center"|2763,84
| |
| |align="center"|1045,38
| |
| |-
| |
| |align="center"|9
| |
| |align="center"|1915.30
| |
| |align="center"|1113,122
| |
| |align="center"|1394,35
| |
| |align="center"|2436,25
| |
| |align="center"|1041,90
| |
| |-
| |
| |align="center"|10
| |
| |align="center"|2062,15
| |
| |align="center"|856,069
| |
| |align="center"|1661,50
| |
| |align="center"|2462,80
| |
| |align="center"|801,30
| |
| |-
| |
| |align="center"|11
| |
| |align="center"|2267,75
| |
| |align="center"|1065,227
| |
| |align="center"|1769,21
| |
| |align="center"|2766,29
| |
| |align="center"|997,08
| |
| |-
| |
| |align="center"|12
| |
| |align="center"|2163,10
| |
| |align="center"|1040,966
| |
| |align="center"|1675,92
| |
| |align="center"|2650,28
| |
| |align="center"|974,36
| |
| |-
| |
| |align="center"|13
| |
| |align="center"|2635,00
| |
| |align="center"|1154,294
| |
| |align="center"|2094,78
| |
| |align="center"|3175,22
| |
| |align="center"|1080,44
| |
| |-
| |
| |align="center"|14
| |
| |align="center"|2126,50
| |
| |align="center"|1103,508
| |
| |align="center"|1610,05
| |
| |align="center"|2642,95
| |
| |align="center"|1032,90
| |
| |-
| |
| |align="center"|15
| |
| |align="center"|2243,15
| |
| |align="center"|1126,913
| |
| |align="center"|1715,74
| |
| |align="center"|2770,56
| |
| |align="center"|1054,82
| |
| |-
| |
| |align="center"|16
| |
| |align="center"|2361,25
| |
| |align="center"|1166,260
| |
| |align="center"|1815,43
| |
| |align="center"|2907,07
| |
| |align="center"|1091,64
| |
| |-
| |
| |align="center"|17
| |
| |align="center"|2607,25
| |
| |align="center"|848,019
| |
| |align="center"|2210,37
| |
| |align="center"|3004,13
| |
| |align="center"|793,76
| |
| |-
| |
| |align="center"|18
| |
| |align="center"|2319,55
| |
| |align="center"|941,236
| |
| |align="center"|1879,04
| |
| |align="center"|2760,06
| |
| |align="center"|881,02
| |
| |-
| |
| |align="center"|19
| |
| |align="center"|2203,85
| |
| |align="center"|974,980
| |
| |align="center"|1747,55
| |
| |align="center"|2660,15
| |
| |align="center"|912,60
| |
| |-
| |
| |align="center"|20
| |
| |align="center"|2395,25
| |
| |align="center"|899,461
| |
| |align="center"|1974,29
| |
| |align="center"|2816,21
| |
| |align="center"|841,92
| |
| |-
| |
| |align="center"|21
| |
| |align="center"|2659,00
| |
| |align="center"|969,720
| |
| |align="center"|2205,16
| |
| |align="center"|3112,84
| |
| |align="center"|907,68
| |
| |-
| |
| |align="center"|22
| |
| |align="center"|2168,50
| |
| |align="center"|763,222
| |
| |align="center"|1811,31
| |
| |align="center"|2525,69
| |
| |align="center"|714,38
| |
| |-
| |
| |align="center"|23
| |
| |align="center"|2110,30
| |
| |align="center"|1127,608
| |
| |align="center"|1582,57
| |
| |align="center"|2638,03
| |
| |align="center"|1055,46
| |
| |-
| |
| |align="center"|24
| |
| |align="center"|1884,90
| |
| |align="center"|928,420
| |
| |align="center"|1450,39
| |
| |align="center"|2319,41
| |
| |align="center"|869,02
| |
| |-
| |
| |align="center"|25
| |
| |align="center"|2415,00
| |
| |align="center"|1001,065
| |
| |align="center"|1946,49
| |
| |align="center"|2883,51
| |
| |align="center"|937,02
| |
| |}
| |
|
| |
| Die folgende Abbildung enthält die grafische Darstellung der 25 Punkt[[schätzwert]]e und [[Schätzintervall]]e.
| |
|
| |
| Auch hier wird einzig und allein zum Zweck der Veranschaulichung der wahre [[Mittelwert der Grundgesamtheit|Mittelwert <math>\mu</math> der Grundgesamtheit]] als gestrichelte Linie in die Grafik eingefügt.
| |
|
| |
| {|
| |
| |<R output="display">
| |
| pdf(rpdf, width=9, height=7)
| |
| x <- c(2415)
| |
| y <- c(1:25)
| |
| plot(y, col="white", ylim=c(0, 25), xlim=c(0, 2000), axes=FALSE, xlab="Haushaltsnettoeinkommen", ylab="Stichproben-Nr.", sub="Abb. 1: Sch\u00E4tzintervalle von 25 Zufallsstichproben des Stichprobenumfangs n = 20")
| |
| axis(side=1, at=c(0, 500, 1000, 1500, 2000), labels=c(1300, 1800, 2300, 2800, 3300))
| |
| axis(side=2, at=c(25:0), las=1)
| |
| lines(c(630, 1596), c(1,1), col="red")
| |
| points(1113, 1, pch=16, col="blue")
| |
| lines(c(608, 1525), c(2,2), col="red")
| |
| points(1017, 2, pch=16, col="blue")
| |
| lines(c(798, 1736), c(3,3), col="red")
| |
| points(1267, 3, pch=16, col="blue")
| |
| lines(c(380, 1141), c(4,4), col="red")
| |
| points(760, 4, pch=16, col="blue")
| |
| lines(c(419, 1707), c(5,5), col="red")
| |
| points(1063, 5, pch=16, col="blue")
| |
| lines(c(906, 2042), c(6,6), col="red")
| |
| points(1474, 6, pch=16, col="blue")
| |
| lines(c(603, 1393), c(7,7), col="red")
| |
| points(1000, 7, pch=16, col="blue")
| |
| lines(c(418, 1463), c(8,8), col="red")
| |
| points(941, 8, pch=16, col="blue")
| |
| lines(c(94, 1136), c(9,9), col="red")
| |
| points(615, 9, pch=16, col="blue")
| |
| lines(c(361, 1162), c(10,10), col="red")
| |
| points(762, 10, pch=16, col="blue")
| |
| lines(c(469, 1466), c(11,11), col="red")
| |
| points(967, 11, pch=16, col="blue")
| |
| lines(c(375, 1350), c(12,12), col="red")
| |
| points(863, 12, pch=16, col="blue")
| |
| lines(c(794, 1875), c(13,13), col="red")
| |
| points(1365, 13, pch=16, col="blue")
| |
| lines(c(310, 1342), c(14,14), col="red")
| |
| points(826, 14, pch=16, col="blue")
| |
| lines(c(415, 1470), c(15,15), col="red")
| |
| points(943, 15, pch=16, col="blue")
| |
| lines(c(515, 1607), c(16,16), col="red")
| |
| points(1061, 16, pch=16, col="blue")
| |
| lines(c(910, 1704), c(17,17), col="red")
| |
| points(1307, 17, pch=16, col="blue")
| |
| lines(c(579, 1460), c(18,18), col="red")
| |
| points(1019, 18, pch=16, col="blue")
| |
| lines(c(447, 1360), c(19,19), col="red")
| |
| points(903, 19, pch=16, col="blue")
| |
| lines(c(674, 1516), c(20,20), col="red")
| |
| points(1095, 20, pch=16, col="blue")
| |
| lines(c(905, 1812), c(21,21), col="red")
| |
| points(1359, 21, pch=16, col="blue")
| |
| lines(c(511, 1225), c(22,22), col="red")
| |
| points(868, 22, pch=16, col="blue")
| |
| lines(c(282, 1338), c(23,23), col="red")
| |
| points(810, 23, pch=16, col="blue")
| |
| lines(c(150, 1019), c(24,24), col="red")
| |
| points(584, 24, pch=16, col="blue")
| |
| lines(c(646, 1583), c(25,25), col="red")
| |
| points(1116, 25, pch=16, col="blue")
| |
| abline(v=1115, lty=4, lwd=2)
| |
| legend(1550, 25, bty="n", legend = "Stichprobenmittelwert", col="blue", pch=16, cex=0.8)
| |
| legend(1550, 24, bty="n", legend = "Konfidenzintervall", pch="-", col="red", cex=0.8)
| |
| </R>
| |
| |}
| |
|
| |
| In diesem Fall überdeckt nur ein [[Schätzintervall]] (der [[Stichprobe]] Nr. 24) nicht den wahren Wert <math>\mu</math> des mittleren Haushaltsnettoeinkommens.
| |
|
| |
| Aus Tabelle 3 und Abb. 2 ist zu erkennen, dass hier die [[Länge des Konfidenzintervalls|Länge <math>L</math> der Intervalle]] und der [[Schätzfehler]] <math>E</math> von [[Stichprobe]] zu [[Stichprobe]] variieren und somit [[Zufallsvariable]]n sind.
| |
|
| |
| Die Ursache liegt in der unbekannten [[Standardabweichung (stochastisch)|Standardabweichung]] <math>s</math> der [[Grundgesamtheit]], die geschätzt werden muss und in verschiedenen [[Schätzwert]]en resultiert.
| |
|
| |
| ====Konfidenzintervall bei beliebig verteilter Grundgesamtheit====
| |
|
| |
| Es soll jetzt der in der Praxis am häufigsten auftretende Fall betrachtet werden, dass die [[Verteilung (stochastisch)|Verteilung]] der [[Zufallsvariable]]n <math>X\;</math> und die [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma</math> in der [[Grundgesamtheit]] unbekannt sind.
| |
|
| |
| Um überhaupt ein [[Konfidenzintervall]] angeben zu können, muss der [[Stichprobenumfang]] <math>n</math> ausreichend groß sein, so dass der [[Zentraler Grenzwertsatz|Zentrale Grenzwertsatz]] zur Anwendung kommen kann. Es wird <math>n = 100</math> gewählt.
| |
|
| |
| Dann ist
| |
|
| |
| <math>\left[ \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}},\quad\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right]</math>
| |
|
| |
| ein [[Approximation|approximatives]] [[Konfidenzintervall]] für den unbekannten [[Parameter]] <math>\mu</math> der [[Zufallsvariable]]n <math>X\;</math> (Haushaltnettoeinkommen) zum näherungsweisen [[Konfidenzniveau]]
| |
|
| |
| <math>P\left( \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\leq\mu\leq\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right) \approx1-\alpha</math>
| |
|
| |
| Zum vorgegebenen [[Konfidenzniveau]] <math>1-\alpha=0,95</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]]:
| |
|
| |
| <math>z_{1-\frac{\alpha}{2}}=z_{0.975}=1.96</math>.
| |
|
| |
| Für 50 [[einfache Zufallsstichprobe]]n sind in der Abb. 3 die Punkt[[schätzwert]]e und [[Schätzintervall]]e enthalten, wobei wiederum einzig und allein zum Zweck der Veranschaulichung der wahre [[Mittelwert der Grundgesamtheit|Mittelwert <math>\mu</math> der Grundgesamtheit]] als gepunktete Linie in die Grafik eingefügt wurde.
| |
|
| |
| Auf die Angabe der numerischen Resultate wird verzichtet.
| |
|
| |
| {|
| |
| |<R output="display">
| |
| pdf(rpdf, width=9, height=9)
| |
| x <- c(2415)
| |
| y <- c(1:50)
| |
| plot(y, col="white", ylim=c(0, 50), xlim=c(0, 2000), axes=F, xlab="Haushaltsnettoeinkommen", ylab="Stichproben-Nr.", sub="Abb. 3: Sch\u00E4tzintervalle von 50 Zufallsstichproben des Stichprobenumfangs n = 100")
| |
| axis(side=1, at=c(0, 500, 1000, 1500, 2000), labels=c(1300, 1800, 2300, 2800, 3300))
| |
| axis(side=2, at=c(0:50),labels=F)
| |
| lines(c(670, 1550), c(1,1), col="red")
| |
| points(1113, 1, pch=16, col="blue")
| |
| lines(c(573, 1461), c(2,2), col="red")
| |
| points(1017, 2, pch=16, col="blue")
| |
| lines(c(823, 1711), c(3,3), col="red")
| |
| points(1267, 3, pch=16, col="blue")
| |
| lines(c(317, 1204), c(4,4), col="red")
| |
| points(760, 4, pch=16, col="blue")
| |
| lines(c(619, 1507), c(5,5), col="red")
| |
| points(1063, 5, pch=16, col="blue")
| |
| lines(c(1030, 1918), c(6,6), col="red")
| |
| points(1474, 6, pch=16, col="blue")
| |
| lines(c(554, 1442), c(7,7), col="red")
| |
| points(1000, 7, pch=16, col="blue")
| |
| lines(c(497, 1385), c(8,8), col="red")
| |
| points(941, 8, pch=16, col="blue")
| |
| lines(c(171, 1059), c(9,9), col="red")
| |
| points(615, 9, pch=16, col="blue")
| |
| lines(c(318, 1206), c(10,10), col="red")
| |
| points(762, 10, pch=16, col="blue")
| |
| lines(c(523, 1419), c(11,11), col="red")
| |
| points(967, 11, pch=16, col="blue")
| |
| lines(c(419, 1306), c(12,12), col="red")
| |
| points(863, 12, pch=16, col="blue")
| |
| lines(c(891, 1778), c(13,13), col="red")
| |
| points(1365, 13, pch=16, col="blue")
| |
| lines(c(382, 1270), c(14,14), col="red")
| |
| points(826, 14, pch=16, col="blue")
| |
| lines(c(499, 1387), c(15,15), col="red")
| |
| points(943, 15, pch=16, col="blue")
| |
| lines(c(617, 1505), c(16,16), col="red")
| |
| points(1061, 16, pch=16, col="blue")
| |
| lines(c(863, 1751), c(17,17), col="red")
| |
| points(1307, 17, pch=16, col="blue")
| |
| lines(c(459, 1347), c(18,18), col="red")
| |
| points(1019, 18, pch=16, col="blue")
| |
| lines(c(459, 1347), c(19,19), col="red")
| |
| points(903, 19, pch=16, col="blue")
| |
| lines(c(651, 1539), c(20,20), col="red")
| |
| points(1095, 20, pch=16, col="blue")
| |
| lines(c(915, 1802), c(21,21), col="red")
| |
| points(1359, 21, pch=16, col="blue")
| |
| lines(c(424, 1312), c(22,22), col="red")
| |
| points(868, 22, pch=16, col="blue")
| |
| lines(c(366, 1254), c(23,23), col="red")
| |
| points(810, 23, pch=16, col="blue")
| |
| lines(c(141, 1028), c(24,24), col="red")
| |
| points(584, 24, pch=16, col="blue")
| |
| lines(c(671, 1558), c(25,25), col="red")
| |
| points(1116, 25, pch=16, col="blue")
| |
| lines(c(674, 1516), c(26,26), col="red")
| |
| points(1095, 26, pch=16, col="blue")
| |
| lines(c(905, 1812), c(27,27), col="red")
| |
| points(1359, 27, pch=16, col="blue")
| |
| lines(c(511, 1225), c(28,28), col="red")
| |
| points(868, 28, pch=16, col="blue")
| |
| lines(c(282, 1338), c(29,29), col="red")
| |
| points(810, 29, pch=16, col="blue")
| |
| lines(c(1325, 1995), c(30,30), col="red")
| |
| points(1655, 30, pch=16, col="blue")
| |
| lines(c(646, 1583), c(31,31), col="red")
| |
| points(1116, 31, pch=16, col="blue")
| |
| lines(c(608, 1525), c(32,32), col="red")
| |
| points(1017, 32, pch=16, col="blue")
| |
| lines(c(798, 1736), c(33,33), col="red")
| |
| points(1267, 33, pch=16, col="blue")
| |
| lines(c(380, 1141), c(34,34), col="red")
| |
| points(760, 34, pch=16, col="blue")
| |
| lines(c(419, 1707), c(35,35), col="red")
| |
| points(1063, 35, pch=16, col="blue")
| |
| lines(c(906, 2042), c(36,36), col="red")
| |
| points(1474, 36, pch=16, col="blue")
| |
| lines(c(603, 1393), c(37,37), col="red")
| |
| points(1000, 37, pch=16, col="blue")
| |
| lines(c(418, 1463), c(38,38), col="red")
| |
| points(941, 38, pch=16, col="blue")
| |
| lines(c(94, 1136), c(39,39), col="red")
| |
| points(615, 39, pch=16, col="blue")
| |
| lines(c(361, 1162), c(40,40), col="red")
| |
| points(762, 40, pch=16, col="blue")
| |
| lines(c(415, 1470), c(41,41), col="red")
| |
| points(943, 41, pch=16, col="blue")
| |
| lines(c(515, 1607), c(42,42), col="red")
| |
| points(1061, 42, pch=16, col="blue")
| |
| lines(c(910, 1704), c(43,43), col="red")
| |
| points(1307, 43, pch=16, col="blue")
| |
| lines(c(579, 1460), c(44,44), col="red")
| |
| points(1019, 44, pch=16, col="blue")
| |
| lines(c(447, 1360), c(45,45), col="red")
| |
| points(903, 45, pch=16, col="blue")
| |
| lines(c(150, 1019), c(46,46), col="red")
| |
| points(584, 46, pch=16, col="blue")
| |
| lines(c(646, 1583), c(46,46), col="red")
| |
| points(1116, 46, pch=16, col="blue")
| |
| lines(c(469, 1466), c(47,47), col="red")
| |
| points(967, 47, pch=16, col="blue")
| |
| lines(c(375, 1350), c(48,48), col="red")
| |
| points(863, 48, pch=16, col="blue")
| |
| lines(c(294, 1375), c(49,49), col="red")
| |
| points(865, 49, pch=16, col="blue")
| |
| lines(c(674, 1516), c(50,50), col="red")
| |
| points(1095, 50, pch=16, col="blue")
| |
| abline(v=1115, lty=4, lwd=2)
| |
| legend(1550, 52, bty="n", legend = "Stichprobenmittelwert", col="blue", pch=16, cex=0.8)
| |
| legend(1550, 50, bty="n", legend = "Konfidenzintervall", pch="-", col="red", cex=0.8)
| |
| </R>
| |
| |}
| |
|
| |
| Auch hier ist zu sehen, dass die [[Länge des Konfidenzintervalls|Länge <math>L</math> der Intervalle]] und der [[Schätzfehler]] <math>E</math> von [[Stichprobe]] zu [[Stichprobe]] variieren und somit [[Zufallsvariable]]n sind, was auf die unbekannte [[Standardabweichung (stochastisch)|Standardabweichung]] der [[Grundgesamtheit]] zurückzuführen ist.
| |
|
| |
| Von den 50 [[Schätzintervall]]en überdeckt zwei [[Schätzintervall]]e (4%) nicht den wahren Wert <math>\mu</math> des mittleren Haushaltsnettoeinkommens.
| |
|
| |
| ===Glühlampen===
| |
|
| |
| Ein Unternehmen stellt Glühlampen her. Die Marketing-Abteilung benötigt für Werbungszwecke eine Angabe über die durchschnittliche Brenndauer einer bestimmten Sorte von Glühlampen.
| |
|
| |
| Aus statistischer Sicht ergeben sich dabei folgende Überlegungen:
| |
|
| |
| * Die Erfassung der [[Grundgesamtheit]], d.h. der Gesamtproduktion dieser Sorte von Glühlampen, ist aus zwei Gründen nicht möglich:
| |
| ** Da auch in Zukunft diese Glühlampen produziert werden, liegt die [[Grundgesamtheit]] nicht vollständig vor.
| |
| ** Mit der Feststellung der Brenndauer ist die Zerstörung der Glühlampen verbunden.
| |
|
| |
| * Um systematische Fehler bei der Erfassung des Brenndauer zu vermeiden, wird eine [[Zufallsstichprobe]] gezogen.
| |
|
| |
| * Das Ziehen einer [[Einfache Zufallsstichprobe|einfachen Zufallsstichprobe]] ([[Zufallsauswahlmodell mit Zurücklegen|Zufallsauswahl mit Zurücklegen]]) macht bei dieser Problemstellung wegen der Zerstörung der Glühlampen keinen Sinn. Es wird somit eine [[uneingeschränkte Zufallsstichprobe]] ([[Zufallsauswahlmodell ohne Zurücklegen|Zufallsauswahl ohne Zurücklegen]]) gezogen.
| |
|
| |
| * Da die Gesamtproduktion jedoch sehr groß ist, spielt die Tatsache, dass [[Zufallsauswahlmodell ohne Zurücklegen|ohne Zurücklegen]] gezogen wird, keine Rolle, denn die [[Verteilung der Grundgesamtheit|Verteilung in der Grundgesamtheit]] verändert sich dadurch so gut wie nicht. Die [[Stichprobe]] kann somit als eine [[einfache Zufallsstichprobe]] angesehen werden.
| |
|
| |
| * Neben einer [[Punktschätzung]] für die unbekannte durchschnittliche Brenndauer soll ein [[symmetrisches Konfidenzintervall]] zum [[Konfidenzniveau]] <math>1 - \alpha = 0,95</math> angegeben werden.
| |
|
| |
| * Über die [[Verteilung der Grundgesamtheit|Verteilung der Zufallsvariablen]] <math>X = \;</math> "Brenndauer" und die [[Varianz der Grundgesamtheit|Varianz <math>\sigma^{2}</math> in der Grundgesamtheit]] liegen keine Informationen vor.
| |
|
| |
| ====Zweiseitiges (approximatives) Konfidenzintervall====
| |
|
| |
| Wenn jedoch der [[Stichprobenumfang]] <math>n</math> genügend groß gewählt wird, kann ein [[Approximation|approximatives]] [[Konfidenzintervall]]
| |
|
| |
| <math>\left[ \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}};\;\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right]</math>
| |
|
| |
| zum näherungsweisen [[Konfidenzniveau]]
| |
|
| |
| <math>P\left( \bar{X}-z_{1-\frac{\alpha}{2}}\cdot\frac{X}{\sqrt{n}}\leq\mu\leq\bar{X}+z_{1-\frac{\alpha}{2}}\cdot\frac{S}{\sqrt{n}}\right) \approx1-\alpha</math>
| |
|
| |
| ermittelt werden.
| |
|
| |
| Zum vorgegebenen [[Konfidenzniveau]] <math>1-\alpha=0,95</math> findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]]: <math>z_{1-\frac{\alpha}{2}}=z_{0,975}=1,96</math>.
| |
|
| |
| Um einerseits eine ausreichende [[Approximation]] durch die [[Normalverteilung]] zu garantieren, andererseits aber die Kosten der [[Stichprobe]] gering zu halten, soll der [[Stichprobenumfang|Umfang der Stichprobe]] so klein als notwendig gehalten werden. In diesem Sinn wird <math>n = 50</math> gewählt.
| |
|
| |
| Die konkrete [[Stichprobe]] führte zu folgenden [[Punktschätzung]]en:
| |
|
| |
| *mittlere Brenndauer in der [[Stichprobe]] <math>\bar{x}</math>: <math>1600 \; \mbox{Stunden}</math>
| |
|
| |
| *[[Varianz (stochastisch)|Varianz]] <math>s^{2}</math> in der [[Stichprobe]]: <math>8100 \; \mbox{Stunden}^{2}</math>
| |
|
| |
| *[[Standardabweichung (stochastisch)|Standardabweichung]] <math>s</math> in der [[Stichprobe]]: <math>90 \; \mbox{Stunden}</math>
| |
|
| |
| Damit erhält man das [[Schätzintervall]]:
| |
|
| |
| {|
| |
| |<math>\left[ 1600-1,96\cdot\frac{90}{\sqrt{50}};\; 1600+1,96\cdot\frac{90}{\sqrt{50}}\right]</math>
| |
| |<math>=[1600-24,95;\;1600+24,95]</math>
| |
| |-
| |
| |
| |
| |<math>=[1575,05;\;1624,95]</math>
| |
| |}
| |
|
| |
| Da für das [[Schätzverfahren]] eine hohe [[Sicherheitswahrscheinlichkeit]] von 0,95 (d.h. recht nahe bei Eins) gewählt wurde, kann man davon ausgehen, eines der [[Schätzintervall]]e zum [[Stichprobenumfang]] <math>n = 50</math> erhalten zu haben, dass den wahren Wert <math>\mu</math> enthält.
| |
|
| |
| ====Einseitiges Konfidenzintervall====
| |
|
| |
| Aus der Sicht des Leiters der Marketing-Abteilung ist dieses Ergebnis insoweit unbefriedigend, dass aus psychologischen Gründen bei der Werbung keine Angabe über die [[Grenzen des Konfidenzintervalls|obere Grenze]] der mittleren Brenndauer erfolgen sollte.
| |
|
| |
| Er lässt deshalb ein nach oben offenes [[Konfidenzintervall]], d.h. ein [[einseitiges Konfidenzintervall]], bestimmen. Zum näherungsweisen [[Konfidenzniveau]]
| |
|
| |
| <math>P\left( \bar{X}-z_{1-\alpha}\cdot\frac{S}{\sqrt{n}}\leq\mu\right) =1-\alpha=0,95</math>
| |
|
| |
| findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]]:
| |
|
| |
| <math>z_{1-\alpha}=z_{0,95}=1,645</math>.
| |
|
| |
| Mit den Ergebnissen der gleichen [[Stichprobe]] ergibt sich für die [[Grenzen des Konfidenzintervalls|untere Grenze]]:
| |
|
| |
| <math>v_{u}=1600-1,645\cdot\frac{90}{\sqrt{50}}=1600-20,94=1579,06\mbox{ Stunden}</math>
| |
|
| |
| und für das einseitige [[Schätzintervall]]
| |
|
| |
| <math>\left[1579,06;\;+\infty\right)</math>
| |
|
| |
| Auch für dieses Ergebnis gilt eine analoge Interpretation: Aufgrund der hohen [[Sicherheitswahrscheinlichkeit]] von 0,95 geht man davon aus, eines der einseitigen [[Schätzintervall]]e zum [[Stichprobenumfang]] <math>n = 50</math> erhalten zu haben, dass den wahren Wert <math>\mu</math> enthält.
| |
|
| |
| <!--==Interaktives Beispiel==
| |
|
| |
|
| |
| Es steht eine Grundgesamtheit von <math>N = 500</math> Angestellten einer Versicherungsgesellschaft zur Verfügung. An den Angestellten wurden die Variablen
| |
|
| |
| <math>X_1 =\;</math> Jahresprovision in DM,
| |
|
| |
| <math>X_2 =\;</math> Versicherungsabschlüsse pro Monat,
| |
|
| |
| <math>X_3 =\;</math> Krankheitstage pro Kalenderjahr,
| |
|
| |
| <math>X_4 =\;</math> Wochenarbeitszeit in Stunden
| |
|
| |
| beobachtet. Der [[STAT-Glossar#Erwartungswert|Erwartungswert]] <math>\mu</math>, die [[STAT-Glossar#Varianz|Varianz]] <math>\sigma^{2}</math> und die Verteilung der Variablen in der Grundgesamtheit sind unbekannt.
| |
|
| |
| Ermitteln Sie auf der Basis einer einfachen Zufallsstichprobe eine
| |
| Punkt- und Intervallschätzung für den unbekannten [[STAT-Glossar#Erwartungswert|Erwartungswert]]
| |
| <math>\mu</math>.
| |
|
| |
| Mit diesem Beispiel haben Sie die Möglichkeit, den Einfluss des
| |
| [[STAT-Glossar#Konfidenzniveau|Konfidenzniveaus]] und des [[STAT-Glossar#Stichprobenumfang|Stichprobenumfanges]] auf die Breite des
| |
| Konfidenzintervalls zu studieren. Dazu empfiehlt es sich, nur eine
| |
| der beiden Größen zu verändern, während die andere konstant
| |
| gehalten wird.
| |
|
| |
| Treffen Sie bitte nachfolgend ihre Entscheidungen über
| |
|
| |
| * die zu analysierende Variable,
| |
| * den [[STAT-Glossar#Stichprobenumfang|Stichprobenumfang]] <math>n</math>,
| |
| * das [[STAT-Glossar#Konfidenzniveau|Konfidenzniveau]] <math>1-\alpha</math> (als Dezimalzahl, z.B. 0,95).
| |
|
| |
|
| |
| Hinweis:
| |
|
| |
| Berücksichtigen Sie bei diesen Entscheidungen, welche
| |
| Informationen Sie über die Grundgesamtheit haben.
| |
|
| |
|
| |
| '''Ausgabe:'''
| |
|
| |
| Als Ergebnis gibt dieses interaktive Beispiel
| |
|
| |
| # einen ''[[STAT-Glossar#Scatterplot|Scatterplot]]'' der ausgewählten Variable,
| |
| # den dazu gehörigen ''[[STAT-Glossar#Boxplot|Boxplot]]'' und
| |
| # das -zum gewählte [[STAT-Glossar#Konfidenzniveau|Konfidenzniveau]] passende- ''Konfidenzintervall''
| |
|
| |
|
| |
| aus. Wenn man die gleiche Variable anschließend ein weiteres Mal
| |
| auswählt, aber ein anderes/n [[STAT-Glossar#Konfidenzniveau|Konfidenzniveau]]/[[STAT-Glossar#Stichprobenumfang|Stichprobenumfang]]
| |
| angibt, so werden im nächsten Ausgabefenster auch die alten
| |
| ''Konfidenzintervalle'' angezeigt (zum Vergleich).-->
| |