Konfidenzintervall für den Erwartungswert bei unbekannter Varianz

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen

Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall für den Erwartungswert bei Normalverteilung der Grundgesamtheit

Es gilt:

$X\sim N(\mu ;\sigma ),\;X_{i}\sim N(\mu ;\sigma )\;\forall \,i\,,\;{\bar {X}}\sim N\left(\mu ;\sigma \left({\bar {X}}\right)\right)$ .

Weiterhin sei $S$ die Standardabweichung als Wurzel aus der Stichprobenvarianz $S^{2}$ und $t_{n-1;1-{\frac {\alpha }{2}}}$ das $\left(1-{\frac {\alpha }{2}}\right)$ -Quantil der t-Verteilung.

Dann ist

$\left[{\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}};\quad {\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right]$

ein Konfidenzintervall für den unbekannten Parameter $\mu$ der normalverteilten Zufallsvariablen $X\;$ mit unbekannter Varianz $\sigma ^{2}$ zum Konfidenzniveau

$P\left({\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)=1-\alpha$

Wurde die Stichprobe gezogen und liegen die Stichprobenwerte $x_{1},\ldots ,x_{n}$ vor, dann lassen sich daraus

die Punktschätzwerte ${\bar {x}}$ und $s$

und das Schätzintervall

\left[{\bar {x}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {s}{\sqrt {n}}}\leq \mu \leq {\bar {x}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {s}{\sqrt {n}}}\right]

bestimmen.

Da die t-Verteilung mit wachsender Anzahl der Freiheitsgrade und somit mit wachsendem Stichprobenumfang $n$ gegen die $N(0;1)$ konvergiert, kann bei genügend großem Stichprobenumfang $(n>30)$ approximativ die Standardnormalverteilung und $z_{1-{\frac {\alpha }{2}}}$ statt $t_{n-1;1-{\frac {\alpha }{2}}}$ verwendet werden. Man erhält dann ein approximatives Konfidenzintervall.

Konfidenzintervall für den Erwartungswert bei unbekannter Verteilung der Grundgesamtheit

Wenn die Zufallsvariable $X\;$ in der Grundgesamtheit nicht normalverteilt und die Varianz $\sigma ^{2}$ unbekannt ist, kann unter der Voraussetzung eines großen Stichprobenumfanges $n$ das Konfidenzintervall

$\left[{\bar {X}}-z_{1-{\frac {\alpha }{2}}}{\frac {S}{\sqrt {n}}};{\bar {X}}+z_{1-{\frac {\alpha }{2}}}{\frac {S}{\sqrt {n}}}\right]$

verwendet werden, das näherungsweise das Konfidenzniveau

$P\left({\bar {X}}-z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)=1-\alpha$

hat.

Dies lässt sich darauf zurückführen, dass

bei beliebig verteilter Grundgesamtheit die standardisierte Zufallsvariable $Z\;$ bei großem Stichprobenumfang approximativ standardnormalverteilt ist (Anwendung des zentralen Grenzwertsatzes);

die Schätzfunktion $S^{2}\;$ eine konsistente Schätzfunktion für $\sigma ^{2}$ ist und somit auch $S$ konsistent ist, d.h. es kann bei sehr großem Stichprobenumfang $n$ davon ausgegangen werden, dass $S\;$ hinreichend wenig um den wahren Wert $\sigma$ streut;

die Zufallsvariable $T\;$ , in der $\sigma$ durch $S\;$ ersetzt wurde, ebenfalls bei genügend großem Stichprobenumfang approximativ standardnormalverteilt ist.

Zusatzinformationen

Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Es gilt:

$X\sim N(\mu ;\sigma ),\;X_{i}\sim N(\mu ;\sigma )\;\forall \,i\,,\;{\bar {X}}\sim N\left(\mu ;\sigma \left({\bar {X}}\right)\right)$ .

Die standardisierte Zufallsvariable $Z$ lässt sich jedoch nicht mehr bestimmen, da $\sigma ^{2}$ nunmehr unbekannt ist.

Die Varianz $\sigma ^{2}$ muss aus der Stichprobe geschätzt werden. Eine geeignete Schätzfunktion ist die Stichprobenvarianz

$S^{2}={\frac {1}{n-1}}\cdot \sum \limits _{i=1}^{n}\left(X_{i}-{\bar {X}}\right)^{2}$

Die Standardabweichung $S$ als Wurzel aus $S^{2}$ wird für die Standardisierung verwendet:

$T={\sqrt {n}}\cdot {\frac {{\bar {X}}-\mu }{S}}$

Die Zufallsvariable $T\;$ folgt bei einer einfachen Zufallsstichprobe vom Umfang $n$ einer t-Verteilung mit der Anzahl der Freiheitsgrade $f=n-1$ :

$T\sim t(n-1)\;$

Für die standardisierte Zufallsvariable $T\;$ lässt sich ein zentrales Schwankungsintervall angeben, in dem $T\;$ Realisationen mit einer vorgegebenen Sicherheitswahrscheinlichkeit

$P\left(t_{f;{\frac {\alpha }{2}}}\leq T\leq t_{f;1-{\frac {\alpha }{2}}}\right)=1-\alpha$

annimmt.

Dabei ist $t_{f;{\frac {\alpha }{2}}}$ das ${\frac {\alpha }{2}}$ -Quantil und $t_{f;1-{\frac {\alpha }{2}}}$ das $\left(1-{\frac {\alpha }{2}}\right)$ -Quantil der t-Verteilung.

Aufgrund der Symmetrie der t-Verteilung gilt:

$|t_{f;{\frac {\alpha }{2}}}|=|t_{f;1-{\frac {\alpha }{2}}}|$ und $t_{f;{\frac {\alpha }{2}}}=-t_{f;1-{\frac {\alpha }{2}}}$

Damit folgt:

$P\left(-t_{f;1-{\frac {\alpha }{2}}}\leq T\leq t_{f;1-{\frac {\alpha }{2}}}\right)=1-\alpha$

Für die Wahrscheinlichkeit $1-\alpha$ findet man $t_{f;1-{\frac {\alpha }{2}}}$ in der Tabelle der t-Verteilung.

Die Verteilung ist somit bekannt und sie hängt nicht von dem unbekannten Parameter $\mu$ ab, so dass man nach Einsetzen von $T$ und einfachen Umformungen der Ungleichung ein Konfidenzintervall

$\left[{\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}};\quad {\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right]$

zum Konfidenzniveau

$P\left({\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)=1-\alpha$

erhält.

Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Das Konfidenzintervall ist ein bezüglich der Wahrscheinlichkeit symmetrisches Konfidenzintervall.
Das Konfidenzintervall ist symmetrisch bezüglich der Punktschätzung. Die Grenzen des Intervalls haben zu ${\bar {X}}$ den gleichen Abstand.
Die Länge $L$ des Konfidenzintervalls und der Schätzfehler $E$

L=2t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\quad E=t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}

hängen über

S

von den Stichprobenvariablen

X_{1},\ldots ,X_{n}

ab und sind somit Zufallsvariablen.

Bei gegebenem Stichprobenumfang

n

und Konfidenzniveau

1-\alpha

ergeben sich von Stichprobe zu Stichprobe unterschiedliche Schätzintervalle, die auch verschiedene Länge bzw. verschiedenen Schätzfehler aufweisen können.

Die Länge des Konfidenzintervalls und der Schätzfehler hängen vom Stichprobenumfang $n$ und über $t_{n-1;1-{\frac {\alpha }{2}}}$ vom vorgegebenen Konfidenzniveau $1-\alpha$ ab.

Da die Quantile $t_{n-1;1-{\frac {\alpha }{2}}}$ aus der t-Verteilung größer sind als die Quantile $z_{1-{\frac {\alpha }{2}}}$ aus der Standardnormalverteilung, sind die Konfidenzintervalle bei unbekannter Varianz der Grundgesamtheit breiter als bei bekannter Varianz, wodurch diese fehlende Information zum Ausdruck kommt.

Die zusätzliche Unsicherheit bezüglich

\sigma ^{2}

ist in die t-Verteilung "eingearbeitet".

Beispiele

Haushaltsnettoeinkommen

Für eine Grundgesamtheit von $N=2000$ Privathaushalten sei die Zufallsvariable $X\;$ das Haushaltsnettoeinkommen (in €).

Das mittlere Haushaltsnettoeinkommen dieser Grundgesamtheit, d.h. der Erwartungswert $E[X]=\mu$ , ist unbekannt und soll geschätzt werden.

Über die Punktschätzung hinaus soll ein Konfidenzintervall zum Konfidenzniveau $1-\alpha =0,95$ und für die konkreten Stichproben das Schätzintervall angegeben werden.

Zur Schätzung von $\mu$ wird der Stichprobenmittelwert

${\bar {X}}={\frac {1}{n}}\cdot \sum \limits _{i=1}^{n}X_{i}$

als Schätzfunktion verwendet.

Eine Zufallsstichprobe vom Umfang $n$ liefert die Stichprobenwerte $x_{1},\ldots ,x_{n}$ .

Nach Einsetzen dieser Stichprobenwerte in die Schätzfunktion erhält man einen Schätzwert

${\bar {x}}={\frac {1}{n}}\cdot \sum \limits _{i=1}^{n}x_{i}$

als Punktschätzung für das mittlere Haushaltsnettoeinkommen der Grundgesamtheit.

Die Angabe des Konfidenzintervalls wird entscheidend von den Informationen, die über die Grundgesamtheit vorliegen, bestimmt.

Konfidenzintervall bei normalverteilter Grundgesamtheit

Es wird wiederum davon ausgegangen, dass die Zufallsvariable $X\;$ (Haushaltsnettoeinkommen) in der Grundgesamtheit normalverteilt ist, jedoch sei nunmehr die Standardabweichung unbekannt: $X\sim N(\mu ;\sigma )\;$ .

Für die Bestimmung eines Konfidenzintervalls für $\mu$ muß die Varianz $\sigma ^{2}$ geschätzt werden, was mittels der Schätzfunktion $S^{2}$ erfolgt.

Aufgrund dieser Informationen ist

$\left[{\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}};\;{\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right]$

ein Konfidenzintervall für den unbekannten Parameter $\mu$ der Zufallsvariablen $X\;$ (Haushaltnettoeinkommen) zum Konfidenzniveau

$P\left({\bar {X}}-t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+t_{n-1;1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)=1-\alpha$

Zum vorgegebenen Konfidenzniveau $1-\alpha =0.95$ findet man in der Tabelle der Verteilungsfunktion der t-Verteilung:

$t_{n-1;1-{\frac {\alpha }{2}}}=t_{19;0,975}=2,093$ .

Nach der Ziehung der Stichprobe ist

$\left[{\bar {x}}-2,093\cdot {\frac {s}{\sqrt {n}}};\;{\bar {x}}+2,093\cdot {\frac {s}{\sqrt {n}}}\right]$

das sich für die Stichprobe ergebende Schätzintervall, in dem die Punktschätzwerte ${\bar {x}}$ und $s$ sowie $n$ einzusetzen sind.

Um diese Veränderung in der Bestimmung des Konfidenzintervalls zu veranschaulichen, wird von den gleichen 25 einfachen Zufallsstichproben vom Umfang $n=20$ wie unter Punkt 1.1. ausgegangen.

Für die Stichprobe Nr. 25, deren Stichprobenwerte in der Tabelle 1 enthalten sind, ergibt sich ein mittleres Haushaltsnettoeinkommen von

${\bar {x}}={\frac {48300}{20}}=2415\,\mathrm {\euro}$

und eine Standardabweichung

$s=1001,065\,\mathrm {\euro}$

und damit das Schätzintervall

$\left[2415-2,093\cdot {\frac {1001,065}{\sqrt {20}}};\;2415+2,093\cdot {\frac {1001,065}{\sqrt {20}}}\right]$	$=[2415-468,51;\;2415+468,51]$
	$=[1946,49;\;2883,51]$

Die Interpretation dieses Schätzintervalls ist wie vorher.

Tabelle 3 enthält das mittlere Haushaltsnettoeinkommen ${\bar {x}}$ , die Standardabweichung $s$ , das Schätzintervall sowie den Schätzfehler $e$ für die 25 Zufallsstichproben.

Tabelle 3: Mittleres Haushaltsnettoeinkommen (€) ${\bar {x}}$ , Standardabweichung $s$ , Schätzintervall und Schätzfehler $e$ für 25 Zufallsstichproben vom Umfang $n=20$

$i\;$	${\bar {x}}$	$s\;$	$v_{u}\;$	$v_{o}\;$	$e\;$
1	2413,40	1032,150	1930,34	2896,46	966,12
2	2317,00	872,325	1908,74	2825,26	816,52
3	2567,50	1002,008	2098,55	3036,45	937,90
4	2060,90	812,365	1680,71	2441,09	760,38
5	2363,50	1376,648	1719,22	3007,78	1288,56
6	2774,30	1213,779	2206,24	3342,63	1136,12
7	2298,80	843,736	1903,92	2693,68	789,76
8	2241,15	1116,827	1718,46	2763,84	1045,38
9	1915.30	1113,122	1394,35	2436,25	1041,90
10	2062,15	856,069	1661,50	2462,80	801,30
11	2267,75	1065,227	1769,21	2766,29	997,08
12	2163,10	1040,966	1675,92	2650,28	974,36
13	2635,00	1154,294	2094,78	3175,22	1080,44
14	2126,50	1103,508	1610,05	2642,95	1032,90
15	2243,15	1126,913	1715,74	2770,56	1054,82
16	2361,25	1166,260	1815,43	2907,07	1091,64
17	2607,25	848,019	2210,37	3004,13	793,76
18	2319,55	941,236	1879,04	2760,06	881,02
19	2203,85	974,980	1747,55	2660,15	912,60
20	2395,25	899,461	1974,29	2816,21	841,92
21	2659,00	969,720	2205,16	3112,84	907,68
22	2168,50	763,222	1811,31	2525,69	714,38
23	2110,30	1127,608	1582,57	2638,03	1055,46
24	1884,90	928,420	1450,39	2319,41	869,02
25	2415,00	1001,065	1946,49	2883,51	937,02

Die folgende Abbildung enthält die grafische Darstellung der 25 Punktschätzwerte und Schätzintervalle.

Auch hier wird einzig und allein zum Zweck der Veranschaulichung der wahre Mittelwert $\mu$ der Grundgesamtheit als gestrichelte Linie in die Grafik eingefügt.

In diesem Fall überdeckt nur ein Schätzintervall (der Stichprobe Nr. 24) nicht den wahren Wert $\mu$ des mittleren Haushaltsnettoeinkommens.

Aus Tabelle 3 und Abb. 2 ist zu erkennen, dass hier die Länge $L$ der Intervalle und der Schätzfehler $E$ von Stichprobe zu Stichprobe variieren und somit Zufallsvariablen sind.

Die Ursache liegt in der unbekannten Standardabweichung $s$ der Grundgesamtheit, die geschätzt werden muss und in verschiedenen Schätzwerten resultiert.

Konfidenzintervall bei beliebig verteilter Grundgesamtheit

Es soll jetzt der in der Praxis am häufigsten auftretende Fall betrachtet werden, dass die Verteilung der Zufallsvariablen $X\;$ und die Standardabweichung $\sigma$ in der Grundgesamtheit unbekannt sind.

Um überhaupt ein Konfidenzintervall angeben zu können, muss der Stichprobenumfang $n$ ausreichend groß sein, so dass der Zentrale Grenzwertsatz zur Anwendung kommen kann. Es wird $n=100$ gewählt.

Dann ist

$\left[{\bar {X}}-z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}},\quad {\bar {X}}+z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right]$

ein approximatives Konfidenzintervall für den unbekannten Parameter $\mu$ der Zufallsvariablen $X\;$ (Haushaltnettoeinkommen) zum näherungsweisen Konfidenzniveau

$P\left({\bar {X}}-z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)\approx 1-\alpha$

Zum vorgegebenen Konfidenzniveau $1-\alpha =0,95$ findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung:

$z_{1-{\frac {\alpha }{2}}}=z_{0.975}=1.96$ .

Für 50 einfache Zufallsstichproben sind in der Abb. 3 die Punktschätzwerte und Schätzintervalle enthalten, wobei wiederum einzig und allein zum Zweck der Veranschaulichung der wahre Mittelwert $\mu$ der Grundgesamtheit als gepunktete Linie in die Grafik eingefügt wurde.

Auf die Angabe der numerischen Resultate wird verzichtet.

Auch hier ist zu sehen, dass die Länge $L$ der Intervalle und der Schätzfehler $E$ von Stichprobe zu Stichprobe variieren und somit Zufallsvariablen sind, was auf die unbekannte Standardabweichung der Grundgesamtheit zurückzuführen ist.

Von den 50 Schätzintervallen überdeckt zwei Schätzintervalle (4%) nicht den wahren Wert $\mu$ des mittleren Haushaltsnettoeinkommens.

Glühlampen

Ein Unternehmen stellt Glühlampen her. Die Marketing-Abteilung benötigt für Werbungszwecke eine Angabe über die durchschnittliche Brenndauer einer bestimmten Sorte von Glühlampen.

Aus statistischer Sicht ergeben sich dabei folgende Überlegungen:

Die Erfassung der Grundgesamtheit, d.h. der Gesamtproduktion dieser Sorte von Glühlampen, ist aus zwei Gründen nicht möglich:
- Da auch in Zukunft diese Glühlampen produziert werden, liegt die Grundgesamtheit nicht vollständig vor.
- Mit der Feststellung der Brenndauer ist die Zerstörung der Glühlampen verbunden.

Um systematische Fehler bei der Erfassung des Brenndauer zu vermeiden, wird eine Zufallsstichprobe gezogen.

Das Ziehen einer einfachen Zufallsstichprobe (Zufallsauswahl mit Zurücklegen) macht bei dieser Problemstellung wegen der Zerstörung der Glühlampen keinen Sinn. Es wird somit eine uneingeschränkte Zufallsstichprobe (Zufallsauswahl ohne Zurücklegen) gezogen.

Da die Gesamtproduktion jedoch sehr groß ist, spielt die Tatsache, dass ohne Zurücklegen gezogen wird, keine Rolle, denn die Verteilung in der Grundgesamtheit verändert sich dadurch so gut wie nicht. Die Stichprobe kann somit als eine einfache Zufallsstichprobe angesehen werden.

Neben einer Punktschätzung für die unbekannte durchschnittliche Brenndauer soll ein symmetrisches Konfidenzintervall zum Konfidenzniveau $1-\alpha =0,95$ angegeben werden.

Über die Verteilung der Zufallsvariablen $X=\;$ "Brenndauer" und die Varianz $\sigma ^{2}$ in der Grundgesamtheit liegen keine Informationen vor.

Zweiseitiges (approximatives) Konfidenzintervall

Wenn jedoch der Stichprobenumfang $n$ genügend groß gewählt wird, kann ein approximatives Konfidenzintervall

$\left[{\bar {X}}-z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}};\;{\bar {X}}+z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right]$

zum näherungsweisen Konfidenzniveau

$P\left({\bar {X}}-z_{1-{\frac {\alpha }{2}}}\cdot {\frac {X}{\sqrt {n}}}\leq \mu \leq {\bar {X}}+z_{1-{\frac {\alpha }{2}}}\cdot {\frac {S}{\sqrt {n}}}\right)\approx 1-\alpha$

ermittelt werden.

Zum vorgegebenen Konfidenzniveau $1-\alpha =0,95$ findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung: $z_{1-{\frac {\alpha }{2}}}=z_{0,975}=1,96$ .

Um einerseits eine ausreichende Approximation durch die Normalverteilung zu garantieren, andererseits aber die Kosten der Stichprobe gering zu halten, soll der Umfang der Stichprobe so klein als notwendig gehalten werden. In diesem Sinn wird $n=50$ gewählt.

Die konkrete Stichprobe führte zu folgenden Punktschätzungen:

mittlere Brenndauer in der Stichprobe ${\bar {x}}$ : $1600\;{\mbox{Stunden}}$

Varianz $s^{2}$ in der Stichprobe: $8100\;{\mbox{Stunden}}^{2}$

Standardabweichung $s$ in der Stichprobe: $90\;{\mbox{Stunden}}$

Damit erhält man das Schätzintervall:

$\left[1600-1,96\cdot {\frac {90}{\sqrt {50}}};\;1600+1,96\cdot {\frac {90}{\sqrt {50}}}\right]$	$=[1600-24,95;\;1600+24,95]$
	$=[1575,05;\;1624,95]$

Da für das Schätzverfahren eine hohe Sicherheitswahrscheinlichkeit von 0,95 (d.h. recht nahe bei Eins) gewählt wurde, kann man davon ausgehen, eines der Schätzintervalle zum Stichprobenumfang $n=50$ erhalten zu haben, dass den wahren Wert $\mu$ enthält.

Einseitiges Konfidenzintervall

Aus der Sicht des Leiters der Marketing-Abteilung ist dieses Ergebnis insoweit unbefriedigend, dass aus psychologischen Gründen bei der Werbung keine Angabe über die obere Grenze der mittleren Brenndauer erfolgen sollte.

Er lässt deshalb ein nach oben offenes Konfidenzintervall, d.h. ein einseitiges Konfidenzintervall, bestimmen. Zum näherungsweisen Konfidenzniveau

$P\left({\bar {X}}-z_{1-\alpha }\cdot {\frac {S}{\sqrt {n}}}\leq \mu \right)=1-\alpha =0,95$

findet man in der Tabelle der Verteilungsfunktion der Standardnormalverteilung:

$z_{1-\alpha }=z_{0,95}=1,645$ .

Mit den Ergebnissen der gleichen Stichprobe ergibt sich für die untere Grenze:

$v_{u}=1600-1,645\cdot {\frac {90}{\sqrt {50}}}=1600-20,94=1579,06{\mbox{ Stunden}}$

und für das einseitige Schätzintervall

$\left[1579,06;\;+\infty \right)$

Auch für dieses Ergebnis gilt eine analoge Interpretation: Aufgrund der hohen Sicherheitswahrscheinlichkeit von 0,95 geht man davon aus, eines der einseitigen Schätzintervalle zum Stichprobenumfang $n=50$ erhalten zu haben, dass den wahren Wert $\mu$ enthält.

Konfidenzintervall für den Erwartungswert bei unbekannter Varianz

Aus MM*Stat

Inhaltsverzeichnis

Grundbegriffe

Konfidenzintervall für den Erwartungswert bei Normalverteilung der Grundgesamtheit

Konfidenzintervall für den Erwartungswert bei unbekannter Verteilung der Grundgesamtheit

Zusatzinformationen

Herleitung des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Charakteristika des Konfidenzintervalls bei normalverteilter Grundgesamtheit

Beispiele

Haushaltsnettoeinkommen

Konfidenzintervall bei normalverteilter Grundgesamtheit

Konfidenzintervall bei beliebig verteilter Grundgesamtheit

Glühlampen

Zweiseitiges (approximatives) Konfidenzintervall

Einseitiges Konfidenzintervall