Konfidenzintervall für die Differenz zweier Erwartungswerte

Aus MM*Stat

Wechseln zu: Navigation, Suche

Schätztheorie

Grundbegriffe der Schätztheorie • Gütekriterien einer Schätzfunktion • Mittlere quadratische Abweichung (stochastisch) • Erwartungstreue • Effizienz • Konsistenz • Maximum-Likelihood-Methode • Kleinste-Quadrate-Methode • Intervallschätzung • Konfidenzintervall für den Erwartungswert • Konfidenzintervall für den Erwartungswert bei bekannter Varianz • Konfidenzintervall für den Erwartungswert bei unbekannter Varianz • Konfidenzintervall für den Anteilswert • Konfidenzintervall für die Varianz • Konfidenzintervall für die Differenz zweier Erwartungswerte • Bestimmung des Stichprobenumfangs • Multiple Choice • Video • Aufgaben • Lösungen
Absolute Effizienz • Asymptotische Erwartungstreue • Bias • Breite des Konfidenzintervalls • Einseitiges Konfidenzintervall • Grenzen des Konfidenzintervalls • Grenzen des Schätzintervalls • Irrtumswahrscheinlichkeit • Kleinste-Quadrate-Schätzer • Konfidenzintervall • Konfidenzniveau • Konfidenzwahrscheinlichkeit • KQ-Methode • KQ-Schätzer • Länge des Konfidenzintervalls • Likelihood-Funktion • Log-Likelihood-Funktion • Maximum-Likelihood-Schätzer • Maximum-Likelihood-Schätzung • Mean Square Error • Methode der kleinsten Quadrate • ML-Schätzer • ML-Schätzung • Parameterschätzung • Punktschätzung • Realisiertes Konfidenzintervall • Relative Effizienz • Schätzer • Schätzfehler • Schätzfunktion • Schätzintervall • Schätzung • Schätzverfahren • Schätzwert • Symmetrisches Konfidenzintervall • Unbiasedness • Unverzerrtheit • Vertrauenswahrscheinlichkeit • Verzerrung • Zentrales Konfidenzintervall • Zufallsintervall • Zweiseitiges Konfidenzintervall

Grundbegriffe

Konfidenzintervall für die Differenz zweier Erwartungswerte

Von den vielen Möglichkeiten, Konfidenzintervalle für die Differenz \mu_{1}-\mu_{2} zweier Erwartungswerte zu konstruieren, wird nur diejenige behandelt, für die nachstehende Voraussetzungen gelten:

Von besonderem Interesse bei der praktischen Anwendung von Konfidenzintervallen für die Differenz \mu_{1}-\mu_{2} zweier Erwartungswerte ist es, ob der Wert 0 dabei überdeckt wird oder nicht.

Sobald das aus den Stichproben resultierende Schätzintervall den Wert \mu_{1}-\mu_{2}=0 nicht einschließt, ist ein Unterschied zwischen \mu_{1} und \mu_{2} auf dem verwendeten Konfidenzniveau bedeutsam.

Da die Zufallsvariablen X_{1}\; und X_{2}\; normalverteilt sind, gilt dies auch für die Stichprobenmittelwerte \bar{X_{1}} und \bar{X_{2}} (vgl. Abschnitt "Verteilung des Stichprobenmittelwertes").

Weiterhin sind:

E\left[\bar{X_{1}}\right] = \mu_{1}
Var(\bar{X_{1}}) = \sigma^{2}(\bar{X_{1}}) =\frac{\sigma^{2}_{1}}{n_{1}}
E\left[\bar{X_{2}}\right] = \mu_{2}
Var(\bar{X_{2}}) = \sigma^{2}(\bar{X_{2}}) =\frac{\sigma^{2}_{2}}{n_{2}}

Zusammenfassend kann geschrieben werden:

\bar{X_{1}}\ \sim N\left(  \mu_{1};\frac{\sigma_{1}^{2}}{n_{1}}\right)\qquad\bar{X_{2}}\sim N\left(  \mu_{2};\frac{\sigma_{2}^{2}}{n_{2}}\right)

Aufgrund der Reproduktivitätseigenschaft der Normalverteilung folgt, dass die Differenz der beiden Stichprobenmittelwerte

D=\bar{X_{1}}-\bar{X_{2}}

ebenfalls normalverteilt ist mit dem Erwartungswert

E[D]=E\left[\bar{X_{1}}-\bar{X_{2}}\right]=E\left[\bar{X_{1}}\right]-E\left[\bar{X_{2}}\right]=\mu_{1}-\mu_{2}

und der Varianz

Var(D)=\sigma_{D}^{2}=Var(\bar{X_{1}}-\bar{X_{2}})=Var(\bar{X_{1}})+Var(\bar{X_{2}})=\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}

Die standardisierte Zufallsvariable

Z=\frac{D-E[D]}{\sigma_{D}}=\frac{\left(\bar{X_{1}}-\bar{X_{2}}\right)-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}

ist demzufolge standardnormalverteilt Z \sim N(0;1)\;.

Anhand des Nenners von Z\; wird deutlich, dass für die Konstruktion von Konfidenzintervallen für \mu_{1}-\mu_{2} unterschieden werden muss nach:

Konfidenzintervall für die Differenz zweier Erwartungswerte bei bekannten Varianzen

Bei Gültigkeit der eingangs genannten Voraussetzungen und bekannten Varianzen \sigma_{1}^{2} und \sigma_{2}^{2} ist

\left[ \left(\bar{X_{1}}-\bar{X_{2}}\right)-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}},\;\left(\bar{X_{1}}-\bar{X_{2}}\right)+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}\right]

ein Konfidenzintervall für die Differenz \mu_{1}-\mu_{2} zweier Erwartungswerte zum Konfidenzniveau

P\left(\left(\bar{X_{1}}-\bar{X_{2}}\right)-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}\leq\mu_{1}-\mu_{2}\leq\left(\bar{X_{1}}-\bar{X_{2}}\right)+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}\right)  =1-\alpha

Für die vorgegebene Wahrscheinlichkeit 1 - \alpha findet man z_{1-\frac{\alpha}{2}} aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung.

Wurden die beiden Stichproben gezogen, erhält man ein entsprechendes Schätzintervall.

Sofern keine Normalverteilung in den beiden Grundgesamtheiten unterstellt werden kann, die beiden Stichprobenumfänge jedoch n_{1}\geq 30 und n_{2}\geq30 sind, kann wegen des zentralen Grenzwertsatzes das Konfidenzintervall ebenfalls verwendet werden. Das Konfidenzniveau ist dann approximativ 1-\alpha.

Konfidenzintervall für die Differenz zweier Erwartungswerte bei unbekannten Varianzen

In diesem Fall werden \sigma_{1}^{2} und \sigma_{2}^{2} mittels der erwartungstreuen und konsistenten Schätzfunktionen

S_{1}^{2}=\frac{1}{n_{1}-1}\cdot\sum\limits_{i=1}^{n_{1}}(X_{1i}-\bar{X_{1}})^{2}\qquad
S_{2}^{2}=\frac{1}{n_{2}-1}\cdot\sum\limits_{i=1}^{n_{2}}(X_{2i}-\bar{X_{2}})^{2}

aus den Stichproben geschätzt.

Annahme der Varianzhomogenität

Unter der Annahme der Varianzhomogenität, d.h. beide Grundgesamtheiten haben gleiche Varianz \sigma_{1}^{2}=\sigma_{2}^{2}, ergibt sich eine Schätzung S^{2}\, für die gemeinsame Varianz \sigma^{2} als gewogenes arithmetisches Mittel aus den beiden Stichprobenvarianzen:

S^{2}=\frac{(n_{1}-1)\cdot S_{1}^{2}+(n_{2}-1)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}

S^{2}\; wird auch als pooled variance bezeichnet.

Als Schätzfunktion S_{D}^{2} für \sigma_{D}^{2} folgt:

S_{D}^{2}=S^{2}\cdot \left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)=\frac{n_{1}+n_{2}}{n_{1}n_{2}}\cdot\frac{(n_{1}-1)\cdot S_{1}^{2}+(n_{2}-1)\cdot S_{2}^{2}}{n_{1}+n_{2}-2}

Die Standardabweichung S_{D}\; als Wurzel aus S_{D}^{2} wird für die Standardisierung verwendet, so dass die sich ergebende Zufallsvariable

T=\cfrac{D-E(D)}{S_{D}}=\cfrac{(\bar{x}_{1}-\bar{x}_{2})-(\mu_{1}-\mu_{2})}{\sqrt{\cfrac{n_{1}+n_{2}}{n_{1}n_{2}}\cdot\cfrac{(n_{1}-1)\cdot s_{1}^{2}+(n_{2}-1)\cdot s_{2}^{2}}{n_{1}+n_{2}-2}}}

einer t-Verteilung mit der Anzahl der Freiheitsgrade n_{1}+n_{2}-2 folgt.

Mit diesen Ergebnissen lässt sich ein Konfidenzintervall angeben:

Bei Gültigkeit der eingangs genannten Voraussetzungen und unbekannten gleichen Varianzen \sigma_{1}^{2} =\sigma_{2}^{2} ist:

\left[\left(\bar{X}_{1}-\bar{X}_{2}\right)-t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}\cdot S_{D};\;\left(\bar{X}_{1}-\bar{X}_{2}\right)+t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}\cdot S_{D}\right]

ein Konfidenzintervall für die Differenz \mu_{1} - \mu_{2} zweier Erwartungswerte zum Konfidenzniveau

P\left(\left(\bar{X}_{1}-\bar{X}_{2}\right)-t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}\cdot S_{D}\leq\mu_{1}-\mu_{2}\leq\left(\bar{X}_{1}-\bar{X}_{2}\right)+t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}}\cdot S_{D}\right)\approx 1-\alpha

Für die vorgegebene Wahrscheinlichkeit 1-\alpha findet man t_{n_{1}+n_{2}-2;1-\frac{\alpha}{2}} in der Tabelle der Verteilungsfunktion der t-Verteilung.

Sofern die beiden Stichprobenumfänge genügend groß sind (Faustregel: n_{1}\geq 30 und n_{2}\geq 30) kann t_{f, 1-\frac{\alpha}{2}} durch z_{1-\frac{\alpha}{2}} aus der Standardnormalverteilung ersetzt werden. Das Konfidenzniveau ist dann approximativ 1 - \alpha.

Annahme der Varianzheterogenität

Unter der Annahme der Varianzheterogenität, d.h. beide Grundgesamtheiten haben ungleiche Varianz \sigma_{1}^{2} \neq \sigma_{2}^{2} ergibt sich als Schätzfunktion S_{D}^{2} für \sigma_{D}^{2}

S_{D}^{2}=\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}

Wenn die beiden Stichprobenumfänge genügend groß sind (n_{1}\geq 30 und n_{2}\geq 30), lässt sich folgende Aussage treffen:

Bei Gültigkeit der eingangs genannten Voraussetzungen und unbekannten ungleichen Varianzen \sigma_{1}^{2} und \sigma_{2}^{2} ist

\left[(\bar{X}_{1}-\bar{X}_{2})-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}},\;(\bar{X}_{1}-\bar{X}_{2})+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}\right]

ein approximatives Konfidenzintervall für die Differenz \mu_{1}-\mu_{2} zweier Erwartungswerte zum näherungsweisen Konfidenzniveau

P\left((\bar{X}_{1}-\bar{X}_{2})-z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}\;\leq\;\mu_{1}-\mu_{2}\;\leq\;(\bar{X}_{1}-\bar{X}_{2})+z_{1-\frac{\alpha}{2}}\cdot\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}\right)=1-\alpha

Für die vorgegebene Wahrscheinlichkeit 1 - \alpha findet man z_{1-\frac{\alpha}{2}} aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung.

Für kleine Stichprobenumfänge n_{1} und n_{2} gibt es die Möglichkeit, unter Verwendung der t-Verteilung Konfidenzintervalle für \mu_{1} - \mu_{2} anzugeben.

Zusatzinformationen

Charakteristika des Konfidenzintervalls bei bekannten Varianzen

P\left(  \mu_{1}-\mu_{2}<D-z_{1-\frac{\alpha}{2}}\cdot\sigma_{D}\right)=\frac{\alpha}{2}=P\left(  D+z_{1-\frac{\alpha}{2}}\cdot\sigma_{D}<\mu_{1}-\mu_{2}\right)

Charakteristika des Konfidenzintervalls bei unbekannten Varianzen