Konfidenzintervall für die Differenz zweier Erwartungswerte
Aus MM*Stat
Unterseiten |
Grundbegriffe
Konfidenzintervall für die Differenz zweier Erwartungswerte
Von den vielen Möglichkeiten, Konfidenzintervalle für die Differenz zweier Erwartungswerte zu konstruieren, wird nur diejenige behandelt, für die nachstehende Voraussetzungen gelten:
- Gegeben sind zwei Grundgesamtheiten, in denen die Zufallsvariablen und normalverteilt sind mit bzw. und bzw. , d.h. und .
- Aus jeder Grundgesamtheit wird eine einfache Zufallsstichprobe gezogen bzw. es wird unterstellt, dass die Umfänge der beiden Grundgesamtheiten und genügend groß sind, dass von der Realisierung einfacher Zufallsstichproben ausgegangen werden kann. Die Stichprobenumfänge sind und .
- Die beiden Zufallsstichproben sind unabhängig voneinander.
Von besonderem Interesse bei der praktischen Anwendung von Konfidenzintervallen für die Differenz zweier Erwartungswerte ist es, ob der Wert 0 dabei überdeckt wird oder nicht.
Sobald das aus den Stichproben resultierende Schätzintervall den Wert nicht einschließt, ist ein Unterschied zwischen und auf dem verwendeten Konfidenzniveau bedeutsam.
Da die Zufallsvariablen und normalverteilt sind, gilt dies auch für die Stichprobenmittelwerte und (vgl. Abschnitt "Verteilung des Stichprobenmittelwertes").
Weiterhin sind:
Zusammenfassend kann geschrieben werden:
Aufgrund der Reproduktivitätseigenschaft der Normalverteilung folgt, dass die Differenz der beiden Stichprobenmittelwerte
ebenfalls normalverteilt ist mit dem Erwartungswert
und der Varianz
Die standardisierte Zufallsvariable
ist demzufolge standardnormalverteilt .
Anhand des Nenners von wird deutlich, dass für die Konstruktion von Konfidenzintervallen für unterschieden werden muss nach:
- Die Varianzen der beiden Grundgesamtheiten und sind bekannt.
- Die Varianzen der beiden Grundgesamtheiten und sind unbekannt.
Konfidenzintervall für die Differenz zweier Erwartungswerte bei bekannten Varianzen
Bei Gültigkeit der eingangs genannten Voraussetzungen und bekannten Varianzen und ist
ein Konfidenzintervall für die Differenz zweier Erwartungswerte zum Konfidenzniveau
Für die vorgegebene Wahrscheinlichkeit findet man aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung.
Wurden die beiden Stichproben gezogen, erhält man ein entsprechendes Schätzintervall.
- Sofern keine Normalverteilung in den beiden Grundgesamtheiten unterstellt werden kann, die beiden Stichprobenumfänge jedoch und sind, kann wegen des zentralen Grenzwertsatzes das Konfidenzintervall ebenfalls verwendet werden. Das Konfidenzniveau ist dann approximativ .
Konfidenzintervall für die Differenz zweier Erwartungswerte bei unbekannten Varianzen
In diesem Fall werden und mittels der erwartungstreuen und konsistenten Schätzfunktionen
aus den Stichproben geschätzt.
Annahme der Varianzhomogenität
Unter der Annahme der Varianzhomogenität, d.h. beide Grundgesamtheiten haben gleiche Varianz , ergibt sich eine Schätzung für die gemeinsame Varianz als gewogenes arithmetisches Mittel aus den beiden Stichprobenvarianzen:
wird auch als pooled variance bezeichnet.
Als Schätzfunktion für folgt:
Die Standardabweichung als Wurzel aus wird für die Standardisierung verwendet, so dass die sich ergebende Zufallsvariable
einer t-Verteilung mit der Anzahl der Freiheitsgrade folgt.
Mit diesen Ergebnissen lässt sich ein Konfidenzintervall angeben:
Bei Gültigkeit der eingangs genannten Voraussetzungen und unbekannten gleichen Varianzen ist:
ein Konfidenzintervall für die Differenz zweier Erwartungswerte zum Konfidenzniveau
Für die vorgegebene Wahrscheinlichkeit findet man in der Tabelle der Verteilungsfunktion der t-Verteilung.
- Sofern die beiden Stichprobenumfänge genügend groß sind (Faustregel: und ) kann durch aus der Standardnormalverteilung ersetzt werden. Das Konfidenzniveau ist dann approximativ .
Annahme der Varianzheterogenität
Unter der Annahme der Varianzheterogenität, d.h. beide Grundgesamtheiten haben ungleiche Varianz ergibt sich als Schätzfunktion für
Wenn die beiden Stichprobenumfänge genügend groß sind ( und ), lässt sich folgende Aussage treffen:
Bei Gültigkeit der eingangs genannten Voraussetzungen und unbekannten ungleichen Varianzen und ist
ein approximatives Konfidenzintervall für die Differenz zweier Erwartungswerte zum näherungsweisen Konfidenzniveau
Für die vorgegebene Wahrscheinlichkeit findet man aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung.
- Für kleine Stichprobenumfänge und gibt es die Möglichkeit, unter Verwendung der t-Verteilung Konfidenzintervalle für anzugeben.
Zusatzinformationen
Charakteristika des Konfidenzintervalls bei bekannten Varianzen
- Das angegebene Konfidenzintervall ist ein bezüglich der Wahrscheinlichkeit symmetrisches Konfidenzintervall, denn es gilt:
- Das Konfidenzintervall ist symmetrisch bezüglich der Punktschätzung. Die Grenzen des Intervalls haben zu den gleichen Abstand.
- Die Länge des Konfidenzintervalls und der Schätzfehler hängen nicht von den Stichprobenergebnissen, jedoch von den Stichprobenumfängen und , den Varianzen und der beiden Grundgesamtheiten und vom vorgegebenen Konfidenzniveau ab.
Charakteristika des Konfidenzintervalls bei unbekannten Varianzen
- die angegebenen Konfidenzintervalle sind bezüglich der Wahrscheinlichkeit symmetrische Konfidenzintervalle.
- Die Konfidenzintervalle sind symmetrisch bezüglich der Punktschätzung. Die Grenzen der Intervalle haben zu den gleichen Abstand.
- Die Länge der Konfidenzintervalle und die Schätzfehler sind Zufallsvariablen, da sie über und von den Stichprobenergebnissen abhängen.
- Die Konfidenzintervalle sind außerdem von den Stichprobenumfängen und und vom vorgegebenen Konfidenzniveau abhängig.