Parameter eindimensionaler Verteilungen (empirisch)
Aus MM*Stat
Grundbegriffe
Lageparameter oder Lagemaß
Lageparameter charakterisieren die Lage der Häufigkeitsverteilung auf der Merkmalsachse. Sie sollen:
- die Häufigkeitsverteilung gut repräsentieren,
- einen Vergleich zwischen verschiedenen Häufigkeitsverteilungen ermöglichen,
- zur Beurteilung der einzelnen Merkmalsausprägungen dienen.
Jeder Lageparameter ist ein Merkmalswert, d.h. er besitzt die gleiche Maßeinheit wie das Merkmal. Da sich die Lokalisation eines Merkmals auf verschiedene Weise messen läßt, können verschiedene Lageparameter definiert werden.
- Modus
- Der häufigste Wert.
- Arithmetisches Mittel
- Der (gewichtete) Durchschnitt der Daten.
- Harmonisches Mittel
- Setzt ein verhältnisskaliertes Merkmal voraus und ist ein Spezialfall des arithmetischen Mittels.
- Geometrisches Mittel
- Ist für Zuwachsraten etc. geeignet.
- Quantile (Median, Quartile, Quintile Dezile)
- Teilen die Daten in Gruppen, wobei die Gruppen jeweils einen vorgegebenen Prozentsatz der Beobachtungen enthalten.
Mittelwert
Die vier zuerst genannten Lageparameter sowie der Median werden auch als Mittelwerte bezeichnet.
Robustheit
Ein Parameter heißt robust, wenn er relativ unempfindlich gegenüber Ausreißern ist.
Streuung
Mit dem Begriff Streuung (auch als Dispersion bezeichnet) wird im statistischen Sinne die Variabilität, die Unterschiedlichkeit in den Merkmalswerten eines metrisch skalierten Merkmals erfasst.
Streuungsparameter dienen der numerischen Erfassung dieser Variabilität.
Streuungsparameter oder Streuungsmaß
Die Lageparameter sind zur Charakterisierung einer eindimensionalen Häufigkeitsverteilungen nicht ausreichend. Dies soll durch folgendes Beispiel gezeigt werden:
Monatliche Aufwendungen für Freizeitgüter und Urlaub (in EUR)
- von 10 Zweipersonenhaushalten: 210, 250, 340, 360, 400, 430, 440, 450, 530, 630 und
- von 10 Vierpersonenhaushalten: 340, 350, 360, 380, 390, 410, 420, 440, 460, 490
abgetragen auf einer Merkmalsachse:
<R output="display">
pdf(rpdf, width=10, height=2) par(mar=c(1, 0, 1, 0)) zweiphh = c(210, 250, 340, 360, 400, 430, 440, 450, 530, 630) vierphh = c(340, 350, 360, 380, 390, 410, 420, 440, 460, 490) plot(c(zweiphh, vierphh), c(rep(1,10), rep(0,10)), axes = FALSE, xlab="", ylab="") abline(h=1, lty=1) abline(h=0, lty=1) </R> |
Das arithmetische Mittel beträgt in beiden Fällen 404 EUR. Die grafische Darstellung verdeutlicht jedoch die großen Unterschiede zwischen beiden Verteilungen.
Bei den Vierpersonenhaushalten liegen die Merkmalswerte enger um das Zentrum (arithmetische Mittel) als bei den Zweipersonenhaushalten, d.h. sie streuen weniger.
Neben der Angabe der Lokalisation (Mittelwerte) sind Streuungsparameter unerlässlich zur weitergehenderen Charakterisierung und Unterscheidung verschiedener eindimensionaler Häufigkeitsverteilungen.
Da sich die Variabilität eines Merkmals auf verschiedene Weise messen läßt, können verschiedene Streuungsparameter definiert werden:
- Spannweite
- Ist gleich der Differenz zwischen dem größten und dem kleinsten Beobachtungswert.
- Interquartilsabstand
- Ist die Differenz zwischen dem dritten Quartil und dem ersten Quartil und ein robustes Streuungsmaß.
- Mittlere absolute Abweichung
- Ist die (gewichtete) absolute Abweichung vom arithmetischen Mittel oder Median.
- Empirische Varianz und empirische Standardabweichung
- Ist die (gewichtete) quadrierte Abweichung vom arithmetischen Mittel
- Empirischer Variationskoeffizient und empirischer Quartilsdispersionskoeffizient
- Sind zwei relative Streuungsmaße.