Parameter eindimensionaler Verteilungen (empirisch): Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „{{Mmstat3:Statistik I&II/Eindimensionale Häufigkeitsverteilung|NaviExt}} =={{Vorlage:Überschrift}}== ===Lageparameter oder Lagemaß=== ''Lageparameter'' c…“)
 
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
{{Mmstat3:Statistik I&II/Eindimensionale Häufigkeitsverteilung|NaviExt}}
{{Eindimensionale Häufigkeitsverteilung|NaviExt}}


=={{Vorlage:Überschrift}}==
=={{Vorlage:Überschrift}}==

Version vom 14. Mai 2018, 20:05 Uhr

Vorlage:Eindimensionale Häufigkeitsverteilung

Grundbegriffe

Lageparameter oder Lagemaß

Lageparameter charakterisieren die Lage der Häufigkeitsverteilung auf der Merkmalsachse. Sie sollen:

Jeder Lageparameter ist ein Merkmalswert, d.h. er besitzt die gleiche Maßeinheit wie das Merkmal. Da sich die Lokalisation eines Merkmals auf verschiedene Weise messen läßt, können verschiedene Lageparameter definiert werden.

Modus
Der häufigste Wert.
Arithmetisches Mittel
Der (gewichtete) Durchschnitt der Daten.
Harmonisches Mittel
Setzt ein verhältnisskaliertes Merkmal voraus und ist ein Spezialfall des arithmetischen Mittels.
Geometrisches Mittel
Ist für Zuwachsraten etc. geeignet.
Quantile (Median, Quartile, Quintile Dezile)
Teilen die Daten in Gruppen, wobei die Gruppen jeweils einen vorgegebenen Prozentsatz der Beobachtungen enthalten.

Mittelwert

Die vier zuerst genannten Lageparameter sowie der Median werden auch als Mittelwerte bezeichnet.

Robustheit

Ein Parameter heißt robust, wenn er relativ unempfindlich gegenüber Ausreißern ist.

Streuung

Mit dem Begriff Streuung (auch als Dispersion bezeichnet) wird im statistischen Sinne die Variabilität, die Unterschiedlichkeit in den Merkmalswerten eines metrisch skalierten Merkmals erfasst.

Streuungsparameter dienen der numerischen Erfassung dieser Variabilität.

Streuungsparameter oder Streuungsmaß

Die Lageparameter sind zur Charakterisierung einer eindimensionalen Häufigkeitsverteilungen nicht ausreichend. Dies soll durch folgendes Beispiel gezeigt werden:

Monatliche Aufwendungen für Freizeitgüter und Urlaub (in EUR)

  • von 10 Zweipersonenhaushalten: 210, 250, 340, 360, 400, 430, 440, 450, 530, 630 und
  • von 10 Vierpersonenhaushalten: 340, 350, 360, 380, 390, 410, 420, 440, 460, 490

abgetragen auf einer Merkmalsachse:

<R output="display">

pdf(rpdf, width=10, height=2) par(mar=c(1, 0, 1, 0)) zweiphh = c(210, 250, 340, 360, 400, 430, 440, 450, 530, 630) vierphh = c(340, 350, 360, 380, 390, 410, 420, 440, 460, 490) plot(c(zweiphh, vierphh), c(rep(1,10), rep(0,10)), axes = FALSE, xlab="", ylab="") abline(h=1, lty=1) abline(h=0, lty=1) </R>

Das arithmetische Mittel beträgt in beiden Fällen 404 EUR. Die grafische Darstellung verdeutlicht jedoch die großen Unterschiede zwischen beiden Verteilungen.

Bei den Vierpersonenhaushalten liegen die Merkmalswerte enger um das Zentrum (arithmetische Mittel) als bei den Zweipersonenhaushalten, d.h. sie streuen weniger.

Neben der Angabe der Lokalisation (Mittelwerte) sind Streuungsparameter unerlässlich zur weitergehenderen Charakterisierung und Unterscheidung verschiedener eindimensionaler Häufigkeitsverteilungen.

Da sich die Variabilität eines Merkmals auf verschiedene Weise messen läßt, können verschiedene Streuungsparameter definiert werden:

Spannweite
Ist gleich der Differenz zwischen dem größten und dem kleinsten Beobachtungswert.
Interquartilsabstand
Ist die Differenz zwischen dem dritten Quartil und dem ersten Quartil und ein robustes Streuungsmaß.
Mittlere absolute Abweichung
Ist die (gewichtete) absolute Abweichung vom arithmetischen Mittel oder Median.
Empirische Varianz und empirische Standardabweichung
Ist die (gewichtete) quadrierte Abweichung vom arithmetischen Mittel
Empirischer Variationskoeffizient und empirischer Quartilsdispersionskoeffizient
Sind zwei relative Streuungsmaße.