Quantil
Aus MM*Stat
Inhaltsverzeichnis
Grundbegriffe
p-Quantil
Gegeben sei eine Folge von Merkmalsausprägungen eines mindestens ordinalskalierten Merkmals .
Der Punkt auf der Merkmalsachse, der eine der Größe nach in aufsteigender Folge geordnete Reihe von Merkmalswerten
der Anzahl nach ungefähr oder genau im Verhältnis
mit
teilt, wird als p-Quantil
bezeichnet.
p-Quantil, unklassierte Variablen
Sei keine natürliche Zahl und
die auf
folgende (nächst größere) natürliche Zahl, so ist das p-Quantil
.
Sei eine natürliche Zahl und
, so könnte jeder Wert zwischen
und
als p-Quantil definiert werden. Vereinbarungsgemäß verwendet man jedoch
p-Quantil, klassierte Variablen
Liegen klassierte Merkmale vor, ergibt sich das p-Quantil wie
folgt:
Darin ist die untere Klassengrenze,
die obere Klassengrenze,
die relative Häufigkeit der Quantilsklasse und
die empirische Verteilungsfunktion der Quantilsklasse vorausgehenden Klasse.
Das p-Quantil wird durch Interpolation ermittelt. Wegen
lassen sich die p-Quantile leicht aus der Grafik der empirischen Verteilungsfunktion entnehmen, wie die folgende Abbildung verdeutlicht.
Median bzw. Zentralwert
Gegeben sei die in aufsteigender Folge geordnete Reihe der Merkmalsausprägungen eines mindestens ordinalskalierten Merkmals .
Diejenige Merkmalsausprägung, die die Reihe in zwei gleiche Teile zerlegt, sich also an zentraler Stelle befindet, wird als Median oder Zentralwert bezeichnet. Der Median
ist somit ein spezielles p-Quantil an der Stelle
, also
.
Er ist relativ unempfindlich gegenüber Ausreißern, also Merkmalswerten, die übermäßig stark von den anderen Werten abweichen.
Median für nicht-klassierte Merkmale
- Falls
ungerade ist:
- Falls
gerade ist:
.
Median für klassierte Merkmale
Liegen klassierte Merkmale vor, ergibt sich der Median wie folgt:
Dabei ist die untere Klassengrenze,
die obere Klassengrenze,
die relative Häufigkeit der Medianklasse und
die empirische Verteilungsfunktion der Medianklasse vorausgehenden Klasse.
Der Median wird durch Interpolation ermittelt. Wegen
lässt sich der Median leicht aus der Grafik der empirischen Verteilungsfunktion entnehmen, wie die folgende Abbildung verdeutlicht.
Quartil
Als Quartil bezeichnen wir jene p-Quantile, die die geordnete Reihe der Merkmalsausprägungen in 4 gleichgroße Teile zerlegt. Es gibt also 3 Quartile:
Quintil
Als Quintil bezeichnen wir jene p-Quantile, die die geordnete Reihe der Merkmalsausprägungen in 5 gleichgroße Teile zerlegt. Es gibt also 4 Quintile:
Dezil
Als Dezil bezeichnen wir jene p-Quantile, die die geordnete Reihe der Merkmalsausprägungen in 10 gleichgroße Teile zerlegt. Es gibt also 9 Dezile:
Zusatzinformationen
Eigenschaften des Median für metrisch skalierte Merkmale
Lineare Minimumeigenschaft
Die Summe der absoluten Abweichungen der Merkmalswerte vom Median ist ein Minimum im Vergleich zur Summe der absoluten Abweichungen der Merkmalswerte von jedem anderen beliebigen Wert.
Lineare Transformation
Beispiele
Haushaltsnettoeinkommen
Von | Bis unter | Anteil Befragte |
---|---|---|
0 | 800 | 4,4% |
800 | 1400 | 16,6% |
1400 | 3000 | 47,1% |
3000 | 5000 | 24,3% |
5000 | 25000 | 7,6% |
Grafische Darstellung der Quartile
Berechnung der Quartile
Aus der empirischen Verteilungsfunktion (3. Spalte der Tabelle) ist erkennbar, dass das erste Quartil mit
und das zweite Quartil
mit
in die dritte Klasse 1400 - 3000 DM
fallen.
Diese Klasse weist eine Klassenbreite von 1600 DM auf. Das dritte Quartil mit
liegt in der vierten Klasse 3000 - 5000 DM mit einer Klassenbreite von 2000 DM.
Interpretationen
1. Quartil: 25% der betrachteten Haushalte haben ein monatliches Haushaltsnettoeinkommen von höchstens 1535,88 DM und 75% der Haushalte ein monatliches Haushaltsnettoeinkommen größer als 1535,88 DM.
2. Quartil: 50% der Haushalte haben ein monatliches Haushaltsnettoeinkommen von höchstens 2385,14 DM und 50% der Haushalte ein monatliches Haushaltsnettoeinkommen größer als 2385,14 DM.
3. Quartil: 75% der Haushalte haben ein monatliches Haushaltsnettoeinkommen von höchstens 3567,90 DM und 25% der Haushalte ein monatliches Haushaltsnettoeinkommen größer als 3567,90 DM.
Aus der Berechnung der Quartile folgt unmittelbar, dass 50% der Haushalte ein monatliches Haushaltsnettoeinkommen zwischen 1535,88 DM und 3567,90 DM haben.
Dieser Abstand wird auch als Interquartilsabstand bezeichnet und in einem der folgenden Kapitel genauer erläutert.