Graphische Darstellung eindimensionaler Verteilungen: Unterschied zwischen den Versionen
Aus MM*Stat
Zeile 19: | Zeile 19: | ||
Eine Darstellung wird als ''flächenproportional'' bezeichnet, wenn die darzustellenden Größen als Flächen abgebildet werden, wobei sich die Flächeninhalte proportional zu den darzustellenden Größen verhalten. | Eine Darstellung wird als ''flächenproportional'' bezeichnet, wenn die darzustellenden Größen als Flächen abgebildet werden, wobei sich die Flächeninhalte proportional zu den darzustellenden Größen verhalten. | ||
Zu den flächenproportionalen Darstellungen einer eindimensionaler Verteilung zählen | |||
* das [[Histogramm]], | |||
* das [[Stengel-Blatt-Diagramm]] und | |||
* der [[Dotplot]]. | |||
===Grafische Darstellung diskreter Merkmale=== | ===Grafische Darstellung diskreter Merkmale=== |
Version vom 2. Juli 2020, 08:12 Uhr
Graphische Darstellung eindimensionaler Verteilungen
Höhenproportionale Darstellung
Eine Darstellung wird als höhenproportional bezeichnet, wenn allein die Höhe bzw. Länge des Balkens bzw. Stabes eine Aussage über die darzustellende Größe trifft.
Zu den höhenproportionalen Darstellungen einer eindimensionaler Verteilung zählen
- das Säulen- oder Balkendiagramm,
- das Kreisdiagramm,
- das Rechteck- oder Flächendiagramm,
- das Stab- oder Liniendiagramm,
- das Piktogramm und
- das Kartogramm.
Flächenproportionale Darstellung
Eine Darstellung wird als flächenproportional bezeichnet, wenn die darzustellenden Größen als Flächen abgebildet werden, wobei sich die Flächeninhalte proportional zu den darzustellenden Größen verhalten.
Zu den flächenproportionalen Darstellungen einer eindimensionaler Verteilung zählen
- das Histogramm,
- das Stengel-Blatt-Diagramm und
- der Dotplot.
Grafische Darstellung diskreter Merkmale
Für die grafische Darstellung der eindimensionalen Häufigkeitsverteilung diskreter Merkmale gibt es verschiedene Möglichkeiten: Säulen- bzw. Balkendiagramm, Kreisdiagramm, Rechteck- bzw. Flächendiagramm, Stab- bzw. Liniendiagramm, Piktogramm oder Kartogramm.
Säulen- oder Balkendiagramm
Das Säulen- oder Balkendiagramm dient der grafischen Darstellung der empirischen Häufigkeitsverteilung vor allem von nominalskalierten und ordinalskalierten Merkmalen, aber auch von metrisch skalierten diskreten Merkmalen mit wenigen Merkmalsausprägungen.
Ein Balkendiagramm stellt die Häufigkeit jeder Merkmalsausprägung als separaten Balken dar. Dazu werden auf der Abszissenachse die Merkmalsausprägungen und auf der Ordinatenachse die beobachtete absolute oder relative Häufigkeit der jeweiligen Merkmalsausprägung abgetragen.
Im Allgemeinen handelt es sich hierbei um eine höhenproportionale Darstellung.
In der folgenden Grafik werden die relativen Häufigkeiten in Prozent verwendet:
Kreisdiagramm
Ein Kreisdiagramm stellt die Häufigkeit jeder Merkmalsausprägung durch die Aufteilung einer Kreisfläche in Sektoren dar.
Im Allgemeinen handelt es sich um eine flächenproportionale Darstellung.
Rechteck- oder Flächendiagramm
Ein Rechteck- oder Flächendiagramm stellt die Häufigkeit jeder Merkmalsausprägung durch die Aufteilung einer Fläche in einzelne Bereiche dar.
Im Allgemeinen handelt es sich um eine flächenproportionale Darstellung.
In der folgenden Grafik werden die relativen Häufigkeiten in Prozent verwendet:
Stab- oder Liniendiagramm
Ein Stab- oder Liniendiagramm stellt die Häufigkeit jeder Merkmalsausprägung durch die Höhe von Säulen dar (vgl. Säulendiagramm).
Im Allgemeinen handelt es sich um eine höhenproportionale Darstellung.
Piktogramm
Ein Piktogramm stellt die Häufigkeit jeder Merkmalsausprägung mit unterschiedlich großen Bildsymbolen oder einer verschieden großen Anzahl von Bildsymbolen dar. Dabei muss die ausgewählte Größe des Bildsymbols bzw. die Anzahl der Bildsymbole die dafür stehende Häufigkeit abbilden.
Kartogramm
Ein Kartogramm stellt die Häufigkeit jeder Merkmalsausprägung innerhalb einer Landkarte dar.
Grafische Darstellung stetiger Merkmale
Histogramm
Die grafische Darstellung der Häufigkeiten eines stetigen klassierten Merkmals durch rechteckige Flächen wird als Histogramm bezeichnet. Es eignet sich auch zur Darstellung der Häufigkeiten diskreter Merkmale mit sehr vielen Merkmalsausprägungen, da solche Merkmale vielfach klassiert und als (quasi-)stetige Merkmale behandelt werden.
Die Klassengrenzen werden auf der Abszissenachse abgetragen. Über den Klassen werden Rechtecke in Höhe der Häufigkeitsdichten oder eingezeichnet.
Die Klassenhäufigkeit wird durch die Fläche des Rechtecks über der jeweiligen Klasse repräsentiert (flächenproportionale Darstellung). Die Verwendung der Häufigkeitsdichten ist unbedingt erforderlich, wenn ungleiche Klassenbreiten vorliegen.
Wird jedoch für alle Klassen eine gleiche Klassenbreite gewählt, kann auch eine höhenproportionale Darstellung verwendet werden, indem auf der Ordinatenachse die absoluten bzw. relativen Häufigkeiten abgetragen und die Rechtecke über den Klassen in Höhe der entsprechenden Häufigkeiten eingezeichnet werden.
Beispiel eines Histogramms für 2000 Beobachtungen des monatlichen persönlichen Nettoeinkommens (in Euro, Daten aus ALLBUS 2010):
Stengel-Blatt-Diagramm
Ein Stengel-Blatt-Diagramm (engl. stem-and-leaf-diagram) ist eine halbgrafische Darstellung der Werte einer Beobachtungsreihe eines metrisch skalierten Merkmals. Wie der Name vermuten lässt, besteht das Stengel-Blatt-Diagramm aus einem "Stamm" (stem) und "Blättern" (leaf).
Abhängig von der Anzahl der Beobachtungswerte gibt es zwei Grundvarianten des Stengel-Blatt-Diagramms.
Die erste Variante soll hier an einem kleinen Beispiel veranschaulicht werden. Die zweite Variante wird im Beispiel Netteinkommen weiter unten gezeigt.
Beobachtungsreihe: 32,32,35,36,40,44,47,48,53,57,57,100,105
Frequency Stem & Leaf 2,00 3 . 22 2,00 3 . 56 2,00 4 . 04 2,00 4 . 78 1,00 5 . 3 2,00 5 . 77 2,00 Extremes (>=100) Stem width: 10,00 Each leaf: 1 case(s)
Unterhalb des Diagramms wird die Stamm-Einheit (stem width) angegeben. Das obige Diagramm hat z.B. eine "stem width" von 10, was bedeutet, dass der Stamm die Zehner-Ziffern enthält und die Blätter die Einer-Ziffern.
Der Stamm ist in diesem Beispiel auf zwei Zeilen aufgeteilt. Die erste Zeile, gekennzeichnet durch einen Stern (*), nimmt die Blätter von 0 bis 4, die zweite Zeile, gekennzeichnet durch einen Punkt (.), die Blätter von 5 bis 9 auf.
So hat beispielsweise der Beobachtungswert 47 den Stamm 4 und das Blatt 7. Jedes Blatt steht für einen Beobachtungswert ("Each leaf: 1 case"). Der Beobachtungswert 32 (Stamm 3, Blatt 2) kommt zweimal vor.
Weiterhin existieren zwei extrem große Beobachtungswerte (100 und 105), die als solche ausgewiesen sind.
Dotplot
Ein Dotplot ist eine zweidimensionale Darstellung eindimensionaler Daten, wobei auf der Abszissenachse der Bereich der beobachteten Merkmalswerte abgetragen wird.
Die einzelnen Beobachtungen werden über dieser Achse als Punkte (oder anderes Symbol) eingezeichnet.
Beispiel für 150 US-Stundenlöhne, wobei in dem oberen Teil der Grafik ein Dotplot für alle 150 Beobachtungen zusammen und im unteren Teil ein Dotplot mit der farbigen Trennung nach Männern und Frauen abgebildet ist.