Graphische Darstellung zweidimensionaler Verteilungen

Aus MM*Stat

Version vom 30. Mai 2018, 16:58 Uhr von Jacobdan (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Bivariate Statistik

Zweidimensionale Häufigkeitsverteilung • Graphische Darstellung zweidimensionaler Verteilungen • Randverteilungen, Bedingte Verteilungen • Parameter zweidimensionaler Verteilungen (empirisch) • Kontingenz • Spearman'scher Rangkorrelationskoeffizient • Kendall'scher Rangkorrelationskoeffizient • Kovarianz (empirisch) • Bravais–Pearson–Korrelationskoeffizient • Multiple Choice • Video • Aufgaben • Lösungen
3D-Balkendiagramm • 3D-Scatterplot • Absolute Häufigkeit (zweidimensional) • Ausprägungskombination • Bedingte Verteilung (empirisch) • Bindung • Chi-Quadrat-Koeffizient • Diskordante Merkmalspaare • Gegensinnige Merkmalspaare • Gemeinsame Variation • Gleichsinnige Merkmalspaare • Gruppiertes Balkendiagramm • Häufigkeitstabelle (zweidimensional) • Konditionale Verteilung • Konkordante Merkmalspaare • Kontingenzkoeffizient • Kontingenztabelle • Korrelation • Korrelationskoeffizient (empirisch) • Korrelationskoeffizient (nach Bravais-Pearson) • Korrigierter Kontingenzkoeffizient • Kreuztabelle • linearer Zusammenhang • Marginale Verteilung (empirisch) • Parameter (emp. Randverteilung) • Parameter (emp. bedingte Verteilung) • Quadratische Kontingenz • Randverteilung (empirisch) • Relative Häufigkeit (zweidimensional) • Scatterplot • Scatterplot-Matrix • Streuungsdiagramm • Unabhängigkeit (empirisch) • Unabhängigkeit (statistisch) • Variation (Streuung)

Grundbegriffe

Grafische Darstellung nominal- und ordinalskalierter Merkmale

Eine grafische Darstellung zweidimensionaler Häufigkeitsverteilungen für nominalskalierte Merkmale, ordinalskalierte Merkmale und metrisch skalierte Merkmale mit nur wenigen Ausprägungen gestaltet sich insoweit schwierig, da neben den beiden Merkmalsdimensionen eine dritte Dimension für die gemeinsame Häufigkeitsverteilung benötigt wird.

Grundsätzlich bieten sich zwei verschiedene Darstellungsformen an - das gruppierte Balkendiagramm und das 3D-Balkendiagramm.

Gruppiertes Balkendiagramm

Dieses Diagramm erzeugt für jede Ausprägung der einen Variablen eine Gruppe von Balken entsprechend den Ausprägungen der zweiten "Gruppierungs"-Variablen

3D-Balkendiagramm

Eine plastische Darstellung der zweidimensionalen Häufigkeitsverteilung lässt sich unter Verwendung eines 3D-Balkendiagramms erreichen.

Diese Darstellungsform kann jedoch den Nachteil der Unübersichtlichkeit (Balken verdecken einander) oder erschwerter Interpretierbarkeit (Ablesen der gemeinsamen Häufigkeitsverteilung) mit sich bringen.

Grafische Darstellung metrisch skalierter Merkmale

Die Beobachtungswerte zweier metrisch skalierter Merkmale lassen sich sehr anschaulich als Punkte in einem kartesischen Koordinatensystem - Streuungsdiagramm oder auch Scatterplot genannt - darstellen.

Streuungsdiagramm (engl. Scatterplot)

Streuungsdiagramme bzw. Scatterplots sind besonders dazu geeignet, eventuell bestehende Zusammenhänge zwischen zwei metrischen Merkmalen sichtbar zu machen (Beispiel: Erhöhung von Merkmal führt zu einer sichtbaren Erhöhung von Merkmal ).

3D-Scatterplot

In einem 3D-Scatterplot lassen sich drei metrisch skalierte Merkmale gleichzeitig darstellen. Verschiedene statistische Software bietet darüberhinaus auch die Möglichkeit, den 3D-Scatterplot zu rotieren, was das Erkennen möglicher Zusammenhänge unterstützt.

Scatterplot-Matrix

Sollen mehr als zwei metrisch skalierte Merkmale untersucht werden, kann zur grafischen Darstellung die Scatterplot-Matrix verwendet werden.

Hierbei werden die Scatterplots aller möglichen Paare zweier Merkmale erzeugt und in Form einer Matrix zusammengefügt.

Zu beachten ist jedoch, dass mit steigender Anzahl der zu untersuchenden Merkmale die Übersichtlichkeit und damit auch die Interpretierbarkeit abnimmt.

Beispiele

Kriminalitätsraten

In den U.S.A. wurden 1985 unter anderem verschiedene Kriminalitätsraten für 50 Bundesstaaten ermittelt:

- land area
- population
- murder
- rape
- robbery
- assault
- burglary
- larceny
- auto theft
- US states region number
- US states division number

Der Zusammenhang zwischen der "Mordrate" und der Größe der "Bevölkerung" lässt sich grafisch in Form eines Scatterplots veranschaulichen.

Jeder Bundesstaat wird in dem Scatterplot durch einen Punkt dargestellt.

In dem Scatterplot ist in der Tendenz ein Anstieg der Morde bei steigender Bevölkerungszahl zu erkennen.

Die Darstellung der drei Variablen "population" , "murder" und "robbery" ergibt den foldenden 3D-Scatterplot: