Häufigkeitsverteilung

Aus MM*Stat

Version vom 25. Mai 2018, 12:43 Uhr von Hu-wiki-admin (Diskussion | Beiträge) (1 Version importiert)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt statistische Häufigkeiten im Allgemeinen. Die im Folgenden erklärten Begrifflichkeiten bilden die Grundlage zum Verständnis von eindimensionalen Häufigkeitsverteilungen sowie zweidimensionalen Häufigkeitsverteilungen.

Grundbegriffe der Statistik

Statistik • Statistische Untersuchung • Träger der Statistik • Statistische Einheit • Grundgesamtheit • Merkmal • Skalierung • Klassierung • Statistische Reihen • Statistische Häufigkeiten • Multiple Choice • Aufgaben • Lösungen • Videos
Absolute Häufigkeit • Absolute Klassenhäufigkeit • Absolutskala • Ausprägung • Ausreißer • Beobachtung • Beobachtungswert • Bestandsmasse • Bewegungsmasse • Binäres Merkmal • Daten • Datensatz • Deskriptive Statistik • Dichotomes Merkmal • Diskretes Merkmal • Erhebungsmerkmal • Fortschreibung • Gruppe • Gruppierung • Häufbares Merkmal • Häufigkeitsdichte • Häufigkeitsverteilung • Identifikationskriterium • Identifikationsmerkmal • Intervallskala • Induktive Statistik • Kardinalskala • Klasse • Klassenbreite • Klassengrenze • Klassenhäufigkeit • Klassenmitte • Merkmalsausprägung • Merkmalsträger • Merkmalswert • Messniveau • Metrische Skala • Nominalskala • Nominalzahl • Ordinalskala • Parameter • Qualitatives Merkmal • Quantitatives Merkmal • Quasi-stetiges Merkmal • Rangzahl • Relative Häufigkeit • Relative Klassenhäufigkeit • Schlüsselzahl • Skala • Skalenniveau • Statistische Deskription • Statistische Inferenz • Statistische Masse • Stetiges Merkmal • Stichprobenerhebung • Teilerhebung • Totalerhebung • Umfang der Grundgesamtheit • Urliste • Variable • Verhältnisskala • Verteilung (empirisch) • Vollerhebung

Grundbegriffe

Statistische Häufigkeit

Bei statistischen Reihen treten Merkmalsausprägungen oft mehrfach auf (Häufung) - z.B. mehrfach die Altersangabe 25 Jahre.

In einem solchen Fall werden in der Regel nur noch die verschieden aufgetretenen Merkmalsausprägungen bzw. die Merkmalsklassen aufgeführt und um eine Angabe ergänzt, wie oft die Merkmalsausprägung bzw. ein Merkmalswert aus der Merkmalsklasse aufgetreten ist.

Als statistische Häufigkeit wird in der Statistik die Besetzungszahl einer Merkmalsausprägung oder einer Merkmalsklasse bezeichnet.

Absolute Häufigkeit

Die Anzahl der statistischen Einheiten mit einer bestimmten Merkmalsausprägung x_{j} wird als absolute Häufigkeit bezeichnet und wie folgt symbolisiert:

h\left(  X=x_{j} \right)  = h \left(  x_{j} \right)  = h_{j}

Relative Häufigkeit

Der Anteil der absoluten Häufigkeit einer Merkmalsausprägung bzw. einer Merkmalsklasse am Umfang der untersuchten Gesamtheit bzw. der Stichprobe, wird als relative Häufigkeit  \ f\left(  x_{j} \right) \ bezeichnet:

 f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n} \quad \mbox{mit} \quad 0\leq f\left( x_{j}\right)\leq 1 \ \mbox{und} \ \sum f\left( x_{j}\right) =1

Klassenhäufigkeit

Bei Klassenhäufigkeiten unterscheidet man zwischen absoluter und relativer Klassenhäufigkeit.

Absolute Klassenhäufigkeit

Die Anzahl der statistischen Einheiten mit Merkmalsausprägungen einer bestimmten Klasse wird als absolute Klassenhäufigkeit bezeichnet.

 h\left( x_{j} \right)  = h (  x_{j}^{u}\leq X < x_{j}^{o}) \quad \mbox{mit} \quad 0\leq h\left(  x_{j}\right) \leq n \ \mbox{und} \ \sum h\left(  x_{j} \right)  =n

Relative Klassenhäufigkeit

Als relative Klassenhäufigkeit bezeichnet man die Anzahl der statistischen Einheiten mit Merkmalsausprägungen einer bestimmten Klasse dividiert durch die Anzahl der Beobachtungen n.

 f\left( x_{j} \right)  = f (  x_{j}^{u}\leq X < x_{j}^{o}) = \cfrac{h (  x_{j}^{u}\leq X < x_{j}^{o})}{n} \quad \mbox{mit} \quad 0\leq f\left(  x_{j}\right) \leq 1 \ \mbox{und} \ \sum f\left(  x_{j} \right)  =1

Häufigkeitsdichte

Liegen klassierte Daten vor, lassen sich die Häufigkeitsdichten errechnen. Ihre Ermittlung ist vor allem dann von Bedeutung, wenn ein Merkmal mit unterschiedlichen Klassenbreiten gruppiert wurde.

Die Häufigkeitsdichte einer Klasse ergibt sich, indem die absolute bzw. relative Häufigkeit einer Klasse ins Verhältnis zur Klassenbreite dieser Klasse gesetzt wird.


 \mbox{Für} \ x_{j}^{u}\leq X < x_{j}^{o} \ \mbox{gilt:}


 \widehat{h}\left(  x_{j}\right) = \frac{h\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}} \quad \mbox{sowie} \quad \widehat{f}\left(  x_{j}\right) = \frac{f\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}}

Häufigkeitsverteilung oder (empirische) Verteilung

Die geordneten Merkmalsausprägungen und die Angabe der dazugehörigen absoluten bzw. relativen Häufigkeiten ergeben die Häufigkeitsverteilung oder (empirische) Verteilung des untersuchten Merkmals.

Dieses Merkmal wird mit  \ X \ symbolisiert und an  \ n \ statistischen Einheiten beobachtet.

Ist nur ein einziges Merkmal Gegenstand der Untersuchung wird von einer eindimensionalen Häufigkeitsverteilung gesprochen. Betrachtet man die gemeinsame Verteilung von zwei bzw. mehreren Merkmalen spricht man von einer zweidimensionalen bzw. mehrdimensionalen Häufigkeitsverteilung.

Parameter

Parameter sind repräsentative Maßzahlen, die wichtige Charakteristika einer Häufigkeitsverteilung bzw. einer Wahrscheinlichkeitsverteilung in komprimierter Form zum Ausdruck bringen.

Für Parameter eindimensionaler Häufigkeitsverteilungen, siehe: Parameter eindimensionaler Verteilungen (empirisch).

Für den zweidimensionalen Fall, siehe: Parameter zweidimensionaler Verteilungen (empirisch).

Für Parameter einer Zufallsvariablen, siehe: Parameter eindimensionaler Verteilungen (stochastisch)

Für zwei Zufallsvariablen, siehe: Parameter zweidimensionaler Verteilungen (stochastisch).

Beispiele

Familienstand (absolute und relative Häufigkeit)

Von 150 Personen, die nach ihrem Familienstand befragt wurden, waren 41 ledig, 88 verheiratet, 21 geschieden und niemand verwitwet.

Untersuchungsgegenstand ist das Merkmal "Familienstand  \ (X) \ " mit den möglichen Merkmalsausprägungen:

  •  x_{1}  = \mbox{ledig}
  •  x_{2}  = \mbox{verheiratet}
  •  x_{3}  = \mbox{geschieden} \
  • x_{4} = \mbox{verwitwet}

Die Anzahl der untersuchten statistischen Einheiten beträgt  n=150 .

Die absoluten Häufigkeiten lassen sich direkt aus den obigen Angaben entnehmen:

  •  h\left(  x_{1}\right)  = 41
  •  h\left(  x_{2}\right)  = 88
  •  h\left(  x_{3}\right)  = 21
  •  h\left(  x_{4}\right)  = 0

Die relativen Häufigkeiten lassen sich errechnen, indem die absoluten Häufigkeiten zu der Gesamtzahl (oder Gesamtanzahl) der befragten Personen ins Verhältnis gesetzt werden:

 f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n}

  •  f\left(  x_{1}\right)  = 41/150=0,27
  •  f\left(  x_{2}\right)  = 88/150=0,59
  •  f\left(  x_{3}\right)  = 21/150=0,14
  •  f\left(  x_{4}\right)  = 0/150=0,00


Von den 150 befragten Personen sind demnach 27% ledig, 59% verheiratet, 14% geschieden und 0% verwitwet.