Häufigkeitsverteilung: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
 
(Die Seite wurde neu angelegt: „{{Begriffsklärungshinweis|Dieser Artikel behandelt '''statistische Häufigkeiten''' im Allgemeinen. Die im Folgenden erklärten Begrifflichkeiten bilden die G…“)
Zeile 1: Zeile 1:
#REDIRECT [[Statistische Häufigkeiten#Häufigkeitsverteilung oder (empirische) Verteilung]]
+
{{Begriffsklärungshinweis|Dieser Artikel behandelt '''statistische Häufigkeiten''' im Allgemeinen. Die im Folgenden erklärten Begrifflichkeiten bilden die Grundlage zum Verständnis von [[Eindimensionale Häufigkeitsverteilung|eindimensionalen Häufigkeitsverteilungen]] sowie [[Zweidimensionale Häufigkeitsverteilung|zweidimensionalen Häufigkeitsverteilungen]].}}
 +
{{Mmstat3:Statistik I&II/Grundbegriffe der Statistik|NaviExt}}
  
[[Kategorie:Statistik I&II]]
+
=={{Vorlage:Überschrift}}==
 +
 
 +
===Statistische Häufigkeit===
 +
 
 +
Bei [[Statistische Reihen|statistischen Reihen]] treten [[Merkmalsausprägung]]en oft mehrfach auf (Häufung) - z.B. mehrfach die Altersangabe 25 Jahre.
 +
 
 +
In einem solchen Fall werden in der Regel nur noch die verschieden aufgetretenen [[Merkmalsausprägung]]en bzw. die [[Klasse|Merkmalsklassen]]
 +
aufgeführt und um eine Angabe ergänzt, wie oft die [[Merkmalsausprägung]] bzw. ein [[Merkmalswert]] aus der [[Klasse|Merkmalsklasse]] aufgetreten ist.
 +
 
 +
Als ''statistische Häufigkeit'' wird in der [[Statistik]] die Besetzungszahl einer [[Merkmalsausprägung]] oder einer [[Klasse|Merkmalsklasse]] bezeichnet.
 +
 
 +
=== Absolute Häufigkeit ===
 +
 
 +
Die Anzahl der [[Statistische Einheit|statistischen Einheiten]] mit einer bestimmten [[Merkmalsausprägung]] <math>x_{j}</math> wird als
 +
''absolute Häufigkeit'' bezeichnet und wie folgt symbolisiert:
 +
 
 +
<math>h\left(  X=x_{j} \right)  = h \left(  x_{j} \right)  = h_{j}</math>
 +
 
 +
=== Relative Häufigkeit ===
 +
 
 +
Der Anteil der [[Absolute Häufigkeit|absoluten Häufigkeit]] einer [[Merkmalsausprägung]] bzw. einer [[Klasse|Merkmalsklasse]] am Umfang der untersuchten [[Grundgesamtheit|Gesamtheit]] bzw. der [[Stichprobenerhebung|Stichprobe]], wird als ''relative Häufigkeit'' <math> \ f\left(  x_{j} \right) \ </math> bezeichnet:
 +
 
 +
<math> f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n} \quad \mbox{mit} \quad 0\leq f\left( x_{j}\right)\leq 1 \ \mbox{und} \ \sum f\left( x_{j}\right) =1</math>
 +
 
 +
===Klassenhäufigkeit===
 +
 
 +
Bei ''Klassenhäufigkeiten'' unterscheidet man zwischen [[Absolute Klassenhäufigkeit|absoluter]] und [[relative Klassenhäufigkeit|relativer Klassenhäufigkeit]].
 +
 
 +
===Absolute Klassenhäufigkeit===
 +
 
 +
Die Anzahl der [[Statistische Einheit|statistischen Einheiten]] mit [[Merkmalsausprägung]]en einer bestimmten [[Klasse]] wird als
 +
''absolute Klassenhäufigkeit'' bezeichnet.
 +
 
 +
<math> h\left( x_{j} \right)  = h (  x_{j}^{u}\leq X < x_{j}^{o}) \quad \mbox{mit} \quad 0\leq h\left(  x_{j}\right) \leq n \ \mbox{und} \ \sum h\left(  x_{j} \right)  =n</math>
 +
 
 +
===Relative Klassenhäufigkeit===
 +
 
 +
Als ''relative Klassenhäufigkeit'' bezeichnet man die Anzahl der [[Statistische Einheit|statistischen Einheiten]] mit [[Merkmalsausprägung]]en einer bestimmten [[Klasse]] dividiert durch die Anzahl der [[Beobachtung]]en <math>n</math>.
 +
 
 +
<math> f\left( x_{j} \right)  = f (  x_{j}^{u}\leq X < x_{j}^{o}) = \cfrac{h (  x_{j}^{u}\leq X < x_{j}^{o})}{n} \quad \mbox{mit} \quad 0\leq f\left(  x_{j}\right) \leq 1 \ \mbox{und} \ \sum f\left(  x_{j} \right)  =1</math>
 +
 
 +
=== Häufigkeitsdichte ===
 +
 
 +
Liegen [[Klassierung|klassierte]] Daten vor, lassen sich die ''Häufigkeitsdichten'' errechnen. Ihre Ermittlung ist vor allem
 +
dann von Bedeutung, wenn ein [[Merkmal]] mit unterschiedlichen [[Klassenbreite]]n [[Gruppierung|gruppiert]] wurde.
 +
 
 +
Die Häufigkeitsdichte einer [[Klasse]] ergibt sich, indem die [[Absolute Häufigkeit|absolute]] bzw. [[relative Häufigkeit]] einer [[Klasse]] ins Verhältnis zur [[Klassenbreite]] dieser [[Klasse]] gesetzt wird.
 +
 
 +
 
 +
<math> \mbox{Für} \ x_{j}^{u}\leq X < x_{j}^{o} \ \mbox{gilt:} </math>
 +
 
 +
 
 +
<math> \widehat{h}\left(  x_{j}\right) = \frac{h\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}} \quad \mbox{sowie} \quad \widehat{f}\left(  x_{j}\right) = \frac{f\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}}</math>
 +
 
 +
===Häufigkeitsverteilung oder (empirische) Verteilung===
 +
 
 +
Die geordneten [[Merkmalsausprägung]]en und die Angabe der dazugehörigen [[absolute Häufigkeit|absoluten]] bzw. [[relative Häufigkeit|relativen Häufigkeiten]]  ergeben die ''Häufigkeitsverteilung'' oder ''(empirische) Verteilung'' des untersuchten [[Merkmal]]s.
 +
 
 +
Dieses [[Merkmal]] wird mit <math> \ X \ </math> symbolisiert und an <math> \ n \ </math> [[Statistische Einheit|statistischen Einheiten]] beobachtet.
 +
 
 +
Ist nur ein einziges [[Merkmal]] Gegenstand der [[Statistische Untersuchung|Untersuchung]] wird von einer [[Eindimensionale Häufigkeitsverteilung|eindimensionalen Häufigkeitsverteilung]] gesprochen. Betrachtet man die gemeinsame Verteilung von zwei bzw. mehreren [[Merkmal]]en spricht man von einer [[Zweidimensionale Häufigkeitsverteilung|zweidimensionalen]] bzw. mehrdimensionalen Häufigkeitsverteilung.
 +
 
 +
===Parameter===
 +
 
 +
''Parameter'' sind repräsentative Maßzahlen, die wichtige Charakteristika einer [[Häufigkeitsverteilung]] bzw. einer [[Wahrscheinlichkeitsverteilung]] in komprimierter Form zum Ausdruck bringen.
 +
 
 +
Für Parameter [[Eindimensionale Häufigkeitsverteilung|eindimensionaler Häufigkeitsverteilungen]], siehe: [[Parameter eindimensionaler Verteilungen (empirisch)]].
 +
 
 +
Für den zweidimensionalen Fall, siehe: [[Parameter zweidimensionaler Verteilungen (empirisch)]].
 +
 
 +
Für Parameter einer [[Zufallsvariable]]n, siehe: [[Parameter eindimensionaler Verteilungen (stochastisch)]]
 +
 
 +
Für zwei [[Zufallsvariable]]n, siehe: [[Parameter zweidimensionaler Verteilungen (stochastisch)]].
 +
 
 +
=={{Vorlage:Beispiele}}==
 +
 
 +
===Familienstand (absolute und relative Häufigkeit)===
 +
 
 +
Von 150 Personen, die nach ihrem Familienstand befragt wurden, waren 41 ledig, 88 verheiratet, 21 geschieden und niemand
 +
verwitwet.
 +
 
 +
Untersuchungsgegenstand ist das [[Merkmal]] "Familienstand <math> \ (X) \ </math>" mit den möglichen [[Merkmalsausprägung]]en:
 +
 
 +
* <math> x_{1}  = \mbox{ledig} </math>
 +
* <math> x_{2}  = \mbox{verheiratet} </math>
 +
* <math> x_{3}  = \mbox{geschieden} \ </math>
 +
* <math>x_{4} = \mbox{verwitwet} </math>
 +
 
 +
Die Anzahl der untersuchten [[Statistische Einheit|statistischen Einheiten]] beträgt <math> n=150 </math>.
 +
 
 +
Die [[Absolute Häufigkeit|absoluten Häufigkeiten]] lassen sich direkt aus den obigen Angaben entnehmen:
 +
 
 +
* <math> h\left(  x_{1}\right)  = 41 </math>
 +
* <math> h\left(  x_{2}\right)  = 88 </math>
 +
* <math> h\left(  x_{3}\right)  = 21 </math>
 +
* <math> h\left(  x_{4}\right)  = 0 </math>
 +
 
 +
Die [[Relative Häufigkeit|relativen Häufigkeiten]] lassen sich errechnen, indem die absoluten Häufigkeiten zu der Gesamtzahl (oder Gesamtanzahl) der befragten Personen ins Verhältnis gesetzt werden:
 +
 
 +
<math> f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n} </math>
 +
 
 +
* <math> f\left(  x_{1}\right)  = 41/150=0,27 </math>
 +
* <math> f\left(  x_{2}\right)  = 88/150=0,59 </math>
 +
* <math> f\left(  x_{3}\right)  = 21/150=0,14 </math>
 +
* <math> f\left(  x_{4}\right)  = 0/150=0,00 </math>
 +
 
 +
 
 +
Von den 150 befragten Personen sind demnach ''27%'' ledig, ''59%''
 +
verheiratet, ''14%'' geschieden und ''0%'' verwitwet.

Version vom 14. Mai 2018, 20:59 Uhr

Dieser Artikel behandelt statistische Häufigkeiten im Allgemeinen. Die im Folgenden erklärten Begrifflichkeiten bilden die Grundlage zum Verständnis von eindimensionalen Häufigkeitsverteilungen sowie zweidimensionalen Häufigkeitsverteilungen.

Vorlage:Mmstat3:Statistik I&II/Grundbegriffe der Statistik

Grundbegriffe

Statistische Häufigkeit

Bei statistischen Reihen treten Merkmalsausprägungen oft mehrfach auf (Häufung) - z.B. mehrfach die Altersangabe 25 Jahre.

In einem solchen Fall werden in der Regel nur noch die verschieden aufgetretenen Merkmalsausprägungen bzw. die Merkmalsklassen aufgeführt und um eine Angabe ergänzt, wie oft die Merkmalsausprägung bzw. ein Merkmalswert aus der Merkmalsklasse aufgetreten ist.

Als statistische Häufigkeit wird in der Statistik die Besetzungszahl einer Merkmalsausprägung oder einer Merkmalsklasse bezeichnet.

Absolute Häufigkeit

Die Anzahl der statistischen Einheiten mit einer bestimmten Merkmalsausprägung x_{j} wird als absolute Häufigkeit bezeichnet und wie folgt symbolisiert:

h\left(  X=x_{j} \right)  = h \left(  x_{j} \right)  = h_{j}

Relative Häufigkeit

Der Anteil der absoluten Häufigkeit einer Merkmalsausprägung bzw. einer Merkmalsklasse am Umfang der untersuchten Gesamtheit bzw. der Stichprobe, wird als relative Häufigkeit  \ f\left(  x_{j} \right) \ bezeichnet:

 f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n} \quad \mbox{mit} \quad 0\leq f\left( x_{j}\right)\leq 1 \ \mbox{und} \ \sum f\left( x_{j}\right) =1

Klassenhäufigkeit

Bei Klassenhäufigkeiten unterscheidet man zwischen absoluter und relativer Klassenhäufigkeit.

Absolute Klassenhäufigkeit

Die Anzahl der statistischen Einheiten mit Merkmalsausprägungen einer bestimmten Klasse wird als absolute Klassenhäufigkeit bezeichnet.

 h\left( x_{j} \right)  = h (  x_{j}^{u}\leq X < x_{j}^{o}) \quad \mbox{mit} \quad 0\leq h\left(  x_{j}\right) \leq n \ \mbox{und} \ \sum h\left(  x_{j} \right)  =n

Relative Klassenhäufigkeit

Als relative Klassenhäufigkeit bezeichnet man die Anzahl der statistischen Einheiten mit Merkmalsausprägungen einer bestimmten Klasse dividiert durch die Anzahl der Beobachtungen n.

 f\left( x_{j} \right)  = f (  x_{j}^{u}\leq X < x_{j}^{o}) = \cfrac{h (  x_{j}^{u}\leq X < x_{j}^{o})}{n} \quad \mbox{mit} \quad 0\leq f\left(  x_{j}\right) \leq 1 \ \mbox{und} \ \sum f\left(  x_{j} \right)  =1

Häufigkeitsdichte

Liegen klassierte Daten vor, lassen sich die Häufigkeitsdichten errechnen. Ihre Ermittlung ist vor allem dann von Bedeutung, wenn ein Merkmal mit unterschiedlichen Klassenbreiten gruppiert wurde.

Die Häufigkeitsdichte einer Klasse ergibt sich, indem die absolute bzw. relative Häufigkeit einer Klasse ins Verhältnis zur Klassenbreite dieser Klasse gesetzt wird.


 \mbox{Für} \ x_{j}^{u}\leq X < x_{j}^{o} \ \mbox{gilt:}


 \widehat{h}\left(  x_{j}\right) = \frac{h\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}} \quad \mbox{sowie} \quad \widehat{f}\left(  x_{j}\right) = \frac{f\left(  x_{j}\right)}{x_{j}^{o}-x_{j}^{u}}

Häufigkeitsverteilung oder (empirische) Verteilung

Die geordneten Merkmalsausprägungen und die Angabe der dazugehörigen absoluten bzw. relativen Häufigkeiten ergeben die Häufigkeitsverteilung oder (empirische) Verteilung des untersuchten Merkmals.

Dieses Merkmal wird mit  \ X \ symbolisiert und an  \ n \ statistischen Einheiten beobachtet.

Ist nur ein einziges Merkmal Gegenstand der Untersuchung wird von einer eindimensionalen Häufigkeitsverteilung gesprochen. Betrachtet man die gemeinsame Verteilung von zwei bzw. mehreren Merkmalen spricht man von einer zweidimensionalen bzw. mehrdimensionalen Häufigkeitsverteilung.

Parameter

Parameter sind repräsentative Maßzahlen, die wichtige Charakteristika einer Häufigkeitsverteilung bzw. einer Wahrscheinlichkeitsverteilung in komprimierter Form zum Ausdruck bringen.

Für Parameter eindimensionaler Häufigkeitsverteilungen, siehe: Parameter eindimensionaler Verteilungen (empirisch).

Für den zweidimensionalen Fall, siehe: Parameter zweidimensionaler Verteilungen (empirisch).

Für Parameter einer Zufallsvariablen, siehe: Parameter eindimensionaler Verteilungen (stochastisch)

Für zwei Zufallsvariablen, siehe: Parameter zweidimensionaler Verteilungen (stochastisch).

Beispiele

Familienstand (absolute und relative Häufigkeit)

Von 150 Personen, die nach ihrem Familienstand befragt wurden, waren 41 ledig, 88 verheiratet, 21 geschieden und niemand verwitwet.

Untersuchungsgegenstand ist das Merkmal "Familienstand  \ (X) \ " mit den möglichen Merkmalsausprägungen:

  •  x_{1}  = \mbox{ledig}
  •  x_{2}  = \mbox{verheiratet}
  •  x_{3}  = \mbox{geschieden} \
  • x_{4} = \mbox{verwitwet}

Die Anzahl der untersuchten statistischen Einheiten beträgt  n=150 .

Die absoluten Häufigkeiten lassen sich direkt aus den obigen Angaben entnehmen:

  •  h\left(  x_{1}\right)  = 41
  •  h\left(  x_{2}\right)  = 88
  •  h\left(  x_{3}\right)  = 21
  •  h\left(  x_{4}\right)  = 0

Die relativen Häufigkeiten lassen sich errechnen, indem die absoluten Häufigkeiten zu der Gesamtzahl (oder Gesamtanzahl) der befragten Personen ins Verhältnis gesetzt werden:

 f\left(  x_{j} \right)  = \frac{h \left(  x_{j} \right)  }{n}

  •  f\left(  x_{1}\right)  = 41/150=0,27
  •  f\left(  x_{2}\right)  = 88/150=0,59
  •  f\left(  x_{3}\right)  = 21/150=0,14
  •  f\left(  x_{4}\right)  = 0/150=0,00


Von den 150 befragten Personen sind demnach 27% ledig, 59% verheiratet, 14% geschieden und 0% verwitwet.