Merkmalsausprägung: Unterschied zwischen den Versionen
Aus MM*Stat
(Die Seite wurde neu angelegt: „{{Mmstat3:Statistik I&II/Univariate Statistik|NaviExt}}{{Weblinks|de=Statistische_Variable Statistische Variable|isi=3179.htm Variable|ilmes=v6.htm Variable}}…“) |
K (1 Version importiert) |
(kein Unterschied)
|
Aktuelle Version vom 25. Mai 2018, 11:44 Uhr
Vorlage:Mmstat3:Statistik I&II/Univariate Statistik
Weblinks
|
---|
Grundbegriffe
(Statistisches) Merkmal oder (statistische) Variable
Als (statistisches) Merkmal oder (statistische) Variable wird eine Eigenschaft einer statistischen Einheit bezeichnet. Die Merkmale werden als lateinische Großbuchstaben dargestellt.
Merkmalsausprägung oder Merkmalswert
Als Merkmalsausprägungen oder Merkmalswerte bezeichnet man die konkrete Erscheinungsform (Kategorie, Zahl), die das Merkmal bei einer statistischen Einheit durch Beobachtung oder Messung annimmt. Die Merkmalsausprägungen werden als lateinische Kleinbuchstaben bzw. mit der Anzahl der Merkmalsausprägungen dargestellt.
Merkmal | Merkmalsausprägung |
Ausreißer
Eine Beobachtung wird als Ausreißer bezeichnet, wenn dessen Beobachtungswert extreme Werte abseits der Erwartungen innerhalb einer Reihe von statistischen Beobachtungen annimmt.
Daten oder Datensatz
Der Datensatz (kurz: Daten) ist die Gesamtheit einer oder mehrerer Reihen von statistischen Beobachtungen.
Urliste
Als Urliste bezeichnet man das direkte Ergebnis einer Datenerhebung, also den Datensatz noch vor jeglicher Manipulation (z.B. Klassierung).
Identifikationsmerkmal
Identifikationsmerkmale dienen der Abgrenzung der statistischen Gesamtheit und sind für alle statistischen Einheiten der untersuchten Gesamtheit auf eine Merkmalsausprägung bzw. auf einen Bereich von Merkmalsausprägungen festgelegt.
Beispiel: Wenn eine statistische Untersuchung nur auf die weiblichen Personen abzielt, dann ist das Merkmal Geschlecht ein Identifikationsmerkmal und auf die Merkmalsausprägung weiblich festgelegt.
Erhebungsmerkmal
Erhebungsmerkmale sind die bei einer statistischen Analyse interessierenden Merkmale. Sie werden an allen statistischen Einheiten beobachtet.
Zielt eine statistische Untersuchung auf die Altersstruktur eines bestimmten Personenkreises ab, dann ist Alter ein Erhebungsmerkmal. Die verschiedenen Merkmalswerte werden durch das jeweilige Alter der befragten Personen festgelegt.
Im Unterschied zu den Identifikationsmerkmalen variieren die Erhebungsmerkmale in ihren Merkmalsausprägungen. Eine Merkmal kann zugleich Identifikationsmerkmal und Erhebungsmerkmal sein.
Beispiel: Sollen bei einer statistischen Untersuchung nur Studierende der Bachelorstudiengänge BWL, VWL und Wirtschaftspädagogik einbezogen werden, dann ist das Merkmal Studiengang ein sachliches Identifikationsmerkmal. Gleichzeitig kann der Studiengang auch Erhebungsmerkmal sein.
Diskretes Merkmal
Ein metrisch skaliertes Merkmal heisst diskret, wenn es nur endlich oder abzählbar unendlich viele Werte annehmen kann.
Beispiel: Anzahl der monatlich produzierten PKW.
Stetiges Merkmal
Ein metrisch skaliertes Merkmal heisst stetig, wenn es in jedem beliebig kleinen Intervall nicht mehr abzählbar unendlich viele Werte annehmen kann.
Beispiel: verkaufte Menge von bleifreiem Benzin an einer Tankstelle pro Tag.
Bei statistischen Untersuchungen in der Praxis können auch stetige Merkmale oft nur diskret beobachtet werden, da Messverfahren nicht beliebig genau sind. Das Lebensalter ist z.B. ein stetiges Merkmal, das (rein theoretisch) auf die Millisekunde oder noch genauer angegeben werden kann. In der Praxis wird jedoch das Alter in ganzen Jahren verwendet.
Quasi-stetiges Merkmal
Gleichermaßen kann ein diskretes Merkmal in einem gegebenen Intervall eine sehr große Anzahl von Merkmalswerten annehmen, so dass man es für weitere statistische Analysen zweckmässigerweise als ein quasi-stetiges Merkmal behandelt.
Dichotomes oder binäres Merkmal
Weist ein Merkmal nur zwei sich gegenseitig ausschließende (disjunkte) Ausprägungen auf, handelt es sich um ein dichotomes oder binäres Merkmal.
Beispiel: Geschlecht kodiert als männlich = 0 und weiblich = 1.
Häufbares Merkmal
Können an der selben statistischen Einheit mehrere Ausprägungen eines Merkmals beobachtet werden, handelt es sich um ein häufbares Merkmal.
Beispiel: "Erlernter Beruf" ist ein nominalskaliertes und häufbares Merkmal. Eine Person kann mehrere Ausprägung dieses Merkmals aufweisen, z.B. Koch und Industriekaufmann. Dagegen ist das Merkmal "gegenwärtig ausgeübter Hauptberuf" ein nicht-häufbares Merkmal, da eine Person nur einen Hauptberuf ausüben kann.
Qualitatives vs. quantitatives Merkmal
Variable | Erhebungsmerkmale | mögliche Merkmalsausprägungen |
Alter | ||
Geschlecht | {männlich, weiblich} | |
Familienstand | {ledig, verheiratet, geschieden} | |
monatliches Einkommen |
Wie die nebenstehende Tabelle zeigt, können Merkmalsausprägungen sehr unterschiedlich sein. Die Ausprägungen der Merkmale sind nicht immer Zahlen (wie z.B. bei den Merkmalen Alter, Einkommen) - sie können auch Zustände darstellen (wie z.B. bei Geschlecht, Familienstand).
Eine Möglichkeit der Klassifizierung ist die Unterscheidung in quantitative (Alter, Einkommen) und qualitative (Geschlecht, Familienstand) Merkmale.
Beispiele
Sozioökonomische Struktur (Identifikations- und Erhebungsmerkmal)
Durch eine statistische Untersuchung sollen Aussagen über die sozioökonomische Struktur der Bevölkerung von Berlin per 31.12.1995 getroffen werden.
Die folgenden Tabellen geben die hierfür verwendeten Identifikations- und Erhebungsmerkmale an:
Identifikationsmerkmale | |
Befragter (sachlich) | Bürger |
Wohnort (örtlich) | Berlin |
Stichtag (zeitlich) | 31.12.1995 |
einzelne statistische Einheit | jeder Bürger von Berlin per 31.12.1995 |
Grundgesamtheit | Bevölkerung von Berlin per 31.12.1995 |
Merkmal | Erhebungsmerkmale | mögliche Merkmalsausprägungen |
Alter | ||
Geschlecht | {männlich, weiblich} | |
Familienstand | {ledig, verheiratet, geschieden} | |
monatliches Einkommen |