Univariate Statistik/Lösungen: Unterschied zwischen den Versionen
Aus MM*Stat
Zeile 1.138: | Zeile 1.138: | ||
|- | |- | ||
|0-1000 | |0-1000 | ||
|align="right"| 0. | |align="right"| 0.167 | ||
|align="right"|0. | |align="right"|0.333 | ||
|align="right"|0. | |align="right"|0.167 | ||
|align="right"|0. | |align="right"|0.167 | ||
|align="right"|0. | |align="right"|0.167 | ||
|align="right"| | |align="right"|1.000 | ||
|- | |- | ||
|1000-1500 | |1000-1500 | ||
|align="right"|0. | |align="right"|0.143 | ||
|align="right"|0. | |align="right"|0.286 | ||
|align="right"|0. | |align="right"|0.286 | ||
|align="right"|0. | |align="right"|0.214 | ||
|align="right"|0. | |align="right"|0.071 | ||
|align="right"| | |align="right"|1.000 | ||
|- | |- | ||
|1500-2000 | |1500-2000 | ||
|align="right"|0. | |align="right"|0.150 | ||
|align="right"|0. | |align="right"|0.300 | ||
|align="right"|0. | |align="right"|0.300 | ||
|align="right"|0. | |align="right"|0.150 | ||
|align="right"|0. | |align="right"|0.100 | ||
|align="right"| | |align="right"|1.000 | ||
|- | |- | ||
|2000-3000 | |2000-3000 | ||
|align="right"|0. | |align="right"|0.100 | ||
|align="right"|0. | |align="right"|0.300 | ||
|align="right"|0. | |align="right"|0.200 | ||
|align="right"|0. | |align="right"|0.200 | ||
|align="right"|0. | |align="right"|0.200 | ||
|align="right"|1.000 | |||
|align="right"|1. | |||
|} | |} | ||
<li><p><math>\overline{x}</math> = 1610 EUR</p></li> | <li> e) <p><math>\overline{x}</math> = 1610 EUR</p></li> | ||
<li><p><math>\overline{y}</math> = 43,4 Jahre</p></li> | <li> f) <p><math>\overline{y}</math> = 43,4 Jahre</p></li> | ||
<li><p><math>x_{D}</math> = 1642,86 EUR</p></li> | <li> g) <p><math>x_{D}</math> = 1642,86 EUR</p></li> | ||
<li><p><math>x_{Z}</math> = 1625 EUR</p></li> | <li> h) <p><math>x_{Z}</math> = 1625 EUR</p></li> | ||
<li><p>1535,71 EUR; 1600 EUR; 1615,38 EUR; 1611,11 EUR; 1708,33 EUR</p></li> | <li> i) <p>1535,71 EUR; 1600 EUR; 1615,38 EUR; 1611,11 EUR; 1708,33 EUR</p></li> | ||
<li><p><math>s_{x}</math> = 591,95 EUR</p></li> | <li> j) <p><math>s_{x}</math> = 591,95 EUR</p></li> | ||
<li><p><math>s_{xy}</math> = 476</p></li></ul> | <li> k) <p><math>s_{xy}</math> = 476</p></li></ul> | ||
===Einwohnerzahlen=== | ===Einwohnerzahlen=== |
Version vom 15. April 2019, 08:14 Uhr
Alter und Preis eines PKWs
Gegeben:
Es ist . Daraus folgt:
Ferner ist: ( und die Kovarianz haben das gleiche Vorzeichen);
Anstieg der Produktion
- = 1,1489
- = 2,0736
Arbeitslose
X: Arbeitslosenquote Verhältnis von Arbeitslosen zu Erwerbspersonen
Möglichkeit 1
Zusätzliche Informationen sind Arbeitslosenzahlen, beziehen sich inhaltlich auf den Zähler des Merkmals X harmonisches Mittel
Die Arbeitslosenquote für das Bundesland beträgt 8,75%.
Möglichkeit 2
Anwendung des arithmetischen Mittels nach vorheriger Berechnung der Informationen für den Nenner des Merkmals X. Diese sind und .
Außentemperatur und Dauer eines Weges
Auswirkung der Regelstudienzeit
: “Semesterzahl”; kardinalskaliert, diskret
und c)
10 20 0,10 0,10 11 20 0,10 0,20 12 80 0,40 0,60 13 40 0,20 0,80 14 30 0,15 0,95 15 10 0,05 1,00 Summe 200 1,00 10 Semester
12 Semester
13 Semester
ordinalskaliert
Säulendiagramm
Nein. Eine Verteilungsfunktion erfordert wegen
eine Ordnungsrelation (“kleiner-gleich”-Beziehung) zwischen den Merkmalsausprägungen. Derartige Vergleichszeichen sind jedoch auf nominalskalierte Merkmale nicht anwendbar, da bei Nominalskalierung keine Anordnung möglich ist.
Benzinverbrauch
Bei Verbrauchsdaten in Liter/100km: .
Der Variationskoeffizient verändert sich durch die Umrechnung auf Gallonen/100 Meilen nicht, da diese Umrechnung sowohl beim arithmetischen Mittel als auch bei der Standardabweichung vorgenommen werden muss.
Berliner Bühnen
- Gesamtheit: Menge der Berliner Bühnen im Jahre
Einheit: die einzelne Bühne (z.B. Deutsche Oper, Deutsches Theater, Komische Oper, Schauspielhaus, Hansa–Theater, Schiller–Theater, Theater am Kurfürstendamm, Volksbühne, Theater des Westens).
- Identifikationsmerkmale:
Ort: festgelegt, Berlin.
Zeit: festgelegt, .
Sachlich: Bühne, festgelegt
- Erhebungsmerkmale:
Bühne (festgelegt) Höhe der Einnahmen, Höhe der Ausgaben (variabel)
- Anzahl der Schauspieler, Anzahl der Besucher pro Jahr, Art der Bühne, Anzahl der Gastspiele usw.
Berliner Luftqualität
: “Stickstoffmonoxydgehalt der Berliner Luft im März ”; kardinalskaliert, stetig
-
19,5 - 29,5 5 0,3333 0,3333 0,03333 29,5 - 34,5 4 0,2667 0,6000 0,05334 34,5 - 39,5 5 0,3333 0,9333 0,06666 39,5 - 44,5 1 0,0667 1,0000 0,01334 Summe 15 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion6 Tage
37,5 mg/m
Statistische Massen
Bestandsmassen: b, c, e, i, j, l, m
Bewegungsmassen: a, d, f, g, h, k
Besuche pro Woche
-
0 7 0,14 0,14 1 11 0,22 0,36 2 5 0,10 0,46 3 7 0,14 0,60 4 7 0,14 0,74 5 4 0,08 0,82 6 5 0,10 0,92 7 3 0,06 0,98 9 1 0,02 1,00 50 1,00 = 3 Besuche
Bevölkerungsdichte und Ärztedichte
Bevölkerungsdichte: = 150 Einwohner/km
Ärztedichte: = 1 Arzt/1000 Einwohner
Bibliotheken - Teil III
= 10,4775 Std./Wo.; = 15,2382 Std./Wo.
= 0,1612; = 0,312
Bibliotheken - Teil II
- = 62,998 Std./Wo.; = 63,998 Std./Wo.; = 64,959 Std./Wo.
- = 44,166 Std./Wo.; = 46,3165 Std./Wo.; = 48,831 Std./Wo.
- nein, da keine unimodale Häufigkeitsverteilung vorliegt
- = 2,0502 Mill.EUR/Jahr; = 3,353 Mill.EUR/Jahr; = 4,346 Mill.EUR/Jahr;
= 0,85 Mill.EUR/Jahr; = 6,56 Mill.EUR/Jahr
Bibliotheken - Teil I
alle Merkmale sind kardinalskaliert
Öffnungszeiten und Ausleihzeiten: stetig
Etat für Neuerwerb: quasi-stetig
Planstellen: diskret
: “Öffnungszeiten”
Öffnungszeiten 40 – 50 2 0,0323 0,0323 0,00323 50 – 60 19 0,3065 0,3388 0,03065 60 – 70 25 0,4032 0,7420 0,04032 70 – 80 11 0,1774 0,9194 0,01774 80 – 90 4 0,0645 0,9839 0,00645 90 – 115 1 0,0161 1,0000 0,00064 Summe 62 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion: “Ausleihzeiten”
Ausleihzeiten 25 – 30 5 0,0806 0,0806 0,01612 30 – 40 14 0,2258 0,3064 0,02258 40 – 50 19 0,3065 0,6129 0,03065 50 – 60 12 0,1935 0,8064 0,01935 60 – 70 6 0,0968 0,9032 0,00968 70 – 80 3 0,0484 0,9516 0,00484 80 – 100 3 0,0484 1,0000 0,00242 Summe 62 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion: “Etat für Neuerwerb”
Etat für Neuerwerb 0 – 1 1 0,0161 0,0161 0,0161 1 – 2 14 0,2258 0,2419 0,2258 2 – 3 10 0,1613 0,4032 0,1613 3 – 4 17 0,2742 0,6774 0,2742 4 – 5 13 0,2097 0,8871 0,2097 5 – 6 6 0,0968 0,9839 0,0968 6 – 7 1 0,0161 1,0000 0,0161 Summe 62 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion: “Planstellen”
Planstellen 30 – 70 6 0,0968 0,0968 0,00242 70 – 80 12 0,1935 0,2903 0,01935 80 – 100 10 0,1613 0,4516 0,00807 100 – 150 19 0,3065 0,7581 0,00613 150 – 200 12 0,1935 0,9516 0,00387 200 – 270 3 0,0484 1,0000 0,00069 Summe 62 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion0,7872
0,1452
0,3064
0,5484
77 Planstellen
76,088 Std./Wo.
Brutto- und Nettoeinkommen
Bruttoeinkommen/Beschäftigten und Monat: = 1,0352
Nettoeinkommen/Beschäftigten und Monat: = 1,0279
Buttersorten
Spearman’scher Rangkorrelationskoeffizient:
Cafeteria
Frauen | Männer | ||
---|---|---|---|
Mensa | |||
Cafeteria | |||
Unabhängigkeit:
CDs
- = 4,27 EUR/CD
- = 0,1519; = 0,39 EUR/CD
Das erste Tor
Klassierte Häufigkeitsverteilung
Klasse | ||||
---|---|---|---|---|
0 – 15 | 9 | 9 | 0,36 | 0,36 |
15 – 30 | 5 | 14 | 0,20 | 0,56 |
30 – 45 | 9 | 23 | 0,36 | 0,92 |
45 – 90 | 2 | 25 | 0,08 | 1,00 |
?
(Interpolation)
Ladekabel
= 15,52 EUR/Ladekabel
Diskret vs. stetig
Von den kardinalskalierten Merkmalen sind
diskret: 4, 16, 29, 30, 46, 47
quasi–stetig: 12, 14, 24, 26, 32
stetig: 2, 3, 8, 9, 18, 21, 25, 33, 35, 45
Drei Betriebe
- = 740 EUR Materialverbrauch/1000EUR Produktion
- Materialverbrauch pro 1000EUR Produktion, kardinalskaliert
- i = 0,97; = 112 908 000 EUR Materialverbrauch
Drei Stichproben
gepoolter Datensatz
Eine Befragung von Studierenden - Teil II
- = BWL, da BWL die höchste absolute Häufigkeit beinhaltet. Der Modus ist ein geeigneter Lageparameter, da es sich um nominalskalierte Variablenausprägungen handelt, die lediglich eine Verschiedenartigkeit zum Ausdruck bringen.
- Die drei geeigneten Lageparameter entsprechen hier dem Modus, dem Median und dem Arithmetischen Mittel.
- Der Modus = 1, da die Ausprägung eins die höchste absolute Häufigkeit besitzt.
- Der Median = 1, da eins ungerade ist und daher die Formel
für den Median gilt.
- Das Arithmetische Mittel = 1, da sich mit der Formel
- Das durchschnittliche Einkommen eines/einer Studierenden ergibt sich durch Berechnen des Arithmetischen Mittels wie folgt:
- Als aussagekräftige Lageparameter werden das Arithmetische Mittel und der Median berechnet.
- Der Median berechnet sich für klassierte Daten mit der folgenden Formel:
- Das Arithmetische Mittel wird hier für klassierte Daten mit der folgenden Formel berechnet, wobei die Klassenmitte und die Anzahl der Beobachtungen in Klasse j angibt: Für die Berechnung der Quantile von klassierten Daten wird folgende Formel verwendet:
- Die Quartile werden somit wie folgt für klassierte Daten berechnet:
- Das 90%-Quantil ergibt somit:
- Minimum und Maximum sind hier wie folgt:
- Das Minimum ist hier = 616, da es die kleinste Merkmalsausprägung des Merkmals Einkommen ist
- Das Maximum entspricht = 1440, da es demgegenüber die größte Ausprägung des Merkmals Einkommen ist
Die Quantile ergeben sich wie folgt:
- = 660, da keine ganze Zahl ist, sondern hier woraufhin die Ausprägung an der auf folgenden Zahlenstelle gilt, das heißt 660 ist die Ausprägung an der siebten Stelle.
- mit 700 ist das Ergebnis und steht als Ausprägung an dreizehnter Stelle
- = 850 mit Das entspricht der Ausprägung an neunzehnter Stelle
Eine Befragung von Studierenden - Teil I
Grundgesamtheit: Die Menge aller Studierenden der deutschen Hochschule im Juni
Stichprobe: Die Menge der 25 befragten Studierenden der deutschen Hochschule im Juni
Statistische Einheiten: Studierende der deutschen Hochschule im Juni
Identifikationskriterien:
örtlich: Deutschland
zeitlich: Juni
sachlich: immatrikulierte Person an der Hochschule
: “Studiengang”; nominalskaliert
Studiengang VWL 5 0,2 BWL 10 0,4 Polit.Wiss. 5 0,2 Sozialwiss. 5 0,2 Summe 25 1,0 Graphische Darstellung als Säulendiagramm, Kreisdiagramm oder Flächendiagramm. Siehe dazu Folien in der Vorlesung “Deskriptive Statistik”, beispielsweise:
Grafische Darstellung der Häufigkeit II
: “Anzahl der Geschwister”; kardinalskaliert, diskret
Anzahl der Geschwister 0 8 0,32 0,32 1 11 0,44 0,76 2 4 0,16 0,92 3 2 0,08 1,00 Summe 25 1,00 Graphische Darstellung der Häufigkeitsverteilung als Stabdiagramm, der empirischen Verteilungsfunktion als Treppenfunktion
23 Studierende haben höchstens 2 Geschwister.
Viermal 2 Geschwister zweimal 3 Geschwister 6 Personen mit mindestens 2 Geschwistern, d.h.
haben mindestens zwei Geschwister.
haben ein oder zwei Geschwister.: “Einkommen”; kardinalskaliert (metrisch), quasi-stetig
Einkommen 600 – 650 6 0,24 0,24 0,0048 650 – 700 6 0,24 0,48 0,0048 700 – 900 8 0,32 0,80 0,0016 900 – 1200 2 0,08 0,88 0,0003 1200 – 1450 3 0,12 1,00 0,0005 Summe 25 1,00 Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion
Einkommen der Beamten
Gegeben:
; ; ; ; ; ;
Gesucht:
Einkommensgleichheit
Atoll A | ||||
Person | Einkommen | |||
(in Kauri Schnecken) | ||||
1 | 225 | 50625 | ||
2 | 185 | 34225 | ||
3 | 250 | 62500 | ||
4 | 150 | 22500 | ||
5 | 237 | 56169 | ||
6 | 100 | 10000 | ||
7 | 87 | 7569 | ||
8 | 305 | 93025 | ||
1539 | 336613 |
Einkommen und Alter
a) und b)
Einkommen Alter RV X 20-30 30-40 40-50 50-60 60-70 0-1000 0.02 0.04 0.02 0.02 0.02 0.12 1000-1500 0.04 0.08 0.08 0.06 0.02 0.28 1500-2000 0.06 0.12 0.12 0.06 0.04 0.40 2000-3000 0.02 0.06 0.04 0.04 0.04 0.20 RV Y 0.14 0.30 0.26 0.18 0.12 1.00 - c)
- d)
- e)
= 1610 EUR
- f)
= 43,4 Jahre
- g)
= 1642,86 EUR
- h)
= 1625 EUR
- i)
1535,71 EUR; 1600 EUR; 1615,38 EUR; 1611,11 EUR; 1708,33 EUR
- j)
= 591,95 EUR
- k)
= 476
Einkommen | Alter | ||||
---|---|---|---|---|---|
20-30 | 30-40 | 40-50 | 50-60 | 60-70 | |
0-1000 | 0.143 | 0.133 | 0.077 | 0.111 | 0.0167 |
1000-1500 | 0.286 | 0.267 | 0.308 | 0.333 | 0.167 |
1500-2000 | 0.429 | 0.400 | 0.462 | 0.333 | 0.167 |
2000-3000 | 0.143 | 0.200 | 0.154 | 0.222 | 0.333 |
1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
Einkommen | Alter | RV X | ||||
---|---|---|---|---|---|---|
20-30 | 30-40 | 40-50 | 50-60 | 60-70 | ||
0-1000 | 0.167 | 0.333 | 0.167 | 0.167 | 0.167 | 1.000 |
1000-1500 | 0.143 | 0.286 | 0.286 | 0.214 | 0.071 | 1.000 |
1500-2000 | 0.150 | 0.300 | 0.300 | 0.150 | 0.100 | 1.000 |
2000-3000 | 0.100 | 0.300 | 0.200 | 0.200 | 0.200 | 1.000 |
Einwohnerzahlen
Da wir zwei große Ausreißer in den Daten haben (China und Indien) muss der Median verwendet werden:
Eiskugelkonsum
: “Eiskonsum in Kugeln”; kardinalskaliert, diskret
- {| !align="right"| !align="right"| !align="right"| !align="right"| |- |align="right"| 1 |align="right"| 40 |align="right"| 0,20 |align="right"| 0,20 |- |align="right"| 3 |align="right"| 50 |align="right"| 0,25 |align="right"| 0,45 |- |align="right"| 4 |align="right"| 70 |align="right"| 0,35 |align="right"| 0,80 |- |align="right"| 5 |align="right"| 10 |align="right"| 0,05 |align="right"| 0,85 |- |align="right"| 6 |align="right"| 30 |align="right"| 0,15 |align="right"| 1,00 |- |align="right"| Summe |align="right"| 200 |align="right"| 1,00 |align="right"| |}
Häufigkeitsverteilung: Stabdiagramm
empirische Verteilungsfunktion: Treppenfunktion3 Kugeln
4 Kugeln
Erdbeerplantage - Teil II
- = 4,65 Std./Tag
- = 4,5 Std./Tag
Erdbeerplantage - Teil I
: “Anzahl der Sonnenstunden pro Tag in dieser Saison”; kardinalskaliert, stetig klassiert
- {|
!align="right"|
!align="right"|
!align="right"|
!align="right"|
!align="right"|
!align="right"|
|-
|align="right"| 0 - 2
|align="right"| 20
|align="right"| 0,20
|align="right"| 0,20
|align="right"| 0,10
|align="right"|
|-
|align="right"| 2 - 3
|align="right"| 15
|align="right"| 0,15
|align="right"| 0,35
|align="right"| 0,15
|align="right"|
|-
|align="right"| 3 - 5
|align="right"| 20
|align="right"| 0,20
|align="right"| 0,55
|align="right"| 0,10
|align="right"|
|-
|align="right"| 5 - 8
|align="right"| 35
|align="right"| 0,35
|align="right"| 0,90
|align="right"| 0,12
|align="right"|
|-
|align="right"| 8 - 12
|align="right"| 10
|align="right"| 0,10
|align="right"| 1,00
|align="right"| 0,03
|align="right"|
|-
|align="right"| Summe
|align="right"| 100
|align="right"| 1,0000
|align="right"|
|align="right"|
|align="right"|
|}
Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion
an 55 Tagen
3,5 Std./Tag
47,5 %
Familienstand
Grundgesamtheit:
Menge der Studierenden des Fachbereiches Wirtschaftswissenschaften der Humboldt-Universität zu Berlin im Sommersemester 2012.
Identifikationskriterien:
örtlich – HUB
zeitlich – Sommersemester
sachlich - Studierende, Wirtschaftswissenschaften
statistische Einheit:
Studierender des Fachbereiches Wirtschaftswissenschaften
der Humboldt-Universität zu Berlin im Sommersemester .
untersuchtes statistisches Merkmal:
Familienstand.
Merkmalsausprägungen:
ledig, verheiratet, geschieden, verwitwet
Festgeldkonten
Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land berechnet werden. Hierzu wird jeweils die Klasse bestimmt, in welcher der Median liegt. Bezeichnet die untere Klassengrenze, so ist für klassierte Daten Ermittlung der länderspezifischen variablen Zinssätze mit :
Land 1:
Land 2:
Land 3:
Land 4:
Land 5:
Damit folgt für den durchschnittlichen variablen Zinssatz der Bank:
Fließband
Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind.
Führerschein–Entziehungen
- = 35,65 Jahre 36 Jahre
- = 10,39 Jahre; = 0,2914
- = 26,44 Jahre; = 43,868 Jahre; = 17,428 Jahre
- = 34 Jahre
- = 8,6 Jahre
Gartenzwerg–Großhandel
- ** : “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
- Das Merkmal wurde an den einzelnen Aufträgen erhoben
- Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet:
- = a + b ; = 0 + 1,560 000 = 90 000 EUR/Auftrag
- **
- Arithmetisches Mittel nicht sinnvoll, da Ausreißer vorkommt
- Der Modus nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
- Sinnvoll ist hier der Median mit dem Ergebnis = 12 000 EUR/Auftrag. Da n ungerade ist gilt:
- Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt:
Gefahrene Strecke
Gesucht ist der Quartilsabstand:
Gleisbaubetrieb
Berechnet wurde das einfache arithmetische Mittel. Dies ist jedoch falsch, da das statistische Merkmal Bauzeit/Gleis eine Verhältniszahl ist und die gegebenen Zusatzinformationen über die Bauzeit jedes Bauzuges (8 Stunden) sich inhaltlich auf den Zähler der Verhältniszahl beziehen (In dieser Zusatzinformation steckt die unterschiedliche Anzahl von Gleisen, die von jedem Bauzug in dieser Schicht verlegt wurden und die bei der Berechnung des einfachen arithmetischen Mittels nicht berücksichtigt wurden). Es ist deshalb das einfache harmonische Mittel anzuwenden: = 166,67 Minuten/Gleis.
Glücksspielautomaten
GM
X – Wert der Aktie
– Kurs der Aktie – Wechselkurs
Dann istzu bestimmen. Da die Kovarianz Null ist, folgt aus der Kovarianzzerlegung
dass der obige Wert dem Produkt der Mittelwerte von und entspricht. Mit den marginalen Häufigkeiten berechnet man:
Randverteilung von :
Randverteilung von :
EUR/$ $
damit resultiert der durchschnittliche Wert der GM-Aktie zu EUR.
Grafische Darstellung
Die beiden Balkendiagramme scheiden aus, da die Variable metrisch stetig ist. Da die Daten klassiert mit unterschiedlicher Klassenbreite vorliegen, muss auf der Ordinatenachse die Häufigkeitsdichte abgetragen werden. Damit scheiden die Histogramme aus, bei denen auf der Ordinatenachse die relativen Häufigkeiten abgetragen wurden.
Alter | unter 15 | 15-18 | 18-25 | 25-65 | 65-90 | |
---|---|---|---|---|---|---|
Anzahl | ||||||
der Getöteten | 126 | 76 | 258 | 808 | 638 | 1906 |
rel. Häufigkeit | 0,06611 | 0,03987 | 0,13536 | 0,42392 | 0,33473 | |
Häufigkeitsdichte | 0,00472 | 0,01329 | 0,01934 | 0,01060 | 0,01339 |
Aufgrund dieser Häufigkeitsdichten gibt das Histogramm D die Daten korrekt wieder.
Häufbare Variablen
Von den nominalskalierten Merkmalen sind häufbar:
10, 15, 28, 31, 34, 37, 38, 44
Histogramm
Klassen | H.-dichte | |||||
---|---|---|---|---|---|---|
1 | 0 – 2 | 0,05 | 0,1 | = | 0,1 | |
2 | 2 – 6 | 0,10 | 0,4 | = | 0,5 | |
3 | 6 – 12 | 0,05 | 0,3 | = | 0,8 | |
4 | 12 – 20 | 0,025 | 0,2 | = | 1,0 | |
1,0 |
55 Gemeinden dieses Landkreises haben eine Einwohnerzahl von mindestens 5000 und höchstens 16000.
Intercity – Zug
= 112,5 km/h
Internetstunden
Berechnung von :
Internetstunden | |||
von …bis unter … | |||
0 – 4 | 0,05 | 0,20 | 0,20 |
4 – 8 | 0,06 | 0,24 | 0,44 |
8 – 12 | 0,09 | 0,36 | 0,80 |
12 – 16 | 0,03 | 0,12 | 0,92 |
16 – 20 | 0,02 | 0,08 | 1,00 |
1,00 |
Medianklasse ist 8 – 12.
Kaltmieten
Medianklasse ist 10-13.
Wohnfläche (m) | |||
von …bis unter … | Anzahl | ||
0-6 | 5 | 0,05 | 0,05 |
6-8 | 10 | 0,10 | 0,15 |
8-10 | 30 | 0,30 | 0,45 |
10-13 | 30 | 0,30 | 0,75 |
13-16 | 20 | 0,20 | 0,95 |
16-20 | 5 | 0,05 | 1,00 |
100 | 1,00 |
Kartoffeln
- :“Kosten je verladene Tonne Kartoffeln”; = 0,83 EUR/Tonne
- :“Verladene Tonnen Kartoffeln je Stunde”; = 52 t/h
Kaufkurs der Aktien
oder
Koeffizienten Vergleich
- H) Median
- F) Korr. Kontingenzkoeffizient, K) Quadratische Kontingenz
- D) Interquartilsabstand
- B) Bravais–Pearson KK, D) IQR, G) Kovarianz, L) Spannweite, O) Standardabweichung, P) Varianz
Körpergröße
- : “Körpergröße in cm”; = 128 cm; = 26 cm; = 5,1 cm;
= 0,0398
:“Körpergröße in Zoll”; = 51,2 Zoll; = 4,16 Zoll; = 2,04 Zoll; = 0,0398
- mit und ;
;
Körperschaftssteueraufkommen
Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich
Kontrollzeiten
X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Illegal TeX function
Found \vspacein 2:215“): {\displaystyle \begin{aligned} \overline{x}_H &=\frac{\displaystyle n}{\displaystyle\sum_{i=1}^n\frac{\displaystyle1}{\displaystyle x_i}} =\frac{6}{\displaystyle\frac{1}{0,2}+\frac{1}{0,4}+\frac{1}{0,8}+\frac{1}{0,5}+\frac{1}{0,5}+\frac{1}{0,8}}\vspace{0,5cm}\\ &= \frac{6}{5+2,5+1,25+2+2+1,25} \\ &=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{aligned}}
Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:
Kurzarbeiter
- = 44,328 %
- = 40,36 %
Leichtathletikabteilung
Histogramm
10,8 sec.
sec; = 10,52 sec.; = 0,0602
; ja; Beweis über den Verschiebungssatz
Lernzeit
:“Aufwand für das Studium (in Stunden)”; kardinalskaliert
- {| !align="right"| !align="right"| !align="right"| !align="right"| !align="right"| !align="right"| |- |align="right"| 0 - 3 |align="right"| 1,5 |align="right"| 30 |align="right"| 0,3 |align="right"| 0,3 |align="right"| 0,1 |- |align="right"| 3 - 6 |align="right"| 4,5 |align="right"| 48 |align="right"| 0,48 |align="right"| 0,78 |align="right"| 0,16 |- |align="right"| 6 - 8 |align="right"| 7 |align="right"| 17 |align="right"| 0,17 |align="right"| 0,95 |align="right"| 0,085 |- |align="right"| 8 - 12 |align="right"| 10 |align="right"| 5 |align="right"| 0,05 |align="right"| 1,00 |align="right"| 0,0125 |}
= 4,25 Stunden
38 Studenten
= 4,3 Stunden
= 4,333 Stunden
Lineares Streuungsmaß
Maschinen
= 0,05; = 0,02
Mensaessen
Es sei die Preis/Leistungs–Rangzahl von Eintopf und die von Essen 1.
Fall A: ,
Fall B: ,
Merkmalsausprägungen
- sachliches Kriterium: Beteiligung am Erwerbsleben - auf Erwerbstätige (festgelegt).
- örtliches Kriterium: Großstadt K in der Bundesrepublik Deutschland.
- zeitliches Kriterium: März .
Miete und Wohnfläche
, ,
Minimale Summe
Begründung:
Quadratische Minimumseigenschaft des arithmetischen Mittels
Nelkenstrauß
= 0,95 EUR/Nelke
Neubauwohnungen
= 9,15 Monate/Wohnungseinheit
= 8,5403 Monate/Wohnungseinheit
= 7,3846 Monate/Wohnungseinheit
Old Faithful
Variable : Dauer einer Eruption (in Minuten)
Variable : Zeit zwischen zwei Eruptionen (in Minuten)
Beide Variablen sind metrischen Skalenniveaus
Bravais–Pearson–Korrelationskoeffizient.
Perlenkette
- {| !align="right"| Durchmesser !align="right"| !align="right"| !align="right"| |- |align="right"| 3 - 4 |align="right"| 20 |align="right"| 0,278 |align="right"| 0,278 |- |align="right"| 4 - 5 |align="right"| 21 |align="right"| 0,292 |align="right"| 0,570 |- |align="right"| 5 - 6 |align="right"| 19 |align="right"| 0,264 |align="right"| 0,834 |- |align="right"| 6 - 7 |align="right"| 9 |align="right"| 0,125 |align="right"| 0,959 |- |align="right"| 7 - 8 |align="right"| 3 |align="right"| 0,041 |align="right"| 1,000 |}
= 4,861 mm
= 4,33 mm
= 4,76 mm
Produktionsleistung einer Maschine
= 296,75 Stück/Tag; 296,75/300 = 0,9892
Die Maschine ist durchschnittlich zu 98,92 % pro Tag ausgelastet; die Behauptung ist richtig.
= 296,5 Stück/Tag; = 1,15 Stück/Tag
Reinigungsunternehmen - Teil II
= 45 693; = 213,759; = 0,086
= 4848,75; = 69,633; = 0,02467
= 12 032,4; = 109,692; = 0,04441
Reinigungsunternehmen - Teil I
- = 2488 EUR; = 2470,5 EUR;
- = 2822,5 EUR; = 2798 EUR;
- = 2470 EUR; = 2454 EUR;
- = 2571,2 EUR; = 2546 EUR.
Relationen der Merkmalsausprägungen
Da Relationen angegeben sind, sind die beiden Merkmale und ordinal skaliert; Der Spearman’sche Rangkorrelationskoeffizient ist ein geeignetes Maß
i | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
1 | 3 | 5 | 2 | 4 | |
3 | 1 | 4 | 2 | 5 | |
2 | 2 | 1 | 0 | 1 |
Sanatorium
Spearman’scher Rangkorrelationsoeffizient
Zusammenhang zwischen Gewicht und Laufleistung:
|S|S|S|S| &Gewicht &Rang Gewicht&Differenz
1&70 & 2 & 1
2&60& 1 & 1
3&80&6 & 9
4&77& 3& 1
5&82& 8&9
6&81& 7&1
7&78&4&9
8&100&10&4
9&83&9&0
10&110&11&1
11&79&5&36
a) Median für nicht klassierte Daten, ungerade
Quadratisches Streuungsmaßim Bezug auf Median
Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.
Durchschnittsgeschindigkeit der Frauen?
Eine Frau läuft den Lauf mit m/s
Die andere Frau läuft den Lauf mit m/s
Insgesamt wurden m gelaufen, m mit m/s und m mit m/s. Kann auch wie eine Frau betrachtet werden die erst m langsamer und dann m schneller läuft.
Harmonisches Mittel:Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Illegal TeX function Found \slashin 2:53“): {\displaystyle \begin{aligned} \overline{x}_{H}&= \frac{50m+50m}{\frac{50m}{2m\slash s} +\frac{50m}{4m\slash s}} = \frac{100m}{25s +12,5s }\\ &=\frac{100m}{37,5s}=2,667 m\slash s\\ \end{aligned}}
Schafzucht Teil - II
Pfund = Gebühr + Wechselkurs Gulden,
= 7,8 Tsd. Gulden; = 37,76 (Tsd. Gulden);
= 3,1 Tsd. Pfund; = 9,44 (Tsd. Pfund);
= 3,1 = a + b;
; = 0,25;
7,8 = - 0,8
Gebühr: 0,8 Tsd. Pfund; Wechselkurs: 1 Pfund : 2 Gulden
Schafzucht - Teil I
Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im Verhältnis zur Leistung gegeben ist: wobei die Lohnsumme für die Irischen Arbeiter und die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass und , und den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel:
Schulbezirke
Für Variable :
Für Variable :
Skalierung
nominalskaliert | Geschlecht, Postleitzahl, |
abonnierten Zeitungen, | |
Nationalität , | |
Freizeitbeschäftigung, | |
Rückennummern von Fußsballspielern, | |
Familienstand, erlernter Beruf, | |
Todesursache, Studienfach, | |
Augenfarbe, Wohnsitz, | |
Telefonnummer, | |
Rechtsform einer Unternehmung , | |
Finanzierung des Studiums | |
ordinalskaliert | Schulnote, Betriebsgröenklasse, |
Militärdienstgrad, Windstärke, | |
Schwierigkeitsgrad einer Klettertour, | |
Tarifklassen bei der Kfz-Haftpflicht, | |
Güteklasse, Handelsklasse bei Obst, | |
Aggressivität, Intelligenz, | |
sozialer Status | |
metrisch skaliert/ | Temperatur in Celsius, |
Intervallskala | Normabweichung, Geburtsjahrgang, |
Breitengrade der Erde | |
metrisch skaliert/ | Körpergröße, |
Verhältnisskala | Länge eines Werkstückes, |
Wahlergebnis einer Partei, | |
Fahrpreise, Geschwindigkeit, | |
Kraftstoffverbrauch eines PKW auf 100 km, | |
Preis einer Ware, Lebensalter, | |
Einkommen, Jahresumsatz, | |
Grundstücksgröße, | |
Produktionsdauer | |
metrisch skaliert/ | Kinderzahl, Bücherbestand einer Bibliothek, |
Absolutskala | Seitenzahl eines Buches, |
Semesterzahl, Klausurpunkte |
Sportveranstaltungen
- = 14,4797; = 0,2146; = 0,3035
- = 0
- = 0
- Zusammenhang unter a) nur scheinbar; er wird durch den Einfluss des Lebensalters vorgetäuscht. Bei der Ausschaltung dieses Einflusses durch die Untersuchung altersspezifischer Teilgesamtheiten zeigt sich, dass in Wirklichkeit Unabhängigkeit besteht.
Stellung im Beruf
Geschlecht RV Beamte(r) Angestellte(r) Arbeiter(in) Geschlecht weiblich 15 20 5 40 männlich 10 30 20 60 RV Beruf 25 50 25 n=100 Bedingte Verteilung
Beamte Angestellte Arbeiter w 0,375 0,5 0,125 Bedingte Verteilung
Angestellte w 0,4 m 0,6 Die Merkmale sind nicht unabhängig, da z.B. ist.
Streuungsmaß
- Begründung:
Gegeben Elemente,
- metrisch (kardinal) skalierte Merkmale
Tägliche Arbeitswege - Teil II
- = 4; = 22,5; = 18,5 km
- = 10,4286 km; = 9,53 km
Tägliche Arbeitswege - Teil I
Beschäftigter; Anfahrtsweg (in km) pro Beschäftigter; kardinalskaliert
- {| !align="right"| Anfahrtsweg !align="right"| !align="right"| !align="right"| !align="right"| |- |align="right"| 0 - 1 |align="right"| 7 |align="right"| 0,07 |align="right"| 0,07 |align="right"| 0,07 |- |align="right"| 1 - 5 |align="right"| 24 |align="right"| 0,24 |align="right"| 0,31 |align="right"| 0,06 |- |align="right"| 5 - 15 |align="right"| 35 |align="right"| 0,35 |align="right"| 0,66 |align="right"| 0,035 |- |align="right"| 15 - 30 |align="right"| 18 |align="right"| 0,18 |align="right"| 0,84 |align="right"| 0,012 |- |align="right"| 30 - 50 |align="right"| 16 |align="right"| 0,16 |align="right"| 1,00 |align="right"| 0,008 |}
= 14,705 km
= 0,875 km; Modus
= 10,4286 km
= 0,7143 km; = 4 km; = 22,5 km; = 37,5 km
Tarifvereinbarungen
lineare Transformation:
Tarifverhandlungen
X: Jahresbruttolohn vor der Tarifverhandlung, Y:Jahresbruttolohn nach der Tarifverhandlung;
EUR
Teesorten
= 0,5714
Tekolom und IBBM - Teil II
Tekolom–Aktie , IBBM–Aktie , Portfolio
Tekolom und IBBM - Teil I
, ,
relative Häufigkeiten: ; ;
, , , ,
, , , , ,
Telefonanbieter
Telefon–Interviews
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Expected "}" or valid UTF-16 sequences but "|" found.in 1:32“): {\displaystyle 10\mbox{ Minuten|Freizeit}=0,48}
EUR, 18 Interviews
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Expected "}" or valid UTF-16 sequences but "|" found.in 1:32“): {\displaystyle 10\mbox{ Minuten|Tag}=0,84}
EUR, 10 Interviews
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Expected "}" or valid UTF-16 sequences but "|" found.in 1:32“): {\displaystyle 20\mbox{ Minuten|Freizeit}=0,96}
EUR, 11 Interviews
Fehler beim Parsen (Konvertierungsfehler. Der Server („cli“) hat berichtet: „SyntaxError: Expected "}" or valid UTF-16 sequences but "|" found.in 1:32“): {\displaystyle 20\mbox{ Minuten|Tag}=1,68}
EUR, 20 Interviews
Tennis Turniere
: “Anzahl der pro Turnier bis zum Ausscheiden gespielten Runden”; kardinalskaliert, diskret
- {| !align="right"| !align="right"| !align="right"| !align="right"| |- |align="right"| 1 |align="right"| 10 |align="right"| 0,25 |align="right"| 0,25 |- |align="right"| 2 |align="right"| 16 |align="right"| 0,40 |align="right"| 0,65 |- |align="right"| 4 |align="right"| 6 |align="right"| 0,15 |align="right"| 0,80 |- |align="right"| 5 |align="right"| 6 |align="right"| 0,15 |align="right"| 0,95 |- |align="right"| 6 |align="right"| 2 |align="right"| 0,05 |align="right"| 1,00 |- |align="right"| Summe |align="right"| 40 |align="right"| 1,00 |align="right"| |}
Treppenfunktion
65 %
20 %
30 Turnieren
4. Runde
2. Runde
= 1; d.h. jedes Turnier ging nur über 6 Runden; daher konnte B.B. niemals in eine 7. Runde gelangen, er war also in 100 % aller Turniere in Runde 7 (=x) ausgeschieden.
Verspätungen
= - 0,8
Wählerverhalten
- sachlich
- wahlberechtigte Personen (Deutsche im Sinne von Artikel 116 Abs. 1 des Grundgesetzes, 18. Lebensjahr vollendet, ...)
- räumlich
- Personen welche seit mindestens drei Monaten Ihre Wohnung in der Bundesrepublik Deutschland haben oder sich sonst gewöhnlich dort aufhalten
- zeitlich
- Zeitpunkt der Bundestagswahl
Walzabteilung
X = “Bearbeitungszeit in sec./Stück)”;
Y = “hergestellte Stück pro Stunde”
- a) Man berechnet das harmonische Mittel wie folgt: b) Man berechnet das arithmetische Mittel wie folgt:
- a)
- Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt:
- Anschließend wird das arithmetische Mittel berechnet: b) Das harmonische Mittel wird errechnet:
Wanderer
= 4,8 km/h
WM–Berichterstattung
: “Fernsehkonsum (in Std.) während der letzten Fußball-WM” kardinalskaliert, diskret
- {| !align="right"| !align="right"| !align="right"| !align="right"| |- |align="right"| 0 |align="right"| 1 |align="right"| 0,05 |align="right"| 0,05 |- |align="right"| 1 |align="right"| 2 |align="right"| 0,10 |align="right"| 0,15 |- |align="right"| 2 |align="right"| 8 |align="right"| 0,40 |align="right"| 0,55 |- |align="right"| 3 |align="right"| 4 |align="right"| 0,20 |align="right"| 0,75 |- |align="right"| 4 |align="right"| 5 |align="right"| 0,25 |align="right"| 1,00 |- |align="right"| Summe |align="right"| 20 |align="right"| 1,00 |align="right"| |}
1 Std.
2 Std.
3 Std.
Zigaretten
empirische Verteilungsfunktion,
Annahme: Gleichverteilung der Merkmalswerte innerhalb jeder Klasse: “Anzahl der gerauchten Zigaretten pro Tag”
0 - 5 10 0,05 0,05 0,01 5 - 10 40 0,20 0,25 0,04 10 - 20 90 0,45 0,70 0,045 20 - 40 60 0,30 1,00 0,015 Summe 200 1,0000 0,3
Zuckergewicht
Füllgewicht | ||||
---|---|---|---|---|
980 - 990 | 5 | 0,067 | 0,067 | 0,0067 |
990 - 995 | 12 | 0,160 | 0,227 | 0,032 |
995 - 1000 | 23 | 0,307 | 0,534 | 0,0614 |
1000 - 1005 | 22 | 0,293 | 0,827 | 0,0586 |
1005 - 1010 | 11 | 0,147 | 0,974 | 0,0294 |
1010 - 1020 | 2 | 0,026 | 1,000 | 0,0026 |
= 999,565 g; = 999,446 g; = 999,27 g
Zugfolge - Teil II
- Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.
Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: 36 .
Für den Median von klassierten Daten gilt die folgende Formel:
Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei die Klassenmitte und die Anzahl der Beobachtungen in Klasse j beschreibt:
- Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.
Man berechnet das Arithmetische Mittel von nicht-klassierten Daten wie folgt:
Zugfolge - Teil I
: “Zugfolgeabstand”; kardinalskaliert, stetig
und c) Zugfolgeabstand (Von ... bis unter ...)
0 – 30 14 0,3784 0,3784 0,0126 30 – 60 17 0,4595 0,8379 0,0153 60 – 90 5 0,1351 0,9730 0,0045 90 – 120 1 0,0270 1,0000 0,0009 37 1,0000 Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion