Univariate Statistik/Lösungen: Unterschied zwischen den Versionen

Aktuelle Version vom 14. Juli 2020, 15:18 Uhr

Anstieg der Produktion

$i_{G}={\sqrt[{4}]{1,1^{2}\cdot 1,2^{2}}}$ = 1,1489
$i_{2007/2011}=x_{2011}/x_{2007}=1,2^{4}$ = 2,0736

Arbeitslose

X: Arbeitslosenquote $\rightarrow$ Verhältnis von Arbeitslosen zu Erwerbspersonen
Möglichkeit 1
Zusätzliche Informationen $g(x_{j})$ sind Arbeitslosenzahlen, beziehen sich inhaltlich auf den Zähler des Merkmals X $\rightarrow$ harmonisches Mittel
${\bar {x}}_{H}={\frac {\displaystyle \sum _{j=1}^{k}g_{j}}{\displaystyle \sum _{j=1}^{k}{\frac {\displaystyle g_{j}}{\displaystyle x_{j}}}}}={\frac {3000+4000}{\displaystyle {\frac {3000}{5}}+{\frac {4000}{20}}}}={\frac {7000}{800}}=8,75$
Die Arbeitslosenquote für das Bundesland beträgt 8,75%.

Möglichkeit 2
Anwendung des arithmetischen Mittels nach vorheriger Berechnung der Informationen für den Nenner des Merkmals X. Diese sind $3000/5=600$ und $4000/20=200$ .
${\begin{aligned}{\bar {x}}&={\frac {1}{n}}\sum _{j=1}^{k}x_{j}h(x_{j})\\&={\frac {1}{800}}(5\cdot 600+20\cdot 200)={\frac {3000+4000}{800}}={\frac {7000}{800}}\\&=8,75\end{aligned}}$

Auswirkung der Regelstudienzeit

$X$ : “Semesterzahl”; kardinalskaliert, diskret

und c)

$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x)$
10	20	0,10	0,10
11	20	0,10	0,20
12	80	0,40	0,60
13	40	0,20	0,80
14	30	0,15	0,95
15	10	0,05	1,00
Summe	200	1,00

10 Semester
12 Semester
13 Semester
ordinalskaliert
Säulendiagramm
Nein. Eine Verteilungsfunktion erfordert wegen

$F(x)=\sum _{x_{j}\leq x}f(x)$

eine Ordnungsrelation (“kleiner-gleich”-Beziehung) zwischen den Merkmalsausprägungen. Derartige Vergleichszeichen sind jedoch auf nominalskalierte Merkmale nicht anwendbar, da bei Nominalskalierung keine Anordnung möglich ist.

Benzinverbrauch

Bei Verbrauchsdaten in Liter/100km: $v=0,41/8,2=0,05$ .
Der Variationskoeffizient verändert sich durch die Umrechnung auf Gallonen/100 Meilen nicht, da diese Umrechnung sowohl beim arithmetischen Mittel als auch bei der Standardabweichung vorgenommen werden muss.

Berliner Luftqualität

$X$ : “Stickstoffmonoxydgehalt der Berliner Luft im März ”; kardinalskaliert, stetig

$x_{j}^{u}$ $\leq$ $X$ $<$ $x_{j}^{o}$	$h(x_{j})$	$f(x_{j})$	$F(x)$	$f_{K}(x_{j})$
19,5 - 29,5	5	0,3333	0,3333	0,03333
29,5 - 34,5	4	0,2667	0,6000	0,05334
34,5 - 39,5	5	0,3333	0,9333	0,06666
39,5 - 44,5	1	0,0667	1,0000	0,01334
Summe	15	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion
6 Tage
37,5 mg/m $^{3}$

Besuche pro Woche

$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x_{j})$
0	7	0,14	0,14
1	11	0,22	0,36
2	5	0,10	0,46
3	7	0,14	0,60
4	7	0,14	0,74
5	4	0,08	0,82
6	5	0,10	0,92
7	3	0,06	0,98
9	1	0,02	1,00
	50	1,00

${\overline {x}}$ = 3 Besuche

Bevölkerungsdichte und Ärztedichte

Bevölkerungsdichte: ${\overline {x}}$ = 150 Einwohner/km $^{2}$
Ärztedichte: ${\overline {y}}_{H}$ = 1 Arzt/1000 Einwohner

Bibliotheken - Teil III

$s_{x}$ = 10,4775 Std./Wo.; $s_{y}$ = 15,2382 Std./Wo.
$v_{x}$ = 0,1612; $v_{y}$ = 0,312

Bibliotheken - Teil II

$x_{D}$ = 62,998 Std./Wo.; $x_{0,5}$ = 63,998 Std./Wo.; ${\overline {x}}$ = 64,959 Std./Wo.
$y_{D}$ = 44,166 Std./Wo.; $y_{0,5}$ = 46,3165 Std./Wo.; ${\overline {y}}$ = 48,831 Std./Wo.
nein, da keine unimodale Häufigkeitsverteilung vorliegt
$z_{0,25}$ = 2,0502 Mill.EUR/Jahr; $z_{0,5}$ = 3,353 Mill.EUR/Jahr; $z_{0,75}$ = 4,346 Mill.EUR/Jahr;

$z_{(1)}$ = 0,85 Mill.EUR/Jahr; $z_{(62)}$ = 6,56 Mill.EUR/Jahr

Bibliotheken - Teil I

alle Merkmale sind kardinalskaliert
- Öffnungszeiten und Ausleihzeiten: stetig
- Etat für Neuerwerb: quasi-stetig
- Planstellen: diskret

$X$ : “Öffnungszeiten”

Öffnungszeiten $x_{j}$	$h(x_{j)}$	$f(x_{j})$	$F(x)$	$f_{K}(x_{j})$
40 – 50	2	0,0323	0,0323	0,00323
50 – 60	19	0,3065	0,3388	0,03065
60 – 70	25	0,4032	0,7420	0,04032
70 – 80	11	0,1774	0,9194	0,01774
80 – 90	4	0,0645	0,9839	0,00645
90 – 115	1	0,0161	1,0000	0,00064
Summe	62	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion

$Y$ : “Ausleihzeiten”

Ausleihzeiten $y_{j}$	$h(y_{j)}$	$f(y_{j})$	$F(y)$	$f_{K}(y_{j})$
25 – 30	5	0,0806	0,0806	0,01612
30 – 40	14	0,2258	0,3064	0,02258
40 – 50	19	0,3065	0,6129	0,03065
50 – 60	12	0,1935	0,8064	0,01935
60 – 70	6	0,0968	0,9032	0,00968
70 – 80	3	0,0484	0,9516	0,00484
80 – 100	3	0,0484	1,0000	0,00242
Summe	62	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion

$Z$ : “Etat für Neuerwerb”

Etat für Neuerwerb $z_{j}$	$h(z_{j)}$	$f(z_{j})$	$F(z)$	$f_{K}(z_{j})$
0 – 1	1	0,0161	0,0161	0,0161
1 – 2	14	0,2258	0,2419	0,2258
2 – 3	10	0,1613	0,4032	0,1613
3 – 4	17	0,2742	0,6774	0,2742
4 – 5	13	0,2097	0,8871	0,2097
5 – 6	6	0,0968	0,9839	0,0968
6 – 7	1	0,0161	1,0000	0,0161
Summe	62	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion

$W$ : “Planstellen”

Planstellen $w_{j}$	$h(w_{j)}$	$f(w_{j})$	$F(w)$	$f_{K}(w_{j})$
30 – 70	6	0,0968	0,0968	0,00242
70 – 80	12	0,1935	0,2903	0,01935
80 – 100	10	0,1613	0,4516	0,00807
100 – 150	19	0,3065	0,7581	0,00613
150 – 200	12	0,1935	0,9516	0,00387
200 – 270	3	0,0484	1,0000	0,00069
Summe	62	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion

- 0,7872
- 0,1452
- 0,3064
- 0,5484
- 77 Planstellen
- 76,088 Std./Wo.

Brutto- und Nettoeinkommen

Bruttoeinkommen/Beschäftigten und Monat: $i_{G}$ = 1,0352
Nettoeinkommen/Beschäftigten und Monat: $i_{G}$ = 1,0279

CDs

${\overline {x}}_{H}$ = 4,27 EUR/CD
$s^{2}$ = 0,1519; $s$ = 0,39 EUR/CD

Das erste Tor

Klassierte Häufigkeitsverteilung

Klasse	$h(x)$	$H(x)$	$f(x)$	$F(x)$
0 – 15	9	9	0,36	0,36
15 – 30	5	14	0,20	0,56
30 – 45	9	23	0,36	0,92
45 – 90	2	25	0,08	1,00

$f(20<x\leq 60)=F(60)-F(20)=$ ?
$F(x)=F(x_{j}^{u})+f(x_{j})\cdot (x-x_{j}^{u})/(x_{j}^{o}-x_{j}^{u})$ (Interpolation)
$F(60)=F(45)+0,08\cdot (60-45)/(90-45)=0,92+0,0267=0,9467$
$F(20)=F(15)+0,2\cdot (20-15)/(30-15)=0,36+0,067=0,4267$
$f(20<x\leq 60)=F(60)-F(20)=0,9467-0,4267=0,52$

Ladekabel

${\overline {x}}$ = 15,52 EUR/Ladekabel

Drei Betriebe

${\overline {x}}$ = 740 EUR Materialverbrauch/1000EUR Produktion
Materialverbrauch pro 1000EUR Produktion, kardinalskaliert
i $_{G}$ = 0,97; $x_{2013}$ = 112 908 000 EUR Materialverbrauch

Drei Stichproben

gepoolter Datensatz
${\overline {x}}=\displaystyle {\frac {1}{\displaystyle n}}\displaystyle \sum _{p=1}^{r}{\overline {x}}_{p}n_{p},\quad n=\displaystyle \sum _{p=1}^{r}n_{p};\quad s^{2}=\displaystyle \sum _{l=1}^{r}{\frac {\displaystyle n_{l}}{\displaystyle n}}s_{l}^{2}+\displaystyle \sum _{l=1}^{r}{\frac {\displaystyle n_{l}}{\displaystyle n}}\left({\overline {x}}_{l}-{\overline {x}}\right)^{2}$ ${\begin{aligned}{\overline {x}}&=0,1\cdot 51+0,4\cdot 53+0,5\cdot 54=53,3\\s^{2}&=(0,1\cdot 21+0,4\cdot 22+0,5\cdot 23)\\&+0,1(51-53,3)^{2}\\&+0,4(53-53,3)^{2}+0,5(54-53,3)^{2}\\&=22,4+0,529+0,036+0,245=22,4+0,81=23,21\end{aligned}}$

Eine Befragung von Studierenden - Teil II

$x_{D}$ = BWL, da BWL die höchste absolute Häufigkeit beinhaltet. Der Modus ist ein geeigneter Lageparameter, da es sich um nominalskalierte Variablenausprägungen handelt, die lediglich eine Verschiedenartigkeit zum Ausdruck bringen.
Die drei geeigneten Lageparameter entsprechen hier dem Modus, dem Median und dem Arithmetischen Mittel.
Der Modus $y_{D}$ = 1, da die Ausprägung eins die höchste absolute Häufigkeit besitzt.
Der Median $y_{0,5}$ = 1, da eins ungerade ist und daher die Formel

${\begin{aligned}x_{0,5}&=x_{\left({\tfrac {n+1}{2}}\right)}\\&=x_{\left({\tfrac {25+1}{2}}\right)}\\&=x_{(13)}\end{aligned}}$ für den Median gilt.

Das Arithmetische Mittel ${\overline {y}}$ = 1, da sich mit der Formel

${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{25}}\cdot (8\cdot 0+11\cdot 1+4\cdot 2+2\cdot 3)\\&=1{\text{ ergibt}}.\end{aligned}}$

Das durchschnittliche Einkommen eines/einer Studierenden ergibt sich durch Berechnen des Arithmetischen Mittels wie folgt:

${\begin{aligned}{\overline {z}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot z_{i}\\{\overline {z}}&={\dfrac {1}{25}}\cdot (924+...+640)\\&={\dfrac {1}{25}}\cdot 20200\\&=808{\text{ EUR}}\end{aligned}}$

Als aussagekräftige Lageparameter werden das Arithmetische Mittel und der Median berechnet.
Der Median berechnet sich für klassierte Daten mit der folgenden Formel: ${\begin{aligned}z_{0,5}&=x_{j}^{u}+{\dfrac {(0,5-F(z_{j}^{u}))}{f(z_{j}^{m})}}\cdot (z_{j}^{o}-z_{j}^{u})\\&=700+{\dfrac {(0,5-0,48)}{0,32}}\cdot 200\\&=712,5{\text{ EUR}}\end{aligned}}$
Das Arithmetische Mittel wird hier für klassierte Daten mit der folgenden Formel berechnet, wobei $x_{j}^{m}$ die Klassenmitte und $n_{j}$ die Anzahl der Beobachtungen in Klasse j angibt: ${\begin{aligned}{\overline {z}}&={\dfrac {1}{n}}\cdot \sum _{j=1}^{k}\cdot z_{j}^{m}\cdot n_{j}\\&={\dfrac {1}{25}}\cdot (625\cdot 6+675\cdot 6+800\cdot 8+1050\cdot 2+1325\cdot 3)\\&={\dfrac {20275}{25}}\\&=811{\text{ EUR}}.\end{aligned}}$ Für die Berechnung der Quantile von klassierten Daten wird folgende Formel verwendet: ${\begin{aligned}F(x_{p})&=p\Leftrightarrow x_{p}=x_{j}^{u}+{\dfrac {(p-F(x_{j}^{u}))}{f(x_{j})}}\cdot (x_{j}^{o}-x_{j}^{u})\end{aligned}}$
Die Quartile werden somit wie folgt für klassierte Daten berechnet: ${\begin{aligned}z_{0,25}&=650+{\dfrac {(0,25-0,24)}{0,24}}\cdot 50\\&=652,08{\text{ EUR}}\\z_{0,75}&=700+{\dfrac {(0,75-0,48)}{0,32}}\cdot 200\\&=868,75{\text{ EUR}}\end{aligned}}$
Das 90%-Quantil ergibt somit: ${\begin{aligned}z_{0,9}&=1200+{\dfrac {(0,9-0,88)}{0,12}}\cdot 250\\&=1241,67{\text{ EUR}}\end{aligned}}$
Minimum und Maximum sind hier wie folgt:

Das Minimum ist hier $z_{(1)}$ = 616, da es die kleinste Merkmalsausprägung des Merkmals Einkommen ist
Das Maximum entspricht $z_{(25)}$ = 1440, da es demgegenüber die größte Ausprägung des Merkmals Einkommen ist

Die Quantile ergeben sich wie folgt:

$z_{0,25}$ = 660, da $n\cdot p$ keine ganze Zahl ist, sondern hier $25\cdot 0,25=6,25$ woraufhin die Ausprägung an der auf $n\cdot p$ folgenden Zahlenstelle gilt, das heißt 660 ist die Ausprägung an der siebten Stelle.
$z_{0,5}=700$ mit $n\cdot p=25\cdot 0,5=12,5\Rightarrow$ 700 ist das Ergebnis und steht als Ausprägung an dreizehnter Stelle
$z_{0,75}$ = 850 mit $n\cdot p=25\cdot 0,75=18,75\Rightarrow$ Das entspricht der Ausprägung an neunzehnter Stelle

Eine Befragung von Studierenden - Teil I

Datei:2-7 2-17 Eine Befragung von Studierenden.xlsx

- Grundgesamtheit: Die Menge aller Studierenden der deutschen Hochschule im Juni
- Stichprobe: Die Menge der 25 befragten Studierenden der deutschen Hochschule im Juni
- Statistische Einheiten: Studierende der deutschen Hochschule im Juni
- Identifikationskriterien:
- örtlich: Deutschland
- zeitlich: Juni
- sachlich: immatrikulierte Person an der Hochschule
$X$ : “Studiengang”; nominalskaliert

Studiengang $x_{j}$ $h(x_{j})$ $f(x_{j})$

VWL 5 0,2

BWL 10 0,4

Polit.Wiss. 5 0,2

Sozialwiss. 5 0,2

Summe 25 1,0

Graphische Darstellung als Säulendiagramm, Kreisdiagramm oder Flächendiagramm. Siehe dazu Folien in der Vorlesung “Deskriptive Statistik”, beispielsweise:
Grafische Darstellung der Häufigkeit II

$Y$ : “Anzahl der Geschwister”; kardinalskaliert, diskret

Anzahl der Geschwister $y_{j}$	$h(y_{j})$	$f(y_{j})$	$F(y)$
0	8	0,32	0,32
1	11	0,44	0,76
2	4	0,16	0,92
3	2	0,08	1,00
Summe	25	1,00

Graphische Darstellung der Häufigkeitsverteilung als Stabdiagramm, der empirischen Verteilungsfunktion als Treppenfunktion

23 Studierende haben höchstens 2 Geschwister.
Viermal 2 Geschwister $+$ zweimal 3 Geschwister $=$ 6 Personen mit mindestens 2 Geschwistern, d.h.
${\dfrac {6}{25}}=0,24=24\%$ haben mindestens zwei Geschwister.

${\dfrac {15}{25}}=0,6=60\%$ haben ein oder zwei Geschwister.

$Z$ : “Einkommen”; kardinalskaliert (metrisch), quasi-stetig

Einkommen $z_{j}^{u}\leq Z<z_{j}^{o}$	$h(z_{j})$	$f(z_{j})$	$F(z)$	$f_{K}(z_{j})$
600 – 650	6	0,24	0,24	0,0048
650 – 700	6	0,24	0,48	0,0048
700 – 900	8	0,32	0,80	0,0016
900 – 1200	2	0,08	0,88	0,0003
1200 – 1450	3	0,12	1,00	0,0005
Summe	25	1,00

Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion

- $P[\{750\leq Z\leq 1300\}]=F(1300)-F(750)$
  ${\begin{aligned}F(1300)&=&0,88+{\frac {1300-1200}{1450-1200}}\cdot 0,12=0,928\\F(750)&=&0,48+{\frac {750-700}{900-700}}\cdot 0,32=0,56\\P[\{750\leq Z\leq 1300\}]&=&F(1300)-F(750)=0,928-0,56\\\end{aligned}}$
- $P[\{Z>800\}]=1-F(800)$ ${\begin{aligned}&=&1-[0,24+0,24+{\frac {(800-700)}{(900-700)}}\cdot 0,32]\\&=&1-[0,48+{\frac {100}{200}}\cdot 0,32]\\&=&0,36\end{aligned}}$
- $0,5=0,48+{\frac {z-700}{900-700}}\cdot 0,32\rightarrow z=712,5{\mbox{EUR}}$
- $0,12+0,08=0,2\Rightarrow 20\%\Rightarrow 900EUR$

Einkommen der Beamten

Gegeben:
$x_{0,5}=2590$ ; $x_{0,75}=3590$ ; $R=8000$ ; $IQR=1770$ ; $x_{min}=500$ ; $s=1620$ ; $v=0,54$
Gesucht:
$x_{0,25}=x_{0,75}-IQR=3590-1770=1820$

Einkommensgleichheit

	Atoll A
Person	Einkommen	$x_{i}^{2}$	$x_{i}-{\overline {x}}$	$(x_{i}-{\overline {x}})^{2}$
	(in Kauri Schnecken)
1	225	50625	$32,625$	$1064,390625$
2	185	34225	$-7,375$	$54,390625$
3	250	62500	$57,625$	$3320,640625$
4	150	22500	$-42,375$	$1795,640625$
5	237	56169	$44,625$	$1991,390625$
6	100	10000	$-92,375$	$8533,140625$
7	87	7569	$-105,375$	$11103,890625$
8	305	93025	$112,625$	$12684,390625$
$\sum$	1539	336613		$40547,875$

${\overline {x}}=1539/8=192,375$

Einkommen und Alter

a) und b)

Einkommen	Alter					RV X
	20-30	30-40	40-50	50-60	60-70
0-1000	0.02	0.04	0.02	0.02	0.02	0.12
1000-1500	0.04	0.08	0.08	0.06	0.02	0.28
1500-2000	0.06	0.12	0.12	0.06	0.04	0.40
2000-3000	0.02	0.06	0.04	0.04	0.04	0.20
RV Y	0.14	0.30	0.26	0.18	0.12	1.00

c)

Einkommen	Alter
	20-30	30-40	40-50	50-60	60-70
0-1000	0.143	0.133	0.077	0.111	0.0167
1000-1500	0.286	0.267	0.308	0.333	0.167
1500-2000	0.429	0.400	0.462	0.333	0.167
2000-3000	0.143	0.200	0.154	0.222	0.333
	1.000	1.000	1.000	1.000	1.000

d)

Einkommen	Alter					RV X
	20-30	30-40	40-50	50-60	60-70
0-1000	0.167	0.333	0.167	0.167	0.167	1.000
1000-1500	0.143	0.286	0.286	0.214	0.071	1.000
1500-2000	0.150	0.300	0.300	0.150	0.100	1.000
2000-3000	0.100	0.300	0.200	0.200	0.200	1.000

e)
${\overline {x}}$ = 1610 EUR
f)
${\overline {y}}$ = 43,4 Jahre
g)
$x_{D}$ = 1642,86 EUR
h)
$x_{Z}$ = 1625 EUR
i)
1535,71 EUR; 1600 EUR; 1615,38 EUR; 1611,11 EUR; 1708,33 EUR
j)
$s_{x}$ = 591,95 EUR
k)
$s_{xy}$ = 476

Einwohnerzahlen

Da wir zwei große Ausreißer in den Daten haben (China und Indien) muss der Median verwendet werden: $x_{0,5}=0,5\cdot (x_{(5)}+x_{(6)})=0,5\cdot (122+139)=131$

Eiskugelkonsum

$X$ : “Eiskonsum in Kugeln”; kardinalskaliert, diskret

$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x)$
1	40	0,20	0,20
3	50	0,25	0,45
4	70	0,35	0,80
5	10	0,05	0,85
6	30	0,15	1,00
Summe	200	1,00

Häufigkeitsverteilung: Stabdiagramm
empirische Verteilungsfunktion: Treppenfunktion
$F(5)=0,85$
3 Kugeln
4 Kugeln

Erdbeerplantage - Teil II

${\overline {x}}$ = 4,65 Std./Tag
$x_{0,5}$ = 4,5 Std./Tag

Erdbeerplantage - Teil I

Datei:Erdbeerplantage.xlsx

$X$ : “Anzahl der Sonnenstunden pro Tag in dieser Saison”; kardinalskaliert, stetig klassiert

$x_{j}^{u}\leq x_{j}<x_{j}^{o}$	$h(x_{j})$	$f(x_{j})$	$F(x)$	$f_{K}(x_{j})$
0 - 2	20	0,20	0,20	0,10
2 - 3	15	0,15	0,35	0,15
3 - 5	20	0,20	0,55	0,10
5 - 8	35	0,35	0,90	0,12
8 - 12	10	0,10	1,00	0,03
Summe	100	1,0000

Häufigkeitsverteilung: Histogramm

empirische Verteilungsfunktion: stückweise lineare Funktion
an 55 Tagen
3,5 Std./Tag
47,5 %

Festgeldkonten

Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land $x_{0,5}(L)$ berechnet werden. Hierzu wird jeweils die Klasse $x_{j},j\in \{1,2,3,4\}$ bestimmt, in welcher der Median liegt. Bezeichnet $x_{j}^{u}$ die untere Klassengrenze, so ist für klassierte Daten ${\begin{aligned}x_{0,5}(L)&=&x_{j}^{u}+{\frac {0,5-F(x_{j}^{u})}{f(x_{j})}}\cdot (x_{j}^{o}-x_{j}^{u})\\x_{0,5}(1)&=&5,0+{\frac {0,5-0,44}{0,30}}\cdot 0,5=5,1\\x_{0,5}(2)&=&5,0+{\frac {0,5-0,16}{0,34}}\cdot 0,5=5,5\\x_{0,5}(3)&=&5,5+{\frac {0,5-0,375}{0,625}}\cdot 0,5=5,6\\x_{0,5}(4)&=&4,5+{\frac {0,5-0,15}{0,35}}\cdot 0,5=5,0\\x_{0,5}(5)&=&4,5+{\frac {0,5-0,275}{0,375}}\cdot 0,5=4,8\end{aligned}}$ Ermittlung der länderspezifischen variablen Zinssätze $z(L)=0,7z+0,3x_{0,5}(L)$ mit $z=5,2$ :
Land 1: $z(1)=0,7\cdot 5,2+0,3\cdot 5,1=5,17$
Land 2: $z(2)=0,7\cdot 5,2+0,3\cdot 5,5=5,29$
Land 3: $z(3)=0,7\cdot 5,2+0,3\cdot 5,6=5,32$
Land 4: $z(4)=0,7\cdot 5,2+0,3\cdot 5,0=5,14$
Land 5: $z(5)=0,7\cdot 5,2+0,3\cdot 4,8=5,08$
Damit folgt für den durchschnittlichen variablen Zinssatz der Bank:
${\overline {z}}(L)=26/5=5,2$

Fließband

Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. ${\begin{aligned}{\overline {x}}_{H}&=&{\frac {n}{\displaystyle \sum _{i=1}^{n}{\frac {1}{x_{i}}}}}=\displaystyle {\frac {6}{\displaystyle {\frac {1}{2}}+{\frac {1}{4}}+{\frac {1}{8}}+{\frac {1}{10}}+{\frac {1}{8}}+{\frac {1}{5}}}}\\&=&{\frac {6}{0,5+0,25+0,125+0,1+0,125+0,2}}={\frac {6}{1,3}}=4,61538\end{aligned}}$

Führerschein–Entziehungen

${\overline {x}}$ = 35,65 Jahre $\approx$ 36 Jahre
$s$ = 10,39 Jahre; $v$ = 0,2914
$x_{0,25}$ = 26,44 Jahre; $x_{0,75}$ = 43,868 Jahre; $QA$ = 17,428 Jahre
$x_{Z}$ = 34 Jahre
$d$ = 8,6 Jahre

Gartenzwerg–Großhandel

** $X$ $X$ : “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
- Das Merkmal wurde an den einzelnen Aufträgen erhoben
- Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: ${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{j=1}^{k}\cdot x_{j}^{m}\cdot n_{j}{\text{, wobei }}n=\sum _{j=1}^{k}\cdot u_{j}\\{\overline {x}}&={\dfrac {1}{100}}\cdot (10000\cdot 15+35000\cdot 30+100000\cdot 45+225000\cdot 10)\\{\overline {x}}&=79500{\text{ EUR/Auftrag}}\end{aligned}}$
${\overline {x}}$ = a + b $\cdot$ ${\overline {y}}$ ; ${\overline {x}}$ = 0 + 1,5 $\cdot$ 60 000 = 90 000 EUR/Auftrag
**
- Arithmetisches Mittel ${\overline {x}}$ nicht sinnvoll, da Ausreißer vorkommt
- Der Modus $x_{D}$ nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
- Sinnvoll ist hier der Median mit dem Ergebnis $x_{0,5}$ = 12 000 EUR/Auftrag. Da n ungerade ist gilt: ${\begin{aligned}x_{0,5}&=x_{\left({\tfrac {n+1}{2}}\right)}\\&=x_{\left({\tfrac {5+1}{2}}\right)}\\&=x_{(3)}\end{aligned}}$
- ${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{5}}\cdot 45000\\&=9000{\text{ EUR/Auftrag}}\end{aligned}}$
Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: ${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{(95+5+100)}}\cdot (100\cdot 79500+95\cdot 90000+5\cdot 9000)\\&=82725{\text{ EUR/Auftrag}}\end{aligned}}$

Gefahrene Strecke

Gesucht ist der Quartilsabstand: ${\begin{aligned}QA&=x_{0,75}-x_{0,25}\\x_{p}&=x_{j}^{u}+(p-F(x_{j}^{u}))(x_{j}^{o}-x_{j}^{u})/f(x_{j})\\x_{0,25}&=50+(0,25-0,15)50/0,25=70{\text{ km}}\\x_{0,75}&=300+(0,75-0,7)200/0,2=350{\text{ km}}\\QA&=350-70=280{\text{ km}}\end{aligned}}$

Gleisbaubetrieb

Berechnet wurde das einfache arithmetische Mittel. Dies ist jedoch falsch, da das statistische Merkmal Bauzeit/Gleis eine Verhältniszahl ist und die gegebenen Zusatzinformationen über die Bauzeit jedes Bauzuges (8 Stunden) sich inhaltlich auf den Zähler der Verhältniszahl beziehen (In dieser Zusatzinformation steckt die unterschiedliche Anzahl von Gleisen, die von jedem Bauzug in dieser Schicht verlegt wurden und die bei der Berechnung des einfachen arithmetischen Mittels nicht berücksichtigt wurden). Es ist deshalb das einfache harmonische Mittel anzuwenden: ${\overline {x}}_{H}$ = 166,67 Minuten/Gleis.

Glücksspielautomaten

${\overline {x}}(A)=2,0\quad {\overline {x}}(B)=1,893$
$x_{z}(A)=1,75$

Grafische Darstellung

Die beiden Balkendiagramme scheiden aus, da die Variable metrisch stetig ist. Da die Daten klassiert mit unterschiedlicher Klassenbreite vorliegen, muss auf der Ordinatenachse die Häufigkeitsdichte abgetragen werden. Damit scheiden die Histogramme aus, bei denen auf der Ordinatenachse die relativen Häufigkeiten abgetragen wurden.

Alter	unter 15	15-18	18-25	25-65	65-90	$\sum$
Anzahl
der Getöteten	126	76	258	808	638	1906
rel. Häufigkeit	0,06611	0,03987	0,13536	0,42392	0,33473
Häufigkeitsdichte	0,00472	0,01329	0,01934	0,01060	0,01339

Aufgrund dieser Häufigkeitsdichten gibt das Histogramm D die Daten korrekt wieder.

Histogramm

$j$	Klassen	H.-dichte		$F(X)$
1	0 – 2	0,05	0,1	=	$0,05\cdot 2$	0,1
2	2 – 6	0,10	0,4	=	$0,1\cdot 4$	0,5
3	6 – 12	0,05	0,3	=	$0,05\cdot 6$	0,8
4	12 – 20	0,025	0,2	=	$0,025\cdot 8$	1,0
			1,0

${\begin{aligned}F(X)&=&F(x_{j}^{u})+{\frac {x-x_{j}^{u}}{x_{j}^{o}-x_{j}^{u}}}\cdot f(x_{j})\\F(5)&=&0,1+{\frac {5-2}{6-2}}\cdot 0,4=0,1+0,3=0,4\\F(16)&=&0,8+{\frac {16-12}{20-12}}\cdot 0,2=0,8+0,1=0,9\end{aligned}}$ $F(5\leq X\leq 16)=F(16)-F(15)=0,9-0,4=0,5$
$H(5\leq X\leq 16)=F(5\leq X\leq 16)\cdot 110=0,5\cdot 110=55$

55 Gemeinden dieses Landkreises haben eine Einwohnerzahl von mindestens 5000 und höchstens 16000.

Intercity – Zug

${\overline {x}}_{H}$ = 112,5 km/h

Internetstunden

Berechnung von $f(.)$ : $f(x_{j})={\hat {f}}(x_{j})\cdot (x_{j}^{o}-x_{j}^{u})$

Internetstunden
von …bis unter …	${\hat {f}}(x_{j})$	$f(x_{j})$	$F(x_{j})$
0 – 4	0,05	0,20	0,20
4 – 8	0,06	0,24	0,44
8 – 12	0,09	0,36	0,80
12 – 16	0,03	0,12	0,92
16 – 20	0,02	0,08	1,00
		1,00

Medianklasse ist 8 – 12. $x_{z}=x_{j}^{u}+{\frac {0,5-F(x_{j}^{u})}{f(x_{j})}}\cdot (x_{j}^{o}-x_{j}^{u})=8+{\frac {0,5-0,44}{0,36}}\cdot (12-8)=8,6666$

Kaltmieten

Medianklasse ist 10-13. $x_{z}=x_{j}^{u}+{\frac {0,5-F(x_{j}^{u})}{f(x_{j})}}\cdot (x_{j}^{o}-x_{j}^{u})=10+{\frac {0,5-0,45}{0,3}}\cdot (13-10)=10,5$

Wohnfläche (m $^{2}$ )
von …bis unter …	Anzahl	$f(x_{j})$	$F(x_{j})$
0-6	5	0,05	0,05
6-8	10	0,10	0,15
8-10	30	0,30	0,45
10-13	30	0,30	0,75
13-16	20	0,20	0,95
16-20	5	0,05	1,00
	100	1,00

Kartoffeln

$X$ :“Kosten je verladene Tonne Kartoffeln”; ${\overline {x}}_{H}$ = 0,83 EUR/Tonne
$Y$ :“Verladene Tonnen Kartoffeln je Stunde”; ${\overline {y}}$ = 52 t/h

Kaufkurs der Aktien

${\begin{aligned}{\overline {x}}_{H}={\frac {\displaystyle \sum _{j=1}^{k}g_{j}}{\displaystyle \sum _{j=1}^{k}{\frac {g_{j}}{x_{j}}}}}&={\frac {45000+84000+3600+14000}{\displaystyle {\frac {45000}{500}}+{\frac {84000}{600}}+{\frac {3600}{400}}+{\frac {14000}{700}}}}\\&={\frac {146600}{90+140+9+20}}\\&={\frac {146600}{259}}=566,02\end{aligned}}$

oder ${\overline {x}}={\frac {1}{n}}\sum _{j=1}^{k}x_{j}h(x_{j})={\frac {500\cdot 90+600\cdot 140+400\cdot 9+700\cdot 20}{90+140+9+20}}={\frac {146600}{259}}=566,02$

Körperschaftssteueraufkommen

Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich ${\begin{aligned}{\overline {x}}&=&{\frac {1}{n}}\sum _{p=1}^{r}{\overline {x}}_{p}n_{p}\\&=&{\frac {1}{10000}}(100\cdot 9500+9500\cdot 100+300\cdot 200+100\cdot 400)={\frac {2000000}{10000}}=200\\\\s^{2}&=&\sum _{l=1}^{r}{\frac {n_{l}}{n}}s_{l}^{2}+\sum _{l=1}^{r}{\frac {n_{l}}{n}}({\overline {x}}_{l}-{\overline {x}})^{2}\\&=&\left[{\frac {100}{10000}}\cdot (1000)^{2}+{\frac {9500}{10000}}\cdot (80)^{2}+{\frac {300}{10000}}\cdot (100)^{2}+{\frac {100}{10000}}\cdot (250)^{2}\right]\\&+&\left[{\frac {100}{10000}}\cdot (9500-200)^{2}+{\frac {9500}{10000}}\cdot (100-200)^{2}+{\frac {300}{10000}}\cdot (200-200)^{2}\right.\\&+&\left.{\frac {100}{10000}}\cdot (400-200)^{2}\right]\\&=&(10000+6080+300+625)+(864900+9500+0+400)=891805\\\\{\sqrt {s^{2}}}&=&{\sqrt {891805}}=944,3543\approx 944\end{aligned}}$

Kontrollzeiten

X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:
${\begin{aligned}{\overline {x}}_{H}&={\frac {\displaystyle n}{\displaystyle \sum _{i=1}^{n}{\frac {\displaystyle 1}{\displaystyle x_{i}}}}}={\frac {6}{\displaystyle {\frac {1}{0,2}}+{\frac {1}{0,4}}+{\frac {1}{0,8}}+{\frac {1}{0,5}}+{\frac {1}{0,5}}+{\frac {1}{0,8}}}}\\&={\frac {6}{5+2,5+1,25+2+2+1,25}}\\&={\frac {6}{14}}=0,4285\approx 0,429{\mbox{ min/Stück}}\end{aligned}}$ Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:
${\overline {x}}=(6\cdot 480)/6720=2880/6720=0,4285\approx 0,429{\mbox{ min/Stück}}$

Kurzarbeiter

${\overline {x}}$ = 44,328 %
$x_{0,5}$ = 40,36 %

Leichtathletikabteilung

Histogramm
10,8 sec.
$MQ({\overline {x}})=s^{2}=0,0601$ sec $^{2}$ ; $x_{0,5}$ = 10,52 sec.; $MQ(x_{Z})$ = 0,0602
$MQ({\overline {x}})<MQ(x_{Z})$ ; ja; Beweis über den Verschiebungssatz

$MQ(c)={\frac {1}{n}}\sum (x_{i}-c)^{2}={\frac {1}{n}}\sum (x_{i}-{\overline {x}}+{\overline {x}}-c)^{2}=s^{2}+({\overline {x}}-c)^{2};c=x_{0,5}$

Lernzeit

$X$ :“Aufwand für das Studium (in Stunden)”; kardinalskaliert

$x_{j}^{u}\leq x_{j}<x_{j}^{o}$	$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x_{j})$	$f_{K}(x_{j})$
0 - 3	1,5	30	0,3	0,3	0,1
3 - 6	4,5	48	0,48	0,78	0,16
6 - 8	7	17	0,17	0,95	0,085
8 - 12	10	5	0,05	1,00	0,0125

$x_{0,5}$ = 4,25 Stunden
38 Studenten
${\overline {x}}$ = 4,3 Stunden
$x_{D}$ = 4,333 Stunden

Lineares Streuungsmaß

${\begin{aligned}X_{Z}&=&17;d=(1/n)\sum _{i=1}^{n}|x_{i}-x_{Z}|;\\8&=&(1/5)(|3-17|+|7-17|+|17-17|+|19-17|+|x_{5}-17|)\\\Leftrightarrow 40&=&14+10+0+2+x_{5}-17\\\Leftrightarrow x_{5}&=&31\end{aligned}}$

Maschinen

$v_{Fiat}$ = 0,05; $v_{Mercedes}$ = 0,02

Miete und Wohnfläche

$s_{xy}=\displaystyle {\frac {1}{n}}\sum x_{i}y_{i}-{\overline {x}}\cdot {\overline {y}}$
${\overline {x}}=\displaystyle {\frac {3\cdot 40+60+2\cdot 80+4\cdot 90}{10}}={\frac {700}{10}}=70$
${\overline {y}}=\displaystyle {\frac {3\cdot 12+15+9+5\cdot 10}{10}}={\frac {110}{10}}=11$
${\overline {x}}=70$ , ${\overline {y}}=11$ , $\sum x_{i}y_{i}=7390$

$\rightarrow s_{xy}=7390/10-70\cdot 11=-31$

Minimale Summe

$c={\bar {x}}=10$
Begründung:
Quadratische Minimumseigenschaft des arithmetischen Mittels

Nelkenstrauß

${\overline {x}}$ = 0,95 EUR/Nelke

Neubauwohnungen

${\overline {x}}$ = 9,15 Monate/Wohnungseinheit
$x_{0,5}$ = 8,5403 Monate/Wohnungseinheit
$x_{D}$ = 7,3846 Monate/Wohnungseinheit

Perlenkette

Durchmesser	$h(x_{j})$	$f(x_{j})$	$F(x_{j})$
3 - 4	20	0,278	0,278
4 - 5	21	0,292	0,570
5 - 6	19	0,264	0,834
6 - 7	9	0,125	0,959
7 - 8	3	0,041	1,000

${\overline {x}}$ = 4,861 mm
$x_{D}$ = 4,33 mm
$x_{0,5}$ = 4,76 mm

Produktionsleistung einer Maschine

${\overline {x}}$ = 296,75 Stück/Tag; 296,75/300 = 0,9892

Die Maschine ist durchschnittlich zu 98,92 % pro Tag ausgelastet; die Behauptung ist richtig.
$x_{Z}$ = 296,5 Stück/Tag; $d$ = 1,15 Stück/Tag

Reinigungsunternehmen - Teil II

$s_{1}^{2}$ = 45 693; $s_{1}$ = 213,759; $v_{1}$ = 0,086
$s_{2}^{2}$ = 4848,75; $s_{2}$ = 69,633; $v_{2}$ = 0,02467
$s_{3}^{2}$ = 12 032,4; $s_{3}$ = 109,692; $v_{3}$ = 0,04441 ${\begin{aligned}s^{2}&=\sum \limits _{l=1}^{3}{\dfrac {n_{l}}{n}}s_{l}^{2}+\sum \limits _{l=1}^{3}{\dfrac {n_{l}}{n}}({\overline {x}}_{l}-{\overline {x}})^{2}\\&={\dfrac {6}{15}}\cdot 45693+{\dfrac {4}{15}}\cdot 4848,75\\&+{\dfrac {5}{15}}\cdot 12032,4+{\dfrac {6}{15}}(-83,2)^{2}+{\dfrac {4}{15}}\cdot 251,3^{2}+{\dfrac {5}{15}}(-101,2)^{2}\\&=23581+23023,16\\&=46604,16\\\\s&=215,88{\text{ EUR;}}\\v&=0,08396\end{aligned}}$

Reinigungsunternehmen - Teil I

${\overline {x}}$ = 2488 EUR; $x_{0,5}$ = 2470,5 EUR;
${\overline {x}}$ = 2822,5 EUR; $x_{0,5}$ = 2798 EUR;
${\overline {x}}$ = 2470 EUR; $x_{0,5}$ = 2454 EUR;
${\overline {x}}$ = 2571,2 EUR; $x_{0,5}$ = 2546 EUR.

Sanatorium

Spearman’scher Rangkorrelationsoeffizient $r_{S}=1-{\frac {6\sum _{i=1}^{n}d_{i}^{2}}{n(n^{2}-1)}},\quad {\text{wobei:}}\quad d_{i}={\text{Rang }}x_{i}-{\text{Rang }}y_{i}$

Zusammenhang zwischen Gewicht und Laufleistung:

Platzierung Y	Gewicht X	Rang Gewicht	Differenz²
1	70	2	1
2	60	1	1
3	80	6	9
4	77	3	1
5	82	8	9
6	81	7	1
7	78	4	9
8	100	10	4
9	83	9	0
10	110	11	1
11	79	5	36

${\begin{aligned}\sum _{i=1}^{n}d_{i}^{2}&=1+1+9+1+9+1+9+4+0+1+36\\&=72\\\end{aligned}}$

$r_{S}=1-{\frac {6\cdot 72}{11(11^{2}-1)}}=0,6727$

a) Median für nicht klassierte Daten, $n$ ungerade $x_{Z}=x_{0.5}=x_{({\frac {n+1}{2}})}=x_{6}=80{\text{ kg }}$
Quadratisches Streuungsmaßim Bezug auf Median

${\begin{aligned}MQ(x_{Z})&=MQ(x_{0,5})={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-x_{0,5})^{2}\\&=((70-80)^{2}+(60-80)^{2}+(80-80)^{2}\\&+(77-80)^{2}+(82-80)^{2}+(81-80)^{2}\\&+(78-80)^{2}+(100-80)^{2}+(83-80)^{2}\\&+(110-80)^{2}+(79-80)^{2})\cdot {\frac {1}{11}}\\&={\frac {1828}{11}}=166,18\\\end{aligned}}$
Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.
Durchschnittsgeschindigkeit der Frauen?
- Eine Frau läuft den Lauf mit $2$ m/s
- Die andere Frau läuft den Lauf mit $4$ m/s
Insgesamt wurden $100$ m gelaufen, $50$ m mit $2$ m/s und $50$ m mit $4$ m/s. Kann auch wie eine Frau betrachtet werden die erst $50$ m langsamer und dann $50$ m schneller läuft.
Harmonisches Mittel:

${\begin{aligned}{\overline {x}}_{H}&={\frac {50m+50m}{{\frac {50m}{2m/s}}+{\frac {50m}{4m/s}}}}={\frac {100m}{25s+12,5s}}\\&={\frac {100m}{37,5s}}=2,667m/s\\\end{aligned}}$

Schafzucht Teil - II

Pfund = Gebühr + Wechselkurs $\cdot$ Gulden, $y_{i}=a+b\cdot x_{i}$
${\overline {x}}$ = 7,8 Tsd. Gulden; $s_{x}^{2}$ = 37,76 (Tsd. Gulden) $^{2}$ ;
${\overline {y}}$ = 3,1 Tsd. Pfund; $s_{y}^{2}$ = 9,44 (Tsd. Pfund) $^{2}$ ;
${\overline {y}}$ = 3,1 = a + b ${\overline {x}}$ ; $s_{y}^{2}=b^{2}\cdot s_{x}^{2}$
$a=3,1-7,8b$ ; $b^{2}=s_{y}^{2}/s_{x}^{2}$ = 0,25; $b=0,5$
$a=3,1-0,5\cdot$ 7,8 = - 0,8
Gebühr: 0,8 Tsd. Pfund; Wechselkurs: 1 Pfund : 2 Gulden

Schafzucht - Teil I

Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im Verhältnis zur Leistung gegeben ist: ${\overline {x}}_{H}={\dfrac {\sum _{j=1}^{k}g_{j}}{\sum _{j=1}^{k}{\dfrac {g_{j}}{x_{j}}}}},$ wobei $g_{1}$ die Lohnsumme für die Irischen Arbeiter und $g_{2}$ die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass $g_{1}=285$ und $g_{2}=260$ , und $x_{1}=15$ den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und $x_{2}=20$ den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: ${\begin{aligned}{\overline {x}}_{H}&={\dfrac {\sum _{j=1}^{k}g_{j}}{\sum _{j=1}^{k}{\dfrac {g_{j}}{x_{j}}}}}\\&={\dfrac {285+260}{{\dfrac {285}{15}}+{\dfrac {260}{20}}}}\\&={\dfrac {545}{19+13}}=17,03{\dfrac {\text{Pfund}}{\text{kg}}}\end{aligned}}$

Schulbezirke

Für Variable $X$ : $X={\mbox{nominal, nur Modus}}$
Für Variable $Y$ : $Y={\mbox{metrisch, alle außer Modus}}$

Streuungsmaß

Begründung:

Gegeben $n=50$ Elemente, $k=2$
$K(50;2)=1225$

metrisch (kardinal) skalierte Merkmale

Tägliche Arbeitswege - Teil II

$x_{0,25}$ = 4; $x_{0,75}$ = 22,5; $QA$ = 18,5 km
$x_{Z}$ = 10,4286 km; $d$ = 9,53 km

Tägliche Arbeitswege - Teil I

Beschäftigter; Anfahrtsweg (in km) pro Beschäftigter; kardinalskaliert
{|class="wikitable" !align="right"| Anfahrtsweg !align="right"| $h(x_{j})$ !align="right"| $f(x_{j})$ !align="right"| $F(x_{j})$ !align="right"| $f_{K}(x_{j})$ |- |align="right"| 0 - 1 |align="right"| 7 |align="right"| 0,07 |align="right"| 0,07 |align="right"| 0,07 |- |align="right"| 1 - 5 |align="right"| 24 |align="right"| 0,24 |align="right"| 0,31 |align="right"| 0,06 |- |align="right"| 5 - 15 |align="right"| 35 |align="right"| 0,35 |align="right"| 0,66 |align="right"| 0,035 |- |align="right"| 15 - 30 |align="right"| 18 |align="right"| 0,18 |align="right"| 0,84 |align="right"| 0,012 |- |align="right"| 30 - 50 |align="right"| 16 |align="right"| 0,16 |align="right"| 1,00 |align="right"| 0,008 |}
${\overline {x}}$ = 14,705 km
$x_{D}$ = 0,875 km; Modus
$x_{0,5}$ = 10,4286 km
$x_{0,05}$ = 0,7143 km; $x_{0,25}$ = 4 km; $x_{0,75}$ = 22,5 km; $x_{0,9}$ = 37,5 km

Tarifverhandlungen

X: Jahresbruttolohn vor der Tarifverhandlung, Y:Jahresbruttolohn nach der Tarifverhandlung; ${\overline {x}}=21200{\mbox{ EUR}}$ ${\overline {y}}={\frac {\sum _{i=1}^{n}y_{i}}{n}}={\frac {\sum _{i=1}^{n_{1}}(a_{1}+bx_{i})+\sum _{i=n_{1}+1}^{n_{2}}(a_{2}+bx_{i})}{n}}={\frac {n_{1}a_{1}+n_{2}a_{2}}{n}}+b{\overline {x}}$
$n_{1}=4000,n_{2}=16000,n=20000,a_{1}=200,a_{2}=0,b=1,05;{\overline {y}}=4000\cdot 200/20000+1,05\cdot 21200=40+22260=22300$ EUR

Tekolom und IBBM - Teil I

$X={\mbox{Kurs der Tekolom--Aktie}}$ , $Y={\mbox{Kurs der IBBM--Aktie}}$ ,
relative Häufigkeiten: $f_{1}=73/365=0,2$ ; $f_{2}=146/365=0,4$ ; $f_{3}=146/365=0,4$
${\overline {x}}=\sum f_{i}x_{i}$ , ${\overline {y}}=\sum f_{i}y_{i}$ , $s_{X}^{2}=\sum f_{i}(x_{i}-{\overline {x}})^{2}$ , $s_{Y}^{2}=\sum f_{i}(y_{i}-{\overline {y}})^{2}$ ,
$s_{XY}=\sum f_{i}(x_{i}-{\overline {x}})(y_{i}-{\overline {y}})$
${\overline {x}}=41$ , ${\overline {y}}=126$ , $s_{X}^{2}=14$ , $s_{Y}^{2}=14$ , $s_{XY}=4$ , $\rho =\displaystyle {\frac {s_{XY}}{s_{X}s_{Y}}}=0,28571$

Telefonanbieter

${\overline {x}}_{H}=\displaystyle {\frac {\mbox{Gesamtsumme}}{\mbox{Gesamtdauer}}}=\displaystyle {\frac {78,75}{525}}=0,15$

Telefon–Interviews

$10Minuten|Freizeit=0,48$ EUR, 18 Interviews
${\text{ }}\qquad 10\cdot 60Sek.=600/150=4Einheiten\cdot 12=48Cent$
$10Minuten|Tag=0,84$ EUR, 10 Interviews
${\text{ }}\qquad 10\cdot 60Sek.=600/90=6,{\overline {66}}Einheiten\rightarrow 7\cdot 12=84Cent$
$20Minuten|Freizeit=0,96$ EUR, 11 Interviews
${\text{ }}\qquad 20\cdot 60Sek.=1200/150=8Einheiten\cdot 12=96Cent$
$20Minuten|Tag=1,68$ EUR, 20 Interviews
${\text{ }}\qquad 20\cdot 60Sek.=1200/90=13,{\overline {33}}Einheiten\rightarrow 14\cdot 12=168Cent$
${\overline {X}}=(18\cdot 0,48+10\cdot 0,84+11\cdot 0,96+20\cdot 1,68)/59=1,037$

Tennis Turniere

$X$ : “Anzahl der pro Turnier bis zum Ausscheiden gespielten Runden”; kardinalskaliert, diskret

$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x)$
1	10	0,25	0,25
2	16	0,40	0,65
4	6	0,15	0,80
5	6	0,15	0,95
6	2	0,05	1,00
Summe	40	1,00

Treppenfunktion
65 %
20 %
30 Turnieren
4. Runde
2. Runde
$F(7)$ = 1; d.h. jedes Turnier ging nur über 6 Runden; daher konnte B.B. niemals in eine 7. Runde gelangen, er war also in 100 % aller Turniere in Runde 7 (=x) ausgeschieden.

Walzabteilung

X = “Bearbeitungszeit in sec./Stück)”;
Y = “hergestellte Stück pro Stunde”

a) Man berechnet das harmonische Mittel wie folgt: ${\begin{aligned}{\overline {x}}_{H}&={\dfrac {n}{\sum _{i=1}^{n}\cdot {\dfrac {1}{x_{i}}}}}\\&={\dfrac {4}{{\dfrac {1}{20}}+{\dfrac {1}{30}}+{\dfrac {1}{60}}+{\dfrac {1}{60}}}}\\&=34,286{\text{ sec./Stück}}\end{aligned}}$ b) Man berechnet das arithmetische Mittel wie folgt: ${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{2000}}\cdot (1000\cdot 20+500\cdot 30+300\cdot 60+200\cdot 60)\\&=32,5{\text{ sec./Stück}}\end{aligned}}$
a)
Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: ${\begin{aligned}{\text{A produziert}}{\dfrac {3600{\text{ sec}}}{20{\text{ sec}}}}&=180{\text{ Stück pro Stunde}}\\{\text{B produziert}}{\dfrac {3600{\text{ sec}}}{30{\text{ sec}}}}&=120{\text{ Stück pro Stunde}}\\{\text{C und D produzieren jeweils}}{\dfrac {3600{\text{ sec}}}{60{\text{ sec}}}}&=60{\text{ Stück pro Stunde}}\end{aligned}}$
Anschließend wird das arithmetische Mittel berechnet: ${\begin{aligned}{\overline {y}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{4}}\cdot (180+120+60+60)\\&=105{\text{ Stück/h}}\end{aligned}}$ b) Das harmonische Mittel wird errechnet: ${\begin{aligned}{\overline {y}}_{H}&={\dfrac {n}{\sum _{i=1}^{n}\cdot {\dfrac {1}{x_{i}}}}}\\&={\dfrac {2000}{{\dfrac {1000}{180}}+{\dfrac {500}{120}}+{\dfrac {300}{60}}+{\dfrac {200}{60}}}}\\&=110,77{\text{ Stück/h}}\end{aligned}}$

Wanderer

${\overline {x}}_{H}$ = 4,8 km/h

WM–Berichterstattung

$X$ : “Fernsehkonsum (in Std.) während der letzten Fußball-WM” kardinalskaliert, diskret

$x_{j}$	$h(x_{j})$	$f(x_{j})$	$F(x)$
0	1	0,05	0,05
1	2	0,10	0,15
2	8	0,40	0,55
3	4	0,20	0,75
4	5	0,25	1,00
Summe	20	1,00

1 Std.
2 Std.
3 Std.

Zigaretten

empirische Verteilungsfunktion,
Annahme: Gleichverteilung der Merkmalswerte innerhalb jeder Klasse

$X$ : “Anzahl der gerauchten Zigaretten pro Tag”

$x_{j}^{u}$ $\leq$ $X$ $<$ $x_{j}^{o}$	$h(x_{j})$	$f(x_{j})$	$F(x)$	$f_{K}(x_{j})$
0 - 5	10	0,05	0,05	0,01
5 - 10	40	0,20	0,25	0,04
10 - 20	90	0,45	0,70	0,045
20 - 40	60	0,30	1,00	0,015
Summe	200	1,0000

0,3

Zuckergewicht

Füllgewicht	$h(x_{j})$	$f(x_{j})$	$F(x_{j})$	$f_{K}(x_{j})$
980 - 990	5	0,067	0,067	0,0067
990 - 995	12	0,160	0,227	0,032
995 - 1000	23	0,307	0,534	0,0614
1000 - 1005	22	0,293	0,827	0,0586
1005 - 1010	11	0,147	0,974	0,0294
1010 - 1020	2	0,026	1,000	0,0026

$x_{D}$ = 999,565 g; $x_{0,5}$ = 999,446 g; ${\overline {x}}$ = 999,27 g

Zugfolge - Teil II

Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.

Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: ${\begin{aligned}x_{D}&=x_{2}^{u}+{\dfrac {f_{K}(x_{2})-f_{K}(x_{2-1})}{2f_{K}(x_{2})-f_{K}(x_{2-1})-f_{K}(x_{2+1})}}\cdot (x_{2}^{o}-x_{2}^{u})\\&=30+{\dfrac {{\dfrac {0,4595}{30}}-{\dfrac {0,3784}{30}}}{2\cdot {\dfrac {0,4595}{30}}-{\dfrac {0,3784}{30}}-{\dfrac {0,1351}{30}}}}\cdot (60-30)\\&=30+{\dfrac {1}{5}}\cdot 30=36\end{aligned}}$ 36 .
Für den Median von klassierten Daten gilt die folgende Formel:
${\begin{aligned}x_{0,5}&=F(x_{0},5)\Leftrightarrow \\x_{0,5}&=x_{j}^{u}+{\dfrac {(0,5-F(x_{j}^{u}))}{f(x_{j}^{m})}}\cdot (x_{j}^{o}-x_{j}^{u})\\x_{0,5}&=30+{\dfrac {(0,5-0,3784)}{0,4595}}\cdot 30\\&=37,94{\text{Minuten}}.\\\end{aligned}}$ Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei $x_{j}^{m}$ die Klassenmitte und $n_{j}$ die Anzahl der Beobachtungen in Klasse j beschreibt:
${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{j=1}^{k}\cdot x_{j}^{m}\cdot n_{j}\\&={\dfrac {1}{37}}\cdot (15\cdot 14+45\cdot 17+75\cdot 5+105\cdot 1)\\&=39,324{\text{ Minuten}}\\\end{aligned}}$

Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.

Man berechnet das Arithmetische Mittel ${\overline {x}}$ von nicht-klassierten Daten wie folgt: ${\begin{aligned}{\overline {x}}&={\dfrac {1}{n}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{37}}\cdot \sum _{i=1}^{n}\cdot x_{i}\\&={\dfrac {1}{37}}\cdot 1440\\&=38,92{\text{ Minuten}}\end{aligned}}$

Zugfolge - Teil I

$X$ : “Zugfolgeabstand”; kardinalskaliert, stetig

und c) Zugfolgeabstand (Von ... bis unter ...)

	$h(x_{j})$	$f(x_{j})$	$F(x_{j}^{o})$	$f_{K}(x_{j})$
0	–	30	14	0,3784	0,3784	0,0126
30	–	60	17	0,4595	0,8379	0,0153
60	–	90	5	0,1351	0,9730	0,0045
90	–	120	1	0,0270	1,0000	0,0009
	37	1,0000

Häufigkeitsverteilung: Histogramm
empirische Verteilungsfunktion: stückweise lineare Funktion

@@ Zeile 836: / Zeile 836: @@
 <p>Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion</p></li>
 <li><ul>
-<li><p><math>P[\{750 \leq Z \leq 1300\}] = F(1300) - F(750)</math> <math>\begin{align}
+<li><p><math>P[\{750 \leq Z \leq 1300\}] = F(1300) - F(750)</math>
+<br>
+<math>\begin{align}
 F(1300) &=& 0,88 + \frac{1300 - 1200}{1450 - 1200} \cdot 0,12 = 0,928 \\
 F(750) &=& 0,48 + \frac{750-700}{900 - 700} \cdot 0,32 = 0,56 \\
@@ Zeile 1.245: / Zeile 1.247: @@
 ===Festgeldkonten===
-Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land <math>x_{0,5}(L)</math> berechnet werden. Hierzu wird jeweils die Klasse <math>x_j, j\in\{1,2,3,4\}</math> bestimmt, in welcher der Median liegt. Bezeichnet <math>x_j^u</math> die untere Klassengrenze, so ist für klassierte Daten <math>\begin{aligned}
+Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land <math>x_{0,5}(L)</math> berechnet werden. Hierzu wird jeweils die Klasse <math>x_j, j\in\{1,2,3,4\}</math> bestimmt, in welcher der Median liegt. Bezeichnet <math>x_j^u</math> die untere Klassengrenze, so ist für klassierte Daten <math>\begin{align}
     x_{0,5}(L)&=&x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)\\
     x_{0,5}(1)&=&5,0+\frac{0,5-0,44}{0,30}\cdot0,5=5,1\\
@@ Zeile 1.252: / Zeile 1.254: @@
     x_{0,5}(4)&=&4,5+\frac{0,5-0,15}{0,35}\cdot0,5=5,0\\
     x_{0,5}(5)&=&4,5+\frac{0,5-0,275}{0,375}\cdot0,5=4,8
-  \end{aligned}</math> Ermittlung der länderspezifischen variablen Zinssätze <math>z(L)=0,7z+0,3x_{0,5}(L)</math> mit <math>z=5,2</math>:<br />
+  \end{align}</math> Ermittlung der länderspezifischen variablen Zinssätze <math>z(L)=0,7z+0,3x_{0,5}(L)</math> mit <math>z=5,2</math>:<br />
 Land 1: <math>z(1)=0,7\cdot5,2+0,3\cdot5,1=5,17</math><br />
 Land 2: <math>z(2)=0,7\cdot5,2+0,3\cdot5,5=5,29</math><br />
@@ Zeile 1.263: / Zeile 1.265: @@
 ===Fließband===
-Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. <math>\begin{aligned}
+Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. <math>\begin{align}
 \overline{x}_H&=&\frac{n}{\displaystyle \sum_{i=1}^n\frac{1}{x_i}}=\displaystyle\frac{6}{\displaystyle\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{10}+\frac{1}{8}+\frac{1}{5}}\\
-&=&\frac{6}{0,5+0,25+0,125+0,1+0,125+0,2}=\frac{6}{1,3}=4,61538\end{aligned}</math>
+&=&\frac{6}{0,5+0,25+0,125+0,1+0,125+0,2}=\frac{6}{1,3}=4,61538\end{align}</math>
 ===Führerschein–Entziehungen===
@@ Zeile 1.279: / Zeile 1.281: @@
 * ** <math>X</math>: “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
 ** Das Merkmal wurde an den einzelnen Aufträgen erhoben
-** Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: <math>\begin{aligned}
+** Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: <math>\begin{align}
     \overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j\text{, wobei } n = \sum_{j=1}^{k} \cdot u_j \\
     \overline{x} &= \dfrac{1}{100} \cdot (10000 \cdot 15 + 35000 \cdot 30 + 100000 \cdot 45 + 225000 \cdot 10) \\
     \overline{x} &= 79 500 \text{ EUR/Auftrag}
-    \end{aligned}</math>
+    \end{align}</math>
 * <math>\overline{x}</math>= a + b <math>\cdot</math> <math>\overline{y}</math>; <math>\overline{x}</math> = 0 + 1,5<math>\cdot</math>60 000 = 90 000 EUR/Auftrag
 * **
 ** Arithmetisches Mittel <math>\overline{x}</math> nicht sinnvoll, da Ausreißer vorkommt
 ** Der Modus <math>x_{D}</math> nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
-** Sinnvoll ist hier der Median mit dem Ergebnis <math>x_{0,5}</math> = 12 000 EUR/Auftrag. Da n ungerade ist gilt: <math>\begin{aligned}
+** Sinnvoll ist hier der Median mit dem Ergebnis <math>x_{0,5}</math> = 12 000 EUR/Auftrag. Da n ungerade ist gilt: <math>\begin{align}
                 x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
                 &= x_{\left(\tfrac{5+1}{2}\right)} \\
                 &= x_{(3)}
-                \end{aligned}</math>
+                \end{align}</math>
-** <math>\begin{aligned}
+** <math>\begin{align}
                 \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
                 &= \dfrac{1}{5} \cdot 45000 \\
                 &= 9 000 \text{ EUR/Auftrag}
-               \end{aligned}</math>
+               \end{align}</math>
-* Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: <math>\begin{aligned}
+* Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: <math>\begin{align}
 \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 &= \dfrac{1}{(95 + 5 + 100)} \cdot (100 \cdot 79500 + 95 \cdot 90000 + 5 \cdot 9000) \\
-&= 82 725 \text{ EUR/Auftrag}\end{aligned}</math>
+&= 82 725 \text{ EUR/Auftrag}\end{align}</math>
 ===Gefahrene Strecke===
-Gesucht ist der Quartilsabstand: <math>\begin{aligned}
+Gesucht ist der Quartilsabstand: <math>\begin{align}
 QA    &=x_{0,75}-x_{0,25}\\
 x_p   &=x_j^u+(p-F(x_j^u))(x_j^o-x_j^u)/f(x_j)\\
 x_{0,25}&=50+(0,25-0,15)50/0,25=70 \text{ km}\\
 x_{0,75}&=300+(0,75-0,7)200/0,2=350 \text{ km}\\
-QA&=350-70=280 \text{ km}\end{aligned}</math>
+QA&=350-70=280 \text{ km}\end{align}</math>
 ===Gleisbaubetrieb===
@@ Zeile 1.444: / Zeile 1.446: @@
 <br />
 <br />
-<math>\begin{aligned}
+<math>\begin{align}
      F(X)&=&F(x_j^u)+\frac{x-x_j^u}{x_j^o-x_j^u}\cdot f(x_j)\\
      F(5)&=&0,1+\frac{5-2}{6-2}\cdot0,4=0,1+0,3=0,4\\
-     F(16)&=&0,8+\frac{16-12}{20-12}\cdot0,2=0,8+0,1=0,9\end{aligned}</math> <math>F(5\leq X\leq16)=F(16)-F(15)=0,9-0,4=0,5</math><br />
+     F(16)&=&0,8+\frac{16-12}{20-12}\cdot0,2=0,8+0,1=0,9\end{align}</math> <math>F(5\leq X\leq16)=F(16)-F(15)=0,9-0,4=0,5</math><br />
 <math>H(5\leq X\leq16)=F(5\leq X\leq16)\cdot110=0,5\cdot110=55</math><br />
 <br />
@@ Zeile 1.577: / Zeile 1.579: @@
 ===Kaufkurs der Aktien===
-<math>\begin{aligned}
+<math>\begin{align}
 \overline{x}_H = \frac{\displaystyle\sum_{j=1}^{k}g_j}{\displaystyle\sum_{j=1}^k\frac{g_j}{x_j}} &= \frac{45000+84000+3600+14000}{\displaystyle\frac{45000}{500}+\frac{84000}{600}+\frac{3600}{400}+\frac{14000}{700}} \\
 &= \frac{146600}{90+140+9+20} \\
-&=\frac{146600}{259}=566,02\end{aligned}</math>
+&=\frac{146600}{259}=566,02\end{align}</math>
 oder<math>\overline{x}=\frac{1}{n}\sum_{j=1}^kx_jh(x_j)=\frac{500\cdot90+600\cdot140+400\cdot9+700\cdot20}{90+140+9+20}=\frac{146600}{259}=566,02</math>
@@ Zeile 1.586: / Zeile 1.588: @@
 ===Körperschaftssteueraufkommen===
-Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich <math>\begin{aligned}
+Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich <math>\begin{align}
     \overline{x}&=&\frac{1}{n}\sum_{p=1}^r\overline{x}_pn_p\\
     &=&\frac{1}{10000}(100\cdot9500+9500\cdot100+300\cdot200+100\cdot400)=\frac{2000000}{10000}=200\\ \\
@@ Zeile 1.594: / Zeile 1.596: @@
       &=&(10000+6080+300+625)+(864900+9500+0+400)=891805\\ \\
     \sqrt{s^2}&=&\sqrt{891805}=944,3543\approx944
-  \end{aligned}</math>
+  \end{align}</math>
 ===Kontrollzeiten===
 X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:<br />
-<math>\begin{aligned}
+<math>\begin{align}
 \overline{x}_H &=\frac{\displaystyle n}{\displaystyle\sum_{i=1}^n\frac{\displaystyle1}{\displaystyle x_i}} =\frac{6}{\displaystyle\frac{1}{0,2}+\frac{1}{0,4}+\frac{1}{0,8}+\frac{1}{0,5}+\frac{1}{0,5}+\frac{1}{0,8}}\\
 &= \frac{6}{5+2,5+1,25+2+2+1,25} \\
-&=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{aligned}</math> Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:<br />
+&=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{align}</math> Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:<br />
 <math>\overline{x}=(6\cdot480)/6720=2880/6720=0,4285\approx0,429\mbox{ min/Stück}</math>
@@ Zeile 1.669: / Zeile 1.671: @@
 ===Lineares Streuungsmaß===
-<math>\begin{aligned}
+<math>\begin{align}
 X_Z &=& 17; d = (1/n)\sum_{i=1}^n|x_i - x_Z| ;\\ 8 &=& (1/5)(|3-17|+|7-17|+|17-17|+|19-17|+|x_5-17|)\\ \Leftrightarrow 40 &=& 14+10+0+2+x_5-17
-\\ \Leftrightarrow x_5 &=& 31\end{aligned}</math>
+\\ \Leftrightarrow x_5 &=& 31\end{align}</math>
 ===Maschinen===
@@ Zeile 1.751: / Zeile 1.753: @@
 <math>s_{1}^{2}</math> = 45 693; <math>s_{1}</math> = 213,759; <math>v_{1}</math> = 0,086<br />
 <math>s_{2}^{2}</math> = 4848,75; <math>s_{2}</math> = 69,633; <math>v_{2}</math> = 0,02467<br />
-<math>s_{3}^{2}</math> = 12 032,4; <math>s_{3}</math> = 109,692; <math>v_{3}</math> = 0,04441 <math>\begin{aligned}
+<math>s_{3}^{2}</math> = 12 032,4; <math>s_{3}</math> = 109,692; <math>v_{3}</math> = 0,04441 <math>\begin{align}
 s ^{2}&= \sum\limits_{l=1} ^3\dfrac{n_{l}}{n}s_{l} ^{2}+ \sum\limits
        _{l=1} ^3\dfrac{n_{l}}{n}(\overline{x}_{l}- \overline{x}) ^{2} \\
@@ Zeile 1.760: / Zeile 1.762: @@
       \\
       s&= 215,88 \text{ EUR;} \\
-     v&= 0,08396\end{aligned}</math>
+     v&= 0,08396\end{align}</math>
 ===Reinigungsunternehmen - Teil I===
@@ Zeile 1.839: / Zeile 1.841: @@
 |}
-<p><math>\begin{aligned}
+<p><math>\begin{align}
    \sum_{i=1}^n d_i^2  &= 1+1+9+1+9+1+9+4+0+1+36\\
-         &= 72\\\end{aligned}</math></p>
+         &= 72\\\end{align}</math></p>
 <p><math>r_{S}=  1- \frac{6\cdot72}{11(11^2 -1)}=0,6727</math></p></li>
 <li><p>a) Median für nicht klassierte Daten,<math> n</math> ungerade <math>x_{Z}= x_{0.5}=x_{(\frac{n+1}{2})}=x_6=80 \text{ kg }</math></p></li>
 <li><p>Quadratisches Streuungsmaßim Bezug auf Median</p>
-<p><math>\begin{aligned}
+<p><math>\begin{align}
   MQ(x_{Z})&= MQ(x_{0,5}) = \frac{1}{n}\sum_{i=1}^n  (x_i - x_{0,5})^2\\ &=((70-80)^2+(60-80)^2+(80-80)^2\\&+(77-80)^2+(82-80)^2+(81-80)^2\\&+(78-80)^2+(100-80)^2+(83-80)^2\\&+(110-80)^2+(79-80)^2)\cdot\frac{1}{11} \\
-&= \frac{1828}{11} = 166,18\\\end{aligned}</math></p></li>
+&= \frac{1828}{11} = 166,18\\\end{align}</math></p></li>
 <li><p>Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.</p></li>
 <li><p>Durchschnittsgeschindigkeit der Frauen?</p>
@@ Zeile 1.856: / Zeile 1.858: @@
 <p>Insgesamt wurden <math>100</math>m gelaufen, <math>50</math>m mit <math>2</math>m/s und <math>50</math>m mit <math>4</math>m/s. Kann auch wie eine Frau betrachtet werden die erst <math>50</math>m langsamer und dann <math>50</math>m schneller läuft.<br />
 Harmonisches Mittel:</p>
-<p><math>\begin{aligned}
+<p><math>\begin{align}
      \overline{x}_{H}&=  \frac{50m+50m}{\frac{50m}{2m / s} +\frac{50m}{4m / s}} = \frac{100m}{25s +12,5s }\\
        &=\frac{100m}{37,5s}=2,667  m / s\\
-    \end{aligned}</math></p></li></ul>
+    \end{align}</math></p></li></ul>
 ===Schafzucht Teil - II===
@@ Zeile 1.874: / Zeile 1.876: @@
 ===Schafzucht - Teil I===
-Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im '''Verhältnis''' zur Leistung gegeben ist: <math>\overline{x}_H = \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}},</math> wobei <math>g_1</math> die Lohnsumme für die Irischen Arbeiter und <math>g_2</math> die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass <math>g_1 =285</math> und <math>g_2 =260</math>, und <math>x_1=15</math> den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und <math>x_2=20</math> den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: <math>\begin{aligned}
+Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im '''Verhältnis''' zur Leistung gegeben ist: <math>\overline{x}_H = \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}},</math> wobei <math>g_1</math> die Lohnsumme für die Irischen Arbeiter und <math>g_2</math> die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass <math>g_1 =285</math> und <math>g_2 =260</math>, und <math>x_1=15</math> den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und <math>x_2=20</math> den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: <math>\begin{align}
 \overline{x}_H &= \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}}\\
                  &= \dfrac{285+ 260}{\dfrac{285}{15}+\dfrac{260}{20}}\\
-                 &= \dfrac{545}{19+13}=17,03 \dfrac{\text{Pfund} }{\text{kg}}\end{aligned}</math>
+                 &= \dfrac{545}{19+13}=17,03 \dfrac{\text{Pfund} }{\text{kg}}\end{align}</math>
 ===Schulbezirke===
@@ Zeile 2.032: / Zeile 2.034: @@
 Y = “hergestellte Stück pro Stunde”
-* a) Man berechnet das harmonische Mittel wie folgt: <math>\begin{aligned}
+* a) Man berechnet das harmonische Mittel wie folgt: <math>\begin{align}
 \overline{x}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
                   &= \dfrac{4}{\dfrac{1}{20} + \dfrac{1}{30} + \dfrac{1}{60} + \dfrac{1}{60}} \\
-                  &= 34,286 \text{ sec./Stück}\end{aligned}</math> b) Man berechnet das arithmetische Mittel wie folgt: <math>\begin{aligned}
+                  &= 34,286 \text{ sec./Stück}\end{align}</math> b) Man berechnet das arithmetische Mittel wie folgt: <math>\begin{align}
 \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
               &= \dfrac{1}{2000} \cdot (1000 \cdot 20 + 500 \cdot 30 + 300 \cdot 60 + 200 \cdot 60) \\
-              &= 32,5 \text{ sec./Stück}\end{aligned}</math>
+              &= 32,5 \text{ sec./Stück}\end{align}</math>
 * a)
-* Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: <math>\begin{aligned}
+* Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: <math>\begin{align}
 \text{A produziert} \dfrac{3600 \text{ sec}}{20 \text{ sec}} &= 180 \text{ Stück pro Stunde} \\
 \text{B produziert} \dfrac{3600 \text{ sec}}{30 \text{ sec}} &= 120 \text{ Stück pro Stunde} \\
-\text{C und D produzieren jeweils} \dfrac{3600 \text{ sec}}{60 \text{ sec}} &= 60 \text{ Stück pro Stunde}\end{aligned}</math>
+\text{C und D produzieren jeweils} \dfrac{3600 \text{ sec}}{60 \text{ sec}} &= 60 \text{ Stück pro Stunde}\end{align}</math>
-* Anschließend wird das arithmetische Mittel berechnet: <math>\begin{aligned}
+* Anschließend wird das arithmetische Mittel berechnet: <math>\begin{align}
 \overline{y} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
               &= \dfrac{1}{4} \cdot (180 + 120 + 60 + 60) \\
-              &= 105 \text{ Stück/h}\end{aligned}</math> b) Das harmonische Mittel wird errechnet: <math>\begin{aligned}
+              &= 105 \text{ Stück/h}\end{align}</math> b) Das harmonische Mittel wird errechnet: <math>\begin{align}
 \overline{y}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
 &= \dfrac{2000}{\dfrac{1000}{180} + \dfrac{500}{120} + \dfrac{300}{60} + \dfrac{200}{60}} \\
-&= 110,77 \text{ Stück/h}\end{aligned}</math>
+&= 110,77 \text{ Stück/h}\end{align}</math>
 ===Wanderer===
@@ Zeile 2.216: / Zeile 2.218: @@
 * Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.<br />
-Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: <math>\begin{aligned}
+Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: <math>\begin{align}
 x_{D} &= x_2^u + \dfrac{f_K(x_2)-f_K(x_{2-1})}{2f_K(x_2)-f_K(x_{2-1})-f_K(x_{2+1})}\cdot (x_2^o-x_2^u)\\
       &= 30 +\dfrac{\dfrac{0,4595}{30}-\dfrac{0,3784}{30}}{2\cdot \dfrac{0,4595}{30}-\dfrac{0,3784}{30} - \dfrac{0,1351}{30}}\cdot (60-30)\\
-      &=30+ \dfrac{1}{5}\cdot 30 =36\end{aligned}</math> 36 .<br />
+      &=30+ \dfrac{1}{5}\cdot 30 =36\end{align}</math> 36 .<br />
 Für den Median von klassierten Daten gilt die folgende Formel:<br />
-<math>\begin{aligned}
+<math>\begin{align}
 x_{0,5} &= F(x_0,5) \Leftrightarrow \\
 x_{0,5} &= x_j^u + \dfrac{(0,5 - F(x_j^u))}{f(x_j^m)} \cdot (x_j^o - x_j^u) \\
 x_{0,5} &= 30 + \dfrac{(0,5 - 0,3784)}{0,4595} \cdot 30 \\
-&= 37,94 \text{Minuten}. \\\end{aligned}</math> Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei <math> x_j^m </math> die Klassenmitte und <math> n_j </math> die Anzahl der Beobachtungen in Klasse j beschreibt:<br />
+&= 37,94 \text{Minuten}. \\\end{align}</math> Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei <math> x_j^m </math> die Klassenmitte und <math> n_j </math> die Anzahl der Beobachtungen in Klasse j beschreibt:<br />
-<math>\begin{aligned}
+<math>\begin{align}
 \overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j \\
 &= \dfrac{1}{37} \cdot (15 \cdot 14 + 45 \cdot 17 + 75 \cdot 5 + 105 \cdot 1) \\
-&= 39,324 \text{ Minuten} \\\end{aligned}</math>
+&= 39,324 \text{ Minuten} \\\end{align}</math>
 * Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.<br />
-Man berechnet das Arithmetische Mittel <math>\overline{x}</math> von nicht-klassierten Daten wie folgt: <math>\begin{aligned}
+Man berechnet das Arithmetische Mittel <math>\overline{x}</math> von nicht-klassierten Daten wie folgt: <math>\begin{align}
 \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 &= \dfrac{1}{37} \cdot \sum_{i=1}^{n} \cdot x_i \\
 &= \dfrac{1}{37} \cdot 1440  \\
-&= 38,92 \text{ Minuten}\end{aligned}</math>
+&= 38,92 \text{ Minuten}\end{align}</math>
 ===Zugfolge - Teil I===

Platzierung Y	Gewicht X	Rang Gewicht	Differenz²
1	70	2	1
2	60	1	1
3	80	6	9
4	77	3	1
5	82	8	9
6	81	7	1
7	78	4	9
8	100	10	4
9	83	9	0
10	110	11	1
11	79	5	36

Platzierung Y	Gewicht X	Rang Gewicht	Differenz²
1	70	2	1
2	60	1	1
3	80	6	9
4	77	3	1
5	82	8	9
6	81	7	1
7	78	4	9
8	100	10	4
9	83	9	0
10	110	11	1
11	79	5	36

Univariate Statistik/Lösungen: Unterschied zwischen den Versionen

Aus MM*Stat

Aktuelle Version vom 14. Juli 2020, 15:18 Uhr

Anstieg der Produktion

Arbeitslose

Auswirkung der Regelstudienzeit

Benzinverbrauch

Berliner Luftqualität

Besuche pro Woche

Bevölkerungsdichte und Ärztedichte

Bibliotheken - Teil III

Bibliotheken - Teil II

Bibliotheken - Teil I

Brutto- und Nettoeinkommen

CDs

Das erste Tor

Ladekabel

Drei Betriebe

Drei Stichproben

Eine Befragung von Studierenden - Teil II

Eine Befragung von Studierenden - Teil I

Einkommen der Beamten

Einkommensgleichheit

Einkommen und Alter

Einwohnerzahlen

Eiskugelkonsum

Erdbeerplantage - Teil II

Erdbeerplantage - Teil I

Festgeldkonten

Fließband

Führerschein–Entziehungen

Gartenzwerg–Großhandel

Gefahrene Strecke

Gleisbaubetrieb

Glücksspielautomaten

Grafische Darstellung

Histogramm

Intercity – Zug

Internetstunden

Kaltmieten

Kartoffeln

Kaufkurs der Aktien

Körperschaftssteueraufkommen

Kontrollzeiten

Kurzarbeiter

Leichtathletikabteilung

Lernzeit

Lineares Streuungsmaß

Maschinen

Miete und Wohnfläche

Minimale Summe

Nelkenstrauß

Neubauwohnungen

Perlenkette

Produktionsleistung einer Maschine

Reinigungsunternehmen - Teil II

Reinigungsunternehmen - Teil I

Sanatorium

Schafzucht Teil - II

Schafzucht - Teil I

Schulbezirke

Streuungsmaß

Tägliche Arbeitswege - Teil II

Tägliche Arbeitswege - Teil I

Tarifverhandlungen

Tekolom und IBBM - Teil I

Telefonanbieter

Telefon–Interviews

Tennis Turniere

Walzabteilung

Wanderer

WM–Berichterstattung

Zigaretten

Zuckergewicht

Zugfolge - Teil II

Zugfolge - Teil I

Platzierung Y	Gewicht X	Rang Gewicht	Differenz²
1	70	2	1
2	60	1	1
3	80	6	9
4	77	3	1
5	82	8	9
6	81	7	1
7	78	4	9
8	100	10	4
9	83	9	0
10	110	11	1
11	79	5	36