Univariate Statistik/Lösungen: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Arbeitslose)
(Zugfolge - Teil II)
 
(19 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 641: Zeile 641:
  
 
gepoolter Datensatz<br />
 
gepoolter Datensatz<br />
<math>\overline{x}=\displaystyle\frac{1}{\displaystyle n}\displaystyle\sum_{p=1}^r\overline{x}_pn_p,\quad n=\displaystyle\sum_{p=1}^rn_p;\quad s^2=\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}s_l^2+\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}\left(\overline{x}_l-\overline{x}\right)^2</math> <math>\begin{aligned}
+
<math>\overline{x}=\displaystyle\frac{1}{\displaystyle n}\displaystyle\sum_{p=1}^r\overline{x}_pn_p,\quad n=\displaystyle\sum_{p=1}^rn_p;\quad s^2=\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}s_l^2+\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}\left(\overline{x}_l-\overline{x}\right)^2</math> <math>\begin{align}
 
\overline{x}&=0,1\cdot51+0,4\cdot53+0,5\cdot54=53,3 \\
 
\overline{x}&=0,1\cdot51+0,4\cdot53+0,5\cdot54=53,3 \\
 
s^2&=(0,1\cdot21+0,4\cdot22+0,5\cdot23) \\
 
s^2&=(0,1\cdot21+0,4\cdot22+0,5\cdot23) \\
 
&+ 0,1(51-53,3)^2 \\
 
&+ 0,1(51-53,3)^2 \\
 
&+0,4(53-53,3)^2+0,5(54-53,3)^2 \\
 
&+0,4(53-53,3)^2+0,5(54-53,3)^2 \\
&=22,4+0,529+0,036+0,245=22,4+0,81=23,21\end{aligned}</math>
+
&=22,4+0,529+0,036+0,245=22,4+0,81=23,21\end{align}</math>
  
 
===Eine Befragung von Studierenden - Teil II===
 
===Eine Befragung von Studierenden - Teil II===
Zeile 654: Zeile 654:
 
* Der Modus <math>y_{D}</math> = 1, da die Ausprägung eins die höchste absolute Häufigkeit besitzt.
 
* Der Modus <math>y_{D}</math> = 1, da die Ausprägung eins die höchste absolute Häufigkeit besitzt.
 
* Der Median <math>y_{0,5}</math> = 1, da eins ungerade ist und daher die Formel<br />
 
* Der Median <math>y_{0,5}</math> = 1, da eins ungerade ist und daher die Formel<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
           x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
 
           x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
 
           &= x_{\left(\tfrac{25+1}{2}\right)} \\
 
           &= x_{\left(\tfrac{25+1}{2}\right)} \\
 
           &= x_{(13)}
 
           &= x_{(13)}
           \end{aligned}</math> für den Median gilt.<br />
+
           \end{align}</math> für den Median gilt.<br />
  
 
* Das Arithmetische Mittel <math>\overline{y}</math> = 1, da sich mit der Formel<br />
 
* Das Arithmetische Mittel <math>\overline{y}</math> = 1, da sich mit der Formel<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
           \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i  \\
 
           \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i  \\
 
           &= \dfrac{1}{25} \cdot (8 \cdot 0 + 11 \cdot 1 + 4 \cdot 2 + 2 \cdot 3) \\
 
           &= \dfrac{1}{25} \cdot (8 \cdot 0 + 11 \cdot 1 + 4 \cdot 2 + 2 \cdot 3) \\
 
           &= 1 \text{ ergibt}.
 
           &= 1 \text{ ergibt}.
           \end{aligned}</math>
+
           \end{align}</math>
 
* Das durchschnittliche Einkommen eines/einer Studierenden ergibt sich durch Berechnen des Arithmetischen Mittels wie folgt:<br />
 
* Das durchschnittliche Einkommen eines/einer Studierenden ergibt sich durch Berechnen des Arithmetischen Mittels wie folgt:<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
           \overline{z} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot z_i \\
 
           \overline{z} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot z_i \\
 
           \overline{z} &= \dfrac{1}{25} \cdot (924 + ... + 640) \\
 
           \overline{z} &= \dfrac{1}{25} \cdot (924 + ... + 640) \\
 
           &= \dfrac{1}{25} \cdot 20200 \\
 
           &= \dfrac{1}{25} \cdot 20200 \\
 
           &= 808 \text{ EUR}
 
           &= 808 \text{ EUR}
           \end{aligned}</math>
+
           \end{align}</math>
 
* Als aussagekräftige Lageparameter werden das Arithmetische Mittel und der Median berechnet.
 
* Als aussagekräftige Lageparameter werden das Arithmetische Mittel und der Median berechnet.
* Der Median berechnet sich für klassierte Daten mit der folgenden Formel: <math>\begin{aligned}
+
* Der Median berechnet sich für klassierte Daten mit der folgenden Formel: <math>\begin{align}
 
z_{0,5} &= x_j^u + \dfrac{(0,5 - F(z_j^u))}{f(z_j^m)} \cdot (z_j^o - z_j^u) \\
 
z_{0,5} &= x_j^u + \dfrac{(0,5 - F(z_j^u))}{f(z_j^m)} \cdot (z_j^o - z_j^u) \\
 
&= 700 + \dfrac{(0,5 - 0,48)}{0,32} \cdot 200 \\
 
&= 700 + \dfrac{(0,5 - 0,48)}{0,32} \cdot 200 \\
&= 712,5 \text{ EUR} \end{aligned}</math>
+
&= 712,5 \text{ EUR} \end{align}</math>
* Das Arithmetische Mittel wird hier für klassierte Daten mit der folgenden Formel berechnet, wobei <math> x_j^m </math> die Klassenmitte und <math>n_j</math> die Anzahl der Beobachtungen in Klasse j angibt: <math>\begin{aligned}
+
* Das Arithmetische Mittel wird hier für klassierte Daten mit der folgenden Formel berechnet, wobei <math> x_j^m </math> die Klassenmitte und <math>n_j</math> die Anzahl der Beobachtungen in Klasse j angibt: <math>\begin{align}
 
\overline{z} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot z_j^m \cdot n_j \\
 
\overline{z} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot z_j^m \cdot n_j \\
 
&= \dfrac{1}{25} \cdot (625 \cdot 6 + 675 \cdot 6 + 800 \cdot 8 + 1050 \cdot 2 + 1325 \cdot 3) \\
 
&= \dfrac{1}{25} \cdot (625 \cdot 6 + 675 \cdot 6 + 800 \cdot 8 + 1050 \cdot 2 + 1325 \cdot 3) \\
 
&= \dfrac{20275}{25} \\
 
&= \dfrac{20275}{25} \\
&= 811 \text{ EUR}. \end{aligned}</math> Für die Berechnung der Quantile von klassierten Daten wird folgende Formel verwendet: <math>\begin{aligned}
+
&= 811 \text{ EUR}. \end{align}</math> Für die Berechnung der Quantile von klassierten Daten wird folgende Formel verwendet: <math>\begin{align}
F(x_p) &= p \Leftrightarrow x_p = x_j^u + \dfrac{(p - F(x_j^u))}{f(x_j)} \cdot (x_j^o - x_j^u)\end{aligned}</math>
+
F(x_p) &= p \Leftrightarrow x_p = x_j^u + \dfrac{(p - F(x_j^u))}{f(x_j)} \cdot (x_j^o - x_j^u)\end{align}</math>
* Die Quartile werden somit wie folgt für klassierte Daten berechnet: <math>\begin{aligned}
+
* Die Quartile werden somit wie folgt für klassierte Daten berechnet: <math>\begin{align}
 
z_{0,25} &= 650 + \dfrac{(0,25 - 0,24)}{0,24} \cdot 50 \\
 
z_{0,25} &= 650 + \dfrac{(0,25 - 0,24)}{0,24} \cdot 50 \\
 
&= 652,08 \text{ EUR}\\
 
&= 652,08 \text{ EUR}\\
 
z_{0,75} &= 700 + \dfrac{(0,75 - 0,48)}{0,32} \cdot 200 \\
 
z_{0,75} &= 700 + \dfrac{(0,75 - 0,48)}{0,32} \cdot 200 \\
&= 868,75 \text{ EUR}\end{aligned}</math>
+
&= 868,75 \text{ EUR}\end{align}</math>
* Das 90%-Quantil ergibt somit: <math>\begin{aligned}
+
* Das 90%-Quantil ergibt somit: <math>\begin{align}
 
z_{0,9} &= 1200 + \dfrac{(0,9 - 0,88)}{0,12} \cdot 250 \\
 
z_{0,9} &= 1200 + \dfrac{(0,9 - 0,88)}{0,12} \cdot 250 \\
&= 1241,67 \text{ EUR}\end{aligned}</math>
+
&= 1241,67 \text{ EUR}\end{align}</math>
 
* Minimum und Maximum sind hier wie folgt:<br />
 
* Minimum und Maximum sind hier wie folgt:<br />
  
Zeile 783: Zeile 783:
 
<li><p>23 Studierende haben höchstens 2 Geschwister.</p></li>
 
<li><p>23 Studierende haben höchstens 2 Geschwister.</p></li>
 
<li><p>Viermal 2 Geschwister <math>+</math> zweimal 3 Geschwister <math>=</math> 6 Personen mit mindestens 2 Geschwistern, d.h.<br />
 
<li><p>Viermal 2 Geschwister <math>+</math> zweimal 3 Geschwister <math>=</math> 6 Personen mit mindestens 2 Geschwistern, d.h.<br />
 +
 
<math>\dfrac{6}{25}=0,24=24\%</math> haben mindestens zwei Geschwister.<br />
 
<math>\dfrac{6}{25}=0,24=24\%</math> haben mindestens zwei Geschwister.<br />
 +
<br>
 
<math>\dfrac{15}{25}=0,6=60\%</math> haben ein oder zwei Geschwister.</p></li>
 
<math>\dfrac{15}{25}=0,6=60\%</math> haben ein oder zwei Geschwister.</p></li>
 
<li><p><math>Z</math>: “Einkommen”; kardinalskaliert (metrisch), quasi-stetig</p>
 
<li><p><math>Z</math>: “Einkommen”; kardinalskaliert (metrisch), quasi-stetig</p>
Zeile 834: Zeile 836:
 
<p>Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion</p></li>
 
<p>Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion</p></li>
 
<li><ul>
 
<li><ul>
<li><p><math>P[\{750 \leq Z \leq 1300\}] = F(1300) - F(750)</math> <math>\begin{aligned}
+
<li><p><math>P[\{750 \leq Z \leq 1300\}] = F(1300) - F(750)</math>  
 +
<br>
 +
<math>\begin{align}
 
F(1300) &=& 0,88 + \frac{1300 - 1200}{1450 - 1200} \cdot 0,12 = 0,928 \\
 
F(1300) &=& 0,88 + \frac{1300 - 1200}{1450 - 1200} \cdot 0,12 = 0,928 \\
 
F(750) &=& 0,48 + \frac{750-700}{900 - 700} \cdot 0,32 = 0,56 \\
 
F(750) &=& 0,48 + \frac{750-700}{900 - 700} \cdot 0,32 = 0,56 \\
 
  P[\{750 \leq Z \leq 1300\}] &=& F(1300) - F(750) = 0,928 - 0,56 \\
 
  P[\{750 \leq Z \leq 1300\}] &=& F(1300) - F(750) = 0,928 - 0,56 \\
   \end{aligned}</math></p></li>
+
   \end{align}</math></p></li>
<li><p><math>P[\{Z > 800\}] = 1 - F(800)</math> <math>\begin{aligned}
+
<li><p><math>P[\{Z > 800\}] = 1 - F(800)</math> <math>\begin{align}
 
&=& 1 - [0,24 + 0,24 + \frac{(800 - 700)}{(900 - 700)} \cdot 0,32] \\
 
&=& 1 - [0,24 + 0,24 + \frac{(800 - 700)}{(900 - 700)} \cdot 0,32] \\
 
&=& 1 - [0,48 + \frac{100}{200} \cdot 0,32] \\
 
&=& 1 - [0,48 + \frac{100}{200} \cdot 0,32] \\
 
&=& 0,36
 
&=& 0,36
   \end{aligned}</math></p></li>
+
   \end{align}</math></p></li>
 
<li><p><math>0,5 = 0,48 + \frac{z - 700}{ 900 - 700}\cdot 0,32
 
<li><p><math>0,5 = 0,48 + \frac{z - 700}{ 900 - 700}\cdot 0,32
 
   \rightarrow  z = 712,5 \mbox {EUR}</math></p></li>
 
   \rightarrow  z = 712,5 \mbox {EUR}</math></p></li>
Zeile 1.243: Zeile 1.247:
 
===Festgeldkonten===
 
===Festgeldkonten===
  
Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land <math>x_{0,5}(L)</math> berechnet werden. Hierzu wird jeweils die Klasse <math>x_j, j\in\{1,2,3,4\}</math> bestimmt, in welcher der Median liegt. Bezeichnet <math>x_j^u</math> die untere Klassengrenze, so ist für klassierte Daten <math>\begin{aligned}
+
Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land <math>x_{0,5}(L)</math> berechnet werden. Hierzu wird jeweils die Klasse <math>x_j, j\in\{1,2,3,4\}</math> bestimmt, in welcher der Median liegt. Bezeichnet <math>x_j^u</math> die untere Klassengrenze, so ist für klassierte Daten <math>\begin{align}
 
   x_{0,5}(L)&=&x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)\\
 
   x_{0,5}(L)&=&x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)\\
 
   x_{0,5}(1)&=&5,0+\frac{0,5-0,44}{0,30}\cdot0,5=5,1\\
 
   x_{0,5}(1)&=&5,0+\frac{0,5-0,44}{0,30}\cdot0,5=5,1\\
Zeile 1.250: Zeile 1.254:
 
   x_{0,5}(4)&=&4,5+\frac{0,5-0,15}{0,35}\cdot0,5=5,0\\
 
   x_{0,5}(4)&=&4,5+\frac{0,5-0,15}{0,35}\cdot0,5=5,0\\
 
   x_{0,5}(5)&=&4,5+\frac{0,5-0,275}{0,375}\cdot0,5=4,8
 
   x_{0,5}(5)&=&4,5+\frac{0,5-0,275}{0,375}\cdot0,5=4,8
  \end{aligned}</math> Ermittlung der länderspezifischen variablen Zinssätze <math>z(L)=0,7z+0,3x_{0,5}(L)</math> mit <math>z=5,2</math>:<br />
+
  \end{align}</math> Ermittlung der länderspezifischen variablen Zinssätze <math>z(L)=0,7z+0,3x_{0,5}(L)</math> mit <math>z=5,2</math>:<br />
 
Land 1: <math>z(1)=0,7\cdot5,2+0,3\cdot5,1=5,17</math><br />
 
Land 1: <math>z(1)=0,7\cdot5,2+0,3\cdot5,1=5,17</math><br />
 
Land 2: <math>z(2)=0,7\cdot5,2+0,3\cdot5,5=5,29</math><br />
 
Land 2: <math>z(2)=0,7\cdot5,2+0,3\cdot5,5=5,29</math><br />
Zeile 1.261: Zeile 1.265:
 
===Fließband===
 
===Fließband===
  
Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. <math>\begin{aligned}
+
Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. <math>\begin{align}
 
\overline{x}_H&=&\frac{n}{\displaystyle \sum_{i=1}^n\frac{1}{x_i}}=\displaystyle\frac{6}{\displaystyle\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{10}+\frac{1}{8}+\frac{1}{5}}\\
 
\overline{x}_H&=&\frac{n}{\displaystyle \sum_{i=1}^n\frac{1}{x_i}}=\displaystyle\frac{6}{\displaystyle\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{10}+\frac{1}{8}+\frac{1}{5}}\\
&=&\frac{6}{0,5+0,25+0,125+0,1+0,125+0,2}=\frac{6}{1,3}=4,61538\end{aligned}</math>
+
&=&\frac{6}{0,5+0,25+0,125+0,1+0,125+0,2}=\frac{6}{1,3}=4,61538\end{align}</math>
  
 
===Führerschein–Entziehungen===
 
===Führerschein–Entziehungen===
Zeile 1.277: Zeile 1.281:
 
* ** <math>X</math>: “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
 
* ** <math>X</math>: “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
 
** Das Merkmal wurde an den einzelnen Aufträgen erhoben
 
** Das Merkmal wurde an den einzelnen Aufträgen erhoben
** Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: <math>\begin{aligned}
+
** Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: <math>\begin{align}
 
   \overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j\text{, wobei } n = \sum_{j=1}^{k} \cdot u_j \\
 
   \overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j\text{, wobei } n = \sum_{j=1}^{k} \cdot u_j \\
 
   \overline{x} &= \dfrac{1}{100} \cdot (10000 \cdot 15 + 35000 \cdot 30 + 100000 \cdot 45 + 225000 \cdot 10) \\
 
   \overline{x} &= \dfrac{1}{100} \cdot (10000 \cdot 15 + 35000 \cdot 30 + 100000 \cdot 45 + 225000 \cdot 10) \\
 
   \overline{x} &= 79 500 \text{ EUR/Auftrag}
 
   \overline{x} &= 79 500 \text{ EUR/Auftrag}
   \end{aligned}</math>
+
   \end{align}</math>
 
* <math>\overline{x}</math>= a + b <math>\cdot</math> <math>\overline{y}</math>; <math>\overline{x}</math> = 0 + 1,5<math>\cdot</math>60 000 = 90 000 EUR/Auftrag
 
* <math>\overline{x}</math>= a + b <math>\cdot</math> <math>\overline{y}</math>; <math>\overline{x}</math> = 0 + 1,5<math>\cdot</math>60 000 = 90 000 EUR/Auftrag
 
* **  
 
* **  
 
** Arithmetisches Mittel <math>\overline{x}</math> nicht sinnvoll, da Ausreißer vorkommt
 
** Arithmetisches Mittel <math>\overline{x}</math> nicht sinnvoll, da Ausreißer vorkommt
 
** Der Modus <math>x_{D}</math> nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
 
** Der Modus <math>x_{D}</math> nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
** Sinnvoll ist hier der Median mit dem Ergebnis <math>x_{0,5}</math> = 12 000 EUR/Auftrag. Da n ungerade ist gilt: <math>\begin{aligned}
+
** Sinnvoll ist hier der Median mit dem Ergebnis <math>x_{0,5}</math> = 12 000 EUR/Auftrag. Da n ungerade ist gilt: <math>\begin{align}
 
               x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
 
               x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
 
               &= x_{\left(\tfrac{5+1}{2}\right)} \\
 
               &= x_{\left(\tfrac{5+1}{2}\right)} \\
 
               &= x_{(3)}  
 
               &= x_{(3)}  
               \end{aligned}</math>
+
               \end{align}</math>
** <math>\begin{aligned}
+
** <math>\begin{align}
 
               \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
               \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
               &= \dfrac{1}{5} \cdot 45000 \\
 
               &= \dfrac{1}{5} \cdot 45000 \\
 
               &= 9 000 \text{ EUR/Auftrag}  
 
               &= 9 000 \text{ EUR/Auftrag}  
               \end{aligned}</math>
+
               \end{align}</math>
* Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: <math>\begin{aligned}
+
* Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: <math>\begin{align}
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
&= \dfrac{1}{(95 + 5 + 100)} \cdot (100 \cdot 79500 + 95 \cdot 90000 + 5 \cdot 9000) \\
 
&= \dfrac{1}{(95 + 5 + 100)} \cdot (100 \cdot 79500 + 95 \cdot 90000 + 5 \cdot 9000) \\
&= 82 725 \text{ EUR/Auftrag}\end{aligned}</math>
+
&= 82 725 \text{ EUR/Auftrag}\end{align}</math>
  
 
===Gefahrene Strecke===
 
===Gefahrene Strecke===
  
Gesucht ist der Quartilsabstand: <math>\begin{aligned}
+
Gesucht ist der Quartilsabstand: <math>\begin{align}
 
QA    &=x_{0,75}-x_{0,25}\\
 
QA    &=x_{0,75}-x_{0,25}\\
 
x_p  &=x_j^u+(p-F(x_j^u))(x_j^o-x_j^u)/f(x_j)\\
 
x_p  &=x_j^u+(p-F(x_j^u))(x_j^o-x_j^u)/f(x_j)\\
 
x_{0,25}&=50+(0,25-0,15)50/0,25=70 \text{ km}\\
 
x_{0,25}&=50+(0,25-0,15)50/0,25=70 \text{ km}\\
 
x_{0,75}&=300+(0,75-0,7)200/0,2=350 \text{ km}\\
 
x_{0,75}&=300+(0,75-0,7)200/0,2=350 \text{ km}\\
QA&=350-70=280 \text{ km}\end{aligned}</math>
+
QA&=350-70=280 \text{ km}\end{align}</math>
  
 
===Gleisbaubetrieb===
 
===Gleisbaubetrieb===
Zeile 1.442: Zeile 1.446:
 
<br />
 
<br />
 
<br />
 
<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
     F(X)&=&F(x_j^u)+\frac{x-x_j^u}{x_j^o-x_j^u}\cdot f(x_j)\\
 
     F(X)&=&F(x_j^u)+\frac{x-x_j^u}{x_j^o-x_j^u}\cdot f(x_j)\\
 
     F(5)&=&0,1+\frac{5-2}{6-2}\cdot0,4=0,1+0,3=0,4\\
 
     F(5)&=&0,1+\frac{5-2}{6-2}\cdot0,4=0,1+0,3=0,4\\
     F(16)&=&0,8+\frac{16-12}{20-12}\cdot0,2=0,8+0,1=0,9\end{aligned}</math> <math>F(5\leq X\leq16)=F(16)-F(15)=0,9-0,4=0,5</math><br />
+
     F(16)&=&0,8+\frac{16-12}{20-12}\cdot0,2=0,8+0,1=0,9\end{align}</math> <math>F(5\leq X\leq16)=F(16)-F(15)=0,9-0,4=0,5</math><br />
 
<math>H(5\leq X\leq16)=F(5\leq X\leq16)\cdot110=0,5\cdot110=55</math><br />
 
<math>H(5\leq X\leq16)=F(5\leq X\leq16)\cdot110=0,5\cdot110=55</math><br />
 
<br />
 
<br />
Zeile 1.575: Zeile 1.579:
 
===Kaufkurs der Aktien===
 
===Kaufkurs der Aktien===
  
<math>\begin{aligned}
+
<math>\begin{align}
 
\overline{x}_H = \frac{\displaystyle\sum_{j=1}^{k}g_j}{\displaystyle\sum_{j=1}^k\frac{g_j}{x_j}} &= \frac{45000+84000+3600+14000}{\displaystyle\frac{45000}{500}+\frac{84000}{600}+\frac{3600}{400}+\frac{14000}{700}} \\
 
\overline{x}_H = \frac{\displaystyle\sum_{j=1}^{k}g_j}{\displaystyle\sum_{j=1}^k\frac{g_j}{x_j}} &= \frac{45000+84000+3600+14000}{\displaystyle\frac{45000}{500}+\frac{84000}{600}+\frac{3600}{400}+\frac{14000}{700}} \\
 
&= \frac{146600}{90+140+9+20} \\
 
&= \frac{146600}{90+140+9+20} \\
&=\frac{146600}{259}=566,02\end{aligned}</math>
+
&=\frac{146600}{259}=566,02\end{align}</math>
  
 
oder<math>\overline{x}=\frac{1}{n}\sum_{j=1}^kx_jh(x_j)=\frac{500\cdot90+600\cdot140+400\cdot9+700\cdot20}{90+140+9+20}=\frac{146600}{259}=566,02</math>
 
oder<math>\overline{x}=\frac{1}{n}\sum_{j=1}^kx_jh(x_j)=\frac{500\cdot90+600\cdot140+400\cdot9+700\cdot20}{90+140+9+20}=\frac{146600}{259}=566,02</math>
Zeile 1.584: Zeile 1.588:
 
===Körperschaftssteueraufkommen===
 
===Körperschaftssteueraufkommen===
  
Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich <math>\begin{aligned}
+
Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich <math>\begin{align}
 
   \overline{x}&=&\frac{1}{n}\sum_{p=1}^r\overline{x}_pn_p\\
 
   \overline{x}&=&\frac{1}{n}\sum_{p=1}^r\overline{x}_pn_p\\
 
   &=&\frac{1}{10000}(100\cdot9500+9500\cdot100+300\cdot200+100\cdot400)=\frac{2000000}{10000}=200\\ \\
 
   &=&\frac{1}{10000}(100\cdot9500+9500\cdot100+300\cdot200+100\cdot400)=\frac{2000000}{10000}=200\\ \\
Zeile 1.592: Zeile 1.596:
 
     &=&(10000+6080+300+625)+(864900+9500+0+400)=891805\\ \\
 
     &=&(10000+6080+300+625)+(864900+9500+0+400)=891805\\ \\
 
   \sqrt{s^2}&=&\sqrt{891805}=944,3543\approx944
 
   \sqrt{s^2}&=&\sqrt{891805}=944,3543\approx944
  \end{aligned}</math>
+
  \end{align}</math>
  
 
===Kontrollzeiten===
 
===Kontrollzeiten===
  
 
X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:<br />
 
X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
\overline{x}_H &=\frac{\displaystyle n}{\displaystyle\sum_{i=1}^n\frac{\displaystyle1}{\displaystyle x_i}} =\frac{6}{\displaystyle\frac{1}{0,2}+\frac{1}{0,4}+\frac{1}{0,8}+\frac{1}{0,5}+\frac{1}{0,5}+\frac{1}{0,8}}\\
 
\overline{x}_H &=\frac{\displaystyle n}{\displaystyle\sum_{i=1}^n\frac{\displaystyle1}{\displaystyle x_i}} =\frac{6}{\displaystyle\frac{1}{0,2}+\frac{1}{0,4}+\frac{1}{0,8}+\frac{1}{0,5}+\frac{1}{0,5}+\frac{1}{0,8}}\\
 
&= \frac{6}{5+2,5+1,25+2+2+1,25} \\
 
&= \frac{6}{5+2,5+1,25+2+2+1,25} \\
&=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{aligned}</math> Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:<br />
+
&=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{align}</math> Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:<br />
 
<math>\overline{x}=(6\cdot480)/6720=2880/6720=0,4285\approx0,429\mbox{ min/Stück}</math>
 
<math>\overline{x}=(6\cdot480)/6720=2880/6720=0,4285\approx0,429\mbox{ min/Stück}</math>
  
Zeile 1.667: Zeile 1.671:
 
===Lineares Streuungsmaß===
 
===Lineares Streuungsmaß===
  
<math>\begin{aligned}
+
<math>\begin{align}
 
X_Z &=& 17; d = (1/n)\sum_{i=1}^n|x_i - x_Z| ;\\ 8 &=& (1/5)(|3-17|+|7-17|+|17-17|+|19-17|+|x_5-17|)\\ \Leftrightarrow 40 &=& 14+10+0+2+x_5-17  
 
X_Z &=& 17; d = (1/n)\sum_{i=1}^n|x_i - x_Z| ;\\ 8 &=& (1/5)(|3-17|+|7-17|+|17-17|+|19-17|+|x_5-17|)\\ \Leftrightarrow 40 &=& 14+10+0+2+x_5-17  
\\ \Leftrightarrow x_5 &=& 31\end{aligned}</math>
+
\\ \Leftrightarrow x_5 &=& 31\end{align}</math>
  
 
===Maschinen===
 
===Maschinen===
Zeile 1.749: Zeile 1.753:
 
<math>s_{1}^{2}</math> = 45 693; <math>s_{1}</math> = 213,759; <math>v_{1}</math> = 0,086<br />
 
<math>s_{1}^{2}</math> = 45 693; <math>s_{1}</math> = 213,759; <math>v_{1}</math> = 0,086<br />
 
<math>s_{2}^{2}</math> = 4848,75; <math>s_{2}</math> = 69,633; <math>v_{2}</math> = 0,02467<br />
 
<math>s_{2}^{2}</math> = 4848,75; <math>s_{2}</math> = 69,633; <math>v_{2}</math> = 0,02467<br />
<math>s_{3}^{2}</math> = 12 032,4; <math>s_{3}</math> = 109,692; <math>v_{3}</math> = 0,04441 <math>\begin{aligned}
+
<math>s_{3}^{2}</math> = 12 032,4; <math>s_{3}</math> = 109,692; <math>v_{3}</math> = 0,04441 <math>\begin{align}
 
s ^{2}&= \sum\limits_{l=1} ^3\dfrac{n_{l}}{n}s_{l} ^{2}+ \sum\limits
 
s ^{2}&= \sum\limits_{l=1} ^3\dfrac{n_{l}}{n}s_{l} ^{2}+ \sum\limits
 
       _{l=1} ^3\dfrac{n_{l}}{n}(\overline{x}_{l}- \overline{x}) ^{2} \\
 
       _{l=1} ^3\dfrac{n_{l}}{n}(\overline{x}_{l}- \overline{x}) ^{2} \\
Zeile 1.758: Zeile 1.762:
 
     \\
 
     \\
 
     s&= 215,88 \text{ EUR;} \\
 
     s&= 215,88 \text{ EUR;} \\
     v&= 0,08396\end{aligned}</math>
+
     v&= 0,08396\end{align}</math>
  
 
===Reinigungsunternehmen - Teil I===
 
===Reinigungsunternehmen - Teil I===
Zeile 1.837: Zeile 1.841:
 
|}
 
|}
  
<p><math>\begin{aligned}
+
<p><math>\begin{align}
 
   \sum_{i=1}^n d_i^2  &= 1+1+9+1+9+1+9+4+0+1+36\\
 
   \sum_{i=1}^n d_i^2  &= 1+1+9+1+9+1+9+4+0+1+36\\
         &= 72\\\end{aligned}</math></p>
+
         &= 72\\\end{align}</math></p>
 
<p><math>r_{S}=  1- \frac{6\cdot72}{11(11^2 -1)}=0,6727</math></p></li>
 
<p><math>r_{S}=  1- \frac{6\cdot72}{11(11^2 -1)}=0,6727</math></p></li>
 
<li><p>a) Median für nicht klassierte Daten,<math> n</math> ungerade <math>x_{Z}= x_{0.5}=x_{(\frac{n+1}{2})}=x_6=80 \text{ kg }</math></p></li>
 
<li><p>a) Median für nicht klassierte Daten,<math> n</math> ungerade <math>x_{Z}= x_{0.5}=x_{(\frac{n+1}{2})}=x_6=80 \text{ kg }</math></p></li>
 
<li><p>Quadratisches Streuungsmaßim Bezug auf Median</p>
 
<li><p>Quadratisches Streuungsmaßim Bezug auf Median</p>
<p><math>\begin{aligned}
+
<p><math>\begin{align}
 
  MQ(x_{Z})&= MQ(x_{0,5}) = \frac{1}{n}\sum_{i=1}^n  (x_i - x_{0,5})^2\\ &=((70-80)^2+(60-80)^2+(80-80)^2\\&+(77-80)^2+(82-80)^2+(81-80)^2\\&+(78-80)^2+(100-80)^2+(83-80)^2\\&+(110-80)^2+(79-80)^2)\cdot\frac{1}{11} \\
 
  MQ(x_{Z})&= MQ(x_{0,5}) = \frac{1}{n}\sum_{i=1}^n  (x_i - x_{0,5})^2\\ &=((70-80)^2+(60-80)^2+(80-80)^2\\&+(77-80)^2+(82-80)^2+(81-80)^2\\&+(78-80)^2+(100-80)^2+(83-80)^2\\&+(110-80)^2+(79-80)^2)\cdot\frac{1}{11} \\
&= \frac{1828}{11} = 166,18\\\end{aligned}</math></p></li>
+
&= \frac{1828}{11} = 166,18\\\end{align}</math></p></li>
 
<li><p>Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.</p></li>
 
<li><p>Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.</p></li>
 
<li><p>Durchschnittsgeschindigkeit der Frauen?</p>
 
<li><p>Durchschnittsgeschindigkeit der Frauen?</p>
Zeile 1.854: Zeile 1.858:
 
<p>Insgesamt wurden <math>100</math>m gelaufen, <math>50</math>m mit <math>2</math>m/s und <math>50</math>m mit <math>4</math>m/s. Kann auch wie eine Frau betrachtet werden die erst <math>50</math>m langsamer und dann <math>50</math>m schneller läuft.<br />
 
<p>Insgesamt wurden <math>100</math>m gelaufen, <math>50</math>m mit <math>2</math>m/s und <math>50</math>m mit <math>4</math>m/s. Kann auch wie eine Frau betrachtet werden die erst <math>50</math>m langsamer und dann <math>50</math>m schneller läuft.<br />
 
Harmonisches Mittel:</p>
 
Harmonisches Mittel:</p>
<p><math>\begin{aligned}
+
<p><math>\begin{align}
 
     \overline{x}_{H}&=  \frac{50m+50m}{\frac{50m}{2m / s} +\frac{50m}{4m / s}} = \frac{100m}{25s +12,5s }\\
 
     \overline{x}_{H}&=  \frac{50m+50m}{\frac{50m}{2m / s} +\frac{50m}{4m / s}} = \frac{100m}{25s +12,5s }\\
 
       &=\frac{100m}{37,5s}=2,667  m / s\\
 
       &=\frac{100m}{37,5s}=2,667  m / s\\
   \end{aligned}</math></p></li></ul>
+
   \end{align}</math></p></li></ul>
  
 
===Schafzucht Teil - II===
 
===Schafzucht Teil - II===
Zeile 1.872: Zeile 1.876:
 
===Schafzucht - Teil I===
 
===Schafzucht - Teil I===
  
Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im '''Verhältnis''' zur Leistung gegeben ist: <math>\overline{x}_H = \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}},</math> wobei <math>g_1</math> die Lohnsumme für die Irischen Arbeiter und <math>g_2</math> die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass <math>g_1 =285</math> und <math>g_2 =260</math>, und <math>x_1=15</math> den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und <math>x_2=20</math> den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: <math>\begin{aligned}
+
Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im '''Verhältnis''' zur Leistung gegeben ist: <math>\overline{x}_H = \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}},</math> wobei <math>g_1</math> die Lohnsumme für die Irischen Arbeiter und <math>g_2</math> die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass <math>g_1 =285</math> und <math>g_2 =260</math>, und <math>x_1=15</math> den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und <math>x_2=20</math> den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: <math>\begin{align}
 
\overline{x}_H &= \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}}\\
 
\overline{x}_H &= \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}}\\
 
                 &= \dfrac{285+ 260}{\dfrac{285}{15}+\dfrac{260}{20}}\\
 
                 &= \dfrac{285+ 260}{\dfrac{285}{15}+\dfrac{260}{20}}\\
                 &= \dfrac{545}{19+13}=17,03 \dfrac{\text{Pfund} }{\text{kg}}\end{aligned}</math>
+
                 &= \dfrac{545}{19+13}=17,03 \dfrac{\text{Pfund} }{\text{kg}}\end{align}</math>
  
 
===Schulbezirke===
 
===Schulbezirke===
Zeile 2.030: Zeile 2.034:
 
Y = “hergestellte Stück pro Stunde”
 
Y = “hergestellte Stück pro Stunde”
  
* a) Man berechnet das harmonische Mittel wie folgt: <math>\begin{aligned}
+
* a) Man berechnet das harmonische Mittel wie folgt: <math>\begin{align}
 
\overline{x}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
 
\overline{x}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
 
                 &= \dfrac{4}{\dfrac{1}{20} + \dfrac{1}{30} + \dfrac{1}{60} + \dfrac{1}{60}} \\
 
                 &= \dfrac{4}{\dfrac{1}{20} + \dfrac{1}{30} + \dfrac{1}{60} + \dfrac{1}{60}} \\
                 &= 34,286 \text{ sec./Stück}\end{aligned}</math> b) Man berechnet das arithmetische Mittel wie folgt: <math>\begin{aligned}
+
                 &= 34,286 \text{ sec./Stück}\end{align}</math> b) Man berechnet das arithmetische Mittel wie folgt: <math>\begin{align}
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
             &= \dfrac{1}{2000} \cdot (1000 \cdot 20 + 500 \cdot 30 + 300 \cdot 60 + 200 \cdot 60) \\
 
             &= \dfrac{1}{2000} \cdot (1000 \cdot 20 + 500 \cdot 30 + 300 \cdot 60 + 200 \cdot 60) \\
             &= 32,5 \text{ sec./Stück}\end{aligned}</math>
+
             &= 32,5 \text{ sec./Stück}\end{align}</math>
 
* a)
 
* a)
* Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: <math>\begin{aligned}
+
* Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: <math>\begin{align}
 
\text{A produziert} \dfrac{3600 \text{ sec}}{20 \text{ sec}} &= 180 \text{ Stück pro Stunde} \\
 
\text{A produziert} \dfrac{3600 \text{ sec}}{20 \text{ sec}} &= 180 \text{ Stück pro Stunde} \\
 
\text{B produziert} \dfrac{3600 \text{ sec}}{30 \text{ sec}} &= 120 \text{ Stück pro Stunde} \\
 
\text{B produziert} \dfrac{3600 \text{ sec}}{30 \text{ sec}} &= 120 \text{ Stück pro Stunde} \\
\text{C und D produzieren jeweils} \dfrac{3600 \text{ sec}}{60 \text{ sec}} &= 60 \text{ Stück pro Stunde}\end{aligned}</math>
+
\text{C und D produzieren jeweils} \dfrac{3600 \text{ sec}}{60 \text{ sec}} &= 60 \text{ Stück pro Stunde}\end{align}</math>
* Anschließend wird das arithmetische Mittel berechnet: <math>\begin{aligned}
+
* Anschließend wird das arithmetische Mittel berechnet: <math>\begin{align}
 
\overline{y} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
\overline{y} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
             &= \dfrac{1}{4} \cdot (180 + 120 + 60 + 60) \\
 
             &= \dfrac{1}{4} \cdot (180 + 120 + 60 + 60) \\
             &= 105 \text{ Stück/h}\end{aligned}</math> b) Das harmonische Mittel wird errechnet: <math>\begin{aligned}
+
             &= 105 \text{ Stück/h}\end{align}</math> b) Das harmonische Mittel wird errechnet: <math>\begin{align}
 
\overline{y}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
 
\overline{y}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
 
&= \dfrac{2000}{\dfrac{1000}{180} + \dfrac{500}{120} + \dfrac{300}{60} + \dfrac{200}{60}} \\
 
&= \dfrac{2000}{\dfrac{1000}{180} + \dfrac{500}{120} + \dfrac{300}{60} + \dfrac{200}{60}} \\
&= 110,77 \text{ Stück/h}\end{aligned}</math>
+
&= 110,77 \text{ Stück/h}\end{align}</math>
  
 
===Wanderer===
 
===Wanderer===
Zeile 2.214: Zeile 2.218:
  
 
* Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.<br />
 
* Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.<br />
Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: <math>\begin{aligned}
+
Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: <math>\begin{align}
 
x_{D} &= x_2^u + \dfrac{f_K(x_2)-f_K(x_{2-1})}{2f_K(x_2)-f_K(x_{2-1})-f_K(x_{2+1})}\cdot (x_2^o-x_2^u)\\
 
x_{D} &= x_2^u + \dfrac{f_K(x_2)-f_K(x_{2-1})}{2f_K(x_2)-f_K(x_{2-1})-f_K(x_{2+1})}\cdot (x_2^o-x_2^u)\\
 
     &= 30 +\dfrac{\dfrac{0,4595}{30}-\dfrac{0,3784}{30}}{2\cdot \dfrac{0,4595}{30}-\dfrac{0,3784}{30} - \dfrac{0,1351}{30}}\cdot (60-30)\\
 
     &= 30 +\dfrac{\dfrac{0,4595}{30}-\dfrac{0,3784}{30}}{2\cdot \dfrac{0,4595}{30}-\dfrac{0,3784}{30} - \dfrac{0,1351}{30}}\cdot (60-30)\\
     &=30+ \dfrac{1}{5}\cdot 30 =36\end{aligned}</math> 36 .<br />
+
     &=30+ \dfrac{1}{5}\cdot 30 =36\end{align}</math> 36 .<br />
 
Für den Median von klassierten Daten gilt die folgende Formel:<br />
 
Für den Median von klassierten Daten gilt die folgende Formel:<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
x_{0,5} &= F(x_0,5) \Leftrightarrow \\
 
x_{0,5} &= F(x_0,5) \Leftrightarrow \\
 
x_{0,5} &= x_j^u + \dfrac{(0,5 - F(x_j^u))}{f(x_j^m)} \cdot (x_j^o - x_j^u) \\
 
x_{0,5} &= x_j^u + \dfrac{(0,5 - F(x_j^u))}{f(x_j^m)} \cdot (x_j^o - x_j^u) \\
 
x_{0,5} &= 30 + \dfrac{(0,5 - 0,3784)}{0,4595} \cdot 30 \\
 
x_{0,5} &= 30 + \dfrac{(0,5 - 0,3784)}{0,4595} \cdot 30 \\
&= 37,94 \text{Minuten}. \\\end{aligned}</math> Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei <math> x_j^m </math> die Klassenmitte und <math> n_j </math> die Anzahl der Beobachtungen in Klasse j beschreibt:<br />
+
&= 37,94 \text{Minuten}. \\\end{align}</math> Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei <math> x_j^m </math> die Klassenmitte und <math> n_j </math> die Anzahl der Beobachtungen in Klasse j beschreibt:<br />
<math>\begin{aligned}
+
<math>\begin{align}
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j \\
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j \\
 
&= \dfrac{1}{37} \cdot (15 \cdot 14 + 45 \cdot 17 + 75 \cdot 5 + 105 \cdot 1) \\
 
&= \dfrac{1}{37} \cdot (15 \cdot 14 + 45 \cdot 17 + 75 \cdot 5 + 105 \cdot 1) \\
&= 39,324 \text{ Minuten} \\\end{aligned}</math>
+
&= 39,324 \text{ Minuten} \\\end{align}</math>
 
* Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.<br />
 
* Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.<br />
Man berechnet das Arithmetische Mittel <math>\overline{x}</math> von nicht-klassierten Daten wie folgt: <math>\begin{aligned}
+
Man berechnet das Arithmetische Mittel <math>\overline{x}</math> von nicht-klassierten Daten wie folgt: <math>\begin{align}
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
&= \dfrac{1}{37} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
&= \dfrac{1}{37} \cdot \sum_{i=1}^{n} \cdot x_i \\
 
&= \dfrac{1}{37} \cdot 1440  \\
 
&= \dfrac{1}{37} \cdot 1440  \\
&= 38,92 \text{ Minuten}\end{aligned}</math>
+
&= 38,92 \text{ Minuten}\end{align}</math>
  
 
===Zugfolge - Teil I===
 
===Zugfolge - Teil I===

Aktuelle Version vom 14. Juli 2020, 15:18 Uhr

Inhaltsverzeichnis

Anstieg der Produktion

  • i_{G} = \sqrt[4]{{1,1 ^{2} \cdot1,2 ^{2}}} = 1,1489
  • i_{2007/2011} = x_{2011}/x_{2007} = 1,2^{4} = 2,0736

Arbeitslose

X: Arbeitslosenquote\rightarrow Verhältnis von Arbeitslosen zu Erwerbspersonen
Möglichkeit 1
Zusätzliche Informationen g(x_j) sind Arbeitslosenzahlen, beziehen sich inhaltlich auf den Zähler des Merkmals X \rightarrow harmonisches Mittel
\bar{x}_H=\frac{\displaystyle\sum_{j=1}^kg_j}{\displaystyle\sum_{j=1}^k\frac{\displaystyle g_j}{\displaystyle x_j}}=\frac{3000+4000}{\displaystyle\frac{3000}{5}+\frac{4000}{20}}=\frac{7000}{800}=8,75
Die Arbeitslosenquote für das Bundesland beträgt 8,75%.

Möglichkeit 2
Anwendung des arithmetischen Mittels nach vorheriger Berechnung der Informationen für den Nenner des Merkmals X. Diese sind 3000/5=600 und 4000/20=200.

\begin{align}
  \bar{x}& = \frac{1}{n}\sum_{j=1}^kx_jh(x_j)\\
         & = \frac{1}{800}(5\cdot600+20\cdot200)=\frac{3000+4000}{800}=\frac{7000}{800}\\
         & = 8,75
\end{align}

Auswirkung der Regelstudienzeit

  • X: “Semesterzahl”; kardinalskaliert, diskret

  • und c)

    x_{j} h(x_{j}) f(x_{j}) F(x)
    10 20 0,10 0,10
    11 20 0,10 0,20
    12 80 0,40 0,60
    13 40 0,20 0,80
    14 30 0,15 0,95
    15 10 0,05 1,00
    Summe 200 1,00
  • 10 Semester

  • 12 Semester

  • 13 Semester

  • ordinalskaliert

  • Säulendiagramm

  • Nein. Eine Verteilungsfunktion erfordert wegen

    F(x)= \sum_{x_{j} \leq x}f(x)

    eine Ordnungsrelation (“kleiner-gleich”-Beziehung) zwischen den Merkmalsausprägungen. Derartige Vergleichszeichen sind jedoch auf nominalskalierte Merkmale nicht anwendbar, da bei Nominalskalierung keine Anordnung möglich ist.

Benzinverbrauch

Bei Verbrauchsdaten in Liter/100km: v=0,41/8,2=0,05.
Der Variationskoeffizient verändert sich durch die Umrechnung auf Gallonen/100 Meilen nicht, da diese Umrechnung sowohl beim arithmetischen Mittel als auch bei der Standardabweichung vorgenommen werden muss.


Berliner Luftqualität

  • X: “Stickstoffmonoxydgehalt der Berliner Luft im März ”; kardinalskaliert, stetig

  • x_{j}^{u} \leq X < x_{j}^{o} h(x_{
j}) f(x_{j}) F(x) f_K(x_{
j})
    19,5 - 29,5 5 0,3333 0,3333 0,03333
    29,5 - 34,5 4 0,2667 0,6000 0,05334
    34,5 - 39,5 5 0,3333 0,9333 0,06666
    39,5 - 44,5 1 0,0667 1,0000 0,01334
    Summe 15 1,0000
  • Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion

  • 6 Tage

  • 37,5 mg/m^{3}

Besuche pro Woche

  • x_{j} h(x_{j}) f(x_{j}) F(x_{
j})
    0 7 0,14 0,14
    1 11 0,22 0,36
    2 5 0,10 0,46
    3 7 0,14 0,60
    4 7 0,14 0,74
    5 4 0,08 0,82
    6 5 0,10 0,92
    7 3 0,06 0,98
    9 1 0,02 1,00
    50 1,00
  • \overline{x} = 3 Besuche

Bevölkerungsdichte und Ärztedichte

Bevölkerungsdichte: \overline{x} = 150 Einwohner/km^2
Ärztedichte: \overline{y}_{H} = 1 Arzt/1000 Einwohner

Bibliotheken - Teil III

s_{x} = 10,4775 Std./Wo.; s_{y} = 15,2382 Std./Wo.
v_{x} = 0,1612; v_{y} = 0,312

Bibliotheken - Teil II

  • x_{D} = 62,998 Std./Wo.; x_{0,5} = 63,998 Std./Wo.; \overline{x} = 64,959 Std./Wo.
  • y_{D} = 44,166 Std./Wo.; y_{0,5} = 46,3165 Std./Wo.; \overline{y} = 48,831 Std./Wo.
  • nein, da keine unimodale Häufigkeitsverteilung vorliegt
  • z_{0,25} = 2,0502 Mill.EUR/Jahr; z_{0,5} = 3,353 Mill.EUR/Jahr; z_{0,75} = 4,346 Mill.EUR/Jahr;

z_{(1)} = 0,85 Mill.EUR/Jahr; z_{(62)} = 6,56 Mill.EUR/Jahr

Bibliotheken - Teil I

  • alle Merkmale sind kardinalskaliert

    • Öffnungszeiten und Ausleihzeiten: stetig

    • Etat für Neuerwerb: quasi-stetig

    • Planstellen: diskret

  • X: “Öffnungszeiten”

    Öffnungszeiten x_{j} h(x_{j)} f(x_{j}) F(x) f_K(x_j)
    40 – 50 2 0,0323 0,0323 0,00323
    50 – 60 19 0,3065 0,3388 0,03065
    60 – 70 25 0,4032 0,7420 0,04032
    70 – 80 11 0,1774 0,9194 0,01774
    80 – 90 4 0,0645 0,9839 0,00645
    90 – 115 1 0,0161 1,0000 0,00064
    Summe 62 1,0000

    Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion

  • Y: “Ausleihzeiten”

    Ausleihzeiten y_{j} h(y_{j)} f(y_{j}) F(y) f_K(y_j)
    25 – 30 5 0,0806 0,0806 0,01612
    30 – 40 14 0,2258 0,3064 0,02258
    40 – 50 19 0,3065 0,6129 0,03065
    50 – 60 12 0,1935 0,8064 0,01935
    60 – 70 6 0,0968 0,9032 0,00968
    70 – 80 3 0,0484 0,9516 0,00484
    80 – 100 3 0,0484 1,0000 0,00242
    Summe 62 1,0000

    Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion

  • Z: “Etat für Neuerwerb”

    Etat für Neuerwerb z_{j} h(z_{j)} f(z_{j}) F(z) f_K(z_j)
    0 – 1 1 0,0161 0,0161 0,0161
    1 – 2 14 0,2258 0,2419 0,2258
    2 – 3 10 0,1613 0,4032 0,1613
    3 – 4 17 0,2742 0,6774 0,2742
    4 – 5 13 0,2097 0,8871 0,2097
    5 – 6 6 0,0968 0,9839 0,0968
    6 – 7 1 0,0161 1,0000 0,0161
    Summe 62 1,0000

    Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion

  • W: “Planstellen”

    Planstellen w_{j} h(w_{j)} f(w_{j}) F(w) f_K(w_j)
    30 – 70 6 0,0968 0,0968 0,00242
    70 – 80 12 0,1935 0,2903 0,01935
    80 – 100 10 0,1613 0,4516 0,00807
    100 – 150 19 0,3065 0,7581 0,00613
    150 – 200 12 0,1935 0,9516 0,00387
    200 – 270 3 0,0484 1,0000 0,00069
    Summe 62 1,0000

    Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion

    • 0,7872

    • 0,1452

    • 0,3064

    • 0,5484

    • 77 Planstellen

    • 76,088 Std./Wo.

Brutto- und Nettoeinkommen

Bruttoeinkommen/Beschäftigten und Monat: i_{G} = 1,0352
Nettoeinkommen/Beschäftigten und Monat: i_{G} = 1,0279


CDs

  • \overline{x}_{H} = 4,27 EUR/CD
  • s^{2} = 0,1519; s = 0,39 EUR/CD

Das erste Tor

Klassierte Häufigkeitsverteilung


Klasse h(x) H(x) f(x) F(x)
0 – 15 9 9 0,36 0,36
15 – 30 5 14 0,20 0,56
30 – 45 9 23 0,36 0,92
45 – 90 2 25 0,08 1,00



f(20<x\leq60)=F(60)-F(20)=?
F(x)=F(x_j^u)+f(x_j)\cdot(x-x_j^u)/(x_j^o-x_j^u)(Interpolation)
F(60)=F(45)+0,08\cdot(60-45)/(90-45)=0,92+0,0267=0,9467
F(20)=F(15)+0,2\cdot(20-15)/(30-15)=0,36+0,067=0,4267
f(20<x\leq60)=F(60)-F(20)=0,9467-0,4267=0,52

Ladekabel

\overline{x} = 15,52 EUR/Ladekabel


Drei Betriebe

  • \overline{x} = 740 EUR Materialverbrauch/1000EUR Produktion
  • Materialverbrauch pro 1000EUR Produktion, kardinalskaliert
  • i_{G} = 0,97; x_{2013} = 112 908 000 EUR Materialverbrauch

Drei Stichproben

gepoolter Datensatz
\overline{x}=\displaystyle\frac{1}{\displaystyle n}\displaystyle\sum_{p=1}^r\overline{x}_pn_p,\quad n=\displaystyle\sum_{p=1}^rn_p;\quad s^2=\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}s_l^2+\displaystyle\sum_{l=1}^r\frac{\displaystyle n_l}{\displaystyle n}\left(\overline{x}_l-\overline{x}\right)^2 \begin{align}
\overline{x}&=0,1\cdot51+0,4\cdot53+0,5\cdot54=53,3 \\
s^2&=(0,1\cdot21+0,4\cdot22+0,5\cdot23) \\
&+ 0,1(51-53,3)^2 \\
&+0,4(53-53,3)^2+0,5(54-53,3)^2 \\
&=22,4+0,529+0,036+0,245=22,4+0,81=23,21\end{align}

Eine Befragung von Studierenden - Teil II

  • x_{D} = BWL, da BWL die höchste absolute Häufigkeit beinhaltet. Der Modus ist ein geeigneter Lageparameter, da es sich um nominalskalierte Variablenausprägungen handelt, die lediglich eine Verschiedenartigkeit zum Ausdruck bringen.
  • Die drei geeigneten Lageparameter entsprechen hier dem Modus, dem Median und dem Arithmetischen Mittel.
  • Der Modus y_{D} = 1, da die Ausprägung eins die höchste absolute Häufigkeit besitzt.
  • Der Median y_{0,5} = 1, da eins ungerade ist und daher die Formel

\begin{align}
           x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
           &= x_{\left(\tfrac{25+1}{2}\right)} \\
           &= x_{(13)}
           \end{align} für den Median gilt.

  • Das Arithmetische Mittel \overline{y} = 1, da sich mit der Formel

\begin{align}
           \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i  \\
           &= \dfrac{1}{25} \cdot (8 \cdot 0 + 11 \cdot 1 + 4 \cdot 2 + 2 \cdot 3) \\
           &= 1 \text{ ergibt}.
           \end{align}

  • Das durchschnittliche Einkommen eines/einer Studierenden ergibt sich durch Berechnen des Arithmetischen Mittels wie folgt:

\begin{align}
           \overline{z} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot z_i \\
           \overline{z} &= \dfrac{1}{25} \cdot (924 + ... + 640) \\
           &= \dfrac{1}{25} \cdot 20200 \\
           &= 808 \text{ EUR}
           \end{align}

  • Als aussagekräftige Lageparameter werden das Arithmetische Mittel und der Median berechnet.
  • Der Median berechnet sich für klassierte Daten mit der folgenden Formel: \begin{align}
z_{0,5} &= x_j^u + \dfrac{(0,5 - F(z_j^u))}{f(z_j^m)} \cdot (z_j^o - z_j^u) \\
&= 700 + \dfrac{(0,5 - 0,48)}{0,32} \cdot 200 \\
&= 712,5 \text{ EUR} \end{align}
  • Das Arithmetische Mittel wird hier für klassierte Daten mit der folgenden Formel berechnet, wobei  x_j^m die Klassenmitte und n_j die Anzahl der Beobachtungen in Klasse j angibt: \begin{align}
\overline{z} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot z_j^m \cdot n_j \\
&= \dfrac{1}{25} \cdot (625 \cdot 6 + 675 \cdot 6 + 800 \cdot 8 + 1050 \cdot 2 + 1325 \cdot 3) \\
&= \dfrac{20275}{25} \\
&= 811 \text{ EUR}. \end{align} Für die Berechnung der Quantile von klassierten Daten wird folgende Formel verwendet: \begin{align}
F(x_p) &= p \Leftrightarrow x_p = x_j^u + \dfrac{(p - F(x_j^u))}{f(x_j)} \cdot (x_j^o - x_j^u)\end{align}
  • Die Quartile werden somit wie folgt für klassierte Daten berechnet: \begin{align}
z_{0,25} &= 650 + \dfrac{(0,25 - 0,24)}{0,24} \cdot 50 \\
&= 652,08 \text{ EUR}\\
z_{0,75} &= 700 + \dfrac{(0,75 - 0,48)}{0,32} \cdot 200 \\
&= 868,75 \text{ EUR}\end{align}
  • Das 90%-Quantil ergibt somit: \begin{align}
z_{0,9} &= 1200 + \dfrac{(0,9 - 0,88)}{0,12} \cdot 250 \\
&= 1241,67 \text{ EUR}\end{align}
  • Minimum und Maximum sind hier wie folgt:
  • Das Minimum ist hier z_{(1)} = 616, da es die kleinste Merkmalsausprägung des Merkmals Einkommen ist
  • Das Maximum entspricht z_{(25)} = 1440, da es demgegenüber die größte Ausprägung des Merkmals Einkommen ist

Die Quantile ergeben sich wie folgt:

  • z_{0,25} = 660, da n \cdot p keine ganze Zahl ist, sondern hier 25 \cdot 0,25 = 6,25 woraufhin die Ausprägung an der auf n \cdot p folgenden Zahlenstelle gilt, das heißt 660 ist die Ausprägung an der siebten Stelle.
  • z_{0,5} = 700 mit n \cdot p = 25 \cdot 0,5 = 12,5  \Rightarrow 700 ist das Ergebnis und steht als Ausprägung an dreizehnter Stelle
  • z_{0,75} = 850 mit n \cdot p = 25 \cdot 0,75 = 18,75 \Rightarrow Das entspricht der Ausprägung an neunzehnter Stelle

Eine Befragung von Studierenden - Teil I

Datei:2-7 2-17 Eine Befragung von Studierenden.xlsx

    • Grundgesamtheit: Die Menge aller Studierenden der deutschen Hochschule im Juni

    • Stichprobe: Die Menge der 25 befragten Studierenden der deutschen Hochschule im Juni

    • Statistische Einheiten: Studierende der deutschen Hochschule im Juni

    • Identifikationskriterien:

    • örtlich: Deutschland

    • zeitlich: Juni

    • sachlich: immatrikulierte Person an der Hochschule

  • X: “Studiengang”; nominalskaliert

    Studiengang x_j h(x_{j}) f(x_{j})
    VWL 5 0,2
    BWL 10 0,4
    Polit.Wiss. 5 0,2
    Sozialwiss. 5 0,2
    Summe 25 1,0

    Graphische Darstellung als Säulendiagramm, Kreisdiagramm oder Flächendiagramm. Siehe dazu Folien in der Vorlesung “Deskriptive Statistik”, beispielsweise:

  • Grafische Darstellung der Häufigkeit II

  • Y: “Anzahl der Geschwister”; kardinalskaliert, diskret

    Anzahl der Geschwister y_{j} h(y_{j}) f(y_{j}) F(y)
    0 8 0,32 0,32
    1 11 0,44 0,76
    2 4 0,16 0,92
    3 2 0,08 1,00
    Summe 25 1,00

    Graphische Darstellung der Häufigkeitsverteilung als Stabdiagramm, der empirischen Verteilungsfunktion als Treppenfunktion

  • 23 Studierende haben höchstens 2 Geschwister.

  • Viermal 2 Geschwister + zweimal 3 Geschwister = 6 Personen mit mindestens 2 Geschwistern, d.h.
    \dfrac{6}{25}=0,24=24\% haben mindestens zwei Geschwister.

    \dfrac{15}{25}=0,6=60\% haben ein oder zwei Geschwister.

  • Z: “Einkommen”; kardinalskaliert (metrisch), quasi-stetig

    Einkommen z_{j}^{u} \leq Z < z_{j}^{o} h(z_{j}) f(z_{j}) F(z) f_K(z_j)
    600 – 650 6 0,24 0,24 0,0048
    650 – 700 6 0,24 0,48 0,0048
    700 – 900 8 0,32 0,80 0,0016
    900 – 1200 2 0,08 0,88 0,0003
    1200 – 1450 3 0,12 1,00 0,0005
    Summe 25 1,00

    Graphische Darstellung der Häufigkeitsverteilung als Histogramm, der empirischen Verteilungsfunktion als stückweise linearer Funktion

    • P[\{750 \leq Z \leq 1300\}] = F(1300) - F(750)
      \begin{align}
F(1300) &=& 0,88 + \frac{1300 - 1200}{1450 - 1200} \cdot 0,12 = 0,928 \\
F(750) &=& 0,48 + \frac{750-700}{900 - 700} \cdot 0,32 = 0,56 \\
 P[\{750 \leq Z \leq 1300\}] &=& F(1300) - F(750) = 0,928 - 0,56 \\
  \end{align}

    • P[\{Z > 800\}] = 1 - F(800) \begin{align}
&=& 1 - [0,24 + 0,24 + \frac{(800 - 700)}{(900 - 700)} \cdot 0,32] \\
&=& 1 - [0,48 + \frac{100}{200} \cdot 0,32] \\
&=& 0,36
  \end{align}

    • 0,5 = 0,48 + \frac{z - 700}{ 900 - 700}\cdot 0,32
  \rightarrow  z = 712,5 \mbox {EUR}

    •  0,12 + 0,08 = 0,2 \Rightarrow 20 \% \Rightarrow 900 EUR

Einkommen der Beamten

Gegeben:
x_{0,5}=2590; x_{0,75}=3590; R=8000; IQR=1770; x_{min}=500; s=1620; v=0,54
Gesucht:
x_{0,25}=x_{0,75}-IQR=3590-1770=1820

Einkommensgleichheit

Atoll A
Person Einkommen x_i^2 x_i-\overline{x} (x_i-\overline{x})^2
(in Kauri Schnecken)
1 225 50625 32,625 1064,390625
2 185 34225 -7,375 54,390625
3 250 62500 57,625 3320,640625
4 150 22500 -42,375 1795,640625
5 237 56169 44,625 1991,390625
6 100 10000 -92,375 8533,140625
7 87 7569 -105,375 11103,890625
8 305 93025 112,625 12684,390625
\sum 1539 336613 40547,875



\overline{x}=1539/8=192,375

Einkommen und Alter

  • a) und b)

    Einkommen Alter RV X
    20-30 30-40 40-50 50-60 60-70
    0-1000 0.02 0.04 0.02 0.02 0.02 0.12
    1000-1500 0.04 0.08 0.08 0.06 0.02 0.28
    1500-2000 0.06 0.12 0.12 0.06 0.04 0.40
    2000-3000 0.02 0.06 0.04 0.04 0.04 0.20
    RV Y 0.14 0.30 0.26 0.18 0.12 1.00
  • c)
  • Einkommen Alter
    20-30 30-40 40-50 50-60 60-70
    0-1000 0.143 0.133 0.077 0.111 0.0167
    1000-1500 0.286 0.267 0.308 0.333 0.167
    1500-2000 0.429 0.400 0.462 0.333 0.167
    2000-3000 0.143 0.200 0.154 0.222 0.333
    1.000 1.000 1.000 1.000 1.000
  • d)

  • Einkommen Alter RV X
    20-30 30-40 40-50 50-60 60-70
    0-1000 0.167 0.333 0.167 0.167 0.167 1.000
    1000-1500 0.143 0.286 0.286 0.214 0.071 1.000
    1500-2000 0.150 0.300 0.300 0.150 0.100 1.000
    2000-3000 0.100 0.300 0.200 0.200 0.200 1.000

  • e)

    \overline{x} = 1610 EUR

  • f)

    \overline{y} = 43,4 Jahre

  • g)

    x_{D} = 1642,86 EUR

  • h)

    x_{Z} = 1625 EUR

  • i)

    1535,71 EUR; 1600 EUR; 1615,38 EUR; 1611,11 EUR; 1708,33 EUR

  • j)

    s_{x} = 591,95 EUR

  • k)

    s_{xy} = 476

Einwohnerzahlen

Da wir zwei große Ausreißer in den Daten haben (China und Indien) muss der Median verwendet werden: x_{0,5}=0,5\cdot(x_{(5)}+x_{(6)})=0,5\cdot(122+139)=131

Eiskugelkonsum

  • X: “Eiskonsum in Kugeln”; kardinalskaliert, diskret

  • x_{j} h(x_{j}) f(x_{j}) F(x)
    1 40 0,20 0,20
    3 50 0,25 0,45
    4 70 0,35 0,80
    5 10 0,05 0,85
    6 30 0,15 1,00
    Summe 200 1,00
  • Häufigkeitsverteilung: Stabdiagramm
    empirische Verteilungsfunktion: Treppenfunktion

  • F(5) = 0,85

  • 3 Kugeln

  • 4 Kugeln

Erdbeerplantage - Teil II

  • \overline{x} = 4,65 Std./Tag
  • x_{0,5} = 4,5 Std./Tag

Erdbeerplantage - Teil I

Datei:Erdbeerplantage.xlsx

  • X: “Anzahl der Sonnenstunden pro Tag in dieser Saison”; kardinalskaliert, stetig klassiert

  • x_j^u\le x_{j}<x_j^o h(x_{j}) f(x_{j}) F(x) f_K(x_j)
    0 - 2 20 0,20 0,20 0,10
    2 - 3 15 0,15 0,35 0,15
    3 - 5 20 0,20 0,55 0,10
    5 - 8 35 0,35 0,90 0,12
    8 - 12 10 0,10 1,00 0,03
    Summe 100 1,0000

    Häufigkeitsverteilung: Histogramm

  • empirische Verteilungsfunktion: stückweise lineare Funktion

  • an 55 Tagen

  • 3,5 Std./Tag

  • 47,5 %

Festgeldkonten

Zuerst muss der Median der Zinssätze für Einlagen im jeweiligen Land x_{0,5}(L) berechnet werden. Hierzu wird jeweils die Klasse x_j, j\in\{1,2,3,4\} bestimmt, in welcher der Median liegt. Bezeichnet x_j^u die untere Klassengrenze, so ist für klassierte Daten \begin{align}
   x_{0,5}(L)&=&x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)\\
   x_{0,5}(1)&=&5,0+\frac{0,5-0,44}{0,30}\cdot0,5=5,1\\
   x_{0,5}(2)&=&5,0+\frac{0,5-0,16}{0,34}\cdot0,5=5,5\\
   x_{0,5}(3)&=&5,5+\frac{0,5-0,375}{0,625}\cdot0,5=5,6\\
   x_{0,5}(4)&=&4,5+\frac{0,5-0,15}{0,35}\cdot0,5=5,0\\
   x_{0,5}(5)&=&4,5+\frac{0,5-0,275}{0,375}\cdot0,5=4,8
 \end{align} Ermittlung der länderspezifischen variablen Zinssätze z(L)=0,7z+0,3x_{0,5}(L) mit z=5,2:
Land 1: z(1)=0,7\cdot5,2+0,3\cdot5,1=5,17
Land 2: z(2)=0,7\cdot5,2+0,3\cdot5,5=5,29
Land 3: z(3)=0,7\cdot5,2+0,3\cdot5,6=5,32
Land 4: z(4)=0,7\cdot5,2+0,3\cdot5,0=5,14
Land 5: z(5)=0,7\cdot5,2+0,3\cdot4,8=5,08
Damit folgt für den durchschnittlichen variablen Zinssatz der Bank:
\overline{z}(L)=26/5=5,2

Fließband

Die mittlere Stückzeit kann also harmonisches Mittel berechnet werden, da es sich bei den angebenen Daten um Verhältniszahlen (Zeit/Stück) handelt, deren Nenner (die Stückzahlen) nicht explizit gegeben sind. \begin{align}
\overline{x}_H&=&\frac{n}{\displaystyle \sum_{i=1}^n\frac{1}{x_i}}=\displaystyle\frac{6}{\displaystyle\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{10}+\frac{1}{8}+\frac{1}{5}}\\
&=&\frac{6}{0,5+0,25+0,125+0,1+0,125+0,2}=\frac{6}{1,3}=4,61538\end{align}

Führerschein–Entziehungen

  • \overline{x} = 35,65 Jahre \approx 36 Jahre
  • s = 10,39 Jahre; v = 0,2914
  • x_{0,25} = 26,44 Jahre; x_{0,75} = 43,868 Jahre; QA = 17,428 Jahre
  • x_{Z} = 34 Jahre
  • d = 8,6 Jahre

Gartenzwerg–Großhandel

  • ** X: “Auftragshöhe (in EUR) pro Auftrag”; kardinalskaliert
    • Das Merkmal wurde an den einzelnen Aufträgen erhoben
    • Die durchschnittliche Auftragshöhe für klassierte Daten wird wie folgt berechnet: \begin{align}
   \overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j\text{, wobei } n = \sum_{j=1}^{k} \cdot u_j \\
   \overline{x} &= \dfrac{1}{100} \cdot (10000 \cdot 15 + 35000 \cdot 30 + 100000 \cdot 45 + 225000 \cdot 10) \\
   \overline{x} &= 79 500 \text{ EUR/Auftrag}
   \end{align}
  • \overline{x}= a + b \cdot \overline{y}; \overline{x} = 0 + 1,5\cdot60 000 = 90 000 EUR/Auftrag
  • **
    • Arithmetisches Mittel \overline{x} nicht sinnvoll, da Ausreißer vorkommt
    • Der Modus x_{D} nicht sinnvoll, da eventuell multimodale Häufigkeitsverteilung vorliegt
    • Sinnvoll ist hier der Median mit dem Ergebnis x_{0,5} = 12 000 EUR/Auftrag. Da n ungerade ist gilt: \begin{align}
               x_{0,5} &= x_{\left(\tfrac{n+1}{2}\right)} \\
               &= x_{\left(\tfrac{5+1}{2}\right)} \\
               &= x_{(3)} 
               \end{align}
    • \begin{align}
               \overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
               &= \dfrac{1}{5} \cdot 45000 \\
               &= 9 000 \text{ EUR/Auftrag} 
              \end{align}
  • Die durchschnittliche Auftragshöhe für das gesamte Unternehmen beträgt: \begin{align}
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
&= \dfrac{1}{(95 + 5 + 100)} \cdot (100 \cdot 79500 + 95 \cdot 90000 + 5 \cdot 9000) \\
&= 82 725 \text{ EUR/Auftrag}\end{align}

Gefahrene Strecke

Gesucht ist der Quartilsabstand: \begin{align}
QA    &=x_{0,75}-x_{0,25}\\
x_p   &=x_j^u+(p-F(x_j^u))(x_j^o-x_j^u)/f(x_j)\\
x_{0,25}&=50+(0,25-0,15)50/0,25=70 \text{ km}\\
x_{0,75}&=300+(0,75-0,7)200/0,2=350 \text{ km}\\
QA&=350-70=280 \text{ km}\end{align}

Gleisbaubetrieb

Berechnet wurde das einfache arithmetische Mittel. Dies ist jedoch falsch, da das statistische Merkmal Bauzeit/Gleis eine Verhältniszahl ist und die gegebenen Zusatzinformationen über die Bauzeit jedes Bauzuges (8 Stunden) sich inhaltlich auf den Zähler der Verhältniszahl beziehen (In dieser Zusatzinformation steckt die unterschiedliche Anzahl von Gleisen, die von jedem Bauzug in dieser Schicht verlegt wurden und die bei der Berechnung des einfachen arithmetischen Mittels nicht berücksichtigt wurden). Es ist deshalb das einfache harmonische Mittel anzuwenden: \overline{x}_{H} = 166,67 Minuten/Gleis.

Glücksspielautomaten

\overline{x}(A)=2,0\quad\overline{x}(B)=1,893
x_z(A)=1,75

Grafische Darstellung

Die beiden Balkendiagramme scheiden aus, da die Variable metrisch stetig ist. Da die Daten klassiert mit unterschiedlicher Klassenbreite vorliegen, muss auf der Ordinatenachse die Häufigkeitsdichte abgetragen werden. Damit scheiden die Histogramme aus, bei denen auf der Ordinatenachse die relativen Häufigkeiten abgetragen wurden.


Alter unter 15 15-18 18-25 25-65 65-90 \sum
Anzahl
der Getöteten 126 76 258 808 638 1906
rel. Häufigkeit 0,06611 0,03987 0,13536 0,42392 0,33473
Häufigkeitsdichte 0,00472 0,01329 0,01934 0,01060 0,01339



Aufgrund dieser Häufigkeitsdichten gibt das Histogramm D die Daten korrekt wieder.

Histogramm

j Klassen H.-dichte F(X)
1 0 – 2 0,05 0,1 = 0,05\cdot2 0,1
2 2 – 6 0,10 0,4 = 0,1\cdot4 0,5
3 6 – 12 0,05 0,3 = 0,05\cdot6 0,8
4 12 – 20 0,025 0,2 = 0,025\cdot8 1,0
1,0



\begin{align}
    F(X)&=&F(x_j^u)+\frac{x-x_j^u}{x_j^o-x_j^u}\cdot f(x_j)\\
    F(5)&=&0,1+\frac{5-2}{6-2}\cdot0,4=0,1+0,3=0,4\\
    F(16)&=&0,8+\frac{16-12}{20-12}\cdot0,2=0,8+0,1=0,9\end{align} F(5\leq X\leq16)=F(16)-F(15)=0,9-0,4=0,5
H(5\leq X\leq16)=F(5\leq X\leq16)\cdot110=0,5\cdot110=55

55 Gemeinden dieses Landkreises haben eine Einwohnerzahl von mindestens 5000 und höchstens 16000.

Intercity – Zug

\overline{x}_{H} = 112,5 km/h

Internetstunden

Berechnung von f(.):f(x_j)=\hat{f}(x_j)\cdot(x_j^o-x_j^u)

Internetstunden
von …bis unter … \hat{f}(x_j) f(x_j) F(x_j)
0 – 4 0,05 0,20 0,20
4 – 8 0,06 0,24 0,44
8 – 12 0,09 0,36 0,80
12 – 16 0,03 0,12 0,92
16 – 20 0,02 0,08 1,00
1,00



Medianklasse ist 8 – 12.x_z=x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)=8+\frac{0,5-0,44}{0,36}\cdot(12-8)=8,6666

Kaltmieten

Medianklasse ist 10-13.x_z=x_j^u+\frac{0,5-F(x_j^u)}{f(x_j)}\cdot(x_j^o-x_j^u)=10+\frac{0,5-0,45}{0,3}\cdot(13-10)=10,5


Wohnfläche (m^2)
von …bis unter … Anzahl f(x_j) F(x_j)
0-6 5 0,05 0,05
6-8 10 0,10 0,15
8-10 30 0,30 0,45
10-13 30 0,30 0,75
13-16 20 0,20 0,95
16-20 5 0,05 1,00
100 1,00


Kartoffeln

  • X:“Kosten je verladene Tonne Kartoffeln”; \overline{x}_{H} = 0,83 EUR/Tonne
  • Y:“Verladene Tonnen Kartoffeln je Stunde”; \overline{y} = 52 t/h

Kaufkurs der Aktien

\begin{align}
\overline{x}_H = \frac{\displaystyle\sum_{j=1}^{k}g_j}{\displaystyle\sum_{j=1}^k\frac{g_j}{x_j}} &= \frac{45000+84000+3600+14000}{\displaystyle\frac{45000}{500}+\frac{84000}{600}+\frac{3600}{400}+\frac{14000}{700}} \\
&= \frac{146600}{90+140+9+20} \\
&=\frac{146600}{259}=566,02\end{align}

oder\overline{x}=\frac{1}{n}\sum_{j=1}^kx_jh(x_j)=\frac{500\cdot90+600\cdot140+400\cdot9+700\cdot20}{90+140+9+20}=\frac{146600}{259}=566,02

Körperschaftssteueraufkommen

Berechnung der gepoolten Varianz; dafür ist der Gesamtmittelwert erforderlich \begin{align}
   \overline{x}&=&\frac{1}{n}\sum_{p=1}^r\overline{x}_pn_p\\
   &=&\frac{1}{10000}(100\cdot9500+9500\cdot100+300\cdot200+100\cdot400)=\frac{2000000}{10000}=200\\ \\
   s^2&=&\sum_{l=1}^r\frac{n_l}{n}s_l^2+\sum_{l=1}^r\frac{n_l}{n}(\overline{x}_l-\overline{x})^2\\
   &=&\left[\frac{100}{10000}\cdot(1000)^2+\frac{9500}{10000}\cdot(80)^2+\frac{300}{10000}\cdot(100)^2+\frac{100}{10000}\cdot(250)^2\right]\\&+&\left[\frac{100}{10000}\cdot(9500-200)^2+\frac{9500}{10000}\cdot(100-200)^2+\frac{300}{10000}\cdot(200-200)^2\right.\\
     &+&\left.\frac{100}{10000}\cdot(400-200)^2\right]\\
     &=&(10000+6080+300+625)+(864900+9500+0+400)=891805\\ \\
   \sqrt{s^2}&=&\sqrt{891805}=944,3543\approx944
 \end{align}

Kontrollzeiten

X: Kontrollzeit pro Stück; Verhältniszahl. Die Bestandsmasse, über die zu mitteln ist, sind somit die produzierten Stück und nicht die Arbeiterinnen. Als zusätzliche Informationen sind jedoch nicht die produzierten Stück (Zusatzinformation zum Nenner des Merkmals), sondern die gesamte Kontrollzeit von 8 Stunden (Zusatzinformation zum Zähler von X) gegeben, die für alle Arbeiterinnen gleich ist. Anwendung des einfachen harmonischen Mittels:
\begin{align}
\overline{x}_H &=\frac{\displaystyle n}{\displaystyle\sum_{i=1}^n\frac{\displaystyle1}{\displaystyle x_i}} =\frac{6}{\displaystyle\frac{1}{0,2}+\frac{1}{0,4}+\frac{1}{0,8}+\frac{1}{0,5}+\frac{1}{0,5}+\frac{1}{0,8}}\\
&= \frac{6}{5+2,5+1,25+2+2+1,25} \\
&=\frac{6}{14}= 0,4285\approx0,429 \mbox{ min/Stück}\end{align} Es können jedoch auch die von den einzelnen Arbeiterinnen in den acht Stunden kontrollierten Stückzahlen aus der Tabelle ermittelt werden, die die absoluten Häufigkeiten für die Berechnung des arithmetischen Mittels darstellen (2400,1200,600,960,960,600). Dann Anwendung des gewogenen arithmetischen Mittels:
\overline{x}=(6\cdot480)/6720=2880/6720=0,4285\approx0,429\mbox{ min/Stück}

Kurzarbeiter

  • \overline{x} = 44,328 %
  • x_{0,5} = 40,36 %

Leichtathletikabteilung

  • Histogramm

  • 10,8 sec.

  • MQ(\overline{x}) = s^{2} = 0,0601 sec^{2}; x_{0,5} = 10,52 sec.; MQ(x_{Z}) = 0,0602

  • MQ(\overline{x}) < MQ(x_{Z}); ja; Beweis über den Verschiebungssatz

    MQ(c)=\frac{1}{n} \sum (x_{i}-c) ^{2} = \frac{1}{n} \sum
   (x_{i}- \overline{x} + \overline{x} - c) ^{2} = s^{2}+(\overline{x} - c) ^{2}; c=x_{0,5}

Lernzeit

  • X:“Aufwand für das Studium (in Stunden)”; kardinalskaliert

  • x_{j}^{u} \leq x_{j}<x_{j}^{o} x_{j} h(x_{j}) f(x_{j}) F(x_{j}) f_K(x_{j})
    0 - 3 1,5 30 0,3 0,3 0,1
    3 - 6 4,5 48 0,48 0,78 0,16
    6 - 8 7 17 0,17 0,95 0,085
    8 - 12 10 5 0,05 1,00 0,0125
  • x_{0,5} = 4,25 Stunden

  • 38 Studenten

  • \overline{x} = 4,3 Stunden

  • x_{D} = 4,333 Stunden

Lineares Streuungsmaß

\begin{align}
X_Z &=& 17; d = (1/n)\sum_{i=1}^n|x_i - x_Z| ;\\ 8 &=& (1/5)(|3-17|+|7-17|+|17-17|+|19-17|+|x_5-17|)\\ \Leftrightarrow 40 &=& 14+10+0+2+x_5-17 
\\ \Leftrightarrow x_5 &=& 31\end{align}

Maschinen

v_{Fiat} = 0,05; v_{Mercedes} = 0,02

Miete und Wohnfläche

s_{xy}=\displaystyle\frac{1}{n}\sum x_iy_i-\overline{x}\cdot\overline{y}
\overline{x}=\displaystyle\frac{3\cdot40+60+2\cdot80+4\cdot90}{10}=\frac{700}{10}=70
\overline{y}=\displaystyle\frac{3\cdot12+15+9+5\cdot10}{10}=\frac{110}{10}=11
\overline{x}=70, \overline{y}=11, \sum x_iy_i=7390

\rightarrow s_{xy}=7390/10-70\cdot11=-31

Minimale Summe

c=\bar{x}=10
Begründung:
Quadratische Minimumseigenschaft des arithmetischen Mittels

Nelkenstrauß

\overline{x} = 0,95 EUR/Nelke

Neubauwohnungen

\overline{x} = 9,15 Monate/Wohnungseinheit
x_{0,5} = 8,5403 Monate/Wohnungseinheit
x_{D} = 7,3846 Monate/Wohnungseinheit

Perlenkette

  • Durchmesser h(x_{j}) f(x_{j}) F(x_{j})
    3 - 4 20 0,278 0,278
    4 - 5 21 0,292 0,570
    5 - 6 19 0,264 0,834
    6 - 7 9 0,125 0,959
    7 - 8 3 0,041 1,000
  • \overline{x} = 4,861 mm

  • x_{D} = 4,33 mm

  • x_{0,5} = 4,76 mm

Produktionsleistung einer Maschine

  • \overline{x} = 296,75 Stück/Tag; 296,75/300 = 0,9892

    Die Maschine ist durchschnittlich zu 98,92 % pro Tag ausgelastet; die Behauptung ist richtig.

  • x_{Z} = 296,5 Stück/Tag; d = 1,15 Stück/Tag

Reinigungsunternehmen - Teil II

s_{1}^{2} = 45 693; s_{1} = 213,759; v_{1} = 0,086
s_{2}^{2} = 4848,75; s_{2} = 69,633; v_{2} = 0,02467
s_{3}^{2} = 12 032,4; s_{3} = 109,692; v_{3} = 0,04441 \begin{align}
s ^{2}&= \sum\limits_{l=1} ^3\dfrac{n_{l}}{n}s_{l} ^{2}+ \sum\limits
      _{l=1} ^3\dfrac{n_{l}}{n}(\overline{x}_{l}- \overline{x}) ^{2} \\
      &= \dfrac{6}{15} \cdot 45693+\dfrac{4}{15} \cdot 4848,75 \\ 
      &+\dfrac{5}{15} \cdot 12032,4+\dfrac{6}{15}(-83,2) ^{2}+\dfrac{4}{15} \cdot 251,3 ^{2}+\dfrac{5}{15}(-101,2) ^{2} \\
     &= 23581+23023,16 \\
     &= 46604,16 \\
     \\
     s&= 215,88 \text{ EUR;} \\
    v&= 0,08396\end{align}

Reinigungsunternehmen - Teil I

  • \overline{x} = 2488 EUR; x_{0,5} = 2470,5 EUR;
  • \overline{x} = 2822,5 EUR; x_{0,5} = 2798 EUR;
  • \overline{x} = 2470 EUR; x_{0,5} = 2454 EUR;
  • \overline{x} = 2571,2 EUR; x_{0,5} = 2546 EUR.

Sanatorium

  • Spearman’scher Rangkorrelationsoeffizient r_{S}=  1- \frac{6\sum_{i=1}^n d_{i}^2}{n(n^2-1)},\quad 
\text{wobei:}\quad
   d_i = \text{Rang } x_i -  \text{Rang }  y_i

    Zusammenhang zwischen Gewicht und Laufleistung:

    Platzierung Y Gewicht X Rang Gewicht Differenz²
    1 70 2 1
    2 60 1 1
    3 80 6 9
    4 77 3 1
    5 82 8 9
    6 81 7 1
    7 78 4 9
    8 100 10 4
    9 83 9 0
    10 110 11 1
    11 79 5 36

    \begin{align}
  \sum_{i=1}^n d_i^2  &= 1+1+9+1+9+1+9+4+0+1+36\\
        &= 72\\\end{align}

    r_{S}=  1- \frac{6\cdot72}{11(11^2 -1)}=0,6727

  • a) Median für nicht klassierte Daten, n ungerade x_{Z}= x_{0.5}=x_{(\frac{n+1}{2})}=x_6=80 \text{ kg }

  • Quadratisches Streuungsmaßim Bezug auf Median

    \begin{align}
 MQ(x_{Z})&= MQ(x_{0,5}) = \frac{1}{n}\sum_{i=1}^n  (x_i - x_{0,5})^2\\ &=((70-80)^2+(60-80)^2+(80-80)^2\\&+(77-80)^2+(82-80)^2+(81-80)^2\\&+(78-80)^2+(100-80)^2+(83-80)^2\\&+(110-80)^2+(79-80)^2)\cdot\frac{1}{11} \\
&= \frac{1828}{11} = 166,18\\\end{align}

  • Kleiner, da die Varianz ein Streuungsmaß in Bezug auf das arithmetische Mittel ist. Das arithmetische Mittel minimiert die mittlere quadratische Abweichung.

  • Durchschnittsgeschindigkeit der Frauen?

    • Eine Frau läuft den Lauf mit 2m/s

    • Die andere Frau läuft den Lauf mit 4m/s

    Insgesamt wurden 100m gelaufen, 50m mit 2m/s und 50m mit 4m/s. Kann auch wie eine Frau betrachtet werden die erst 50m langsamer und dann 50m schneller läuft.
    Harmonisches Mittel:

    \begin{align}
    \overline{x}_{H}&=  \frac{50m+50m}{\frac{50m}{2m / s} +\frac{50m}{4m / s}} = \frac{100m}{25s +12,5s }\\
      &=\frac{100m}{37,5s}=2,667  m / s\\
   \end{align}

Schafzucht Teil - II

Pfund = Gebühr + Wechselkurs \cdot Gulden, y_{i } = a + b \cdot x_{i}
\overline{x} = 7,8 Tsd. Gulden; s_{x}^{2} = 37,76 (Tsd. Gulden)^{2};
\overline{y} = 3,1 Tsd. Pfund; s_{y}^{2} = 9,44 (Tsd. Pfund)^{2};
\overline{y} = 3,1 = a + b\overline{x}; s_{y}^{2} = b^{2}\cdot s_{
x}^{2}
a = 3,1 - 7,8b; b^{2 } = s_{y}^{2}/s_{x}^{2} = 0,25; b = 0,5
a = 3,1 - 0,5 \cdot 7,8 = - 0,8
Gebühr: 0,8 Tsd. Pfund; Wechselkurs: 1 Pfund : 2 Gulden

Schafzucht - Teil I

Wir berechnen das harmonische Mittel. Von den in der Vorlesung präsentierten Formeln wählen wir die folgende, weil der Lohn im Verhältnis zur Leistung gegeben ist: \overline{x}_H = \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}}, wobei g_1 die Lohnsumme für die Irischen Arbeiter und g_2 die Lohnsumme für die einheimischen Arbeiter darstellt. Das bedeutet hier, dass g_1 =285 und g_2 =260, und x_1=15 den Lohn für die Irischen Arbeiter in Pfund pro Kilogramm und x_2=20 den Lohn für die einheimischen Arbeiter darstellt. Damit ergibt sich für das harmonische Mittel: \begin{align}
\overline{x}_H &= \dfrac{\sum_{j=1}^{k}g_j}{\sum_{j=1}^{k}\dfrac{g_j}{x_j}}\\
                &= \dfrac{285+ 260}{\dfrac{285}{15}+\dfrac{260}{20}}\\
                &= \dfrac{545}{19+13}=17,03 \dfrac{\text{Pfund} }{\text{kg}}\end{align}

Schulbezirke

Für Variable X: X=\mbox{nominal, nur Modus}
Für Variable Y: Y=\mbox{metrisch, alle außer Modus}



Streuungsmaß

  • Begründung:

Gegeben n=50 Elemente, k=2
K(50;2)=1225

  • metrisch (kardinal) skalierte Merkmale

Tägliche Arbeitswege - Teil II

  • x_{0,25} = 4; x_{0,75} = 22,5; QA = 18,5 km
  • x_{Z} = 10,4286 km; d = 9,53 km

Tägliche Arbeitswege - Teil I

  • Beschäftigter; Anfahrtsweg (in km) pro Beschäftigter; kardinalskaliert

  • {|class="wikitable" !align="right"| Anfahrtsweg !align="right"| h(x_{j}) !align="right"| f(x_{j}) !align="right"| F(x_{j}) !align="right"| f_K(x_{
j}) |- |align="right"| 0 - 1 |align="right"| 7 |align="right"| 0,07 |align="right"| 0,07 |align="right"| 0,07 |- |align="right"| 1 - 5 |align="right"| 24 |align="right"| 0,24 |align="right"| 0,31 |align="right"| 0,06 |- |align="right"| 5 - 15 |align="right"| 35 |align="right"| 0,35 |align="right"| 0,66 |align="right"| 0,035 |- |align="right"| 15 - 30 |align="right"| 18 |align="right"| 0,18 |align="right"| 0,84 |align="right"| 0,012 |- |align="right"| 30 - 50 |align="right"| 16 |align="right"| 0,16 |align="right"| 1,00 |align="right"| 0,008 |}
  • \overline{x} = 14,705 km

  • x_{D} = 0,875 km; Modus

  • x_{0,5} = 10,4286 km

  • x_{0,05} = 0,7143 km; x_{0,25} = 4 km; x_{0,75} = 22,5 km; x_{0,9} = 37,5 km

Tarifverhandlungen

X: Jahresbruttolohn vor der Tarifverhandlung, Y:Jahresbruttolohn nach der Tarifverhandlung; \overline{x} = 21200\mbox{ EUR} \overline{y} = \frac{\sum_{i=1}^{n} y_i}{n} = \frac{\sum_{i=1}^{n_1}(a_1+bx_i)+\sum_{i=n_1+1}^{n_2}(a_2+bx_i)}{n} = \frac{n_1a_1+n_2a_2}{n}+b\overline{x}
n_1=4000, n_2=16000, n=20000, a_1=200, a_2=0, b=1,05; \overline{y}=4000\cdot 200/20000+1,05\cdot 21200=40+22260=22300 EUR

Tekolom und IBBM - Teil I

X=\mbox{Kurs der Tekolom--Aktie}, Y=\mbox{Kurs der IBBM--Aktie},
relative Häufigkeiten: f_1=73/365=0,2; f_2=146/365=0,4; f_3=146/365=0,4
\overline{x}=\sum f_ix_i, \overline{y}=\sum f_iy_i, s^2_X=\sum f_i(x_i-\overline{x})^2, s^2_Y=\sum f_i(y_i-\overline{y})^2,
s_{XY}=\sum f_i(x_i-\overline{x})(y_i-\overline{y})
\overline{x}=41, \overline{y}=126, s^2_X=14, s^2_Y=14, s_{XY}=4, \rho=\displaystyle\frac{s_{XY}}{s_Xs_Y}=0,28571

Telefonanbieter

\overline{x}_H=\displaystyle\frac{\mbox{Gesamtsumme}}{\mbox{Gesamtdauer}}=\displaystyle\frac{78,75}{525}=0,15

Telefon–Interviews

10 Minuten|Freizeit =0,48 EUR, 18 Interviews
\text{ } \qquad 10\cdot60 Sek. =600/150=4  Einheiten \cdot12=48 Cent
10  Minuten|Tag=0,84 EUR, 10 Interviews
\text{ } \qquad 10\cdot60 Sek. =600/90=6,\overline{66} Einheiten \rightarrow 7\cdot12=84  Cent
20 Minuten|Freizeit =0,96 EUR, 11 Interviews
\text{ } \qquad 20\cdot60  Sek.=1200/150=8  Einheiten \cdot12=96  Cent
20  Minuten|Tag =1,68 EUR, 20 Interviews
\text{ } \qquad 20\cdot60  Sek.=1200/90=13,\overline{33} Einheiten \rightarrow14\cdot12=168  Cent
\overline{X}=(18\cdot0,48+10\cdot0,84+11\cdot0,96+20\cdot1,68)/59=1,037

Tennis Turniere

  • X: “Anzahl der pro Turnier bis zum Ausscheiden gespielten Runden”; kardinalskaliert, diskret

  • x_{j} h(x_{j}) f(x_{j}) F(x)
    1 10 0,25 0,25
    2 16 0,40 0,65
    4 6 0,15 0,80
    5 6 0,15 0,95
    6 2 0,05 1,00
    Summe 40 1,00
  • Treppenfunktion

  • 65 %

  • 20 %

  • 30 Turnieren

  • 4. Runde

  • 2. Runde

  • F(7) = 1; d.h. jedes Turnier ging nur über 6 Runden; daher konnte B.B. niemals in eine 7. Runde gelangen, er war also in 100 % aller Turniere in Runde 7 (=x) ausgeschieden.

Walzabteilung

X = “Bearbeitungszeit in sec./Stück)”;
Y = “hergestellte Stück pro Stunde”

  • a) Man berechnet das harmonische Mittel wie folgt: \begin{align}
\overline{x}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
                 &= \dfrac{4}{\dfrac{1}{20} + \dfrac{1}{30} + \dfrac{1}{60} + \dfrac{1}{60}} \\
                 &= 34,286 \text{ sec./Stück}\end{align} b) Man berechnet das arithmetische Mittel wie folgt: \begin{align}
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
             &= \dfrac{1}{2000} \cdot (1000 \cdot 20 + 500 \cdot 30 + 300 \cdot 60 + 200 \cdot 60) \\
             &= 32,5 \text{ sec./Stück}\end{align}
  • a)
  • Zuerst errechnet man die jeweils pro Stunde produzierten Einheiten pro Arbeiter wie folgt: \begin{align}
\text{A produziert} \dfrac{3600 \text{ sec}}{20 \text{ sec}} &= 180 \text{ Stück pro Stunde} \\
\text{B produziert} \dfrac{3600 \text{ sec}}{30 \text{ sec}} &= 120 \text{ Stück pro Stunde} \\
\text{C und D produzieren jeweils} \dfrac{3600 \text{ sec}}{60 \text{ sec}} &= 60 \text{ Stück pro Stunde}\end{align}
  • Anschließend wird das arithmetische Mittel berechnet: \begin{align}
\overline{y} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
             &= \dfrac{1}{4} \cdot (180 + 120 + 60 + 60) \\
             &= 105 \text{ Stück/h}\end{align} b) Das harmonische Mittel wird errechnet: \begin{align}
\overline{y}_{H} &= \dfrac{n}{\sum_{i=1}^{n} \cdot \dfrac{1}{x_i}} \\
&= \dfrac{2000}{\dfrac{1000}{180} + \dfrac{500}{120} + \dfrac{300}{60} + \dfrac{200}{60}} \\
&= 110,77 \text{ Stück/h}\end{align}

Wanderer

\overline{x}_{H} = 4,8 km/h

WM–Berichterstattung

  • X: “Fernsehkonsum (in Std.) während der letzten Fußball-WM” kardinalskaliert, diskret

  • x_{j} h(x_{j}) f(x_{j}) F(x)
    0 1 0,05 0,05
    1 2 0,10 0,15
    2 8 0,40 0,55
    3 4 0,20 0,75
    4 5 0,25 1,00
    Summe 20 1,00
  • 1 Std.

  • 2 Std.

  • 3 Std.

Zigaretten

  • empirische Verteilungsfunktion,
    Annahme: Gleichverteilung der Merkmalswerte innerhalb jeder Klasse

  • X: “Anzahl der gerauchten Zigaretten pro Tag”

    x_{j}^{u} \leq X < x_{j}^{o} h(x_{
j}) f(x_{j}) F(x) f_K(x_{
j})
    0 - 5 10 0,05 0,05 0,01
    5 - 10 40 0,20 0,25 0,04
    10 - 20 90 0,45 0,70 0,045
    20 - 40 60 0,30 1,00 0,015
    Summe 200 1,0000
  • 0,3

Zuckergewicht

Füllgewicht h(x_{j}) f(x_{j}) F(x_{j}) f_K(x_{j})
980 - 990 5 0,067 0,067 0,0067
990 - 995 12 0,160 0,227 0,032
995 - 1000 23 0,307 0,534 0,0614
1000 - 1005 22 0,293 0,827 0,0586
1005 - 1010 11 0,147 0,974 0,0294
1010 - 1020 2 0,026 1,000 0,0026

x_{D} = 999,565 g; x_{0,5} = 999,446 g; \overline{x} = 999,27 g

Zugfolge - Teil II

  • Wir wählen den Mittelwert, den Median und den Modus als Lageparameter für die klassierten Daten.

Für den Modus ist zunächst die Modalklasse zu berechnen; das bedeutet die Klasse mit der höchsten Häufigkeitsdichte. Da hier die Klassenbreite für alle Klassen 30 beträgt, genügt es, die Klasse mit der höchsten Häufigkeit zu wählen. Das entspricht der Klasse 30-60. Für die Feinbestimmung gilt folgende Formel für den Modus bei klassierten Daten: \begin{align}
x_{D} &= x_2^u + \dfrac{f_K(x_2)-f_K(x_{2-1})}{2f_K(x_2)-f_K(x_{2-1})-f_K(x_{2+1})}\cdot (x_2^o-x_2^u)\\
     &= 30 +\dfrac{\dfrac{0,4595}{30}-\dfrac{0,3784}{30}}{2\cdot \dfrac{0,4595}{30}-\dfrac{0,3784}{30} - \dfrac{0,1351}{30}}\cdot (60-30)\\
     &=30+ \dfrac{1}{5}\cdot 30 =36\end{align} 36 .
Für den Median von klassierten Daten gilt die folgende Formel:
\begin{align}
x_{0,5} &= F(x_0,5) \Leftrightarrow \\
x_{0,5} &= x_j^u + \dfrac{(0,5 - F(x_j^u))}{f(x_j^m)} \cdot (x_j^o - x_j^u) \\
x_{0,5} &= 30 + \dfrac{(0,5 - 0,3784)}{0,4595} \cdot 30 \\
&= 37,94 \text{Minuten}. \\\end{align} Der Mittelwert für klassierte Daten berechnet sich wie folgt, wobei  x_j^m die Klassenmitte und  n_j die Anzahl der Beobachtungen in Klasse j beschreibt:
\begin{align}
\overline{x} &= \dfrac{1}{n} \cdot \sum_{j=1}^{k} \cdot x_j^m \cdot n_j \\
&= \dfrac{1}{37} \cdot (15 \cdot 14 + 45 \cdot 17 + 75 \cdot 5 + 105 \cdot 1) \\
&= 39,324 \text{ Minuten} \\\end{align}

  • Der Unterschied zum Ergebnis aus Teilaufgabe a) ergibt sich aufgrund von Informationsverlust durch die Klassierung der Daten.

Man berechnet das Arithmetische Mittel \overline{x} von nicht-klassierten Daten wie folgt: \begin{align}
\overline{x} &= \dfrac{1}{n} \cdot \sum_{i=1}^{n} \cdot x_i \\
&= \dfrac{1}{37} \cdot \sum_{i=1}^{n} \cdot x_i \\
&= \dfrac{1}{37} \cdot 1440  \\
&= 38,92 \text{ Minuten}\end{align}

Zugfolge - Teil I

  • X: “Zugfolgeabstand”; kardinalskaliert, stetig

  • und c) Zugfolgeabstand (Von ... bis unter ...)

    h(x_{j}) f(x_{j}) F(x_j^o) f_K(x_j)
    0 30 14 0,3784 0,3784 0,0126
    30 60 17 0,4595 0,8379 0,0153
    60 90 5 0,1351 0,9730 0,0045
    90 120 1 0,0270 1,0000 0,0009
    37 1,0000

    Häufigkeitsverteilung: Histogramm
    empirische Verteilungsfunktion: stückweise lineare Funktion