Stichprobentheorie/Lösungen

Aus MM*Stat

< Stichprobentheorie
Version vom 3. Juni 2019, 08:57 Uhr von Siskosth (Diskussion | Beiträge) (Drei Personen)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Anteil der Studentinnen an allen Studierenden

Aus dem Aufgabentext: \pi = 0,4 und n = 30

Y: “Anzahl der Studentinnen bei einer einfachen Zufallsstichprobe vom Umfang n = 30

Y \sim B(n; \pi)=B(30;0,4)

Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} P(Y < 0,3 \cdot 30) + P(Y > 0,5 \cdot 30) & = & P(Y < 9) + P(Y > 15)\\ & = & P(Y \leq 8) + [1- P(Y \leq 15)]\\ & = & 0,0940 + (1 - 0,9029)\\ & = & 0,1911\\\end{aligned}

Y: “Anzahl der Studentinnen bei einer Zufallsstichprobe n = 30

Y \sim B(30;0,4); P[(Y < 9) \cup (Y > 15)]  = 0,1911

Ausschussanteil

  • Menge der produzierten Teil \approx unendlich groß e Grundgesamtheit; Binomialverteilung; n = 50, \pi = 0,02 \Rightarrow Approximation mittels Poisson-Verteilung

  • X: “Anzahl defekter Stücke in Zufallsstichprobe n = 50

    x 0 1 2 3 4 5
    P(X = x) 0,3679 0,3679 0,1839 0,0613 0,0153 0,0031
  • P(X \leq k) = 0,95, k ganzzahlig \Rightarrow k = 3

Betriebsunfälle

X: “Anzahl der Schwerverletzten bei 60 Betriebsunfällen”; X\sim B(60;0,2)

np = 12 > 5; n(1-\pi) = 48 > 5 \Rightarrow Approximation durch Normalverteilung

\hat{\Pi}: “Anteil der Schwerverletzten bei 60 Betriebsunfällen”; X \approx N(0,2;0,0516)

  • P(\widehat{\pi} < 0,3) = 0,97381
  • P(\widehat{\pi} > 0,2) = 0,5
  • P(0,15 \leq \widehat{\pi} < 0,25) = 0,667954

Drei Personen

Datei:7-1 Drei Personen.xlsx

  • Mittelwert \mu und Varianz \sigma^2 der Grundgesamtheit: Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \mu &=& \frac{20+22+24}{3} = 22\\ \sigma^2 &=& \frac{(20-22)^2+(22-22)^2+(24-22)^2}{3} = \frac{4+0+4}{3}=\frac83\end{aligned}

  • Anordnung spielt eine Rolle \Rightarrow Variation, Wiederholung möglich V^W(3;2)=3^2=9

  • Nr. 1 2 3 4 5 6 7 8 9
    x_{1 } 20 20 20 22 22 22 24 24 24
    x_{2 } 20 22 24 20 22 24 20 22 24
    \frac19 \frac19 \frac19 \frac19 \frac19 \frac19 \frac19 \frac19 \frac19
    y 20+20= 40 42 44 42 44 46 44 46 48
    \bar{x} \frac{20+20}{2}= 20 21 22 21 22 23 22 23 24
    s^{2\prime} \frac{(20-20)^2+(20-20)^2}{1}= 0 2 8 2 0 2 8 2 0
    s^{2} \frac{(20-20)^2+(20-20)^2}{2}= 0 1 4 1 0 1 4 1 0
    • y 40 42 44 46 48
      P(Y=y) 1/9 2/9 3/9 2/9 1/9

      Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(Y) &=\frac{40}{9}+\frac{42\cdot2}{9}+\frac{44\cdot3}{9}+\frac{46\cdot2}{9}+\frac{48\cdot1}{9}=44\\ Var(Y)&=\frac{(40-44)^2}{9}+\frac{(42-44)^2\cdot2}{9}+\frac{(44-44)^2\cdot3}{9}\\ &+\frac{(46-44)^2\cdot2}{9}+\frac{(48-44)^2}{9}\\ &=\frac{16}{9}+\frac{8}{9}+\frac{0}{9}+\frac{8}{9}+\frac{16}{9}=\frac{48}{9}=\frac{16}{3}\end{aligned}

    • \overline{x} 20 21 22 23 24
      P(\bar{X}=\bar{x}) 1/9 2/9 3/9 2/9 1/9

      Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(\bar{X}) &=\frac{20}{9}+\frac{21\cdot2}{9}+\frac{22\cdot3}{9}+\frac{23\cdot2}{9}+\frac{24\cdot1}{9}=22\\ E(\bar{X}) &= E\left(\frac{Y}{2}\right)=\frac12 E(Y)=22 \text{ (alternativ)}\\ Var(\bar{X})&=\frac{(20-22)^2}{9}+\frac{(21-22)^2\cdot2}{9}+\frac{(22-22)^2\cdot3}{9}\\ &+\frac{(23-22)^2\cdot2}{9}+\frac{(24-22)^2}{9}\\ &=\frac{4}{9}+\frac{2}{9}+\frac{0}{9}+\frac{2}{9}+\frac{4}{9}=\frac{12}{9}=\frac{4}{3}\\ Var(\bar{X})&= Var\left(\frac{Y}{2}\right)=\frac14 Var(Y)=\frac{4}{3} \text{ (alternativ)}\end{aligned}

    • s^{\prime2} 0 2 8
      P(S^{\prime2}=s^{\prime2}) 3/9 4/9 2/9

      Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(S^2) &=&\frac{0\cdot 3}{9}+\frac{2\cdot 4}{9}+\frac{8\cdot2}{9}=\frac{24}{9}=\frac83\\\end{aligned}

    • s^{2} 0 1 4
      P(S^{\prime2}=s^{2}) 3/9 4/9 2/9

      Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(S^{2}) &=&\frac{0\cdot 3}{9}+\frac{1\cdot 4}{9}+\frac{4\cdot2}{9}=\frac{12}{9}=\frac43\\ E(S^{\prime2}) &=& E(S^{\prime2}/2)=\tfrac12E(S^{\prime2})=\frac{8}{2\cdot3}=\frac43 \text{ (alternativ)}\end{aligned}

    • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 44 = E(Y) &=& n\cdot\mu = 2\cdot22 = 44\\ \frac{16}{3} =Var(Y) &=& n\cdot\sigma^{2} = 2\cdot\frac83= \frac{16}{3}\\\end{aligned}

    • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 22 = E(\overline{X}) &=& \mu = 22\\ \frac43 =Var(\overline{X}) &=& \sigma^{2}/n = \frac8{3\cdot2}= \frac43\\\end{aligned}

    • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \frac43=E({S'}^{2}) &=& \sigma^{2}\cdot(n-1)/n = \frac83 \frac12=\frac43\\\end{aligned}

    • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \frac83=E(S^{2}) &=& \sigma^{2} = \frac83\end{aligned}

  • \mu = 22; \sigma^{2} = 8/3

  • V^{W}(3,2) = 9

  • Nr. 1 2 3 4 5 6 7 8 9
    x_{1 } 20 20 20 22 22 22 24 24 24
    x_{2 } 20 22 24 20 22 24 20 22 24
    • y 40 42 44 46 48
      f(y) 1/9 2/9 3/9 2/9 1/9


      E(Y) =44, Var(Y) = 16/3

    • \overline{x} 20 21 22 23 24
      f(\overline{x}) 1/9 2/9 3/9 2/9 1/9


      E(\overline{x}) = 22, Var(\overline{x}) = 4/3

    • s'^{2} 0 1 4
      f(s'^{2}) 3/9 4/9 2/9


      E(S'^{2}) = 4/3

    • s^{2} 0 2 8
      f(s^{2}) 3/9 4/9 2/9


      E(S^{2}) = 8/3

  • Die unter d) errechneten Ergebnisse stimmen mit den Behauptungen überein.

Erwartungswert und Varianz

  • \sum_{i=1}^n X_{i} \sim B(n;p); E(\sum_{i=1}^n X_{i}) = np; Var(\sum_{i=1}^n X_{i}) = np(1-p)
  • \sum_{i=1}^n X_{i} \sim N(n\mu;\sqrt{n\sigma^{2}}); E(\sum_{i=1}^n X_{i}) = n\mu; Var(\sum_{i=1}^n
X_{i}) = n\sigma^{2}
  • \sum_{i=1}^n X_{i} \sim Einpunkt(n\mu); E(\sum_{i=1}^n X_{i}) = n\mu; Var(\sum_{i=1}^n X_{i}) = 0

Lift

X_{i}: “Gewicht von Person i

E(X_{i}) = 72; Var(X_{i}) = 24^{2}

\sum_{i=1}^{36} X_{i}: “Gesamtgewicht der 36 Personen”

\sum_{i=1}^{36} X_{i} ist approximativ [Z.G.S., n > 30] N(n\mu; \sqrt{n\sigma^{2}})

P(\sum_{i=1}^{36} > 2800) = 0,074934

Normal–Verteilung Approximation

  • ** n > 30
    • E(X_{i}) \neq \pm \infty
    • 0<Var(X_{i})<\infty
    • X_{i} identisch verteilt
    • X_{i} unabhängig
  • Zentraler Grenzwertsatz
  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} Y = \sum_{i=1}^n X_i &\approx& N(\bullet;\bullet) \mbox{ (ZGWS)}\\ E(Y) &=& E\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n E(X_i) = \sum_{i=1}^n \mu = n\cdot\mu\\ Var(Y) &=& Var\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n Var(X_i) = \sum_{i=1}^n \sigma^2 = n\cdot\sigma^2\\ \end{aligned}
  • X_{i} unabhängig und identisch verteilt, n \to \infty (n > 30), E(X_{i}) und Var(X_{i}) > 0 existieren
  • Zentraler Grenzwertsatz
  • Y ist approximativ N(n\cdot\mu; \sqrt{n\cdot\sigma^{2}})

Spielautomat

X_{i}: “Gewinn beim Spiel i”; X_{i} \sim N(0;1)

\sum_{i=1}^{16} X_{i} \sim N(0;4)

P(\sum_{i=1}^n X_{i} > 16) = 0,000032

Tabletten gegen Kopfschmerzen

X_{i}: “Wirkstoffmenge in einer Tablette”; X_{i} \sim
N(\mu;\sigma)

\overline{X}: “Durchschnittliche Wirkstoffmenge in einer Tablette”; \overline{X}\sim
N(\mu;\sigma/\sqrt{n})

P( \overline{X} >\mu+\frac{1}{2})
=P \left (\frac{ \overline X- \mu}{\sigma/ \sqrt{n}}
>\frac{\sqrt{n}}{2 \sigma} \right) =1- \Phi \left( \frac{\sqrt{n}}{2 \sigma} \right)

  • P(Z > 2)=0,02275
  • P(Z > 4)=0,000032
  • P(Z > 2)=0,02275

Tabletten gegen Kopfschmerzen, weiter

  • P(S^{*2} > 2\sigma^{2}) = P(nS^{*2}/\sigma^{2}
> 2n) = P(nS^{*2}/\sigma^{2} > 14) \approx 0,05

(weil nS^{*2}/\sigma^{2}\sim \chi^2_{n})

  • P(S^{*2} > 2\sigma^{2}) = P(nS^{*2}/\sigma^{2}
> 2n) = P(nS^{*2}/\sigma^{2} > 32) \approx 0,01

(weil nS^{*2}/\sigma^{2}\sim \chi^2_{n})

  • P(S^{2} > 2\sigma^{2}) = P[(n-1)S^{2}/\sigma^{2}
> 2(n-1)]  = P[(n-1)S^{2}/\sigma^{2} > 30) \approx 0,01

(weil nS^{2}/\sigma^{2}\sim \chi^2_{n-1})

Tennislehrer

X_{i}: “Anzahl der über den Zaun geschlagenen Bälle pro Schüler in einer Trainingsstunde”


x 0 1 2 3 4 5 6 7 \sum
P(X_i = x) 0 0,3 0,1 0 0 0,2 & 0,3 & 0,1 & 1

Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(X_{i}) &=& 1\cdot 0,3+2\cdot0,1+5\cdot0,2+6\cdot0,3+7\cdot0,1=4\\ Var(X_{i}) &=& (1-4)^2\cdot0,3+(2-4)^2\cdot0,1+(5-4)^2\cdot0,2 \\ &+&(6-4)^2\cdot0,3+(7-4)^2\cdot0,1 = 5,4\end{aligned}

Y: “Anzahl der über den Zaun geschlagenen Bälle pro Monat”
1 Monat = 30 Tage mit 8 Trainungsstunden

Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} Y &=& \sum_{i=1}^{8\cdot30} X_{i} \\ Y &\approx& N(\bullet;\bullet) \quad \text{ wegen ZGS}\\ E(Y) &=& E\left( \sum_{i=1}^{240} X_{i} \right)= \sum_{i=1}^{240} E(X_{i}) = 240\cdot4 = 960\\ Var(Y) &=& Var\left( \sum_{i=1}^{240} X_{i} \right)= \sum_{i=1}^{240} Var(X_{i}) = 240\cdot5,4 = 1296=36^2\end{aligned}

Die Kovarianzterme Cov(X_i,X_j) fallen weg, da X_i und X_j unabhängig sind.

  • Standardisierung: \displaystyle Z=\frac{Y-E(Y)}{\sqrt{Var(Y)}}\approx N(0;1) \Rightarrow Z=\frac{Y-960}{36} Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} P(900 \leq Y \leq 1000)&=& P\left(\frac{900-960}{36} \leq \frac{Y-960}{36} \leq \frac{1000-960}{36}\right)\\ &=& P(-1,67 \leq Z \leq 1,11)\\ &=& \Phi(1,11) - \Phi(-1,67)\\ &&\text{Eigenschaft der Standardnormalverteilung: } \Phi(-z)=1-\Phi(z)\\ &=& \Phi(1,11) - (1 - \Phi(1,67))\\ &=& 0,81904\end{aligned}

  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} P(Y > 1050) &=& P\left(\frac{Y-960}{36}>\frac{1050-960}{36}\right)\\ &=& P(Z > 2,5)= 1-\Phi(2,5) = 0,00621\end{aligned}

  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 0,99 &=& P( y_{u} \leq Y \leq y_{o}) \\ &=& P\left(\frac{y_{u}-960}{36} \leq Z \leq \frac{y_{o}-960}{36}\right) \\ &=& \Phi\left(\frac{y_{o}-960}{36}\right) - \Phi\left(\frac{y_{u}-960}{36}\right)\end{aligned}

    Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \Phi\left(\frac{y_{o}-960}{36}\right)=0,995 &\Rightarrow & \Phi\left(\frac{y_{o}-960}{36}\right) = 2,5\\ y_{u} &=& 960 - 2,58 \cdot 36 = 867,12 \\ y_{o} &=& 960 + 2,58 \cdot 36 = 1052,88\end{aligned}

    • n=240 > 30

    • E(X_{i})=4 \neq \pm \infty

    • 0< Var(X_{i})=5,4  <\infty

    • X_{i} identisch verteilt, da nur ein Verteilungsmodell für alle Schüler angesetzt

    • X_{i} unabhängig, da alles unterschiedliche Schüler

    Hinweis: Es handelt sich nur um ein wegen der letzen beiden Bedingungen

X_{i}: “Anzahl der über den Zaun geschlagenen Bälle pro Schüler in einer Trainingsstunde”; E(X_{i}) = 4; Var(X_{i}) = 5,4

Y: “Anzahl der über den Zaun geschlagenen Bälle pro Monat”; Y = \Sigma_{i} X_{i}

Y ist approximativ [Z.G.S.; n>30] N(960;36)

  • P(900 \leq Y \leq 1000) = 0,81904
  • P(Y > 1050) = 0,00621
  • P(? \leq Y \leq ?) = 0,99; y_{u} = 867,12, y_{o}= 1052,88
  • Z.G.S, X_{i} sind iid; n > 30

Tippfehler

Y: “Anzahl der Tippfehler im Manuskript”; n = 1100

  • Y = \sum_{i=1}^n X_{i} ist approximativ (ZGWS.; n>30) N(n\mu; \sqrt{n\sigma^{2}}),
    E(Y) = n\mu = 1540; Var(Y) = n\sigma^{2} = 484

  • (i) P(Y \geq 1600) = 0,0032  ,
    (ii) P(1500 \leq Y \leq 1650) = 0,9656,
    (iii)

    • ohne Stetigkeitskorrektur: P(Y = 1540) = 0,

    • mit Stetigkeitskorrektur (nicht zulässig, da \sigma^2>9):
      P(1539,5\leq Y\leq 1540,5) \approx \Phi(0,02)-\Phi(-0,02)= 0,015956
      bzw. mit \Phi(0,02272727)-\Phi(-0,02272727) = 0,01813218

    (iv) P(Y \leq 1540) = 0,5

Urne

\widehat{\pi}: “Anteil roter Kugeln in der Stichprobe”; \widehat{\pi} = X/n; X: “Anzahl roter Kugeln in der Stichprobe”; X \sim H(N;M;n)

  • X \sim H(5;2;3); P(p_{1} \leq \widehat{\pi} \leq p_{2})
= P(x_{1} \leq X \leq x_{2})
= P(1 \leq X \leq 2) = 0,9
  • n/N < 0,05 \Rightarrow Approximation durch B(4;0,2); P(1 \leq X \leq 3) = 0,5888
  • n\pi(1-\pi) = 16 > 9; 0,1 < M/N < 0,9; n > 30 \Rightarrow Approximation durch N(0,2;0,031); bei Berücksichtigung der Stetigkeitskorrektur: P(0,095 \leq \widehat{\pi} \leq 0,305) = 0,999276
  • Approximation durch N(0,2;0,04), wegen n/N < 0,05 kann Korrekturfaktor vernachlässigt werden; P(0,14 \leq \widehat{\pi} \leq 0,3) = 0,926983