Schätztheorie/Lösungen

Aus MM*Stat

Version vom 25. April 2019, 12:11 Uhr von Siskosth (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

500 Haushalte

X: Haushaltsgröße , ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittliche Haushaltsgröße bei einer Zufallsstichprobe vom Umfang n=100
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;s/\sqrt{n})–verteilt.
\overline{x}=2,73, s^2=\sum(x_i-\overline{x})^2/(n-1)=1,58, z_{1-\alpha/2}=z_{0,975}=1,96
P(\overline{X}-z_{1-\alpha/2}\cdot S/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot S/\sqrt{n})\approx1-\alpha=0,95
, [\overline{x}-z_{1-\alpha/2}\cdot s/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot s/\sqrt{n}]\approx[2,73-1,96\cdot\sqrt{1,58/500};2,73+1,96\cdot\sqrt{1,58/500}]\approx[2,620;2,840]

Absolventen der Fakultät

1-\alpha/2=0,975;\quad z_{0,975}=1,96;\quad e=0,2;\quad n\geq z_{1-\alpha/2}^2/4e^2;\quad n\geq1,96^2/4\cdot0,2^2=3,8416/0,16=24,01\rightarrow n\geq25

Antibiotikumtabletten

Grundgesamtheit: X: “Wirkstoffgehalt je Tablette”; X\sim N(\mu;10)
\overline{X}: “Durchschnittlicher Wirkstoffgehalt je Tablette bei einer einfachen Zufallsstichprobe vom Umfang n”; \overline{X}\sim N(\mu;10/\sqrt{n})
P(\overline{X}-2\leq\mu\leq\overline{X}+2)=P(\overline{X}-z_{1-\alpha/2}\cdot10/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot10/\sqrt{n})=0,98
z_{0,99}=2,33;\quad n\geq(\sigma z/e)^2=(10\cdot2,33/2)^2=11,65^2=135,7225\rightarrow n\geq136

Apfelsinen

  • X: “Gewicht der Apfelsinen” \sim N(\mu; \sigma=20g)
  • Einfache Zufallsstichprobe mit n=25
  • Summe des Gewichts: 7500g \Rightarrow \bar{x}=\frac{7500}{25}=300g

Allgemeines Konfidenzintervall für den Mittelwert \mu der Grundgesamtheit: P\left(\bar{X}-c\frac{\sigma}{\sqrt{n}}\leq \mu \leq\bar{X}+c\frac{\sigma}{\sqrt{n}}\right) = 1-\alpha c aus N(0;1), da \sigma bekannt \Longrightarrow c=z_{1-\alpha/2}

Schätzintervall für den Mittelwert \mu der Grundgesamtheit: 1-\alpha=80,64\% \Rightarrow 1-\alpha/2=90,32\% \Rightarrow \Phi(z_{ 1-\alpha/2})=0,9032 \Rightarrow z_{ 1-\alpha/2} = 1,3 \left[\bar{x}-z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}; \bar{x}+z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}\right] \left[300-1,3\frac{20}{\sqrt{25}}; 300+1,3\frac{20}{\sqrt{25}}\right]= \left[294,8; 305,2\right]

Grundgesamtheit: X: Gewicht einer Apfelsine; Normalverteilung und \sigma=20g bekannt; \overline{X}: Durchschnittsgewicht einer Apfelsine in einer einfachen Zufallsstichprobe vom Umfang n=25, \overline{X}\sim N(\mu; \sigma/\sqrt{n}); P(\overline{x}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n})=0,8064;
Schätzintervall: [\overline{x}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n};\overline{x}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n}]; \overline{x}=300\mbox{ g}; z_{0,9032}=1,3
[300-1,3\cdot20/5;300+1,3\cdot20/5]=[294,8;305,2]

Brikett

X:\mbox{ Gewicht eines Briketts }X\sim N(500;50)
\overline{X}:\mbox{ Durchschnittliches Gewicht eines Briketts bei einer Zufallsstichprobe }n=25
\overline{X}\sim N(500;10); z=(\overline{X}-\mu_0)\sqrt{n}/\sigma; z=(510-500)5/50=1; P(Z\leq1)=0,841345; 1-P(Z\leq1)=1-0,841345=0,158655

Dichotome Grundgesamtheit

Q(\pi) = 3\pi^{2} - 2\pi + 1; \widehat{\pi} =
1/3

Dioxinausstoß

X: Dioxinausstoß [kg/min], X\sim N(5;1)
\overline{X}: Durchschnittlicher Dioxinausstoß [kg/min], X\sim N(5;1/3)

  • Berechnung der statistischen Sicherheit für ein gegebenes Schwankungsintervall

P\left(\mu-c\cdot\displaystyle\frac{\sigma}{\sqrt{n}}\leq\overline{X}\leq\mu+c\cdot\displaystyle\frac{\sigma}{\sqrt{n}}\right)=1-\alpha

P(4\leq\overline{X}\leq6)=1-\alpha=?

P\left(\displaystyle\frac{4-5}{1}\sqrt{9}\leq\overline{X}\leq\displaystyle\frac{6-5}{1}\sqrt{9}\right)=P(-3\leq Z\leq3)=2\cdot P(Z\leq3)-1
=2\cdot0,99865-1=0,9973

Mit einer Wahrscheinlichkeit von 99,73% liegt der Durchschnitt einer Stichprobe vom Umfang n=9 zwischen 4 und 6 kg/min Dioxinausstoß.

  • symmetrisches Schwankungsintervall gesucht bei gegebener statistischer Sicherheit


P\left(\mu-c\displaystyle\frac{\sigma}{\sqrt{n}}\leq\overline{X}\leq\mu+c\displaystyle\frac{\sigma}{\sqrt{n}}\right)=0,95

P\left(5-\displaystyle\frac{c}{3}\leq\overline{X}\leq5+\displaystyle\frac{c}{3}\right)=0,95

c_{0,975}=1,96

\left[5-\displaystyle\frac{1,96}{3};5+\displaystyle\frac{1,96}{3}\right]=[4,347;5,653]

  • n\geq\displaystyle\frac{\sigma^2\cdot z_{1-\alpha/2}^2}{e^2}


\Leftrightarrow n\geq\displaystyle\frac{1\cdot1,96^2}{0,5^2}=15,37\approx16

Um mit einer Sicherheit von 95% den durchschnittlichen Dioxinausstoß auf 0,5 kg/min genau schätzen zu können, benötigt man einen Stichprobenumfang von mindestens 16 Zeitintervallen.

  • P\left(\overline{X}-c\cdot\displaystyle\frac{\sigma}{\sqrt{n}}\leq\mu\leq\overline{X}+c\cdot\displaystyle\frac{\sigma}{\sqrt{n}}\right)=1-\alpha

c aus N(0;1)

  • 1-\alpha=0,98; 1-\alpha/2=0,99; c=2,33; \overline{x}=63/9=7 kg/min; \sigma=1

[7-2,33/3;7+2,33/3]=[6,22;7,78]

Eintagsfliegen

X: Lebensdauer von Eintagsfliegen\sim N(\mu;\sigma^2), \mu und \sigma^2 unbekannt
n=16 (kleine Stichprobe); \overline{x}=1440; s^2=57600, s=240
Schätzintervall:

Fehler beim Parsen (PNG-Konvertierung fehlgeschlagen. Bitte die korrekte Installation von LaTeX und dvipng überprüfen (oder dvips + gs + convert)): \begin{align} \left[ \overline{x} \text{ ± } t_{n-1; 1-\alpha/2} \cdot \frac{s}{\sqrt{n}} \right] &= \left[ 1440 \text{ ± } t_{15; 1-\alpha/2} \cdot \frac{240}{\sqrt{16}} \right] \\ &= \left[ 1440 \text{ ± } t_{15; 1-\alpha/2} \cdot 60 \right] \\ &= \left[ 1263.12; 1616.88 \right] \end{align}


\begin{align}
1616,88 &= 1440+t_{15;1-\alpha/2}\cdot 60;\quad t_{15;1-\alpha/2} \\
        &=2,948;\quad 1-\alpha/2=0,995
\end{align}

(aus t-Verteilung);
1-\alpha=0,99

Erwartungstreue

  • X_1, X_2, X_3 einfache Zufallsstichprobe
  • X_{i} \sim(\mu;\sigma^2)
  • X_{i} unabhängig
  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(\widehat{\theta}_{1}) &= E \left(\frac13(X_1 + X_2 + X_3)\right) \\ &= \frac13 \left(E(X_1)+ E(X_2)+ E(X_3)\right)=\frac13 \cdot 3\mu=\mu \\ E(\widehat{\theta}_{2}) &= E \left(\frac14(2X_1 + 2X_2)\right)=\\ &=\frac14 \left(2E(X_1)+ 2E(X_2)\right)=\frac14 \cdot 4\mu=\mu \\ E(\widehat{\theta}_{3})&= E \left(\frac13(2X_1 + X_3)\right)\\ &=\frac13 \left(2E(X_1)+ E(X_3)\right) = \frac13 \cdot 3\mu=\mu\end{aligned}

  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} Var(\widehat{\theta}_{1}) &= Var \left(\frac13(X_1 + X_2 + X_3)\right) \\ &= \frac19(Var(X_1)+ Var(X_2)+ Var(X_3))=\frac39\sigma^{2}=\frac{\sigma^{2}}{3}\\ Var(\widehat{\theta}_{2}) &= Var \left(\frac14(2X_1 + 2X_3)\right)\\ &=\frac1{16}(4Var(X_1)+ 4Var(X_2))=\frac{8}{16} \sigma^{2}=\frac{\sigma^{2}}{2}\\ Var(\widehat{\theta}_{3}) &= Var \left(\frac13(2X_1 + X_3)\right) \\ &= \frac19(4Var(X_1)+ Var(X_3))=\frac59 \sigma^2\\\end{aligned}

    Var(\widehat{\theta}_{1}) < Var(\widehat{\theta}_{2}) < Var(\widehat{\theta}_{3})

  • alle drei, führen Sie den Beweis !
  • Var(\widehat{\theta}_{1}) = \sigma^{2}/3
< Var(\widehat{\theta}_{2}) = \sigma^{2}/2
< Var(\widehat{\theta}_{3}) = 5\sigma^{2}/9
\Rightarrow \widehat{\theta}_{1}

Fahrradschläuche

X: “Durchmesser eines Fahrradschlauches”; X \sim N(\mu;\sigma)

\overline{X}: “Mittlerer Durchmesser eines Fahrradschlauches bei einer Zufallsstichprobe vom Umfang n = 25”; \overline{X} \sim N(\mu;\sigma/\sqrt{n})

  • P( \overline{X}-c \frac{S}{ \sqrt{n}} \leq  \mu
            \leq  \overline{X}+c \cdot \frac{S}{ \sqrt{n}})=1- \alpha c aus t–Verteilung mit f = 24: c = 1,711
  • [39,9734;42,0266]
  • n \geq 293

Faktenmagazin

Konfidenzintervall für den Erwartungswert \mu:\ \left[\overline{x}-t_{1-\alpha/2;f}\frac{s}{\sqrt{n}};\overline{x}+t_{1-\alpha/2;f}\frac{s}{\sqrt{n}}\right]t_{0,995;24}=2,797
[74000-2,797\cdot10000/5;74000+2,797\cdot10000/5]=[68406;79594]

Finanzamt

  • L(\lambda) = \lambda^{3}\cdot e-^{9\lambda}
  • \widehat\lambda = 1/3 \Rightarrow Frau Hurtig

Fluggesellschaft

1-\alpha/2=0,995;\quad z_{0,995}=2,58
0,9\pm2,58\sqrt{\displaystyle\frac{0,9\cdot0,1}{200}}
[84,5\%;95,5\%]

Gasverbrauch

P(\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n}\leq\bar{X}\leq\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n})=1-\alpha;
[\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n};\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n}]
n=36; \frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t_f \approx N(0;1)
\mu=5; s=2; 1-\alpha=0,95; 1-\alpha/2=0,975; z_{0,975}=1,96
[5-1,96\cdot2/6;5+1,96\cdot2/6]=[5-0,6533;5+0,6533]=[4,3467;5,5633]

Glücksspiel

X: Ertrag , ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittlicher Ertrag bei einer Zufallsstichprobe vom Umfang n=50
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;s/\sqrt{n})–verteilt.
\quad\overline{x}=-0,58,\quad s^2=\sum(x_i-\overline{x})^2/(n-1)=0,82, z_{1-\alpha/2}=z_{0,975}=1,96
P(\overline{X}-z_{1-\alpha/2}\cdot S/\sqrt{n}\leq \mu\leq\overline{X}+z_{1-\alpha/2}\cdot S/\sqrt{n})\approx1-\alpha=0,95
[\overline{x}-z_{1-\alpha/2}\cdot s/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot s/\sqrt{n}]\approx[-0,58-1,96\cdot\sqrt{0,0164};-0,58+1,96\cdot\sqrt{0,0164}]\approx[-0,831;-0,329]

Handybesitzer

Da keine Information über \pi in Form einer Vorstichprobe oder anderweitig gegeben ist, wird der ungünstigste Fall angenommen und \hat{\pi} so gewählt, dass die Varianz \sigma^2_{\hat{\pi}}=\hat{\pi}(1-\hat{\pi)} maximal wird. Dieser ungünstigste Fall tritt bei \hat{\pi}=0,5 ein.
1-\alpha=0,95;\quad z_{0,975}=1,96\quad \ell=0,06
n=z^2_{1-\alpha/2}/\ell^2=1,96^2/0,06^2=3,8416/0,0036=1067,11\rightarrow n=1068

Jährliche Fahrleistung 2

X: Jährliche Fahrleistung , X ist normalverteilt
\mu=25, \sigma unbekannt, s^2=80, n=20, f=19, 1-\alpha=0,95, t_{1-0,975;19}=2,093
P(\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n}\leq\overline{X}\leq\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n})=1-\alpha;
[\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n};\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n}];
\left[25-2,093\cdot\sqrt{\displaystyle\frac{80}{20}};25+2,093\cdot\sqrt{\displaystyle\frac{80}{20}}\right]=[25-4,186;25+4,186]=[20,814;29,186]

Jährliche Fahrleistung 3

X: Jährliche Fahrleistung , X ist normalverteilt
\overline{x}=25,\sigma unbekannt, s^2=90,25, n=100, \overline{X} ist approximativ normalverteilt (n \geq 30)
Konfidenzniveau 1-\alpha=0,95; z_{0,975}=1,96
Schätzintervall:\left[25\pm1,96\cdot\sqrt{\frac{90,25}{100}}\right]=[25\pm1,96\cdot0,95]=[25\pm1,862]=[23,138;26,862]

Jährliche Fahrleistung

  • \left[\overline{X}-t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle S}{\displaystyle\sqrt{n}};\overline{X}+t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle S}{\displaystyle\sqrt{n}}\right], so dass

P\left(\overline{X}-t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle S}{\displaystyle\sqrt{n}}\leq\mu\leq\overline{X}+t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle S}{\displaystyle\sqrt{n}}\right)=1-\alpha

  • \left[\overline{x}-t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle s}{\displaystyle\sqrt{n}};\overline{x}+t_{1-\alpha/2;n-1}\cdot\frac{\displaystyle s}{\displaystyle\sqrt{n}}\right]

\overline{x}=25; s^2=80; n=20; 1-\alpha=0,95; t_{0,975;19}=2,093
\left[25-2,093\displaystyle\sqrt{\frac{\displaystyle80}{\displaystyle20}};25+2,093\displaystyle\sqrt{\frac{\displaystyle80}{\displaystyle20}}\right]
=[25-4,186;25+4,186]
=[20,814\mbox{ (}1000\mbox{ km)};29,186\mbox{ (}1000\mbox{ km)}]

Kaltwasserverbrauch

X: Kaltwasserverbrauch pro Spülgang; X\sim N(\mu;\sigma)=N(\mu;2)
\overline{X}: Durchschnittlicher Kaltwasserverbrauch in einer einfachen Zufallsstichprobe vom Umfang n; \overline{X}\sim N(\mu;\sigma/\sqrt{n})=N(\mu;2/\sqrt{n})
Konfidenzniveau: P(\overline{X}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n})=0,95; z_{1-\alpha/2} aus N(0;1);
z_{0,975}=1,96; e=z_{1-\alpha/2}\cdot\sigma/\sqrt{n}; e=0,5=1,96\cdot2/\sqrt{n}; n=2^2\cdot1,96^2/0,5^2=15,3664/0,25=61,4656; n\geq62

Kilometerleistung

  • n=49, \bar{x}=50 km, \sigma=7 km bekannt

    • Allgemeines Konfidenzintervall für den Mittelwert \mu der Grundgesamtheit P\left(\bar{X}-c\frac{\sigma}{\sqrt{n}}\leq \mu \leq\bar{X}+c\frac{\sigma}{\sqrt{n}}\right) = 1-\alpha c aus N(0;1), da \sigma bekannt \Longrightarrow c=z_{1-\alpha/2}

    • Schätzintervall für den Mittelwert \mu der Grundgesamtheit Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 1-\alpha=95\% &\Rightarrow 1-\alpha/2=97,5\% \\ &\Rightarrow \Phi(z_{ 1-\alpha/2})=0,975 \\ &\Rightarrow z_{ 1-\alpha/2} = 1,96\end{aligned} \left[\bar{x}-z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}; \bar{x}+z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}\right] \left[50-1,96\frac{7}{\sqrt{49}}; 50+1,96\frac{7}{\sqrt{49}}\right]= \left[48,04; 51,96\right]

    • Schätzintervall für den Mittelwert \mu der Grundgesamtheit, Breite fix, n variabel \left[\bar{x}-z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}; \bar{x}+z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}\right]= \left[v_u; v_o\right] Breite: Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} v_o-v_u &=& \left(50+1,96\frac{7}{\sqrt{n}}\right)- \left(50-1,96\frac{7}{\sqrt{n}}\right)\\ 2\text{ km }&=& \frac{2\cdot1,96\cdot7\text{ km}}{\sqrt{n}}\\ \sqrt{n}&=& 13,72 \Rightarrow n=188,23 \text{ also } n\geq189\\\end{aligned}

  • Y: “Anzahl der ADAC Mitglieder” \sim B(200;\pi)

    Approximationsbedingung: \hat{\pi}=\frac{40}{200}=0,2 \Rightarrow n\pi(1-\pi)\approx 200\cdot0,2\cdot0,8=32>9

    Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} Y&\approx& N\left(\mu=n\pi;\sigma=\sqrt{n\pi(1-\pi)}\right)\\ \hat{\pi}=\frac{Y}{n}&\approx& N\left(\mu=\pi;\sigma=\sqrt{\frac{\pi(1-\pi)}{n}}\right)\end{aligned}

    Konfidenzintervall P\left(\frac{Y}{n}-c\sqrt{\frac{\frac{Y}{n}\left(1-\frac{Y}{n}\right)}{n}} \leq \pi \leq \frac{Y}{n}+c\sqrt{\frac{\frac{Y}{n}\left(1-\frac{Y}{n}\right)}{n}}\right)=1-\alpha c aus N(0;1), da \sigma bekannt \Longrightarrow c=z_{1-\alpha/2}

    Schätzintervall Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 1-\alpha=99\% &\Rightarrow 1-\alpha/2=99,5\% \\ &\Rightarrow \Phi(z_{ 1-\alpha/2})=0,995 \\ &\Rightarrow z_{ 1-\alpha/2} = 2,58\end{aligned} Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} &\left[0,2-2,58\sqrt{\frac{0,2\cdot(1-0,2)}{200}}; 0,2+2,58\sqrt{\frac{0,2\cdot(1-0,2)}{200}}\right]\\ &= [0,12703; 0,27297]\end{aligned}

  • X_i\sim N(\mu; \sigma) \Longrightarrow \bar{X} \sim N(\mu_{\bar{X}}=\mu; \sigma_{\bar{X}}=\sigma/\sqrt{n}) Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} n&=&5\\ \bar{x}&=& \frac{0,18+0,25+0,12+0,20+0,25}{5}=0,2\\ s^2 %&=& \frac{(0,18-0,2)^2+(0,25-0,2)^2+(0,12-0,2)^2+(0,20-0,2)^2+(0,25-0,2)^2}{4}\\ &=& \frac{0,0004+0,0025+0,0064+0+0,0005}{4}=0,00295\\\end{aligned}

    • Allgemeines Konfidenzintervall für den Mittelwert \mu der Grundgesamtheit P\left(\bar{X}-c\frac{S}{\sqrt{n}}\leq \mu \leq\bar{X}+c\frac{S}{\sqrt{n}}\right) = 1-\alpha c aus t_{n-1}, da \sigma unbekannt \Longrightarrow c=t_{n-1;1-\alpha/2}

    • Schätzintervall Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} 1-\alpha=95\% &\Rightarrow 1-\alpha/2=97,5\% \\ &\Rightarrow t_{n-1;1-\alpha/2} = 2,776\end{aligned} \left[0,2-2,776\sqrt{\frac{0,00295}{5}}; 0,2+2,776\sqrt{\frac{0,00295}{5}}\right] = [0,1326; 0,2674]

  • X_{i}: “Fahrleistung eines PKW’s”; i = 1,...,49; X_{i} beliebig verteilt mit E(X_{i} = \mu, Var(X_{i}) = \sigma^{2} \overline{X}: “Durchschnittliche Fahrleistung eines PKW’s bei einer Zufallsstichprobe vom Umfang n = 49”;

\overline{X} ist approximativ N(\mu;\sigma/\sqrt{n}) – Zentraler Grenzwertsatz, n > 30

    • P\left( \overline{X}-c \cdot  \frac{\sigma}{ \sqrt{n}} \leq
    \mu  \leq \overline{X}+c \cdot  \frac{\sigma}{ \sqrt{n}}\right)=1-
  \alpha c aus N(0;1); c = 1,96
    • [48,04;51,96]
    • n \geq 189
  • Y: “Anzahl der ADAC-Mitglieder bei einer Zufallsstichprobe n=200Y \sim B(200;\pi); wegen Erfüllung der Approximationsbedingungen folgt: Y ist approximativ

N(n\pi;\sqrt{n\pi(1-\pi)}) und Y/n ist approximativ N(\pi;\sqrt{n\pi(1-\pi)}/n) verteilt P \left (\frac{Y}{n}-c \cdot
\sqrt{\frac{\frac{Y}{n}\left(1-\frac{Y}{n}\right)}{n}}
\leq\pi\leq
\frac{Y}{n}+c \cdot \sqrt{\frac{\frac{Y}{n}\left(1-\frac{Y}{n}\right)}{n}}
\right )=1- \alpha c aus N(0;1); c = 2,58; [0,127;0,273]

  • X: “Füllmenge eines Bechers”; X \sim N(\mu;\sigma) \overline{X}: “Durchschnittliche Füllmenge eines Bechers bei einer Zufallsstichprobe vom Umfang n = 5”; \overline{X} \sim N(\mu;\sigma/\sqrt{n})
    • P(\overline{X}-c \cdot  \frac{S}{ \sqrt{n}} \leq  \mu
            \leq  \overline{X}+c \cdot \frac{S}{ \sqrt{n}})=1- \alpha c aus t–Verteilung mit f = 4; c = 2,776
    • [0,1326;0,2674]

Konfidenzniveau 2

\overline{x}-t_{1-\alpha/2;f}\cdot s/\sqrt{n}=2,1; s=10; \overline{x}=(2,1+5,9)/2=4; 4-t_{1-\alpha/2;f}\cdot10/10=2,1; f=99; t_{1-\alpha/2;f}=z_{1-\alpha/2}=1,9; 1-\alpha/2=0,971283; \alpha/2=0,028717; \alpha=0,057434; 1-\alpha=0,942566

Konfidenzniveau

\overline{x}-t_{1-\alpha/2;f}\cdot s/\sqrt{n}=1,6; s=10; \overline{x}=(6,4+1,6)/2=4; 4-t_{1-\alpha/2;f}\cdot 10/10=1,6; f=99;
t_{1-\alpha/2;f}=z_{1-\alpha/2}=2,4; 1-\alpha/2=0,991802; \alpha/2=0,008198; \alpha=0,016396;
1-\alpha=0,983604

Konzentration des Stoffes E

X: Konzentration von E im Wasser; X\sim N(\mu;\sigma)
\overline{X}:Mittlere Konzentration von E im Wasser bei Zufallsstichprobe n=9; \overline{X}\sim N(\mu;\sigma/\sqrt{n})
\sigma unbekannt, mittels S^2=\sum(X_i-\overline{X})^2/(n-1) schätzen
T=(\overline{X}-\mu)\sqrt{n}/S ist t-verteilt mit f=n-1 Freiheitsgraden

\begin{align}
P[\overline{X}-t_{f;1-\alpha/2}\cdot S/\sqrt{n}\leq\mu\leq\overline{X}+t_{f;1-\alpha/2}\cdot S/\sqrt{n}] &=1-\alpha=0,9 \\
\overline{x}&=90/9=10
\end{align}
; s^2=(0+4+0+4+81+25+1+9+4)/8=128/8=16; s=4; t_{8;0,95}=1,86
[10-1,86\cdot4/3;10+1,86\cdot4/3]=[7,520;12,480]

Kugelschreiber

Gewicht der Schreibminen: M\sim N(\mu_M;\sigma_M)=N(\mu_M;0,4); Gewicht der Metallfedern: F\sim N(\mu_F;\sigma_F)=N(\mu_F;0,2); Gewicht der Kunststoffhüllen: H\sim N(\mu_H;\sigma_H)=N(\mu_H;0,4)
Gesamtgewicht eines Kugelschreibers: X=M+F+H; X\sim N(\mu_X;\sigma_X)=N(\mu_X;0,6)
\sigma_X^2=\sigma_M^2+\sigma_F^2+\sigma_H^2=0,4^2+0,2^2+0,4^2=0,36 (wegen Unabhängigkeit von M, F und H)
\overline{X}: Durchschnittsgewicht eines Kugelschreibers in einer einfachen Zufallsstichprobe vom Umfang n=25; \overline{X}\sim N(\mu;\sigma/\sqrt{n})=N(\mu;0,12); \sigma/\sqrt{n}=0,6/5=0,12
Konfidenzniveau: P(\overline{X}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n})=0,8064; z_{1-\alpha/2} aus N(0;1)
z_{0,9032}=1,3; \overline{x}=375/25=15
Schätzintervall:
[\overline{x}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n};\overline{x}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n}]
[15-1,3\cdot0,12; 15+1,3\cdot0,12]=[14,844; 15,156]

Lampen

  • X: “Anzahl der defekten Lampen in der Stichprobe”
    X \sim B(n;\pi) mit \pi
= d/N
    “Intuitive” Schätzfunktion: \widehat{\theta} = N/n \cdot X = 50X
    E(\widehat{\theta}) = N/n\cdot E(X) = N/n\cdot n\cdot d/N=d

  • \vartheta = 150

  • Die einfache Zufallsstichprobe wird durch ein Ziehen mit Zurücklegen realisiert, d.h. mit geringer Wahrscheinlichkeit wird die gleiche Lampe zweimal gezogen. Sinnvoller wäre hier ein Ziehen ohne Zurücklegen, d.h. eine uneingeschränkte Zufallsstichprobe.

    An dem Ergebnis in a) ändert sich nichts, da X\sim Hyp(N,d,n)\approx B(n, \pi=d/n) ist (n/N=0,002<0,05).

Langlebensdauergarantie

X: Brenndauer, ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittliche Brenndauer bei einer Zufallsstichprobe vom Umfang n=100
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;s/\sqrt{n})–verteilt.
\overline{x}=1300, s=100, z_{1-\alpha/2}=z_{0,99}=2,33
P(\overline{X}-z_{1-\alpha/2}\cdot S/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot S/\sqrt{n})\approx1-\alpha=0,98;
[\overline{x}-z_{1-\alpha/2}\cdot s/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot s/\sqrt{n}]
\approx[1300-2,33\cdot100/\sqrt{100};1300+2,33\cdot100/\sqrt{100}]\approx[1276,7;1323,3]

Likelihood-Funktion

  • Likelihood-Funktion: Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} L(\lambda;x_1,x_2,x_3,x_4)&=&f(x_1|\lambda)\cdot f(x_2|\lambda)\cdot f(x_3|\lambda)\cdot f(x_4|\lambda)\\ &=&\frac{\lambda^2}{2!}e^{-\lambda}\cdot\frac{\lambda^4}{4!}e^{-\lambda}\cdot\frac{\lambda^6}{6!}e^{-\lambda}\cdot\frac{\lambda^3}{3!}e^{-\lambda}=\frac{\lambda^{15}}{2!4!6!3!}e^{-4\lambda}\end{aligned}

  • ML-Schätzwert für \lambda:

    Poisson-Verteilung: Log-Likelihood-Funktion:
    \displaystyle f_{PO}(x;\lambda)=\frac{\lambda^x}{x!}e^{-\lambda} \displaystyle \ln L(\lambda)=15\ln\lambda-\ln(2!4!6!3!)-4\lambda



    \displaystyle\frac{\delta\ln L(\lambda)}{\delta\lambda}=\frac{15}{\hat{\lambda}}-4=0
    \displaystyle\hat{\lambda}=\frac{15}{4}=3,75

Love–Parade

X: Ausgaben,X ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittliche Ausgaben bei einer Zufallsstichprobe vom Umfang n=100
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;s/\sqrt{n})–verteilt.
\overline{x}=350, s=24, z_{1-\alpha/2}=z_{0,975}=1,96
[\overline{x}-z_{1-\alpha/2}\cdot s/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot s/\sqrt{n}]=[350-1,96\cdot24/\sqrt{n};350+1,96\cdot24/\sqrt{n}] = [345,296;354,704]

Mietverein 2

  • X: Mietpreis einer 80m^2–Altbauwohnung

X ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittlicher Mietpreis einer 80m^2–Altbauwohnung bei einer Zufallsstichprobe von n=36
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;\sigma/\sqrt{n})–verteilt.
\sigma^2 ist unbekannt und wird mittels der Stichprobenfunktion S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 geschätzt.

P\left(\overline{X}-c\cdot\displaystyle\frac{S}{\sqrt{n}}\leq\mu\leq\overline{X}+c\cdot\displaystyle\frac{S}{\sqrt{n}}\right)=1-\alpha; c aus N(0;1)

  • 1-\alpha=0,98\rightarrow c=2,33; \overline{x}=950; s=180

[950-2,33\cdot180/6;950+2,33\cdot180/6]=[950-69,9;950+69,9]=[880,1;1019,9]

Mietverein

X\sim N(\mu;\sigma=180\mbox{ EUR}); \ell=120; 1-\alpha=0,95; 1-\alpha/2=0,975; z_{0,975}=1,96
n\geq(4\sigma^2z_{1-\alpha/2}^2)\ell^2
n\geq(4\cdot180^2\cdot1,96^2)/120^2=(4\cdot32400\cdot3,8416)/14400=497871,36/14400=34,5744
n\geq35

Milchfettgehalt

X:Milchfettgehalt, \mu=3,7352, \sigma^2=0,0081, X\sim N(3,7352;0,09)


P(X>x)=P\left(\frac{X-3,7352}{0,09} > \frac{x-3,7352}{0,09} \right)=P(Z>z)=0,61 Aus der vorliegenden Tabelle der Standardnormalverteilung findet man für P(Z\leq z)=0,61 den Wert z=0,28, so dass der gesuchte Wert z=-0,28 ist.
(x-3,7352)/0,09=-0,28;\quad\textbf{x=3,71}

Mittelwert und Varianz

\overline{x} = 3 als Schätzwert für \mu; s^{2} = 2,22 als Schätzwert für \sigma^{2}

Notwendiger Stichprobenumfang

Da keine Informationen über \pi in Form einer Vorstichprobe gegeben sind, wird der ungünstigste Fall angenommen und \hat{\pi} so gewählt, dass die Varianz \sigma^2_{\hat{\pi}}=\hat{\pi}(1-\hat{\pi)} maximal wird. Dieser ungünstigste Fall tritt bei \hat{\pi}=0,5 ein.
1-\alpha=0,99;\quad z_{0,995}=2,58;\quad \ell=0,05;
\quad n\geq z_{1-\alpha/2}^2/\ell^2=2,58^2/0,05^2=2662,56\rightarrow n\geq 2663

PKWs in Berlin

Da keine Informationen über \pi in Form einer Vorstichprobe gegeben sind, wird der ungünstigste Fall angenommen und \hat{\pi} so gewählt, dass die Varianz \sigma^2_{\hat{\pi}}=\hat{\pi}\cdot(1-\hat{\pi}) maximal ist. Dieser ungünstigste Fall tritt bei \hat{\pi}=0,5 ein.
1-\alpha=0,95; z_{0,975}=1,96; I=0,06; n=z_{1-\alpha/2}^2/I^2=1,96^2/0,06^2=1067,11;\rightarrow n\geq1068.

Schwankungsintervall

Zentrales Schwankungsintervall:

 \left[ \mu-c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}};\mu+c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}} \right]

Sicherheitswahrscheinlichkeit:

P\left(\mu-c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}}<\overline{X}<\mu+c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}}\right)=1-\alpha

1-\alpha/2=0,975;\;c=1,96
\mu-c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}}=354-1,96\cdot\frac{\displaystyle22,5}{\displaystyle\sqrt{81}}=354-1,96\cdot2,5=354-4,9=349,1
\mu+c\cdot\frac{\displaystyle\sigma}{\displaystyle\sqrt{n}}=354+1,96\cdot\frac{\displaystyle22,5}{\sqrt{\displaystyle81}}=354+1,96\cdot2,5=354+4,9=358,9

Schweinemäster

X: “Gewicht eines Schweins”; X \sim N(\mu;\sigma)

\overline{X}: “Durchschnittliches Gewicht eines Schweins bei einer Zufallsstichprobe vom Umfang n = 6”; \overline{X} \sim N(\mu;\sigma/\sqrt{n})

  • \overline{X} = 100; s^{2} = 6
  • P(\overline{X}-c \cdot  \frac{S}{ \sqrt{n}} \leq  \mu
            \leq  \overline{X}+c \cdot \frac{S}{ \sqrt{n}})=1- \alpha c aus t–Verteilung mit f = 5: c = 2,571
  • [97,429;102,571]
  • Wird dieses Verfahren der Intervallschätzung “unendlich oft” durchgeführt, so kann man mit (durchschnittlich) 95% richtigen Ergebnissen rechnen; d.h. Schätzintervallen, in denen der unbekannte Wert enthalten ist.
  • durch die Wahl von n bzw. \alpha
  • Intervall wird kleiner: statt c = 2,571 aus t–Verteilung ist c=1,96 aus N(0;1) zu verwenden.

Spielautomat

  • Beim 1. Spiel Verlust von 1 EUR; beim 2. Spiel Gewinn von 1 EUR; ...
  • P(X=0) = p; P(X=-1) = p; P(X= 1) = 1 - 2p
  • f(X=0) = 1/6; f(X=-1) = 2/6; f(X= 1) = 3/6
  • L(x_{1},..., x_{6}|p) = p^{3}\cdot(1 - 2p)^{3}
  • v - Anzahl der verlorenen Spiele;

u - Anzahl der unentschiedenen Spiele;
g - Anzahl der gewonnenen Spiele;
n = v + u + g \widehat{p}= (v + u)/2n

  • \widehat{p}= 1/4
  • \widehat{p}= 5/18

Sportliche Betätigung

1-\alpha/2=0,99506\quad z_{0,99506}=2,58\quad\hat{\pi}=180/200=0,9
Da n sehr groß, Schätzfunktion \hat{\pi}=X/n approx. normalverteilt.\left[\hat{\pi}\pm z_{1-\alpha/2}\cdot\sqrt{\frac{\hat{\pi}(1-\hat{\pi})}{n}}\right]
=0,9\pm2,58\sqrt{\frac{0,9\cdot0,1}{200}}=0,9\pm2,58\cdot0,0212132=0,9\pm0,05473[0,845;0,955]

Startprobleme

  • L(p) = (1 - p)^{8}\cdot p^{2}
  • \widehat{p} = 0,2

Stichprobenmittelwert

P(\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n}\leq\overline{X}\leq\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n})=1-\alpha; [\mu-t_{1-\alpha/2;f}\cdot s/\sqrt{n};\mu+t_{1-\alpha/2;f}\cdot s/\sqrt{n}]
\mu=5; s=2; n=25; f=24; 1-\alpha=0,99; 1-\alpha/2=0,995; t_{0,995;24}=2,797
[5-2,797\cdot2/5;5+2,797\cdot2/5]=5-1,1188;5+1,1188]=[3,8812;6,1188]

Studienmotivation

x 0 1 2 \sum
P(X_i = x) \pi_{0} \pi_{1} \pi_{2} \pi_{0}+\pi_{1}+\pi_{2}=1
  • Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(X_{i}) &=& 0 \cdot \pi_{0}+ 1 \cdot \pi_{1} + 2 \cdot \pi_{2}=\pi_{1} + 2 \cdot \pi_{2}\\ E(\widehat{\pi}_{1})&=&E \left(\frac1{10} \sum_{i=1}^{10} (2X_i - X_i^2) \right)= \frac1{10} \sum_{i=1}^{10} \left (2E(X_i) - E(X_i^2) \right)\end{aligned}

    x^2 0 1 4 \sum
    P(X_i^2 = x^2) \pi_{0} \pi_{1} \pi_{2} \pi_{0}+\pi_{1}+\pi_{2}=1

    Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \displaystyle E(X_{i}^2)&=& 0 \cdot \pi_{0}+ 1 \cdot \pi_{1} + 4 \cdot \pi_{2}=\pi_{1} + 4 \cdot \pi_{2}\\ E(\widehat{\pi}_{1})&=&\frac1{10} \sum_{i=1}^{10} \left (2(\pi_1 + 2\pi_2) - (\pi_1 + 4\pi_2) \right)= \frac1{10} \sum_{i=1}^{10} \pi_1 = \pi_1\\ E(\widehat{\pi}_{2}) &=& E \left(\frac1{20} \sum_{i=1}^{10}(X_i^2 - X_i)\right)= \frac1{20} \sum_{i=1}^{10} \left (E(X_i^2) - E(X_i) \right)\\ &=& \frac1{20} \sum_{i=1}^{10} \left((\pi_1 + 4\pi_2) - (\pi_1 + 2\pi_2) \right) =\frac1{20} \sum_{i=1}^{10} 2\pi_2=\pi_2\end{aligned}

  • Schätzfunktion: \widehat{\pi}_{0} = 1 - \widehat{\pi}_{1} - \widehat{\pi}_{2}

    Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} E(\widehat{\pi}_{0}) &=& E(1 - \widehat{\pi}_{1} - \widehat{\pi}_{2})\\ &=& 1 - E(\widehat{\pi}_{1}) - E(\widehat{\pi}_{2})\\ &=& 1 - \pi_{1} - \pi_{2} = \pi_{0}\end{aligned}

  • Stichprobe:

    i 1 2 3 4 5 6 7 8 9 10
    x_i 0 2 1 0 0 2 2 1 0 2


    x_i 2x_i-x_i^2 x_i^2-x_i
    0 0 0
    1 1 0
    2 0 2

    Fehler beim Parsen (Unbekannte Funktion „\begin“): \begin{aligned} \widehat{\pi}_{1} &=& \frac1{10}\sum_{i=1}^{10} (2x_i-x_i^2) = \frac{0+0+1+0+0+0+0+1+0+0}{10}=0,2\\ \widehat{\pi}_{2} &=& \frac1{20}\sum_{i=1}^{10} (x_i^2-x_i) = \frac{0+2+0+0+0+2+2+0+0+2}{20}=0,4\\ \widehat{\pi}_{0} &=& 1-0,2-0,4=0,4\\\end{aligned}

  • ja, führen Sie den Beweis!
  • \widehat{\pi}_{0} = 1 - \widehat{\pi}_{1} - \widehat{\pi}_{2}; E(\widehat{\pi}_{0}) = 1 - \pi_{1} - \pi_{2};   \widehat{\pi}_{0}=\frac{1}{10} \sum\limits _{i=1} ^{10}(1-\frac32 X_i
   +\frac12 X _{i} ^{2})
  • p_{1} = 0,2; p_{2} = 0,4; p_{0} = 0,4

Trinkwasserverbrauch

X: Wasserverbrauch, ist beliebig verteilt mit E(X)=\mu und Var(X)=\sigma^2
\overline{X}: Durchschnittlicher Wasserverbrauch bei einer Zufallsstichprobe vom Umfang n=100
\overline{X} ist approximativ (zentraler Grenzwertsatz; n>30) N(\mu;s/\sqrt{n})–verteilt.
\overline{x}=12, s^2=\sum(x_i-\overline{x})^2/(n-1)=5, z_{1-\alpha/2}=z_{0,975}=1,96
P(\overline{X}-z_{1-\alpha/2}\cdot S/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot S/\sqrt{n})\approx1-\alpha=0,95;
[\overline{x}-z_{1-\alpha/2}\cdot s/\sqrt{n}\leq\mu\leq\overline{x}+z_{1-\alpha/2}\cdot s/\sqrt{n}]\approx[12-1,96\cdot5/\sqrt{100};12+1,96\cdot5/\sqrt{100}]\approx[11,02;12,98]

Unfallhäufigkeit

  • L_{Vers.}(0,2,0,2,1) = 0,00196; L_{Pol.}(0,2,0,2,1)= 0,001

\Rightarrow Versicherungsgesellschaft

  • Q_{Vers.}(0,2,0,2,1) = 5,25; Q_{Pol.}(0,2,0,2,1) = 4,8

\Rightarrow Polizei

Weizenhektarerträge

Grundgesamtheit sind alle Hektarflächen in Deutschland, auf denen 1996 Weizen angebaut wurde; X: “Hektarertrag für Weizen”; Verteilung von X unbekannt; \sigma^2=324 [dt/ha]^2. \overline{X}: “Durchschnittlicher Hektarertrag für Weizen in Deutschland bei einer einfachen Zufallsstichprobe vom Umfang n=144
Verteilung von \overline{X} unbekannt. Da aber der Stichprobenumfang n>30 ist, kann aufgrund des Zentralen Grenzwertsatzes approximativ die Normalverteilung verwendet werden:
\overline{X}\sim N(\mu;\sigma/\sqrt{n});\quad P(\overline{X}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n}\leq\mu\leq\overline{X}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n})=0,8064
Schätzintervall: [\overline{x}-z_{1-\alpha/2}\cdot\sigma/\sqrt{n};\overline{x}+z_{1-\alpha/2}\cdot\sigma/\sqrt{n}]
1-\alpha/2=0,9032;\quad z_{0,9032}=1,3 aus N(0;1);\quad n=144;\quad \sigma=18
Stichprobenmittelwert für Deutschland:
\overline{x}=(60,4\cdot48+68,8\cdot96)/144=(2899,2+6604,8)/144=66 dt/ha;
Schätzintervall: [66-1,3\cdot18/12;66+1,3\cdot18/12]=[66-1,95;66+1,95]=[64,05;67,95]