Binomialverteilung: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
{{Verteilungsmodelle}}
{{Verteilungsmodelle}}
{{SubpageToc|Beispiele}}


=={{Vorlage:Überschrift}}==
=={{Vorlage:Überschrift}}==
Zeile 130: Zeile 131:


<math>P(X=x)=f(x)={n \choose x }\cdot p^{x}\cdot (1-p)^{n-x}</math>
<math>P(X=x)=f(x)={n \choose x }\cdot p^{x}\cdot (1-p)^{n-x}</math>
=={{Vorlage:Beispiele}}==
===Urne===
In einer Urne befinden sich 10 Kugeln, davon 3 weiße und 7 rote Kugeln.
<math>A= \{\mbox{weiße Kugel}\};\; \bar{A}= \{\mbox{rote Kugel}\};\; P(A) = 0,3;\; P(\bar{A}) = 0,7</math>
Nach jeder Ziehung einer Kugel wird diese vor der nächsten Ziehung in die Urne zurückgelegt. Das Ziehen einer Kugel wird <math>n= 5</math> mal durchgeführt.
Damit sind die Bedingungen eines [[Bernoulli-Experiment]]s erfüllt:
* Es gibt nur zwei mögliche [[Ereignis]]se (rote oder weiße Kugel) als Ergebnis jeder Ziehung.
* Die [[Wahrscheinlichkeit]]en sind konstant, denn durch das Zurücklegen bleibt die Gesamtzahl der Kugeln und die jeweilige Anzahl farbiger Kugeln unverändert.
* Die Ziehungen sind durch das Zurücklegen [[Unabhängigkeit (stochastisch)|unabhängig]] voneinander.
Gesucht ist die [[Wahrscheinlichkeit]], dass 2 weiße Kugeln auftreten, d.h. <math>P(X = 2)</math>.
<math>X_i =</math>{Anzahl des Auftretens einer weißen Kugel bei der i-ten Ziehung}
<math>P(X_i = 1) = 0,3;\; P(X_i = 0) = 0,7</math> für alle <math>i = 1,\; \ldots ,5</math>
Bei 5 Versuchen gibt es 5 [[Unabhängigkeit (stochastisch)|unabhängige]] [[Zufallsvariable]]n <math>X_{1},\;X_{2},\;X_{3},\;X_{4},\;X_{5}</math>
<math>X = \{\mbox{Anzahl des Auftretens weißer Kugeln bei n = 5 Ziehungen mit Zurücklegen}\}</math>
<math>X = \sum\nolimits_i X_i</math>
<math>X \sim B(n;p) = B(5;0,3)\, </math>
Die Anzahl der möglichen voneinander verschiedenen [[Ereignis]]folgen von 2 weißen und 3 roten Kugeln beträgt:
<math>{5\choose2} =\frac{5!}{2!\cdot 3!}=10</math>
Die gesuchte [[Wahrscheinlichkeit]] ist somit
<math>P(X=2) = f_B(2;5;0,3) = {5\choose 2}\cdot 0,3^2 \cdot 0,7^3 = 0,3087</math>
Die folgende Tabelle enthält die [[Wahrscheinlichkeitsverteilung]] und die [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der Binomialverteilung <math>B(5;0,3)</math>:
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
!align="center" |<math>x</math>
!align="center" |<math>f_B(x;5;0,3)</math>
!align="center" |<math>F_B(x;5;0,3)</math>
|-
|align="center" |0
|align="center" |0,1681
|align="center" |0,1681
|-
|align="center" |1
|align="center" |0,3601
|align="center" |0,5282
|-
|align="center" |2
|align="center" |0,3087
|align="center" |0,8369
|-
|align="center" |3
|align="center" |0,1323
|align="center" |0,9692
|-
|align="center" |4
|align="center" |0,0284
|align="center" |0,9976
|-
|align="center" |5
|align="center" |0,0024
|align="center" |1,0000
|}
Die folgende Abbildung zeigt die [[Wahrscheinlichkeitsverteilung]] der Binomialverteilung <math>B(5;0,3)</math>:
{|
|<R output="display">
pdf(rpdf,width=7,height=7)
WVert<- dbinom(c(0:5),5,0.3)
plot(WVert, col="WHITE", xaxt="n",xpd=TRUE, xlim= c(0, 5), ylab="f(X)", xlab="X", font.lab=2,
    main="B(5;0,3)", las=1, font.axis=2 )
axis(side=1, at=c(0:5), font.axis=2)
lines(c(0:5), WVert, type="h", lwd=5, col="BLUE")
</R>
|}
Die Berechnung der gesuchten [[Wahrscheinlichkeit]] erfolgt über die [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] in folgender Weise:
{|
|<math>f_{B}(2;5;0,3)\,</math>
|<math>=F_{B}(2;5;0,3)-F_{B}(1;5;0,3)\,</math>
|-
|
|<math>=0,8369-0,5282=0,3087\,</math>
|}
Die [[Wahrscheinlichkeit]], bei <math>n = 5</math> [[Unabhängigkeit (stochastisch)|unabhängigen]] Ziehungen 2 weiße Kugeln zu ziehen, beträgt damit 0,3087.
===Nebenjob===
Entsprechend einer Erhebung unter den Studenten einer großen Universität habe sich ergeben, dass 65% der Studenten neben ihrem Studium einem Job nachgehen.
Wie groß ist die [[Wahrscheinlichkeit]], dass von <math>n = 8</math> zufällig ausgewählten Studenten dieser Universität höchstens 4 Studenten einen
Nebenjob haben?
Die Bedingungen eines [[Bernoulli-Experiment]]s sind erfüllt:
Es gibt nur zwei mögliche [[Ereignis]]se als Ergebnis jeder Auswahl:
<math>A = \{\mbox{Student mit Nebenjob}\};\; \bar{A}=\{\mbox{Student ohne Nebenjob}\} ;\; P(A) = 0,65 ;\; P(\bar{A}) = 0,35</math>.
Da die [[Grundgesamtheit|Gesamtheit]] der Studenten an dieser Universität als sehr groß vorausgesetzt wurde und da <math>n</math> sehr klein im Verhältnis zum Umfang <math>N</math> der [[Grundgesamtheit|Gesamtheit]] ist, kann trotzdem näherungsweise mit der Binomialverteilung gearbeitet werden.
Die [[Wahrscheinlichkeit]]en können als konstant und die Ziehungen als unabhängig voneinander angesehen werden.
Die interessierende [[Zufallsvariable]] ist <math>\,X = \{\mbox{Anzahl der Studenten mit einem Nebenjob}\}</math>.
Sie ist  <math>X \sim B(n;p) = B(8;0,65)\,</math> verteilt.
Gesucht ist die [[Wahrscheinlichkeit]]  <math>P(X \leq 4)</math>, d.h., der Wert der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] <math>F(4)</math>.
Die [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der <math>B(8; 0,65)</math> liegt nicht tabelliert vor.
Die Berechnung nach der Formel für die [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] ist jedoch sehr aufwendig, da 5 [[Wahrscheinlichkeit]]en <math>f(x), x = 0,1,\;\ldots,\;4</math>, berechnet und dann aufsummiert werden müssen.
Mit Hilfe eines Computers lässt sich aber die [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der <math>B(8; 0,65)</math> leicht generieren. Sie ist in der folgenden Tabelle in der 2. Spalte enthalten.
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
!align="center" |<math>x</math>
!align="center" |<math>B(8;0,65)</math>
!align="center" |<math>B(8;0,35)</math>
|-
|align="center" |<math>0</math>
|align="center" |<math>0,0002</math>
|align="center" |<math>0,0319</math>
|-
|align="center" |<math>1</math>
|align="center" |<math>0,0036</math>
|align="center" |<math>0,1691</math>
|-
|align="center" |<math>2</math>
|align="center" |<math>0,0253</math>
|align="center" |<math>0,4278</math>
|-
|align="center" |<math>3</math>
|align="center" |<math>0,1061</math>
|align="center" |<math>0,7064</math>
|-
|align="center" |<math>4</math>
|align="center" |<math>0,2936</math>
|align="center" |<math>0,8939</math>
|-
|align="center" |<math>5</math>
|align="center" |<math>0,5722</math>
|align="center" |<math>0,9747</math>
|-
|align="center" |<math>6</math>
|align="center" |<math>0,8309</math>
|align="center" |<math>0,9964</math>
|-
|align="center" |<math>7</math>
|align="center" |<math>0,9681</math>
|align="center" |<math>0,9998</math>
|-
|align="center" |<math>8</math>
|align="center" |<math>1,0000</math>
|align="center" |<math>1,0000</math>
|}
{|
|<R output="display">
pdf(rpdf,width=7,height=7)
x <- c(0:8)
WVert<- dbinom(x, 8, 0.65)
WVert2<- dbinom(x, 8, 0.35)
plot(WVert, col="WHITE", xaxt="n", ylab="f(X)", ylim=c(0, 0.3), xlim=c(0, 8), xlab="X", font.lab=2,
    main="B(8;0,65) - blau        B(8;0,35) - rot", las=1, font.axis=2,sub="Abb. 1: Wahrscheinlichkeitsfunktion der B(8;0,35) und der B(8;0,65)")
lines(c(0:8)-0.1, WVert, type="h", lwd=5, col="BLUE")
lines(c(0:8)+0.1, WVert2, type="h", lwd=5, col="RED")
axis(side=1, at=c(0:8), font.axis=2)
</R>
|<R output="display">
pdf(rpdf,width=7,height=7)
x <- c(0:8)
WVert<- pbinom(x, 8, 0.65)
WVert2<- pbinom(x, 8, 0.35)
plot(WVert, col="WHITE", xaxt="n", ylab="F(X)", ylim=c(0, 1), xlim=c(0, 8), xlab="X", font.lab=2,
    main="B(8;0,65) - blau        B(8;0,35) - rot", las=1, font.axis=2,sub="Abb. 2: Verteilungsfunktion der B(8;0,35) und der B(8;0,65)")
lines(c(0:8)-0.1, WVert, type="h", lwd=5, col="BLUE")
lines(c(0:8)+0.1, WVert2, type="h", lwd=5, col="RED")
axis(side=1, at=c(0:8), font.axis=2)
</R>
|}
Die [[Wahrscheinlichkeit]], dass bei einer zufälligen Auswahl von <math>n= 8</math> Studenten höchstens 4 Studenten einem Nebenjob nachgehen, beträgt 0,2936.
Will man jedoch die Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der Binomialverteilung verwenden, so macht man sich die Symmetrieeigenschaft der Binomialverteilung (siehe "Eigenschaften der Binomialverteilung") zunutze.
Da <math>X =\{\mbox{Anzahl der Studenten mit einem Nebenjob}\} \sim B(8;0,65)\,</math> verteilt ist, folgt
<math>\,Y = \{\mbox{Anzahl der Studenten ohne Nebenjob}\}</math>, d.h. <math>\,Y = n - X</math>, einer Binomialverteilung <math>\sim B(8;0,35)\,</math>.
<math>X\leq 4</math>, d.h. <math> x = 0,\;1,\;2,\;3,\;4</math> entspricht <math>Y \geq 4</math>, d.h. <math>\,y = 8,\;7,\;6,\;5,\;4</math>.
Statt der [[Wahrscheinlichkeit]] <math>P(X\leq 4)</math> ist <math>P(Y \geq 4)=1 - P(X \leq 3)</math> gesucht.
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der <math>B(8;0,65)</math>, siehe 3. Spalte der obigen Tabelle, findet man <math>P(Y\leq 3) = 0,7064</math> und somit
<math>P(Y \leq  4) = 1 - 0,7064 = 0,2936</math>.
===Hamburger===
Eine TV-Werbung für Hamburger-Land beinhaltete folgende Aussage: "Unsere Umfrage zeigt, dass 75% der Leute ihre Hamburger am liebsten frittiert essen."
In diesem TV-Spot trifft der Sprecher folgende Aussage: "Rufen Sie vier Hamburger-Land Fans an - höchstens einer von ihnen wird den Hamburger nicht frittiert
wählen."
Trifft diese Aussage so absolut zu?
Die Bedingungen eines [[Bernoulli-Experiment]]s sind erfüllt:
Es gibt nur zwei mögliche [[Ereignis]]se als Ergebnis jeder Auswahl:
<math>A= \{\mbox{nicht frittierter Hamburger}\} ;\; \bar A  = \{\mbox{frittierter Hamburger}\} ;\; P(A) = 0,25 ;\; P(\bar{A}) = 0,75</math>.
Da die Gemeinschaft der Hamburgerland-Fans zweifelsohne als sehr groß angesehen werden kann, spielt es keine Rolle, ob die Auswahl mit oder ohne Zurücklegen erfolgt.
Die [[Wahrscheinlichkeit]]en können somit als konstant und die Ziehungen als [[Unabhängigkeit (stochastisch)|unabhängig]] voneinander vorausgesetzt werden.
Die [[Zufallsvariable]] <math>X = \{\mbox{Anzahl nicht frittierter Hamburger bei 4 Entscheidungen}\}</math> ist somit binomialverteilt mit den [[Parameter]]n <math>n =4</math> und <math>p = 0,25</math>;
d.h. <math>X\sim B(4;0,25)\,</math>
Gesucht ist die [[Wahrscheinlichkeit]] <math>P(X\leq 1)</math>
Diese [[Wahrscheinlichkeit]] ergibt sich als
<math>P(X\leq 1)=P(X=0)+P(X=1)=F_{B}(1;4;0,25)</math>
Die [[Wahrscheinlichkeit]] für das höchstens einmalige Auftreten des [[Ereignis]]ses "nicht frittierter Hamburger" ist die Summe der Einzel[[wahrscheinlichkeit]]en, dass "nicht frittierter Hamburger" von 4 zufällig ausgewählten Hamburgerland-Fans nicht oder einmal gewählt wird.
Dies entspricht jedoch dem Wert der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der Binomialverteilung an der Stelle <math>X = 1</math>.
Für <math>n = 4</math> und <math>p = 0,25</math> liegt die Binomialverteilung tabelliert vor (siehe folgende Tabelle).
{| border="1" cellpadding="3" style="text-align:center;margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
|align="center" |<math>\,x</math>
|align="center" |<math>\,f_B(x;4;0,25)</math>
|align="center" |<math>\,F_B(x;4;0,25)</math>
|-
|align="center" |0
|align="center" |0,3164
|align="center" |0,3164
|-
|align="center" |1
|align="center" |0,4219
|align="center" |0,7383
|-
|align="center" |2
|align="center" |0,2109
|align="center" |0,9492
|-
|align="center" |3
|align="center" |0,0469
|align="center" |0,9961
|-
|align="center" |4
|align="center" |0,0039
|align="center" |1,0000
|}
{|
|<R output="display">
pdf(rpdf,width=7,height=7)
x <- c(0:4)
WVert<- dbinom(x, 4, 0.25)
WVert2<- pbinom(x, 4, 0.25)
plot(WVert, col="WHITE", xaxt="n", ylab="f(X), F(X)", ylim=c(0, 1), xlim=c(0, 4), xlab="X", font.lab=2,
    main="fB(4;0,25) - blau        FB(4;0,25) - rot", las=1, font.axis=2)
lines(c(0:4)-0.05, WVert, type="h", lwd=5, col="BLUE")
lines(c(0:4)+0.05, WVert2, type="h", lwd=5, col="RED")
axis(side=1, at=c(0:4), font.axis=2)
</R>
|}
Aus der letzten Spalte dieser Tabelle kann folgendes entnommen werden: <math>F_B(1;4;0.25)=0.7383</math>.
Unter der Voraussetzung, dass die [[Wahrscheinlichkeit]]en <math>P(\mbox{frittierter Hamburger}) = 0,75</math> und <math>P(\mbox{nicht frittierter Hamburger})
= 0,25 </math> aus der Umfrage auch für die Gesamtheit der Hamburgerland-Fans gültig ist, trifft die obige Aussage mit einer [[Wahrscheinlichkeit]] von 0,7383 zu.
<!--==Interaktives Beispiel Binomialverteilung==
Die Binomialverteilung hängt von den beiden [[Parameter]]n <math>n</math> und <math>p</math>
ab, die
* ihre Gestalt,
* ihre Lage, d.h den [[STAT-Glossar#Erwartungswert|Erwartungswert]] <math>E(X) = n\cdot p</math> und
* ihre Streuung, d.h. <math>\sigma = \sqrt{np(1-p)}</math>
beeinflussen.
Sie haben nunmehr zum einen die Möglichkeit, einen oder beide
[[Parameter]] zu variieren, und erhalten als Output die grafische
Darstellung der entsprechenden [[STAT-Glossar#Wahrscheinlichkeitsfunktion|Wahrscheinlichkeitsfunktion]] der
B(n; p).
Empfehlenswert ist, zunächst nur einen [[Parameter]] zu variieren
und den anderen konstant zu halten, um dessen Wirkung auf die
Binomialverteilung zu studieren.
Weiterhin können Sie sich die Wahrscheinlichkeiten für
spezielle Werte von <math>X</math> berechnen lassen.-->
[[Kategorie:Statistik I&II]]

Aktuelle Version vom 22. November 2018, 16:52 Uhr

Verteilungsmodelle

Diskrete Gleichverteilung • Binomialverteilung • Hypergeometrische Verteilung • Poisson-Verteilung • Stetige Gleichverteilung • Exponentialverteilung • Normalverteilung • Standardnormalverteilung • Schwankungsintervall • Zentraler Grenzwertsatz • Chi-Quadrat-Verteilung • t-Verteilung • F-Verteilung • Approximation von Verteilungen • Multiple Choice • Video • Aufgaben • Lösungen
Approximation • Approximation der Binomialverteilung • Approximation der hypergeometrischen Verteilung • Approximation der Poisson-Verteilung • Bernoulli-Experiment • Endlichkeitskorrektur • Freiheitsgrad • Gauß-Verteilung • Gauß'sche Glockenkurve • Gedächtnislosigkeit der Exponentialverteilung • Gleichverteilung (diskret) • Gleichverteilung (stetig) • Poisson-Prozess • Sicherheitswahrscheinlichkeit • Standardnormalverteilung • Stetigkeitskorrektur • Student'sche t-Verteilung • Überschreitungswahrscheinlichkeit • Zentrales Schwankungsintervall

Grundbegriffe

Bernoulli-Experiment

Ein Zufallsexperiment ist durch folgende Eigenschaften gekennzeichnet:

  • Es gibt nur zwei mögliche Ereignisse und
  • Die Wahrscheinlichkeiten des Eintretens der Ereignisse sind und

Ein derartiges Zufallsexperiment heißt Bernoulli-Experiment.

Binomialverteilung

Der Binomialverteilung liegt ein Bernoulli-Experiment zugrunde, bei dem entweder ein Ereignis mit konstanter Wahrscheinlichkeit oder das zu komplementäre Ereignis mit der Wahrscheinlichkeit eintreten kann.

Dieses Zufallsexperiment wird -mal wiederholt.

Die diskrete Zufallsvariable, welche die Anzahl des Eintretens von bei -maliger Durchführung des Zufallsexperimentes beinhaltet, heißt binomialverteilt mit den Parametern und , wenn ihre Wahrscheinlichkeitsfunktion durch

gegeben ist. In Kurzform schreibt man

Für die Verteilungsfunktion folgt

Erwartungswert und Varianz der Binomialverteilung :

Zusatzinformationen

Eigenschaften der Binomialverteilung

  • Reproduktivitätseigenschaft:
Sind und unabhängige Zufallsvariablen, so ist die Zufallsvariable ebenfalls binomialverteilt mit den Parametern und , d.h. .
  • Symmetrieeigenschaft:
Ist und dann gilt .

Für ausgewählte Werte der Parameter und (mit ) liegt die Binomialverteilung tabelliert vor (z.B. Formelsammlung Statistik I+II).

Graphische Darstellung der Binomialverteilung

Da die Binomialverteilung eine diskrete Verteilung ist, erfolgt die grafische Darstellung der Wahrscheinlichkeitsfunktion als Stabdiagramm und die der Verteilungsfunktion als Treppenfunktion.

Die folgende Abbildung zeigt zu verschiedenen Werten von , bei gleichem , die Wahrscheinlichkeitsfunktion der Binomialverteilung.

Man erkennt, dass die Verteilung für linkssteil ist und zwar umso deutlicher, je kleiner ist.

Für ist die Verteilung symmetrisch zum Wert .

Für erhält man rechtssteile Verteilungen als "Spiegelbild" zu den entsprechenden linkssteilen Verteilungen.


Approximation der Binomialverteilung durch Normalverteilung

Für sehr große Werte von lässt sich die Wahrscheinlichkeitsfunktion durch die Dichtefunktion einer Normalverteilung mit und approximieren.

Diese Approximation ist umso besser, je näher bei 0,5 liegt, und wird schlechter, je näher bei 0 oder 1 liegt.

Die theoretische Rechtfertigung liefert der zentrale Grenzwertsatz.

Herleitung der Binomialverteilung

Für jeden Versuch eines Bernoulli-Experimentes wird eine Zufallsvariable definiert, die nur die Werte 0 (für das Eintreten von ) und 1 (für das Eintreten von ) annehmen kann.

Gemäß den gegebenen Wahrscheinlichkeiten und weist jede Zufallsvariable die Wahrscheinlichkeitsfunktion (Bernoulli-Verteilung)

mit und auf.

Bei -maliger Durchführung der Versuche interessiert die Gesamtzahl des Eintretens von , so dass die Zufallsvariable

betrachtet wird:

ist eine Funktion (Linearkombination) von Zufallsvariablen.

Das Ereignis tritt ein, wenn in der Folge der Versuche genau -mal das Ereignis und -mal das Ereignis eintritt z.B.

, also -mal und -mal .

Die Indizierung der Ereignisse gibt die Nummer des Versuchs an.

Die Wahrscheinlichkeit, dass die Zufallsvariable die Realisation bei dieser Ereignisfolge annimmt, ist wegen der Unabhängigkeit der Versuche

Es gibt jedoch nicht nur eine Folge von Versuchen, bei der genau -mal das Ereignis und -mal das Ereignis eintritt.

Die Wahrscheinlichkeit jeder dieser Folgen ist ebenfalls .

Die Anzahl der verschiedenen Ereignisfolgen lässt sich mithilfe des Binomialkoeffizienten ermitteln, ist also durch die Anzahl der Kombinationen ohne Wiederholung gegeben:

Aufgrund der Unabhängigkeit der Ereignisfolgen resultiert die Wahrscheinlichkeitsfunktion