Binomialverteilung

Aus MM*Stat

Wechseln zu: Navigation, Suche

Verteilungsmodelle

Diskrete Gleichverteilung • Binomialverteilung • Hypergeometrische Verteilung • Poisson-Verteilung • Stetige Gleichverteilung • Exponentialverteilung • Normalverteilung • Standardnormalverteilung • Schwankungsintervall • Zentraler Grenzwertsatz • Chi-Quadrat-Verteilung • t-Verteilung • F-Verteilung • Approximation von Verteilungen • Multiple Choice • Video • Aufgaben • Lösungen
Approximation • Approximation der Binomialverteilung • Approximation der hypergeometrischen Verteilung • Approximation der Poisson-Verteilung • Bernoulli-Experiment • Endlichkeitskorrektur • Freiheitsgrad • Gauß-Verteilung • Gauß'sche Glockenkurve • Gedächtnislosigkeit der Exponentialverteilung • Gleichverteilung (diskret) • Gleichverteilung (stetig) • Poisson-Prozess • Sicherheitswahrscheinlichkeit • Standardnormalverteilung • Stetigkeitskorrektur • Student'sche t-Verteilung • Überschreitungswahrscheinlichkeit • Zentrales Schwankungsintervall

Grundbegriffe

Bernoulli-Experiment

Ein Zufallsexperiment ist durch folgende Eigenschaften gekennzeichnet:

  • Es gibt nur zwei mögliche Ereignisse und
  • Die Wahrscheinlichkeiten des Eintretens der Ereignisse sind und

Ein derartiges Zufallsexperiment heißt Bernoulli-Experiment.

Binomialverteilung

Der Binomialverteilung liegt ein Bernoulli-Experiment zugrunde, bei dem entweder ein Ereignis mit konstanter Wahrscheinlichkeit oder das zu komplementäre Ereignis mit der Wahrscheinlichkeit eintreten kann.

Dieses Zufallsexperiment wird -mal wiederholt.

Die diskrete Zufallsvariable, welche die Anzahl des Eintretens von bei -maliger Durchführung des Zufallsexperimentes beinhaltet, heißt binomialverteilt mit den Parametern und , wenn ihre Wahrscheinlichkeitsfunktion durch

gegeben ist. In Kurzform schreibt man

Für die Verteilungsfunktion folgt

Erwartungswert und Varianz der Binomialverteilung :

Zusatzinformationen

Eigenschaften der Binomialverteilung

  • Reproduktivitätseigenschaft:
Sind und unabhängige Zufallsvariablen, so ist die Zufallsvariable ebenfalls binomialverteilt mit den Parametern und , d.h. .
  • Symmetrieeigenschaft:
Ist und dann gilt .

Für ausgewählte Werte der Parameter und (mit ) liegt die Binomialverteilung tabelliert vor (z.B. Formelsammlung Statistik I+II).

Graphische Darstellung der Binomialverteilung

Da die Binomialverteilung eine diskrete Verteilung ist, erfolgt die grafische Darstellung der Wahrscheinlichkeitsfunktion als Stabdiagramm und die der Verteilungsfunktion als Treppenfunktion.

Die folgende Abbildung zeigt zu verschiedenen Werten von , bei gleichem , die Wahrscheinlichkeitsfunktion der Binomialverteilung.

Man erkennt, dass die Verteilung für linkssteil ist und zwar umso deutlicher, je kleiner ist.

Für ist die Verteilung symmetrisch zum Wert .

Für erhält man rechtssteile Verteilungen als "Spiegelbild" zu den entsprechenden linkssteilen Verteilungen.


Approximation der Binomialverteilung durch Normalverteilung

Für sehr große Werte von lässt sich die Wahrscheinlichkeitsfunktion durch die Dichtefunktion einer Normalverteilung mit und approximieren.

Diese Approximation ist umso besser, je näher bei 0,5 liegt, und wird schlechter, je näher bei 0 oder 1 liegt.

Die theoretische Rechtfertigung liefert der zentrale Grenzwertsatz.

Herleitung der Binomialverteilung

Für jeden Versuch eines Bernoulli-Experimentes wird eine Zufallsvariable definiert, die nur die Werte 0 (für das Eintreten von ) und 1 (für das Eintreten von ) annehmen kann.

Gemäß den gegebenen Wahrscheinlichkeiten und weist jede Zufallsvariable die Wahrscheinlichkeitsfunktion (Bernoulli-Verteilung)

mit und auf.

Bei -maliger Durchführung der Versuche interessiert die Gesamtzahl des Eintretens von , so dass die Zufallsvariable

betrachtet wird:

ist eine Funktion (Linearkombination) von Zufallsvariablen.

Das Ereignis tritt ein, wenn in der Folge der Versuche genau -mal das Ereignis und -mal das Ereignis eintritt z.B.

, also -mal und -mal .

Die Indizierung der Ereignisse gibt die Nummer des Versuchs an.

Die Wahrscheinlichkeit, dass die Zufallsvariable die Realisation bei dieser Ereignisfolge annimmt, ist wegen der Unabhängigkeit der Versuche

Es gibt jedoch nicht nur eine Folge von Versuchen, bei der genau -mal das Ereignis und -mal das Ereignis eintritt.

Die Wahrscheinlichkeit jeder dieser Folgen ist ebenfalls .

Die Anzahl der verschiedenen Ereignisfolgen lässt sich mithilfe des Binomialkoeffizienten ermitteln, ist also durch die Anzahl der Kombinationen ohne Wiederholung gegeben:

Aufgrund der Unabhängigkeit der Ereignisfolgen resultiert die Wahrscheinlichkeitsfunktion

Beispiele

Urne

In einer Urne befinden sich 10 Kugeln, davon 3 weiße und 7 rote Kugeln.

Nach jeder Ziehung einer Kugel wird diese vor der nächsten Ziehung in die Urne zurückgelegt. Das Ziehen einer Kugel wird mal durchgeführt.

Damit sind die Bedingungen eines Bernoulli-Experiments erfüllt:

  • Es gibt nur zwei mögliche Ereignisse (rote oder weiße Kugel) als Ergebnis jeder Ziehung.
  • Die Wahrscheinlichkeiten sind konstant, denn durch das Zurücklegen bleibt die Gesamtzahl der Kugeln und die jeweilige Anzahl farbiger Kugeln unverändert.
  • Die Ziehungen sind durch das Zurücklegen unabhängig voneinander.

Gesucht ist die Wahrscheinlichkeit, dass 2 weiße Kugeln auftreten, d.h. .

{Anzahl des Auftretens einer weißen Kugel bei der i-ten Ziehung}

für alle

Bei 5 Versuchen gibt es 5 unabhängige Zufallsvariablen

Die Anzahl der möglichen voneinander verschiedenen Ereignisfolgen von 2 weißen und 3 roten Kugeln beträgt:

Die gesuchte Wahrscheinlichkeit ist somit

Die folgende Tabelle enthält die Wahrscheinlichkeitsverteilung und die Verteilungsfunktion der Binomialverteilung :

0 0,1681 0,1681
1 0,3601 0,5282
2 0,3087 0,8369
3 0,1323 0,9692
4 0,0284 0,9976
5 0,0024 1,0000

Die folgende Abbildung zeigt die Wahrscheinlichkeitsverteilung der Binomialverteilung :

<R output="display">

pdf(rpdf,width=7,height=7)

WVert<- dbinom(c(0:5),5,0.3) plot(WVert, col="WHITE", xaxt="n",xpd=TRUE, xlim= c(0, 5), ylab="f(X)", xlab="X", font.lab=2,

    main="B(5;0,3)", las=1, font.axis=2 )

axis(side=1, at=c(0:5), font.axis=2) lines(c(0:5), WVert, type="h", lwd=5, col="BLUE") </R>

Die Berechnung der gesuchten Wahrscheinlichkeit erfolgt über die Verteilungsfunktion in folgender Weise:

Die Wahrscheinlichkeit, bei unabhängigen Ziehungen 2 weiße Kugeln zu ziehen, beträgt damit 0,3087.

Nebenjob

Entsprechend einer Erhebung unter den Studenten einer großen Universität habe sich ergeben, dass 65% der Studenten neben ihrem Studium einem Job nachgehen.

Wie groß ist die Wahrscheinlichkeit, dass von zufällig ausgewählten Studenten dieser Universität höchstens 4 Studenten einen Nebenjob haben?

Die Bedingungen eines Bernoulli-Experiments sind erfüllt:

Es gibt nur zwei mögliche Ereignisse als Ergebnis jeder Auswahl:

.

Da die Gesamtheit der Studenten an dieser Universität als sehr groß vorausgesetzt wurde und da sehr klein im Verhältnis zum Umfang der Gesamtheit ist, kann trotzdem näherungsweise mit der Binomialverteilung gearbeitet werden.

Die Wahrscheinlichkeiten können als konstant und die Ziehungen als unabhängig voneinander angesehen werden.

Die interessierende Zufallsvariable ist .

Sie ist verteilt.

Gesucht ist die Wahrscheinlichkeit , d.h., der Wert der Verteilungsfunktion .

Die Verteilungsfunktion der liegt nicht tabelliert vor.

Die Berechnung nach der Formel für die Verteilungsfunktion ist jedoch sehr aufwendig, da 5 Wahrscheinlichkeiten , berechnet und dann aufsummiert werden müssen.

Mit Hilfe eines Computers lässt sich aber die Verteilungsfunktion der leicht generieren. Sie ist in der folgenden Tabelle in der 2. Spalte enthalten.

<R output="display">

pdf(rpdf,width=7,height=7)

x <- c(0:8) WVert<- dbinom(x, 8, 0.65) WVert2<- dbinom(x, 8, 0.35) plot(WVert, col="WHITE", xaxt="n", ylab="f(X)", ylim=c(0, 0.3), xlim=c(0, 8), xlab="X", font.lab=2,

    main="B(8;0,65) - blau         B(8;0,35) - rot", las=1, font.axis=2,sub="Abb. 1: Wahrscheinlichkeitsfunktion der B(8;0,35) und der B(8;0,65)")

lines(c(0:8)-0.1, WVert, type="h", lwd=5, col="BLUE") lines(c(0:8)+0.1, WVert2, type="h", lwd=5, col="RED") axis(side=1, at=c(0:8), font.axis=2) </R>

<R output="display">

pdf(rpdf,width=7,height=7)

x <- c(0:8) WVert<- pbinom(x, 8, 0.65) WVert2<- pbinom(x, 8, 0.35) plot(WVert, col="WHITE", xaxt="n", ylab="F(X)", ylim=c(0, 1), xlim=c(0, 8), xlab="X", font.lab=2,

    main="B(8;0,65) - blau         B(8;0,35) - rot", las=1, font.axis=2,sub="Abb. 2: Verteilungsfunktion der B(8;0,35) und der B(8;0,65)")

lines(c(0:8)-0.1, WVert, type="h", lwd=5, col="BLUE") lines(c(0:8)+0.1, WVert2, type="h", lwd=5, col="RED") axis(side=1, at=c(0:8), font.axis=2) </R>

Die Wahrscheinlichkeit, dass bei einer zufälligen Auswahl von Studenten höchstens 4 Studenten einem Nebenjob nachgehen, beträgt 0,2936.

Will man jedoch die Tabelle der Verteilungsfunktion der Binomialverteilung verwenden, so macht man sich die Symmetrieeigenschaft der Binomialverteilung (siehe "Eigenschaften der Binomialverteilung") zunutze.

Da verteilt ist, folgt

, d.h. , einer Binomialverteilung .

, d.h. entspricht , d.h. .

Statt der Wahrscheinlichkeit ist gesucht.

Aus der Tabelle der Verteilungsfunktion der , siehe 3. Spalte der obigen Tabelle, findet man und somit

.

Hamburger

Eine TV-Werbung für Hamburger-Land beinhaltete folgende Aussage: "Unsere Umfrage zeigt, dass 75% der Leute ihre Hamburger am liebsten frittiert essen."

In diesem TV-Spot trifft der Sprecher folgende Aussage: "Rufen Sie vier Hamburger-Land Fans an - höchstens einer von ihnen wird den Hamburger nicht frittiert wählen."

Trifft diese Aussage so absolut zu?

Die Bedingungen eines Bernoulli-Experiments sind erfüllt:

Es gibt nur zwei mögliche Ereignisse als Ergebnis jeder Auswahl:

.

Da die Gemeinschaft der Hamburgerland-Fans zweifelsohne als sehr groß angesehen werden kann, spielt es keine Rolle, ob die Auswahl mit oder ohne Zurücklegen erfolgt.

Die Wahrscheinlichkeiten können somit als konstant und die Ziehungen als unabhängig voneinander vorausgesetzt werden.

Die Zufallsvariable ist somit binomialverteilt mit den Parametern und ;

d.h.

Gesucht ist die Wahrscheinlichkeit

Diese Wahrscheinlichkeit ergibt sich als

Die Wahrscheinlichkeit für das höchstens einmalige Auftreten des Ereignisses "nicht frittierter Hamburger" ist die Summe der Einzelwahrscheinlichkeiten, dass "nicht frittierter Hamburger" von 4 zufällig ausgewählten Hamburgerland-Fans nicht oder einmal gewählt wird.

Dies entspricht jedoch dem Wert der Verteilungsfunktion der Binomialverteilung an der Stelle .

Für und liegt die Binomialverteilung tabelliert vor (siehe folgende Tabelle).

0 0,3164 0,3164
1 0,4219 0,7383
2 0,2109 0,9492
3 0,0469 0,9961
4 0,0039 1,0000
<R output="display">

pdf(rpdf,width=7,height=7)

x <- c(0:4) WVert<- dbinom(x, 4, 0.25) WVert2<- pbinom(x, 4, 0.25) plot(WVert, col="WHITE", xaxt="n", ylab="f(X), F(X)", ylim=c(0, 1), xlim=c(0, 4), xlab="X", font.lab=2,

    main="fB(4;0,25) - blau         FB(4;0,25) - rot", las=1, font.axis=2)

lines(c(0:4)-0.05, WVert, type="h", lwd=5, col="BLUE") lines(c(0:4)+0.05, WVert2, type="h", lwd=5, col="RED") axis(side=1, at=c(0:4), font.axis=2) </R>

Aus der letzten Spalte dieser Tabelle kann folgendes entnommen werden: .

Unter der Voraussetzung, dass die Wahrscheinlichkeiten und aus der Umfrage auch für die Gesamtheit der Hamburgerland-Fans gültig ist, trifft die obige Aussage mit einer Wahrscheinlichkeit von 0,7383 zu.