Poisson-Verteilung
Aus MM*Stat
Grundbegriffe
Poisson-Prozess
Es seinen folgende Annahmen mit einem Zufallsexperiment verbunden:
- Das Eintreten eines Ereignisses wird immer in Hinblick auf ein Intervall betrachtet. Durch geeignete Wahl der Skala lässt sich immer erreichen, dass das Kontinuum vorgegebenen Umfangs ein Einheitsintervall ist.
- Das Eintreten der Ereignisse ist zufällig in dem Sinne, dass es nicht bestimmten Mustern folgt und daher nicht vorhersehbar ist.
- Unabhängigkeit des Eintretens der Ereignisse bedeutet, dass das Eintreten (oder Nichteintreten) eines Ereignisses nicht das Eintreten oder Nichteintreten dieses Ereignisses in einem anderen Intervall beeinflusst. Damit ist die jeweilige Anzahl von Ereignissen innerhalb eines Intervalls unabhängig von der Anzahl der Ereignisse eines anderen, disjunkten Intervalls.
- Zwei Ereignisse können nicht gleichzeitig auftreten, d.h. in einem beliebig kleinen Intervall soll die Wahrscheinlichkeit, dass mehr als ein Ereignis eintritt, gleich Null sein.
- Die "Intensität" des Eintretens der Ereignisse soll konstant sein mit dem Parameter , d.h. die mittlere Anzahl der in dem Intervall eintretenden Ereignisse soll unabhängig von der Lage des Intervalls sein. Damit hängt die Wahrscheinlichkeit für das Eintreten einer bestimmten Anzahl von Ereignissen in einem Intervall nur von dessen Umfang ab.
Sind diese Bedingungen erfüllt und ist das Kontinuum die Zeit, spricht man von einem Poisson-Prozess.
Poisson-Verteilung
Der Poisson-Verteilung liegt ein Zufallsexperiment zugrunde, bei dem ein Ereignis wiederholt, jedoch zufällig und unabhängig voneinander in einem Kontinuum (z.B. Zeit, Raum, Fläche, Strecke) vorgegebenen Umfangs auftreten kann.
Die Zufallsvariable bezeichne die Anzahl der eingetretenen Ereignisse und ist daher diskret.
Eine diskrete Zufallsvariable mit der Wahrscheinlichkeitsverteilung
heißt Poisson-verteilt mit dem Parameter . In Kurzform schreibt man
Für die Verteilungsfunktion folgt:
Erwartungswert und Varianz der Poisson-Verteilung sind:
.
Der Wertebereich von umfasst alle natürlichen Zahlen.
Die Poisson-Verteilung liegt für bestimmte und Schrittweiten tabelliert vor.
Zusatzinformationen
Reproduktivitätseigenschaft
Sind und verteilt und unabhängige Zufallsvariablen, dann ist die Zufallsvariable ebenfalls Poisson-verteilt mit dem Parameter :
Poisson-Verteilung für Intervalle beliebigen Umfangs
Wenn die Anzahl von Ereignissen im Einheitsintervall -verteilt ist, dann ist die Anzahl von Ereignissen in einem Intervall des Umfangs Poisson-verteilt mit dem Parameter :
Herleitung der Poisson-Verteilung
Die Poisson-Verteilung lässt sich auch aus der Binomialverteilung herleiten. Dazu nimmt man an:
- Die Anzahl der Versuche ist sehr groß.
- Die Wahrscheinlichkeit für das Eintreten eines Ereignisses , d.h. bei der einzelnen Ziehung, ist sehr klein.
- Hält man konstant und schickt gegen Unendlich , dann geht gegen Null.
Damit kann die Binomialverteilung durch die Poisson-Verteilung approximiert werden.
In diesem Sinne (großes und kleines ) wird die Poisson-Verteilung oft auch als Verteilung seltener Ereignisse bezeichnet.
Faustregel zur Anwendung der Poisson-Verteilung statt der Binomialverteilung: und .
Graphische Darstellung der Poisson-Verteilung
Die grafische Darstellung der Wahrscheinlichkeitsfunktion der Poisson-Verteilung erfolgt in Form von Stabdiagrammen.
Je kleiner desto linkssteiler ist die Poisson-Verteilung; je größer desto mehr nähert sich die Poisson-Verteilung einer symmetrischen Verteilung.
Die Grafik zeigt die Poisson-Verteilungen für und .
<R output="display">
pdf(rpdf,width=7,height=7) x=c(0:15) P1<- dpois(x, lambda=5) P2<- dpois(x, lambda=1) par(mfrow=c(2,1)) plot(P1, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 15), ylim=c(0.0,0.45), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", main="lambda=5", las=1, font.axis=2 ) axis(side=1, at=c(0:15), font.axis=2) lines(c(0:15), P1, type="h", lwd=5, col="gray") box(which="figure") plot(P2, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 15), ylim=c(0.0,0.45), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", main="lambda=1", las=1, font.axis=2 ) axis(side=1, at=c(0:15), font.axis=2) lines(c(0:15), P2, type="h", lwd=5, col="gray") box(which="figure") box(which="outer") </R> |
Beispiele
Beispiele für Poisson-Prozesse
Zunächst einige Beispiele für das der Poisson-Verteilung zugrunde liegende Zufallsexperiment und die entsprechende Zufallsvariable :
- Anzahl von Druckfehlern pro Seite in Büchern,
- Anzahl der Fadenbrüche pro Zeitraum in einer Spinnerei,
- Anzahl der pro Minute ankommenden Gespräche in einer Telefonzentrale,
- Anzahl der Kraftfahrzeuge, die pro Minute an einem Beobachtungspunkt vorbeifahren,
- Anzahl der Patienten, die in einem Zeitintervall (z.B. 1 Stunde) in der Unfallstation eines Krankenhauses eintreffen,
- Anzahl der pro Zeiteinheit emittierten -Teilchen einer radioaktiven Substanz
- Anzahl der Fische, die ein Angler pro Tag fängt,
- Anzahl der Schadensmeldungen bei einer Versicherung pro Jahr,
- Anzahl der Kunden, die bei einer Bank innerhalb eines Monats einen Kredit beantragen.
Impfschäden
In einer Stadt von 20000 Einwohnern, die alle geimpft wurden, ist die Wahrscheinlichkeit gleich 0,0001, dass ein Individuum durch das verwendete Serum Impfschäden erleidet.
Eigentlich ist dies ein Bernoulli-Experiment mit:
1. und
2. ist konstant.
3. Unabhängigkeit der Versuche, d.h. der Impfungen.
Für die Berechnung von Wahrscheinlichkeiten für eine bestimmte Anzahl des Eintretens von Impfschäden müsste somit die Binomialverteilung verwendet werden.
Aufgrund der kleinen Wahrscheinlichkeit und der großen Anzahl der Versuche erfolgt eine Approximation durch die Poisson-Verteilung:
und .
ist die im Mittel zu erwartende Anzahl von Impfschäden.
<R output="display">
pdf(rpdf,width=7, height=7) x=c(0:9) P1<- dpois(x, lambda=2) plot(P1, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 9), main="Wahrscheinlichkeitsfunktion der PO(2)", ylim=c(0.0,0.3), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", las=1, font.axis=2, ) axis(side=1, at=c(0:9), font.axis=2) lines(c(0:9), P1, type="h", lwd=5, col="gray") </R> |
Die Wahrscheinlichkeit, dass keiner Impfschäden erleidet, beträgt:
Die Wahrscheinlichkeit, dass genau eine Person einen Impfschaden erleidet beträgt:
Die Wahrscheinlichkeit, dass mehr als 4 Personen Impfschäden erleiden, beträgt:
kann aus der Tabelle der Poisson-Verteilung für und entnommen werden:
Kundenservice
Aufgrund langjähriger Erfahrung geht man davon aus, dass der Kundenservice eines großen Kaufhauses in der Zeit von 9.00 bis 14.00 Uhr im Mittel von einem Kunden pro Stunde in Anspruch genommen wird und in der Zeit von 14.00 bis 19.00 Uhr im Mittel von 2 Kunden pro Stunde.
Da die Inanspruchnahme des Service durch Kunden als zufällig und unabhängig voneinander angesehen werden kann (kein Bestellsytem), ist die Zufallsvariable
Poisson-verteilt mit und die Zufallsvariable
Poisson-verteilt mit .
<R output="display">
pdf(rpdf, width=7, height=7) x=c(0:15) P1<- dpois(x, lambda=5) plot(main="Wahrscheinlichkeitsfunktion der PO(5)",P1, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 15), ylim=c(0.0,0.2), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", las=1, font.axis=2, ) axis(side=1, at=c(0:15), font.axis=2) lines(c(0:15), P1, type="h", lwd=5, col="gray") </R> |
<R output="display">
pdf(rpdf, width=7, height=7) x=c(0:24) P1<- dpois(x, lambda=10) plot(main="Wahrscheinlichkeitsfunktion der PO(10)", P1, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 24), ylim=c(0.0,0.14), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", las=1, font.axis=2, ) axis(side=1, at=c(0:24), font.axis=2) lines(c(0:24), P1, type="h", lwd=5, col="gray") </R> |
Für beide Zeitperioden ist .
Mit diesen Angaben lässt sich die Wahrscheinlichkeit berechnen, dass eine bestimmte Anzahl von Kunden in der Zeit von 9.00 bis 14.00 Uhr den Service in Anspruch nimmt, z.B. :
Mehr als 4 Kunden nehmen den Service in der gleichen Zeitperiode mit einer Wahrscheinlichkeit von
in Anspruch.
Für beide Fragestellungen für die Zeit von 14.00 bis 19.00 Uhr folgt:
Aufgrund der Annahmen kann man davon ausgehen, dass die Inanspruchnahme des Service in beiden Zeitperioden in keinem Zusammenhang steht, d.h. die Zufallsvariablen und können als unabhängig angesehen werden.
Die Wahrscheinlichkeit, dass sowohl von 9.00 bis 14.00 Uhr als auch von 14.00 bis 19.00 Uhr mehr als 4 Kunden kommen, beträgt dann
.
Betrachtet man die Anzahl der Kunden pro Stunde in der gesamten Öffnungszeit von 9.00 bis 19.00 Uhr, so gilt .
Wegen der Unabhängigkeit von und ist Poisson-verteilt mit .