Poisson-Verteilung

Aus MM*Stat

Version vom 14. September 2018, 13:55 Uhr von Siskosth (Diskussion | Beiträge) (Änderung 1352 von Siskosth (Diskussion) rückgängig gemacht.)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Verteilungsmodelle

Diskrete Gleichverteilung • Binomialverteilung • Hypergeometrische Verteilung • Poisson-Verteilung • Stetige Gleichverteilung • Exponentialverteilung • Normalverteilung • Standardnormalverteilung • Schwankungsintervall • Zentraler Grenzwertsatz • Chi-Quadrat-Verteilung • t-Verteilung • F-Verteilung • Approximation von Verteilungen • Multiple Choice • Video • Aufgaben • Lösungen
Approximation • Approximation der Binomialverteilung • Approximation der hypergeometrischen Verteilung • Approximation der Poisson-Verteilung • Bernoulli-Experiment • Endlichkeitskorrektur • Freiheitsgrad • Gauß-Verteilung • Gauß'sche Glockenkurve • Gedächtnislosigkeit der Exponentialverteilung • Gleichverteilung (diskret) • Gleichverteilung (stetig) • Poisson-Prozess • Sicherheitswahrscheinlichkeit • Standardnormalverteilung • Stetigkeitskorrektur • Student'sche t-Verteilung • Überschreitungswahrscheinlichkeit • Zentrales Schwankungsintervall


Grundbegriffe

Poisson-Prozess

Es seinen folgende Annahmen mit einem Zufallsexperiment verbunden:

  • Das Eintreten eines Ereignisses wird immer in Hinblick auf ein Intervall betrachtet. Durch geeignete Wahl der Skala lässt sich immer erreichen, dass das Kontinuum vorgegebenen Umfangs ein Einheitsintervall ist.
  • Das Eintreten der Ereignisse ist zufällig in dem Sinne, dass es nicht bestimmten Mustern folgt und daher nicht vorhersehbar ist.
  • Die "Intensität" des Eintretens der Ereignisse soll konstant sein mit dem Parameter \lambda > 0, d.h. die mittlere Anzahl der in dem Intervall eintretenden Ereignisse soll unabhängig von der Lage des Intervalls sein. Damit hängt die Wahrscheinlichkeit für das Eintreten einer bestimmten Anzahl von Ereignissen in einem Intervall nur von dessen Umfang ab.

Sind diese Bedingungen erfüllt und ist das Kontinuum die Zeit, spricht man von einem Poisson-Prozess.

Poisson-Verteilung

Der Poisson-Verteilung liegt ein Zufallsexperiment zugrunde, bei dem ein Ereignis wiederholt, jedoch zufällig und unabhängig voneinander in einem Kontinuum (z.B. Zeit, Raum, Fläche, Strecke) vorgegebenen Umfangs auftreten kann.

Die Zufallsvariable X bezeichne die Anzahl der eingetretenen Ereignisse und ist daher diskret.

Eine diskrete Zufallsvariable X mit der Wahrscheinlichkeitsverteilung

f_{PO}(x;\lambda )=\begin{cases}\frac{\lambda ^{x}}{x!}e^{-\lambda }& \mbox{, wenn } x=0,1,2,\dots;\lambda >0 \\
0\quad & \mbox{, sonst}\end{cases}

heißt Poisson-verteilt mit dem Parameter \lambda. In Kurzform schreibt man X\sim PO(\lambda)\,

Für die Verteilungsfunktion folgt:

F_{PO}(x;\lambda) =\begin{cases}\sum\limits_{k=0}^{x} \frac{\lambda^x}{x!}e^{- \lambda} & \mbox{, wenn }k \geq 0\; \mbox{ und } \lambda >0 \\
0 \quad & \mbox{, wenn } k \leq 0\end{cases}

Erwartungswert und Varianz der Poisson-Verteilung PO(\lambda) sind:

E[X]=\lambda \qquad Var(X)=\lambda.

Der Wertebereich von X\, umfasst alle natürlichen Zahlen.

Die Poisson-Verteilung liegt für bestimmte \lambda und Schrittweiten tabelliert vor.

Zusatzinformationen

Reproduktivitätseigenschaft

Sind X\sim PO(\lambda _{1})\, und Y\sim PO(\lambda _{2})\, verteilt und unabhängige Zufallsvariablen, dann ist die Zufallsvariable Z = X + Y\, ebenfalls Poisson-verteilt mit dem Parameter {\lambda_1 + \lambda_2}:

Z \sim PO(\lambda_1+\lambda_2)\,

Poisson-Verteilung für Intervalle beliebigen Umfangs

Wenn die Anzahl von Ereignissen im Einheitsintervall PO(\lambda)-verteilt ist, dann ist die Anzahl von Ereignissen in einem Intervall des Umfangs t Poisson-verteilt mit dem Parameter \lambda \cdot t:

f_{PO}(x;\lambda \cdot t) = \frac{(\lambda \cdot t)^x}{x!}e^{-\lambda \cdot t}

Herleitung der Poisson-Verteilung

Die Poisson-Verteilung lässt sich auch aus der Binomialverteilung herleiten. Dazu nimmt man an:

  • Die Anzahl n der Versuche ist sehr groß.
  • Die Wahrscheinlichkeit für das Eintreten eines Ereignisses A, d.h. P(A) = p bei der einzelnen Ziehung, ist sehr klein.
  • Hält man E[X] = n\cdot p = \lambda konstant und schickt n gegen Unendlich  (n \rightarrow \infty) , dann geht p gegen Null.

Damit kann die Binomialverteilung durch die Poisson-Verteilung PO(\lambda = n\cdot p) approximiert werden.

In diesem Sinne (großes n und kleines p) wird die Poisson-Verteilung oft auch als Verteilung seltener Ereignisse bezeichnet.

Faustregel zur Anwendung der Poisson-Verteilung statt der Binomialverteilung: n > 30 und p\leq 0,05.

Graphische Darstellung der Poisson-Verteilung

Die grafische Darstellung der Wahrscheinlichkeitsfunktion der Poisson-Verteilung erfolgt in Form von Stabdiagrammen.

Je kleiner \lambda desto linkssteiler ist die Poisson-Verteilung; je größer \lambda desto mehr nähert sich die Poisson-Verteilung einer symmetrischen Verteilung.

Die Grafik zeigt die Poisson-Verteilungen für \lambda = 5 und \lambda = 1.

Beispiele

Beispiele für Poisson-Prozesse

Zunächst einige Beispiele für das der Poisson-Verteilung zugrunde liegende Zufallsexperiment und die entsprechende Zufallsvariable X\,:

  • Anzahl von Druckfehlern pro Seite in Büchern,
  • Anzahl der Fadenbrüche pro Zeitraum in einer Spinnerei,
  • Anzahl der pro Minute ankommenden Gespräche in einer Telefonzentrale,
  • Anzahl der Kraftfahrzeuge, die pro Minute an einem Beobachtungspunkt vorbeifahren,
  • Anzahl der Patienten, die in einem Zeitintervall (z.B. 1 Stunde) in der Unfallstation eines Krankenhauses eintreffen,
  • Anzahl der pro Zeiteinheit emittierten \alpha-Teilchen einer radioaktiven Substanz
  • Anzahl der Fische, die ein Angler pro Tag fängt,
  • Anzahl der Schadensmeldungen bei einer Versicherung pro Jahr,
  • Anzahl der Kunden, die bei einer Bank innerhalb eines Monats einen Kredit beantragen.

Impfschäden

In einer Stadt von 20000 Einwohnern, die alle geimpft wurden, ist die Wahrscheinlichkeit gleich 0,0001, dass ein Individuum durch das verwendete Serum Impfschäden erleidet.

Eigentlich ist dies ein Bernoulli-Experiment mit:

1. A = \{\mbox{Eintreten eines Impfschadens}\}\, und \bar{A} = \{\mbox{kein Impfschaden}\}

2. P(A) = 0.0001 ist konstant.

3. Unabhängigkeit der Versuche, d.h. der Impfungen.

Für die Berechnung von Wahrscheinlichkeiten für eine bestimmte Anzahl des Eintretens von Impfschäden müsste somit die Binomialverteilung verwendet werden.

Aufgrund der kleinen Wahrscheinlichkeit und der großen Anzahl der Versuche erfolgt eine Approximation durch die Poisson-Verteilung:

n>30 und p\leq 0,05.

\lambda = n\cdot p = 20000 \cdot 0,0001 = 2 ist die im Mittel zu erwartende Anzahl von Impfschäden.


Die Wahrscheinlichkeit, dass keiner Impfschäden erleidet, beträgt:

P(X = 0) = P(X \leq 0) = F(0) = 0,1353

Die Wahrscheinlichkeit, dass genau eine Person einen Impfschaden erleidet beträgt:

P(X = 1) = P(X \leq 1) - P(X \leq 0) = F(1) - F(0) = 0,2707

Die Wahrscheinlichkeit, dass mehr als 4 Personen Impfschäden erleiden, beträgt:

P(X > 4) = 1 - F(4)\,

F(4) kann aus der Tabelle der Poisson-Verteilung für \lambda  =2 und X = 4 entnommen werden:

F(4) = 0,9473

P(X > 4) = 1 - 0,9473 = 0,0527\,

Kundenservice

Aufgrund langjähriger Erfahrung geht man davon aus, dass der Kundenservice eines großen Kaufhauses in der Zeit von 9.00 bis 14.00 Uhr im Mittel von einem Kunden pro Stunde in Anspruch genommen wird und in der Zeit von 14.00 bis 19.00 Uhr im Mittel von 2 Kunden pro Stunde.

Da die Inanspruchnahme des Service durch Kunden als zufällig und unabhängig voneinander angesehen werden kann (kein Bestellsytem), ist die Zufallsvariable

X_{1} = \{\mbox{Anzahl der Kunden pro Stunde in der Zeit von 9.00 bis 14.00 Uhr}\}

Poisson-verteilt mit \lambda_{1} = 1 und die Zufallsvariable

X_{2} = \{\mbox{Anzahl der Kunden pro Stunde in der Zeit von 14.00 bis 19.00 Uhr}\}

Poisson-verteilt mit \lambda_{2} = 2.


Für beide Zeitperioden ist t = 5.

Mit diesen Angaben lässt sich die Wahrscheinlichkeit berechnen, dass eine bestimmte Anzahl von Kunden in der Zeit von 9.00 bis 14.00 Uhr den Service in Anspruch nimmt, z.B. X_{1} = 6:

P(X_1 = 6) = f_{PO}(6;1 \cdot 5) = \frac{(\lambda\cdot t)^x}{x!}e^{-\lambda t} = \frac{(1 \cdot 5)^6}{6!}e^{-1 \cdot 5} =0,1462

Mehr als 4 Kunden nehmen den Service in der gleichen Zeitperiode mit einer Wahrscheinlichkeit von

P(X_1 > 4) = 1 - P(X_1 \leq 4) = 1 - e^{-5}\cdot \left( \frac{5^0}{0!} + \frac{5^1}{1!} + \frac{5^2}{2!} + \frac{5^3}{3!} + \frac{5^4}{4!} \right) = 1 - 0,4405 = 0,5595

in Anspruch.

Für beide Fragestellungen für die Zeit von 14.00 bis 19.00 Uhr (X_{2} = 6 \mbox{ bzw. } X_{2} > 4) folgt:

P(X_2 = 6) = f_{PO}(6;2 \cdot 5) = \frac{(\lambda\cdot t)^x}{x!}e^{-\lambda t} = \frac{(2 \cdot 5)^6}{6!}e^{-2 \cdot 5} =
0,063

P(X_2 > 4) = 1 - P(X_2 \leq 4) = 1 - e^{-10}\cdot \left( \frac{10^0}{0!} + \frac{10^1}{1!} + \frac{10^2}{2!} + \frac{10^3}{3!} + \frac{10^4}{4!}\right) = 1 - 0,0293 = 0,9707

Aufgrund der Annahmen kann man davon ausgehen, dass die Inanspruchnahme des Service in beiden Zeitperioden in keinem Zusammenhang steht, d.h. die Zufallsvariablen X_{1} und X_{2} können als unabhängig angesehen werden.

Die Wahrscheinlichkeit, dass sowohl von 9.00 bis 14.00 Uhr als auch von 14.00 bis 19.00 Uhr mehr als 4 Kunden kommen, beträgt dann

P(X_1 > 4, X_2 > 4) = P(X_1 > 4) \cdot P(X_2 > 4) = 0,5595 \cdot 0,9707 = 0,5431.

Betrachtet man die Anzahl der Kunden pro Stunde in der gesamten Öffnungszeit von 9.00 bis 19.00 Uhr, so gilt Y=X_{1}+X_{2}.

Wegen der Unabhängigkeit von X_{1} und X_{2} ist Y Poisson-verteilt mit \lambda _{1}+\lambda _{2}=1+2=3.