Hypergeometrische Verteilung

Aus MM*Stat

(Weitergeleitet von Endlichkeitskorrektur)
Wechseln zu: Navigation, Suche

Verteilungsmodelle

Diskrete Gleichverteilung • Binomialverteilung • Hypergeometrische Verteilung • Poisson-Verteilung • Stetige Gleichverteilung • Exponentialverteilung • Normalverteilung • Standardnormalverteilung • Schwankungsintervall • Zentraler Grenzwertsatz • Chi-Quadrat-Verteilung • t-Verteilung • F-Verteilung • Approximation von Verteilungen • Multiple Choice • Video • Aufgaben • Lösungen
Approximation • Approximation der Binomialverteilung • Approximation der hypergeometrischen Verteilung • Approximation der Poisson-Verteilung • Bernoulli-Experiment • Endlichkeitskorrektur • Freiheitsgrad • Gauß-Verteilung • Gauß'sche Glockenkurve • Gedächtnislosigkeit der Exponentialverteilung • Gleichverteilung (diskret) • Gleichverteilung (stetig) • Poisson-Prozess • Sicherheitswahrscheinlichkeit • Standardnormalverteilung • Stetigkeitskorrektur • Student'sche t-Verteilung • Überschreitungswahrscheinlichkeit • Zentrales Schwankungsintervall

Grundbegriffe

Hypergeometrische Verteilung

Der hypergeometrischen Verteilung liegt ein Zufallsexperiment mit folgenden Charakteristika zugrunde:

  • Die Gesamtheit besteht aus einer endlichen Anzahl von Objekten.
  • Von den Objekten in der Gesamtheit weisen Objekte eine Eigenschaft und diese Eigenschaft nicht auf, d.h. es gibt nur zwei mögliche Ereignisse und im Ergebnis des Zufallsexperimentes.
  • Es werden Objekte zufällig ausgewählt, wobei das Zufallsauswahlmodell ohne Zurücklegen (Kombination ohne Wiederholung) verwendet wird.

Daraus resultiert, dass bei einem solchen Zufallsexperiment keine Unabhängigkeit der Ziehungen und damit keine Konstanz der Wahrscheinlichkeiten gegeben ist.

Die Zufallsvariable , die die Anzahl des Auftretens von bei -maliger Durchführung dieses Zufallsexperimentes beinhaltet, heißt hypergeometrisch verteilt mit den Parametern , und , wenn ihre Wahrscheinlichkeitsfunktion durch

gegeben ist. In Kurzform schreibt man: .

Erwartungswert und Varianz der hypergeometrischen Verteilung sind gegeben mit

Endlichkeitskorrektur

Setzt man , dann folgt

Damit hat die -Verteilung den gleichen Erwartungswert wie die entsprechende Binomialverteilung , jedoch eine um den Faktor kleinere Varianz.

Die kleinere Varianz lässt sich damit erklären, dass beim Ziehen ohne Zurücklegen keine schon gewonnene Information verschenkt wird.

Der Faktor wird als Endlichkeitskorrektur bezeichnet.

Zusatzinformationen

Hypergeometrische Verteilung und Binomialverteilung

Ebenso wie bei der Binomialverteilung können bei der hypergeometrischen Verteilung im Ergebnis des Zufallsexperimentes nur zwei mögliche Ereignisse und auftreten.

Im Unterschied zur Binomialverteilung wird jedoch ohne Zurücklegen gezogen, wodurch die Ziehungen nicht unabhängig voneinander sind.

Durch das Ziehen ohne Zurücklegen verringert sich die Menge der Objekte von Ziehung zu Ziehung, woraus sofort ersichtlich wird, dass gelten muss.

Es verändert sich außerdem von Ziehung zu Ziehung die Zusammensetzung der Objekte in der Gesamtheit hinsichtlich der Eigenschaft und damit die Wahrscheinlichkeit, ein Objekt mit der Eigenschaft zu ziehen.

Erläuterungen zur Wahrscheinlichkeitsfunktion

  • Da jede Ziehung nur einmal ausgeführt und ohne Zurücklegen gearbeitet wird, kann jedes einzelne Objekt nur einmal bei Ziehungen auftreten (keine Wiederholung).
Bei -maliger Durchführung der Ziehungen interessiert die Gesamtzahl des Eintretens von , so dass die Zufallsvariable betrachtet wird.
Die Anordnung der gezogenen Objekte spielt hinsichtlich der Anzahl des Eintretens von , d.h. für die Bestimmung von , keine Rolle.
Mittels der Kombinatorik lässt sich die Anzahl der Möglichkeiten bestimmen, aus Objekten ohne Zurücklegen und ohne Berücksichtigung der Anordnung zu ziehen.
Sie entspricht der Anzahl der Kombinationen ohne Wiederholung:
  • Wieviele "günstige" Möglichkeiten gibt es, zu erhalten?
Es gilt zunächst , da nicht mehr Objekte mit gezogen werden können, als in der Gesamtheit vorhanden sind, und analog .
Da ohne Zurücklegen gezogen wird, kann ein Objekt mit nicht nochmals eintreten (ohne Wiederholung).
Weiterhin spielt für die Anordnung der Objekte mit in der Ereignisfolge keine Rolle.
Daraus folgt für die Anzahl der Möglichkeiten, aus den Objekten mit genau auszuwählen:
Analog folgt für die Anzahl der Möglichkeiten, aus den Objekten ohne die Eigenschaft genau auszuwählen:
Jede mögliche Ereignisfolge, aus den Objekten mit genau auszuwählen, kann mit jeder möglichen Ereignisfolge, aus den Objekten ohne die Eigenschaft genau auszuwählen, verbunden werden, damit sich insgesamt gezogene Objekte ergeben.
Anzahl der für günstigen Möglichkeiten:

Bestimmung des Wertebereiches der Zufallsvariable

Der größtmögliche Wert von ist , wenn ist, und , wenn , so dass gilt:

.

Für den kleinstmöglichen Wert von ergibt sich:

Es ist . Falls jedoch größer ist als die Anzahl der Objekte ohne , gilt .

Daraus folgt:

Graphische Darstellung der hypergeometrischen Verteilung

Die grafische Darstellung der Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung erfolgt in Form eines Stabdiagramms, zum Beispiel für

.

<R output="display">

pdf(rpdf,width=7,height=7)

x=c(0:8) H1<- dhyper(x, n=80, m=20, k=10) H2<- dhyper(x, n=8, m=8, k=8)

par(mfrow=c(2,1))

plot(H1, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 8), ylim=c(0.0,0.5), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", main="N=100, M=20, n=10", las=1, font.axis=2 ) axis(side=1, at=c(0,2,4,6,8), font.axis=2) lines(c(0:8), H1, type="h", lwd=5, col="BLUE") box(which="figure")

plot(H2, col="white", xaxt="n",xpd=TRUE, xlim= c(0, 8), ylim=c(0.0,0.5), ylab="f(x)", xlab="x", font.lab=2, "yaxs"="i", main="N=16, M=8, n=8", las=1, font.axis=2 ) axis(side=1, at=c(0,2,4,6,8), font.axis=2) lines(c(0:8), H2, type="h", lwd=5, col="BLUE") box(which="figure") box(which="outer")

</R>


Beispiele

Prüfungsfragen

Einem Prüfling wird ein Gesamtkatalog mit 10 Prüfungsfragen vorgelegt.

Der Prüfling weiß, dass der zuständige Prüfer von diesen 10 Fragen 6 Fragen so schwer formuliert hat, dass kein Prüfling sie beantworten könnte.

Von diesen 10 Fragen darf der Prüfling 3 Fragen für seine Prüfung selbst zufällig auswählen.

Fragen

Fragen besitzen Eigenschaft , beantwortbar zu sein

Fragen werden zufällig gezogen (ohne Zurücklegen)

"Anzahl der Fragen mit der Eigenschaft unter gezogenen"

Wertebereich von :

Motivation der Anwendung der hypergeometrischen Verteilung:

  • endliche Gesamtheit von Prüfungsfragen,
  • Zurücklegen macht leider keinen Sinn bei Prüfungsfragen,
  • deshalb keine Unabhängigkeit der Ziehungen,
  • daraus resultiert, dass sich verändert, je nachdem was der Prüfling schon gezogen hat.

Wie groß ist die Wahrscheinlichkeit, dass der Prüfling drei beantwortbare Fragen zieht?

Wie groß ist die Wahrscheinlichkeit, dass der Prüfling mindestens eine beantwortbare Frage zieht?

Als Ergebnis auf die Frage erhält man somit:

Immobilienberater

Ein Immobilienberater weiß aus langjähriger Erfahrung, dass es bei 70% seiner 20 Mandanten, die er jährlich berät, zu einem Vertragsabschluss kommt.

Auch in diesem Jahr berät der Immobilienberater 20 neue Mandanten.

Es wird angenommen, dass die Wahrscheinlichkeit für einen Vertragsabschluss auch für diese Gesamtheit gilt.

Wie groß ist die Wahrscheinlichkeit, dass sich von 4 zufällig ausgewählten Mandanten mindestens die Hälfte zu einem Vertragsabschluss entscheidet?

Die Gesamtheit besteht aus einer endlichen Anzahl Mandanten.

Von den 20 Mandanten entscheiden sich Mandanten zu einem Vertragsabschluss (Eigenschaft ) und bei Mandanten kommt es nicht zu einem Vertragsabschluss, d.h. es gibt nur zwei mögliche Ereignisse im Ergebnis des Zufallsexperimentes.

Es werden Mandanten zufällig ausgewählt. Ein Zufallsauswahlmodell mit Zurücklegen würde sachlogisch keinen Sinn machen, so dass ohne Zurücklegen ausgewählt wird.

Die Zufallsvariable wird als "Anzahl der Mandanten mit Vertragsabschluss" definiert, die aufgrund des beschriebenen Zufallsexperimentes

verteilt ist.

Wegen ist der kleinste mögliche Wert von gleich 0, d.h. bei keinem der 4 Mandanten kommt es zu einem Vertragsabschluss.

Da ist der größte mögliche Wert von gleich 4. Der Wertebereich von ist somit:

.

Gesucht ist die Wahrscheinlichkeit , die sich als berechnen lässt.

Somit resultiert: .

Eine Berechnung über das Gegenereignis ist ebenso möglich. Diese bedeutet in vielen Fällen einen erheblich geringeren Rechenaufwand:

Die Wahrscheinlichkeit, dass sich von 4 zufällig ausgewählten Mandanten (aus den 20 Mandanten des Immobilienberaters) mindestens die Hälfte zu einem Vertragsabschluss entscheidet, beträgt 0,9391.

Versicherungsvertreter

Ein Versicherungsvertreter verkauft in einer Stadt insgesamt 100 Lebensversicherungspolicen, die sich in 40 Kapitallebensversicherungen und 60 Risikolebensversicherungen aufteilen.

Es werden 5 Lebensversicherungen zufällig und ohne Zurücklegen ausgewählt.

Wie groß ist die Wahrscheinlichkeit, dass sich darunter genau 2 Kapitallebensversicherungen befinden?

Die Gesamtheit besteht aus einer endlichen Anzahl Lebensversicherungen.

Im Ergebnis des Zufallsexperimentes (Ziehen einer Lebensversicherung) gibt es nur zwei mögliche Ereignisse:

Kapitallebensversicherung (interessierende Eigenschaft ), deren Anzahl ist, und Risikolebensversicherung (Komplementärereignis), deren Anzahl beträgt.

Die Zufallsvariable wird als "Anzahl der Kapitallebensversicherungen unter 5 ausgewählten Lebensversicherungen" definiert.

ist aufgrund des Zufallsauswahlmodells ohne Zurücklegen -verteilt.

Wegen ist der kleinste mögliche Wert von gleich 0, d.h. keine der 5 gezogenen Lebensversicherungen ist eine Kapitallebensversicherung.

Da ist der größte mögliche Wert von gleich 5.

Der Wertebereich von ist somit: .

Gesucht ist der Wert der Wahrscheinlichkeitsfunktion an der Stelle , d.h. :

Wird z.B. bei sonst gleichen Ausgangsbedingungen die Anzahl der Ziehungen auf erhöht, so bleibt die inhaltliche Bestimmung der Zufallsvariablen erhalten, jedoch verändert sich ihr Wertebereich auf und ist -verteilt.

Es wird nach der Wahrscheinlichkeit gefragt, dass sich genau 4 Kapitallebensversicherungen unter den 10 ausgewählten Lebensversicherungen befinden, d.h. :