Approximation von Verteilungen

Aus MM*Stat

Version vom 18. Mai 2018, 13:28 Uhr von Jacobdan (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „{{Verteilungsmodelle}} =={{Vorlage:Überschrift}}== ===Approximation=== ''Approximation'' bedeutet, dass unter bestimmten Bedingungen statt der AusgangsV…“)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Verteilungsmodelle

Diskrete Gleichverteilung • Binomialverteilung • Hypergeometrische Verteilung • Poisson-Verteilung • Stetige Gleichverteilung • Exponentialverteilung • Normalverteilung • Standardnormalverteilung • Schwankungsintervall • Zentraler Grenzwertsatz • Chi-Quadrat-Verteilung • t-Verteilung • F-Verteilung • Approximation von Verteilungen • Multiple Choice • Video • Aufgaben • Lösungen
Approximation • Approximation der Binomialverteilung • Approximation der hypergeometrischen Verteilung • Approximation der Poisson-Verteilung • Bernoulli-Experiment • Endlichkeitskorrektur • Freiheitsgrad • Gauß-Verteilung • Gauß'sche Glockenkurve • Gedächtnislosigkeit der Exponentialverteilung • Gleichverteilung (diskret) • Gleichverteilung (stetig) • Poisson-Prozess • Sicherheitswahrscheinlichkeit • Standardnormalverteilung • Stetigkeitskorrektur • Student'sche t-Verteilung • Überschreitungswahrscheinlichkeit • Zentrales Schwankungsintervall


Grundbegriffe

Approximation

Approximation bedeutet, dass unter bestimmten Bedingungen statt der Ausgangsverteilung eine einfacher handhabbare Verteilung verwendet wird.

Entsprechende Grenzwertsätze (z.B der zentrale Grenzwertsatz) liefern die theoretischen Grundlagen für derartige Approximationen.

Wird eine Ausgangsverteilung durch eine Grenzverteilung approximiert, so begeht man natürlich einen Fehler in dem Sinne, dass die Wahrscheinlichkeiten der Grenzverteilung nicht exakt den Wahrscheinlichkeiten der Ausgangsverteilung entsprechen.

Man kann jedoch erwarten, dass der Fehler vernachlässigbar klein ist. Um dies zu erreichen, müssen entsprechende Kriterien für die Zulässigkeit der Approximation eingehalten werden.

Im folgenden werden für ausgewählte Verteilungen Approximationsmöglichkeiten angegeben, wobei die Kriterien als Faustregeln für eine hinreichend gute Approximation zu verstehen sind.

In Abhängigkeit von der angestrebten "hinreichend guten" Approximation gibt es in der Literatur unterschiedliche Faustregeln.

Stetigkeitskorrektur

Eine Stetigkeitskorrektur wird bei der Approximation einer diskreten Verteilung durch eine stetige Verteilung angewandt. Grund hierfür ist eine genauere Approximation.

Eine Stetigkeitskorrektur ist notwendig, wenn

und

Eine Stetigkeitskorrektur wird durchgeführt, indem

  • von der unteren Grenze 0,5 abgezogen wird
  • zu der oberen Grenze 0,5 hinzuaddiert wird

Approximation der Binomialverteilung

Approximation durch die Normalverteilung

Dieser Approximation liegt der Grenzwertsatz von Laplace und De Moivre zugrunde.

Es seien unabhängige, Bernoulli-verteilte Zufallsvariablen mit und für alle .

Dann ist eine -verteilte Zufallsvariable mit dem Erwartungswert und der Varianz .

Für , konvergiert die Verteilung der standardisierten Zufallsvariablen

gegen die Standardnormalverteilung .

Für großes gilt:

mit dem Erwartungswert und der Varianz .

Da die Binomialverteilung eine diskrete, die Normalverteilung eine stetige Verteilung ist, sollte eine Stetigkeitskorrektur vorgenommen werden, um eine bessere Approximation zu erreichen:

Faustregel für eine hinreichend gute Approximation der Binomialverteilung:

und .

Approximation durch die Poisson-Verteilung

Da sich die Poisson-Verteilung aus der Binomialverteilung herleiten lässt, kann die Binomialverteilung durch die Poisson-Verteilung approximiert werden, wenn sehr groß und die Wahrscheinlichkeit des Eintretens des Ereignisses klein ist.

Faustregel für die Approximation: und .

Approximation der hypergeometrischen Verteilung

Approximation durch die Normalverteilung

Ist und so kann eine hypergeometrisch verteilte Zufallsvariable durch die Normalverteilung mit den Parametern

approximiert werden.

Auch hierbei ist die Stetigkeitskorrektur zu berücksichtigen.

Approximation durch die Binomialverteilung

Die Binomialverteilung und die hypergeometrische Verteilung unterscheiden sich vor allem durch das Zufallsauswahlmodell:

Modell mit Zurücklegen bei der ersteren und Modell ohne Zurücklegen bei der letzteren.

Je größer der Umfang der Gesamtheit bei der hypergeometrischen Verteilung und die Anzahl der Objekte mit einer interessierenden Eigenschaft wird, womit gegen ein konstantes strebt, umso weniger bedeutsam wird es, dass ohne Zurücklegen gezogen wird.

Für (und ) konvergiert die hypergeometrische Verteilung gegen die Binomialverteilung.

Daraus folgt: Für große und sowie einen kleinen Auswahlsatz kann die hypergeometrische Verteilung durch eine Binomialverteilung mit relativ gut approximiert werden.

Als Faustregel gilt: .

Approximation der Poisson-Verteilung durch die Normalverteilung

Da sich die Poisson-Verteilung mit aus der Binomialverteilung herleiten lässt und die Binomialverteilung durch die Normalverteilung approximiert werden kann, kann für großes die Poisson-Verteilung ebenfalls durch die Normalverteilung approximiert werden.

Ist eine -verteilte Zufallsvariable, dann gilt für großes die Approximation durch die Normalverteilung mit Erwartungswert und Varianz (mit Stetigkeitskorrektur):

Faustregel zur Anwendung der Approximation:

Beispiele

Steuerbescheide

Es sei aus jahrelanger Erfahrung bekannt, dass 10% der Steuerbescheide des Finanzamtes einer größeren Stadt fehlerhaft sind.

Es werden zufällig 100 Steuerbescheide ausgewählt.

Wie groß ist die Wahrscheinlichkeit, dass 12 Steuerbescheide fehlerhaft sind?

Im Ergebnis einer Ziehung können nur zwei mögliche Ereignisse auftreten: "fehlerhafter Steuerbescheid" und "korrekter Steuerbescheid".

Aufgrund der postulierten Ausgangsbedingungen sind die Wahrscheinlichkeiten beider Ereignisse mit und konstant.

Die Zufallsvariable "Anzahl der fehlerhaften Steuerbescheide unter 100 zufällig ausgewählten Steuerbescheiden" ist -verteilt.

Gesucht ist die Wahrscheinlichkeit . Dafür ergibt sich:

kann nicht mehr aus einer Tabelle der Binomialverteilung entnommen werden, sondern muss berechnet werden, was sehr umständlich ist.

Da die Bedingungen einer Approximation durch die Normalverteilung mit und erfüllt sind, wird die gesuchte Wahrscheinlichkeit mittels einer approximativ bestimmt.

Erwartungswert und Varianz der binomialverteilten Zufallsvariable sind:

und so dass die Normalverteilung zur Approximation verwendet wird, die in der folgenden Grafik gezeigt ist.

Zur Erinnerung: Für eine stetige Zufallsvariable sind Wahrscheinlichkeiten als Flächen unter der Dichtefunktion gegeben, so dass die Wahrscheinlichkeit für irgendeinen exakten Wert, wie z.B. , gleich Null ist.

Es wird deshalb 0,5 von 12 substrahiert und zu 12 addiert, was der Stetigkeitskorrektur entspricht.

Statt für die diskrete Zufallsvariable wird das Intervall für die normalverteilte Zufallsvariable verwendet, und wird durch , die Fläche unter der Dichtefunktion der zwischen 11,5 und 12,5, approximiert.

<R output="display">

pdf(rpdf,width=7,height=7)

par(las=1) curve(from=0, to=20, dnorm(x, mean=10, sd=3), xaxt="n", ylab="f(x)", xlab="x", col="blue", ylim=c(0.0,0.14), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l") axis( side=1, at=c(10, 12.5), labels=c("10", "12,5"), tick=TRUE, padj=0) axis( side=1, at=c(11.5), labels=c("11,5"), tick=TRUE, padj=2)

par(new=TRUE)

xx <-c(11.5:12.5, 12.5:11.5) yy <-c(c(dnorm(c(11.5:12.5), mean=10, sd=3)),c(rep(0,2)))

polygon(xx, yy, col="grey", border=NA)

par(new=TRUE)

curve(from=0, to=20, dnorm(x, mean=10, sd=3), xaxt="n", ylab="f(x)", xlab="x", col="blue", ylim=c(0.0,0.14), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")


abline(v=11.5, col="black", lwd=1, lty=2) abline(v=12.5, col="black", lwd=1, lty=2) </R>

Da jedoch nur die Verteilungsfunktion der Standardnormalverteilung tabelliert vorliegt, wird standardisiert:

Aus der Tabelle findet man für und , so dass sich ergibt:

Dies ist eine recht gute Annäherung an die exakte Wahrscheinlichkeit der Binomialverteilung, denn der Fehler beträgt nur .

Gleichzeitig ist aus den errechneten Wahrscheinlichkeiten zu entnehmen, dass

ist.
ist.
ist.

Unwetterschaden

In einer Gemeinde habe im Durchschnitt 1 Haus von 100 Häusern jährlich einen Unwetterschaden.

Wenn 100 Häuser in dieser Gemeinde sind, wie groß ist die Wahrscheinlichkeit, dass genau 4 Häuser im Verlauf eines Jahres einen Unwetterschaden haben?

Es gibt nur zwei mögliche Ereignisse "Haus mit Unwetterschaden" und "Haus ohne Unwetterschaden".

Die Wahrscheinlichkeit für das Eintreten der Ereignisse ist konstant mit bzw. .

Die Zufallsvariable ist -verteilt.

Gesucht ist die Wahrscheinlichkeit , für die sich (sehr umständlich zu berechnen)

ergibt.

Da die Faustregeln einer Approximation durch die Poisson-Verteilung erfüllt sind, wird die gesuchte Wahrscheinlichkeit mittels der Poisson-Verteilung mit berechnet:

Wie ersichtlich, besteht eine gute Übereinstimmung zwischen den Wahrscheinlichkeiten und . Dies trifft für die gesamte Verteilungen zu.

<R>

pdf(rpdf, width=7, height=7)

a=dbinom(c(0:8), 100, 0.01) b=dpois(c(0:8),1) ab <- cbind(a,b) barplot(t(ab), beside=TRUE, col=c("red","darkblue"), ylim=c(0, 0.4), xlab="X", ylab="f(X)", font.lab=2) axis( side=1, at=3*c(1:9)-1, labels=c("0", "1", "2", "3", "4", "5", "6", "7", "8"), tick=FALSE) legend("topright",fill=c("red","darkblue"),c("B(100; 0,01)","PO(1)"), bty="n")

</R>

0 0,36603 0,36788
1 0,36973 0,36788
2 0,18486 0,18394
3 0,06100 0,06131
4 0,01494 0,01533
5 0,00290 0,00307
6 0,00046 0,00051
7 0,00006 0,00007
8 0,00000 0,00000

Nach einem starken Unwetter sind von den 2000 Häusern der gesamten Region 300 Häuser beschädigt.

Wie groß ist die Wahrscheinlichkeit, dass sich unter 10 zufällig ausgewählten Häusern 2 beschädigte Häuser befinden?

Es gibt wiederum nur zwei mögliche Ereignisse: "Haus mit Unwetterschaden" und "Haus ohne Unwetterschaden". Es sind , und .

Die Zufallsvariable ist -verteilt.

Gesucht ist die Wahrscheinlichkeit , für die sich ergibt.

Wie ersichtlich, ist die Berechnung sehr aufwendig.

Da die Faustregeln einer Approximation durch die Binomialverteilung erfüllt sind, wird deshalb die gesuchte Wahrscheinlichkeit mittels der Binomialverteilung mit berechnet:

Auch bei dieser Approximation entsteht ein vernachlässigbarer Fehler bei der Berechnung der Wahrscheinlichkeit mittels statt mit der .