Wahrscheinlichkeitsfunktion
Aus MM*Stat
Grundbegriffe
Eindimensionale Wahrscheinlichkeitsfunktion
Die Wahrscheinlichkeitsfunktion gibt an, mit welcher Wahrscheinlichkeit eine diskrete Zufallsvariable genau den Wert annimmt.
Man schreibt hierfür:
mit und .
Die grafische Darstellung der Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen erfolgt durch ein Stab- oder Balkendiagramm.
Zweidimensionale Wahrscheinlichkeitsfunktion
Die zweidimensionale Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen und gibt die Wahrscheinlichkeit dafür an, dass die Zufallsvariable den Wert und die Zufallsvariable gleichzeitig den Wert annimmt.
Man schreibt hierfür:
Dabei müssen folgende Bedingungen erfüllt sein:
Eine geeignete Darstellungsform der zweidimensionalen Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen ist die Kontingenztabelle oder Kreuztabelle.
Beispiele
Münzwurf
Beim dreimaligen Werfen einer idealen Münze ist das Interesse auf die Anzahl des Auftretens der Ausprägung "Zahl (Z)" gerichtet.
Die zugehörige Zufallsvariable ist:
mit den Realisationen und .
Elementarereignis
|
Wahrscheinlichkeit
|
Zufallsvariable | Wahrscheinlichkeitsfunktion
|
Die Berechnung der Eintrittswahrscheinlichkeiten beruht auf dem Multiplikationssatz für unabhängige Ereignisse.
Die Wahrscheinlichkeitsfunktion kann nun grafisch dargestellt werden:
<R output="display" name="pic_dice3">
pdf(rpdf, width=10, height=7) par(mfrow=c(1,2)) tabe <- rep(1/8, 8) names(tabe) <- c("KKK (3)","KKZ (2)","KZK (2)","KZZ (1)","ZKK (2)","ZKZ (1)","ZZK (1)","ZZZ (0)") plot(as.table(tabe), main="Elementarereignisse", ylab="Wahrscheinlichkeit", axes=F, ylim=c(0,0.4)) points(1:8, tabe, pch=19) axis(1, at=1:8, labels=names(tabe), las=2) axis(2) box() tabk <- c(1,3,3,1)/8 names(tabk) <- 0:3 plot(as.table(tabk), main="Anzahl Koepfe", ylab="Wahrscheinlichkeit", ylim=c(0,0.4)) points(0:3, tabk, pch=19) dev.off() </R> |
Wahlbeteiligung und politisches Interesse
Bei einer Umfrage wurden die Einwohner einer Stadt nach
- der Wahlbeteiligung an der letzten Bundestagswahl (Zufallsvariable ) mit den möglichen Realisationen nein und ja
- sowie
- dem persönlichen politischen Interesse (Zufallsvariable ) mit den möglichen Realisationen sehr stark, stark, mittel, wenig und überhaupt nicht.
befragt.
Die folgende Kontingenztabelle enthält die Werte der zweidimensionalen Wahrscheinlichkeitsfunktion der beiden Zufallsvariablen:
Wahlbeteiligung | politisches Interesse | RV | ||||
sehr stark | stark | mittel | wenig | überhaupt nicht | ||
nein | 0,006 | 0,011 | 0,036 | 0,031 | 0,021 | 0,105 |
ja | 0,107 | 0,196 | 0,398 | 0,152 | 0,042 | 0,895 |
RV | 0,113 | 0,207 | 0,434 | 0,183 | 0,063 | 1,000 |
Jede Zelle dieser Tabelle enthält die Wahrscheinlichkeit, dass die Zufallsvariable die Realisation und gleichzeitig die Zufallsvariable die Realisation annimmt.
Zum Beispiel besagt der Inhalt der Zelle (1,2), dass ein zufällig ausgewählter Einwohner mit einer Wahrscheinlichkeit von 0,196 ein starkes politische Interesse hat und bei der letzten Bundestagswahl seine Stimme abgegeben hat.
Die Randverteilung (RV) von gibt die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "Wahlbeteiligung" an.
Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Einwohner sich an der letzte Bundestagswahl nicht beteiligt hat, beträgt z.B. 0,105.
Die Randverteilung (RV) von enthält die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "politisches Interesse".
Mit einer Wahrscheinlichkeit von 0,183 weist ein zufällig ausgewählter Einwohner wenig politisches Interesse auf.
Die folgende Abbildung zeigt eine grafische Darstellung der zweidimensionalen Wahrscheinlichkeitsfunktion von Wahlbeteilung und politischem Interesse.
<R output="display">
pdf(rpdf,width=7, height=7) library(RColorBrewer) library(lattice) library(latticeExtra) data <- data.frame(Wahlbeteiligung=c("(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein"), P=c(0.107, 0.196, 0.398, 0.152, 0.042, 0.006, 0.011, 0.036, 0.031, 0.021), "pol.Interesse"=c("(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht", "(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht")) colors <- c("cornflowerblue","deeppink4","cornsilk1","lightcyan2","purple4") cloud(P~Wahlbeteiligung+pol.Interesse, data, panel.3d.cloud=panel.3dbars, col.facet=colors, xbase=0.4, ybase=0.4, scales=list(arrows=FALSE, col=1), par.settings = list(axis.line = list(col = "transparent"))) </R> |
Haushaltsgröße
Aus "Statistisches Jahrbuch 1998", herausgegeben vom Statistischen Landesamt Berlin, Kulturbuch-Verlag Berlin, S. 61, können nachstehende Angaben über die Größe von Privathaushalten in Berlin für April 1998 entnommen werden:
Anzahl der im Haushalt lebenden Personen | Anzahl der Privathaushalte (in 1000) |
1 | 820,7 |
2 | 564,7 |
3 | 222,9 |
4 und mehr | 195,8 |
Summe | 1804.1 |
Wenn die Anzahl der im Haushalt lebenden Personen eines zufällig ausgewählten Berliner Privathaushaltes im April 1998 (kurz: Haushaltsgröße) ist, dann bedeuten:
Einpersonenhaushalt | |
Zweipersonenhaushalt | |
Dreipersonenhaushalt | |
Vier- und Mehrpersonenhaushalt. |
Vor der zufälligen Auswahl des Privathaushaltes liegt die Haushaltsgröße noch nicht konkret vor, sie kann jedoch die angegebenen möglichen Realisationen annehmen.
{Haushaltsgröße} ist somit eine Zufallsvariable. Sie ist diskret, da der zulässige Wertebereich nur die ganzzahligen Werte 1,2,3 oder 4 umfasst.
Die relativen Häufigkeiten für die Gesamtheit der Privathaushalte in Berlin ergeben die theoretischen Wahrscheinlichkeiten der möglichen Realisationen von , wobei hier auf die statistische Definition der Wahrscheinlichkeit zurückgegriffen wird.
Die gemeinsame Auflistung der Realisationen von und den zugehörigen Wahrscheinlichkeiten ergibt die Wahrscheinlichkeitsfunktion:
Haushaltsgröße | |
1 | 0,4549 |
2 | 0,3130 |
3 | 0,1236 |
4 | 0,1085 |
Summe | 1,0000 |
Mit Hilfe eines Balkendiagramms kann diese auch graphisch dargestellt werden:
<R output="display">
pdf(rpdf, width=7, height=7) x = c(0.4549, 0.3130, 0.1236, 0.1085) barplot(x, names = c(1:4), width = 0.1, xlim = c(0, 1), space = 1, axes = FALSE, xlab = "x", ylab = ("f(x)"), col ="red") axis(1, at= seq(0,1,by=0.2), labels = rep("", 6), tck = 0, pos = 0) axis(2, at = seq(0,0.5,by=0.1), pos=0, xpd = TRUE, las = 1) </R> |