Wahrscheinlichkeitsfunktion

Aus MM*Stat

Wechseln zu: Navigation, Suche

Zufallsvariable

Zufallsvariable • Wahrscheinlichkeitsfunktion • Wahrscheinlichkeitsdichtefunktion • Verteilungsfunktion (stochastisch) • Randverteilung (stochastisch) • Bedingte Verteilung (stochastisch) • Stochastische Unabhängigkeit • Parameter eindimensionaler Verteilungen (stochastisch) • Parameter zweidimensionaler Verteilungen (stochastisch) • Multiple Choice • Video • Aufgaben • Lösungen
Bedingte Dichtefunktion • Bedingte Verteilungsfunktion • Bedingte Wahrscheinlichkeitsfunktion • Dichtefunktion (eindimensional) • Dichtefunktion (zweidimensional) • Diskrete Zufallsvariable • Erwartungswert • Erwartungswert (diskret) • Erwartungswert (stetig) • Korrelationskoeffizient (stochastisch) • Kovarianz (stochastisch) • Marginaldichte • Marginale Verteilung (stochastisch) • Randdichte • Randverteilungsfunktion • Realisation • Standardabweichung (stochastisch) • Standardisierung • Stetige Zufallsvariable • Tschebyschev-Ungleichung • Unabhängigkeit (stochastisch) • Varianz (stochastisch) • Varianz (stochastisch, diskret) • Varianz (stochastisch, stetig) • Verteilungsfunktion (stochastisch, eindimensional) • Verteilungsfunktion (stochastisch, zweidimensional) • Verteilungsfunktion der Randverteilung • Wahrscheinlichkeitsdichte (eindimensional) • Wahrscheinlichkeitsdichte (zweidimensional) • Wahrscheinlichkeitsfunktion (eindimensional) • Wahrscheinlichkeitsfunktion (zweidimensional) • Verteilung (stochastisch) • Wahrscheinlichkeitsverteilung

Grundbegriffe

Eindimensionale Wahrscheinlichkeitsfunktion

Die Wahrscheinlichkeitsfunktion gibt an, mit welcher Wahrscheinlichkeit eine diskrete Zufallsvariable genau den Wert annimmt.

Man schreibt hierfür:

mit und .

Die grafische Darstellung der Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen erfolgt durch ein Stab- oder Balkendiagramm.

Zweidimensionale Wahrscheinlichkeitsfunktion

Die zweidimensionale Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen und gibt die Wahrscheinlichkeit dafür an, dass die Zufallsvariable den Wert und die Zufallsvariable gleichzeitig den Wert annimmt.

Man schreibt hierfür:

Dabei müssen folgende Bedingungen erfüllt sein:

Eine geeignete Darstellungsform der zweidimensionalen Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen ist die Kontingenztabelle oder Kreuztabelle.

Beispiele

Münzwurf

Beim dreimaligen Werfen einer idealen Münze ist das Interesse auf die Anzahl des Auftretens der Ausprägung "Zahl (Z)" gerichtet.

Die zugehörige Zufallsvariable ist:

mit den Realisationen und .

Elementarereignis

Wahrscheinlichkeit

Zufallsvariable

Realisationen

Wahrscheinlichkeitsfunktion

Die Berechnung der Eintrittswahrscheinlichkeiten beruht auf dem Multiplikationssatz für unabhängige Ereignisse.

Die Wahrscheinlichkeitsfunktion kann nun grafisch dargestellt werden:

<R output="display" name="pic_dice3">

pdf(rpdf, width=10, height=7) par(mfrow=c(1,2)) tabe <- rep(1/8, 8) names(tabe) <- c("KKK (3)","KKZ (2)","KZK (2)","KZZ (1)","ZKK (2)","ZKZ (1)","ZZK (1)","ZZZ (0)") plot(as.table(tabe), main="Elementarereignisse", ylab="Wahrscheinlichkeit", axes=F, ylim=c(0,0.4)) points(1:8, tabe, pch=19) axis(1, at=1:8, labels=names(tabe), las=2) axis(2) box() tabk <- c(1,3,3,1)/8 names(tabk) <- 0:3 plot(as.table(tabk), main="Anzahl Koepfe", ylab="Wahrscheinlichkeit", ylim=c(0,0.4)) points(0:3, tabk, pch=19) dev.off()

</R>

Wahlbeteiligung und politisches Interesse

Bei einer Umfrage wurden die Einwohner einer Stadt nach

  • der Wahlbeteiligung an der letzten Bundestagswahl (Zufallsvariable ) mit den möglichen Realisationen nein und ja
sowie
  • dem persönlichen politischen Interesse (Zufallsvariable ) mit den möglichen Realisationen sehr stark, stark, mittel, wenig und überhaupt nicht.

befragt.

Die folgende Kontingenztabelle enthält die Werte der zweidimensionalen Wahrscheinlichkeitsfunktion der beiden Zufallsvariablen:

Wahlbeteiligung politisches Interesse RV
sehr stark stark mittel wenig überhaupt nicht
nein 0,006 0,011 0,036 0,031 0,021 0,105
ja 0,107 0,196 0,398 0,152 0,042 0,895
RV 0,113 0,207 0,434 0,183 0,063 1,000

Jede Zelle dieser Tabelle enthält die Wahrscheinlichkeit, dass die Zufallsvariable die Realisation und gleichzeitig die Zufallsvariable die Realisation annimmt.

Zum Beispiel besagt der Inhalt der Zelle (1,2), dass ein zufällig ausgewählter Einwohner mit einer Wahrscheinlichkeit von 0,196 ein starkes politische Interesse hat und bei der letzten Bundestagswahl seine Stimme abgegeben hat.

Die Randverteilung (RV) von gibt die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "Wahlbeteiligung" an.

Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Einwohner sich an der letzte Bundestagswahl nicht beteiligt hat, beträgt z.B. 0,105.

Die Randverteilung (RV) von enthält die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "politisches Interesse".

Mit einer Wahrscheinlichkeit von 0,183 weist ein zufällig ausgewählter Einwohner wenig politisches Interesse auf.

Die folgende Abbildung zeigt eine grafische Darstellung der zweidimensionalen Wahrscheinlichkeitsfunktion von Wahlbeteilung und politischem Interesse.

<R output="display">

pdf(rpdf,width=7, height=7) library(RColorBrewer) library(lattice) library(latticeExtra)

data <- data.frame(Wahlbeteiligung=c("(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein"),

                  P=c(0.107, 0.196, 0.398, 0.152, 0.042, 0.006, 0.011, 0.036, 0.031, 0.021),
                  "pol.Interesse"=c("(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht", "(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht")) 

colors <- c("cornflowerblue","deeppink4","cornsilk1","lightcyan2","purple4") cloud(P~Wahlbeteiligung+pol.Interesse, data, panel.3d.cloud=panel.3dbars, col.facet=colors,

     xbase=0.4, ybase=0.4, scales=list(arrows=FALSE, col=1), 
     par.settings = list(axis.line = list(col = "transparent")))

</R>

Haushaltsgröße

Aus "Statistisches Jahrbuch 1998", herausgegeben vom Statistischen Landesamt Berlin, Kulturbuch-Verlag Berlin, S. 61, können nachstehende Angaben über die Größe von Privathaushalten in Berlin für April 1998 entnommen werden:

Anzahl der im Haushalt lebenden Personen Anzahl der Privathaushalte (in 1000)
1 820,7
2 564,7
3 222,9
4 und mehr 195,8
Summe 1804.1

Wenn die Anzahl der im Haushalt lebenden Personen eines zufällig ausgewählten Berliner Privathaushaltes im April 1998 (kurz: Haushaltsgröße) ist, dann bedeuten:

Einpersonenhaushalt
Zweipersonenhaushalt
Dreipersonenhaushalt
Vier- und Mehrpersonenhaushalt.

Vor der zufälligen Auswahl des Privathaushaltes liegt die Haushaltsgröße noch nicht konkret vor, sie kann jedoch die angegebenen möglichen Realisationen annehmen.

{Haushaltsgröße} ist somit eine Zufallsvariable. Sie ist diskret, da der zulässige Wertebereich nur die ganzzahligen Werte 1,2,3 oder 4 umfasst.

Die relativen Häufigkeiten für die Gesamtheit der Privathaushalte in Berlin ergeben die theoretischen Wahrscheinlichkeiten der möglichen Realisationen von , wobei hier auf die statistische Definition der Wahrscheinlichkeit zurückgegriffen wird.

Die gemeinsame Auflistung der Realisationen von und den zugehörigen Wahrscheinlichkeiten ergibt die Wahrscheinlichkeitsfunktion:

Haushaltsgröße
1 0,4549
2 0,3130
3 0,1236
4 0,1085
Summe 1,0000

Mit Hilfe eines Balkendiagramms kann diese auch graphisch dargestellt werden:

<R output="display">

pdf(rpdf, width=7, height=7)

x = c(0.4549, 0.3130, 0.1236, 0.1085) barplot(x, names = c(1:4), width = 0.1, xlim = c(0, 1), space = 1, axes = FALSE, xlab = "x",

       ylab = ("f(x)"), col ="red")

axis(1, at= seq(0,1,by=0.2), labels = rep("", 6), tck = 0, pos = 0) axis(2, at = seq(0,0.5,by=0.1), pos=0, xpd = TRUE, las = 1)

</R>