Wahrscheinlichkeitsfunktion: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „=={{Vorlage:Überschrift}}== ===Eindimensionale Wahrscheinlichkeitsfunktion=== Die ''Wahrscheinlichkeitsfunktion'' gibt an, mit welcher Wahrscheinlichkeit|…“)
 
 
Zeile 1: Zeile 1:
 +
{{Zufallsvariable}}
 +
 
=={{Vorlage:Überschrift}}==
 
=={{Vorlage:Überschrift}}==
  

Aktuelle Version vom 7. April 2019, 17:01 Uhr

Zufallsvariable

Zufallsvariable • Wahrscheinlichkeitsfunktion • Wahrscheinlichkeitsdichtefunktion • Verteilungsfunktion (stochastisch) • Randverteilung (stochastisch) • Bedingte Verteilung (stochastisch) • Stochastische Unabhängigkeit • Parameter eindimensionaler Verteilungen (stochastisch) • Parameter zweidimensionaler Verteilungen (stochastisch) • Multiple Choice • Video • Aufgaben • Lösungen
Bedingte Dichtefunktion • Bedingte Verteilungsfunktion • Bedingte Wahrscheinlichkeitsfunktion • Dichtefunktion (eindimensional) • Dichtefunktion (zweidimensional) • Diskrete Zufallsvariable • Erwartungswert • Erwartungswert (diskret) • Erwartungswert (stetig) • Korrelationskoeffizient (stochastisch) • Kovarianz (stochastisch) • Marginaldichte • Marginale Verteilung (stochastisch) • Randdichte • Randverteilungsfunktion • Realisation • Standardabweichung (stochastisch) • Standardisierung • Stetige Zufallsvariable • Tschebyschev-Ungleichung • Unabhängigkeit (stochastisch) • Varianz (stochastisch) • Varianz (stochastisch, diskret) • Varianz (stochastisch, stetig) • Verteilungsfunktion (stochastisch, eindimensional) • Verteilungsfunktion (stochastisch, zweidimensional) • Verteilungsfunktion der Randverteilung • Wahrscheinlichkeitsdichte (eindimensional) • Wahrscheinlichkeitsdichte (zweidimensional) • Wahrscheinlichkeitsfunktion (eindimensional) • Wahrscheinlichkeitsfunktion (zweidimensional) • Verteilung (stochastisch) • Wahrscheinlichkeitsverteilung

Grundbegriffe

Eindimensionale Wahrscheinlichkeitsfunktion

Die Wahrscheinlichkeitsfunktion gibt an, mit welcher Wahrscheinlichkeit eine diskrete Zufallsvariable X genau den Wert x_{i} annimmt.

Man schreibt hierfür:

P(X=x_{i})=f(x_{i})\qquad i=1,2,\ldots

mit f(x_{i})\geq 0 und  \sum \nolimits_{i}f(x_{i})=1 .

Die grafische Darstellung der Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen erfolgt durch ein Stab- oder Balkendiagramm.

Zweidimensionale Wahrscheinlichkeitsfunktion

Die zweidimensionale Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen X und Y gibt die Wahrscheinlichkeit dafür an, dass die Zufallsvariable X den Wert x_{i} und die Zufallsvariable Y gleichzeitig den Wert y_{j} annimmt.

Man schreibt hierfür:

P(\{X=x_{i}\}\cap \{Y=y_{j}\})=P(X=x_{i},Y=y_{j})=f(x_{i},y_{j})\quad(i,j=1,2,\dots)

Dabei müssen folgende Bedingungen erfüllt sein:

f(x_{i},y_{j})\geq0\quad (i,j=1,2,\dots)

\sum\nolimits_{i}\sum \nolimits_{j}f(x_{i},y_{j})=1

Eine geeignete Darstellungsform der zweidimensionalen Wahrscheinlichkeitsfunktion diskreter Zufallsvariablen ist die Kontingenztabelle oder Kreuztabelle.

X\qquad Y  \,y_1 \dots \,y_j \dots
\,x_1 \,f(x_1,y_1) \dots \,f(x_1,y_j) \dots
: : \dots : \dots
\, x_i \, f(x_i,y_1) \dots \,f(x_i,y_j) \dots
: : \dots : \dots

Beispiele

Münzwurf

Beim dreimaligen Werfen einer idealen Münze ist das Interesse auf die Anzahl des Auftretens der Ausprägung "Zahl (Z)" gerichtet.

Die zugehörige Zufallsvariable  X ist:

X = \{ \mbox{Anzahl von 'Zahl' beim dreimaligen Werfen einer idealen Münze} \} mit den Realisationen x_{1}=0;\; x_{2}=1;\; x_{3}=2; und \,x_{4}=3.

Elementarereignis

\,E_{j}

Wahrscheinlichkeit

\,P(E_{j})

Zufallsvariable X

Realisationen x_{i}\,

Wahrscheinlichkeitsfunktion

\,P(X=x_{i})=f(x_{i})

\, E_{1}=\{ZZZ\} \, P(E_{1})=0,125 \, x_{1}=0 \, f(x_{1})=0,125
\,E_{2}=\{ZZK\} \,P(E_{2})=0,125
\,E_{3}=\{ZKZ\} \,P(E_{3})=0,125 \,x_{2}=1 \,f(x_{2})=0,375
\,E_{4}=\{KZZ\} \,P(E_{4})=0,125
\,E_{5}=\{ZKK\} \,P(E_{5})=0,125
\,E_{6}=\{KZK\} \,P(E_{6})=0,125 \,x_{3}=2 \,f(x_{3})=0,375
\,E_{7}=\{KKZ\} \,P(E_{7})=0,125
\,E_{8}=\{KKK\} \,P(E_{8})=0,125 \,x_{4}=3 \,f(x_{4})=0,125

Die Berechnung der Eintrittswahrscheinlichkeiten P(E_{j}) beruht auf dem Multiplikationssatz für unabhängige Ereignisse.

Die Wahrscheinlichkeitsfunktion kann nun grafisch dargestellt werden:

<R output="display" name="pic_dice3">

pdf(rpdf, width=10, height=7) par(mfrow=c(1,2)) tabe <- rep(1/8, 8) names(tabe) <- c("KKK (3)","KKZ (2)","KZK (2)","KZZ (1)","ZKK (2)","ZKZ (1)","ZZK (1)","ZZZ (0)") plot(as.table(tabe), main="Elementarereignisse", ylab="Wahrscheinlichkeit", axes=F, ylim=c(0,0.4)) points(1:8, tabe, pch=19) axis(1, at=1:8, labels=names(tabe), las=2) axis(2) box() tabk <- c(1,3,3,1)/8 names(tabk) <- 0:3 plot(as.table(tabk), main="Anzahl Koepfe", ylab="Wahrscheinlichkeit", ylim=c(0,0.4)) points(0:3, tabk, pch=19) dev.off()

</R>

Wahlbeteiligung und politisches Interesse

Bei einer Umfrage wurden die Einwohner einer Stadt nach

sowie
  • dem persönlichen politischen Interesse (Zufallsvariable Y\;) mit den möglichen Realisationen y_{1}= sehr stark, y_{2}= stark, y_{3}= mittel, y_{4}= wenig und y_{5}= überhaupt nicht.

befragt.

Die folgende Kontingenztabelle enthält die Werte der zweidimensionalen Wahrscheinlichkeitsfunktion der beiden Zufallsvariablen:

Wahlbeteiligung (X)\; politisches Interesse (Y)\; RV (X)\;
sehr stark \left( y_{1}\right) stark \left( y_{2}\right) mittel \left(y_{3}\right) wenig \left( y_{4}\right) überhaupt nicht \left( y_{5}\right)
nein (x_{1}) 0,006 0,011 0,036 0,031 0,021 0,105
ja (x_{2}) 0,107 0,196 0,398 0,152 0,042 0,895
RV Y\; 0,113 0,207 0,434 0,183 0,063 1,000

Jede Zelle dieser Tabelle enthält die Wahrscheinlichkeit, dass die Zufallsvariable X\; die Realisation x_{i} und gleichzeitig die Zufallsvariable Y\; die Realisation y_{j} annimmt.

Zum Beispiel besagt der Inhalt der Zelle (1,2), dass ein zufällig ausgewählter Einwohner mit einer Wahrscheinlichkeit von 0,196 ein starkes politische Interesse hat und bei der letzten Bundestagswahl seine Stimme abgegeben hat.

Die Randverteilung (RV) von X\; gibt die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "Wahlbeteiligung" an.

Die Wahrscheinlichkeit, dass ein zufällig ausgewählter Einwohner sich an der letzte Bundestagswahl nicht beteiligt hat, beträgt z.B. 0,105.

Die Randverteilung (RV) von Y\; enthält die Wahrscheinlichkeiten der Realisationen der Zufallsvariablen "politisches Interesse".

Mit einer Wahrscheinlichkeit von 0,183 weist ein zufällig ausgewählter Einwohner wenig politisches Interesse auf.

Die folgende Abbildung zeigt eine grafische Darstellung der zweidimensionalen Wahrscheinlichkeitsfunktion von Wahlbeteilung und politischem Interesse.

<R output="display">

pdf(rpdf,width=7, height=7) library(RColorBrewer) library(lattice) library(latticeExtra)

data <- data.frame(Wahlbeteiligung=c("(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x2) ja", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein", "(x1) nein"),

                  P=c(0.107, 0.196, 0.398, 0.152, 0.042, 0.006, 0.011, 0.036, 0.031, 0.021),
                  "pol.Interesse"=c("(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht", "(y1) sehr stark", "(y2) stark", "(y3) mittel", "(y4) wenig", "(y5) überhaupt nicht")) 

colors <- c("cornflowerblue","deeppink4","cornsilk1","lightcyan2","purple4") cloud(P~Wahlbeteiligung+pol.Interesse, data, panel.3d.cloud=panel.3dbars, col.facet=colors,

     xbase=0.4, ybase=0.4, scales=list(arrows=FALSE, col=1), 
     par.settings = list(axis.line = list(col = "transparent")))

</R>

Haushaltsgröße

Aus "Statistisches Jahrbuch 1998", herausgegeben vom Statistischen Landesamt Berlin, Kulturbuch-Verlag Berlin, S. 61, können nachstehende Angaben über die Größe von Privathaushalten in Berlin für April 1998 entnommen werden:

Anzahl der im Haushalt lebenden Personen Anzahl der Privathaushalte (in 1000)
1 820,7
2 564,7
3 222,9
4 und mehr 195,8
Summe 1804.1

Wenn X die Anzahl der im Haushalt lebenden Personen eines zufällig ausgewählten Berliner Privathaushaltes im April 1998 (kurz: Haushaltsgröße) ist, dann bedeuten:

 x_{1}=1 Einpersonenhaushalt
x_{2}=2 Zweipersonenhaushalt
x_{3}=3 Dreipersonenhaushalt
x_{4}=4 Vier- und Mehrpersonenhaushalt.

Vor der zufälligen Auswahl des Privathaushaltes liegt die Haushaltsgröße noch nicht konkret vor, sie kann jedoch die angegebenen möglichen Realisationen annehmen.

 X = {Haushaltsgröße} ist somit eine Zufallsvariable. Sie ist diskret, da der zulässige Wertebereich nur die ganzzahligen Werte 1,2,3 oder 4 umfasst.

Die relativen Häufigkeiten für die Gesamtheit der Privathaushalte in Berlin ergeben die theoretischen Wahrscheinlichkeiten der möglichen Realisationen von  X , wobei hier auf die statistische Definition der Wahrscheinlichkeit zurückgegriffen wird.

Die gemeinsame Auflistung der Realisationen von  X und den zugehörigen Wahrscheinlichkeiten ergibt die Wahrscheinlichkeitsfunktion:

Haushaltsgröße x_{j} f(x_{j})
1 0,4549
2 0,3130
3 0,1236
4 0,1085
Summe 1,0000

Mit Hilfe eines Balkendiagramms kann diese auch graphisch dargestellt werden:

<R output="display">

pdf(rpdf, width=7, height=7)

x = c(0.4549, 0.3130, 0.1236, 0.1085) barplot(x, names = c(1:4), width = 0.1, xlim = c(0, 1), space = 1, axes = FALSE, xlab = "x",

       ylab = ("f(x)"), col ="red")

axis(1, at= seq(0,1,by=0.2), labels = rep("", 6), tck = 0, pos = 0) axis(2, at = seq(0,0.5,by=0.1), pos=0, xpd = TRUE, las = 1)

</R>