Zufallsauswahlmodelle/Beispiele

Aus MM*Stat

Wechseln zu: Navigation, Suche

Beispiele

Klausur

An der Klausur zu einer Lehrveranstaltung im Hauptstudium nehmen N=7 Studenten teil und erreichen die nachstehenden Punktzahlen.

Tabelle 1:

Student A B C D E F G
Punktzahl 10 11 11 12 12 12 16

Für das Merkmal X\; = "Punktzahl der Klausur" resultiert in der Grundgesamtheit folgende Häufigkeitsverteilung.

Tabelle 2:

x\; h(x)\; f(x) = \frac{h(x)}{N} F(x)\;
10 1 1/7 1/7
11 2 2/7 3/7
12 3 3/7 6/7
16 1 1/7 7/7

Aus dieser Verteilung lässt sich für das Merkmal X\; in der Grundgesamtheit der Mittelwert, die Varianz und die Standardabweichung berechnen:

\mu =12,\;\quad\sigma^{2}=\frac{22}{7}=3,143,\;\quad\sigma=1,773

Wird eine Klausur zufällig aus dieser Grundgesamtheit ausgewählt und die Punktzahl festgestellt, so erhält man eine Zufallsvariable, die auch mit X\; bezeichnet wird, da sie inhaltlich gleich dem Merkmal definiert ist, und die Zufallsvariable ebenfalls nur die möglichen Werte 10, 11, 12 oder 16 annehmen kann.

Die relativen Häufigkeiten entsprechen den Wahrscheinlichkeiten, mit denen eine Klausur mit der entsprechenden Punktzahl gezogen wird.

Die Zufallsvariable X\; weist somit die Wahrscheinlichkeitsfunktion f(x) und die Verteilungsfunktion F(X) wie in der Tabelle 2 angegeben sowie den Erwartungswert \mu = 12 und die Varianz \sigma^{2} = 3,143 auf.

Zufallsauswahl mit Zurücklegen

Aus der Grundgesamtheit werden n = 2 Klausuren mit Zurücklegen entnommen.

Für die erste Ziehung erhält man eine Zufallsvariable  X_{1}=\;"Punktzahl der ersten gezogenen Klausur" und für die zweite Ziehung entsprechend eine Zufallsvariable  X_{2}=\;"Punktzahl der zweiten gezogenen Klausur".

X_{1}\; und X_{2}\; sind die beiden Stichprobenvariablen.

Die Tabelle 3 zeigt alle möglichen Stichproben vom Umfang n = 2 mit Zurücklegen und unter Beachtung der Reihenfolge.

Tabelle 3:

1. Klausur 2. Klausur
10 11 11 12 12 12 16
10 10;10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12 16;16

Die Wahrscheinlichkeit, eine dieser Stichproben zu erhalten, beträgt \frac{1}{49}.

Aus der Tabelle 3 lassen sich unmittelbar die Wahrscheinlichkeitsfunktion für X_{1}\; und X_{2}\; ablesen.

Tabelle 4:

x_{1}\; h(x_{1})\; f(x_{1})\; x_{2}\; h(x_{2})\; f(x_{2})\;
10 7 7/49 = 1/7 10 7 7/49 = 1/7
11 14 14/49 = 2/7 11 14 14/49 = 2/7
12 21 21/49 = 3/7 12 21 21/49 = 3/7
16 7 7/49 = 1/7 16 7 7/49 = 1/7

Die Wahrscheinlichkeitsfunktionen von X_{1}\; und X_{2}\; sind identisch und stimmen mit der Wahrscheinlichkeitsfunktion der Zufallsvariablen X\; in der Grundgesamtheit überein.

Aus der Tabelle 3 kann ebenfalls die zweidimensionale Verteilung f(x_{1}, x_{2}) ermittelt werden.

Tabelle 5:

X_{1}\; X_{2}\; f(x_{1})\;
10 11 12 16
10 1 / 49 2 / 49 3 / 49 1 / 49 1 / 7
11 2 / 49 4 / 49 6 / 49 2 / 49 2 / 7
12 3 / 49 6 / 49 9 / 49 3 / 49 3 / 7
16 1 / 49 2 / 49 3 / 49 1 / 49 1 / 7
f(x_{2})\; 1 / 7 2 / 7 3 / 7 1 / 7 1

Die letzte Spalte der Tabelle 5 enthält die Randverteilung von X_{1}\; und die letzte Zeile die Randverteilung von X_{2}\;, welche exakt der Wahrscheinlichkeitsfunktion aus Tabelle 4 entsprechen.

Für jede Zelle der Tabelle 5, d.h. für alle Wertepaare (x_{1},\; x_{2}), folgt:

f(x_{1},x_{2})=f(x_{1})\cdot f(x_{2})

Die Zufallsvariablen X_{1}\; und X_{2}\; sind somit Unabhängigkeit.

Fazit:

Da die Stichprobenvariablen X_{1}\; und X_{2}\; unabhängig und identisch verteilt sind und die gleiche Verteilung wie die Zufallsvariable X in der Grundgesamtheit besitzen, wird durch die Zufallsauswahl mit Zurücklegen eine einfache Zufallsstichprobe realisiert.

Zufallsauswahl ohne Zurücklegen

Aus der Grundgesamtheit werden n = 2 Klausuren ohne Zurücklegen entnommen.

Man erhält wie vorher die Stichprobenvariablen X_{1}\; und X_{2}\;.

Die Tabelle 6 zeigt alle möglichen Stichproben vom Umfang n = 2 ohne Zurücklegen und unter Beachtung der Reihenfolge.

Tabelle 6:

1. Klausur 2. Klausur
10 11 11 12 12 12 16
10 10;11 10;11 10;12 10;12 10;12 10;16
11 11;10 11;11 11;12 11;12 11;12 11;16
11 11;10 11;11 11;12 11;12 11;12 11;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
12 12;10 12;11 12;11 12;12 12;12 12;16
16 16;10 16;11 16;11 16;12 16;12 16;12

Die Wahrscheinlichkeit, eine dieser Stichproben zu erhalten, beträgt \frac{1}{42}.

Aus der Tabelle 6 ergeben sich die Wahrscheinlichkeitsfunktionen für X_{1}\; und X_{2}\;

Tabelle 7:

x_{1}\; h(x_{1})\; f(x_{1})\; x_{2}\; h(x_{2})\; f(x_{2})\;
10 6 6/42 = 1/7 10 6 6/42 = 1/7
11 12 12/42 = 2/7 11 12 12/42 = 2/7
12 18 18/42=3/7 12 18 18/42 = 3/7
16 6 6/42 = 1/7 16 6 6/42 = 1/7

Die Übereinstimmung der Wahrscheinlichkeitsfunktion f(x_{1}) mit der Verteilung der Grundgesamtheit ist nicht verwunderlich, da X_{1}\; für die Ziehung der 1. Klausur steht.

Wenn ohne Zurücklegen gezogen wird, ändert sich jedoch die Verteilung der Grundgesamtheit in Abhängigkeit davon, welcher Wert der Zufallsvariablen X\; (Punktzahl einer Klausur) bei der 1. Ziehung auftrat.

Wenn die erste gezogene Klausur z.B. die Punktzahl 10 hatte (X_{1} = 10)\;, dann ist die bedingte Wahrscheinlichkeit, bei der zweiten gezogenen Klausur die Punktzahl 10 zu erhalten P(X_{2}= 10|X_{1} = 10) = 0\;, denn unter den verbliebenen 6 Klausuren in der Grundgesamtheit gibt es keine weitere Klausur mit der Punktzahl 10.

Die Tabelle 8 enthält alle bedingten Wahrscheinlichkeiten.

Tabelle 8:

x_{2} P(X_{2} = x_{2}|X_{1} = 10)\; P(X_{2} = x_{2}|X_{1} = 11)\; P(X_{2} = x_{2}|X_{1} = 12)\; P(X_{2} = x_{2}|X_{1} = 16)\;
10 0 3/6 1/6 1/6
11 2/6 1/6 2/6 2/6
12 3/6 3/6 2/6 3/6
16 1/6 1/6 1/6 0
\sum 1 1 1 1

Die Wahrscheinlichkeit, dass X_{2}\; einen bestimmten Wert x_{2} annimmt, d.h. P(X_{2} = x_{2}) = f(x_{2})\;, ergibt sich nach dem Satz der totalen Wahrscheinlichkeit:

P(X_{2} = 10)\; = P(X_{2} = 10 | X_{1}=10) \cdot P(X_{1} = 10) + P(X_{2} = 10|X_{1}=11) \cdot P(X_{1} = 11)
+ P(X_{2} = 10|X_{1}=12) \cdot P(X_{1} = 12) +P(X_{2} = 10 | X_{1}=16) \cdot P(X_{1} = 16)
= 0 \cdot \frac{1}{7} +  \frac{1}{6} \cdot \frac{2}{7} +  \frac{1}{6} \cdot \frac{3}{7} +  \frac{1}{6} \cdot \frac{1}{7} =  \frac{6}{42} =  \frac{1}{7}


P(X_{2} = 11)\; = P(X_{2} = 11 | X_{1}=10) \cdot P(X_{1} = 10) + P(X_{2} = 11 |X_{1}=11) \cdot P(X_{1} = 11)
+ P(X_{2} = 1 | X_{1}=12) \cdot P(X_{1} = 12) +P(X_{2} = 11 | X_{1}=16) \cdot P(X_{1} = 16)
=  \frac{2}{6} \cdot \frac{1}{7} +  \frac{1}{6} \cdot \frac{2}{7} +  \frac{2}{6} \cdot \frac{3}{7} +  \frac{2}{6} \cdot \frac{1}{7} =  \frac{12}{42} =  \frac{2}{7}


P(X_{2} = 12)\; = P(X_{2} = 12 | X_{1}=10) \cdot P(X_{1} = 10) + P(X_{2} = 12 |X_{1}=11) \cdot P(X_{1} = 11)
+ P(X_{2} = 2 | X_{1}=12) \cdot P(X_{1} = 12) +P(X_{2} = 12 | X_{1}=16) \cdot P(X_{1} = 16)
=  \frac{3}{6} \cdot \frac{1}{7} +  \frac{3}{6} \cdot \frac{2}{7} +  \frac{2}{6} \cdot \frac{3}{7} +  \frac{3}{6} \cdot \frac{1}{7} =  \frac{18}{42} =  \frac{3}{7}


P(X_{2} = 16)\; = P(X_{2} = 16 | X_{1}=10) \cdot P(X_{1} = 10) + P(X_{2} = 16 |X_{1}=11) \cdot P(X_{1} = 11)
+ P(X_{2} = 6 | X_{1}=12) \cdot P(X_{1} = 12) +P(X_{2} = 16 | X_{1}=16) \cdot P(X_{1} = 16)
=  \frac{1}{6} \cdot \frac{1}{7} +  \frac{1}{6} \cdot \frac{2}{7} +  \frac{1}{6} \cdot \frac{3}{7} + 0 \cdot \frac{1}{7} =  \frac{6}{42} =  \frac{1}{7}


Diese berechneten Wahrscheinlichkeiten f(x_{2}) entsprechen denen aus Tabelle 7..

Damit ist f(x_{2}) identisch mit f(x_{1}) und beide stimmen mit der Verteilung der Grundgesamtheit überein.

Die Stichprobenvariablen X_{1}\; und X_{2}\; sind aber nicht unabhängig voneinander.

Dies lässt sich zum einen daran sehen, dass die bedingten Verteilungen (in der Tabelle 8) nicht übereinstimmen.

Es lässt sich zum anderen anhand der zweidimensionalen Verteilung f(x_{1},\; x_{2}) erkennen, die aus der Tabelle 6 ermittelt werden kann.

Tabelle 9:

X_{1}\; X_{2}\; f(x_{1})\;
10 11 12 16
10 0 2 / 42 3 / 42 1 / 42 1 / 7
11 2 / 42 4 / 42 6 / 42 2 / 42 2 / 7
12 3 / 42 6 / 42 9 / 42 3 / 42 3 / 7
16 1 / 42 2 / 42 3 / 42 1 / 42 1 / 7
f(x_{2})\; 1 / 7 2 / 7 3 / 7 1 / 7 1

Es ist: f(x_{1},\;x_{2})\neq f(x_{1})\cdot f(x_{2}).

Die Zufallsvariablen X_{1}\; und X_{2}\; sind somit nicht unabhängig.

Fazit:

Die Stichprobenvariablen X_{1}\; und X_{2}\; sind zwar identisch verteilt und haben die gleiche Verteilung wie die Zufallsvariable X\; in der Grundgesamtheit, aber sie sind abhängig.

Durch die Zufallsauswahl ohne Zurücklegen wird somit eine uneingeschränkte Zufallsstichprobe jedoch keine einfache Zufallsstichprobe realisiert.