|
|
(Eine dazwischenliegende Version desselben Benutzers wird nicht angezeigt) |
Zeile 1: |
Zeile 1: |
| {{Stichprobentheorie}} | | {{Stichprobentheorie}} |
| | {{SubpageToc|Beispiele}} |
|
| |
|
| =={{Vorlage:Überschrift}}== | | =={{Vorlage:Überschrift}}== |
Zeile 281: |
Zeile 282: |
|
| |
|
| Dies ist der Grund dafür, dass sie in der [[Induktive Statistik|induktiven Statistik]] weniger Anwendung findet. | | Dies ist der Grund dafür, dass sie in der [[Induktive Statistik|induktiven Statistik]] weniger Anwendung findet. |
|
| |
| =={{Vorlage:Beispiele}}==
| |
|
| |
| ===Arbeitsgang===
| |
|
| |
| Für die Beurteilung der Gleichmäßigkeit der benötigten Zeit von Arbeitsgängen wird vielfach die [[Streuung]] herangezogen.
| |
|
| |
| Die von einem Arbeiter benötigte Zeit für einen bestimmten Arbeitsgang ist die [[Zufallsvariable]] <math>X\;</math> in der [[Grundgesamtheit]].
| |
|
| |
| <math>X\;</math> sei [[Normalverteilung|normalverteilt]] mit <math>E[X]=\mu</math> und <math>Var(X)=\sigma^{2}</math>.
| |
|
| |
| Es wird eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> gezogen.
| |
|
| |
| Da die [[Grundgesamtheit]] aus allen möglichen Zeitmessungen für den gleichen Arbeitsgang, ausgeführt von demselben Arbeiter, besteht und deshalb
| |
| als sehr groß angesehen werden kann, wird von der [[Realisation|Realisierung]] einer [[Einfache Zufallsstichprobe|einfachen Zufallsstichprobe]] ausgegangen.
| |
|
| |
| Die [[Stichprobenvariable]]n <math>X_{i}=\;</math> "i-te Zeitmessung für den Arbeitsgang" <math>( i = 1, \ldots, n)</math> sind somit [[Unabhängigkeit (stochastisch)|unabhängig]] voneinander und identisch [[Normalverteilung|normalverteilt]].
| |
|
| |
| ====Berechnung der Wahrscheinlichkeit====
| |
|
| |
| Es wird eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 15</math> gezogen.
| |
|
| |
| Wie groß ist die [[Wahrscheinlichkeit]], dass die [[Stichprobenvarianz]] <math>S^{2}\;</math> Werte im Intervall <math>\left[0,5\cdot\sigma^{2};1,5\cdot\sigma^{2}\right]</math> annimmt?
| |
|
| |
| Gesucht ist somit <math>P\left(0,5\cdot \sigma^{2}\leq s^{2}\leq1,5\cdot \sigma^{2}\right)</math>.
| |
|
| |
| Zur Lösung wird jede Seite der Ungleichung mit <math>\frac{n - 1}{\sigma^{2}}</math> erweitert:
| |
|
| |
| {|
| |
| |<math>P\left(0,5\cdot \sigma^{2}\leq S^{2}\leq1,5\cdot \sigma^{2}\right)</math>
| |
| |<math>=P\left(\frac{n-1}{\sigma^{2}}\cdot 0,5\cdot \sigma^{2}\leq\frac{n-1}{\sigma^{2}}\cdot S^{2}\leq\frac{n-1}{\sigma^{2}}\cdot 1,5\cdot \sigma^{2}\right)</math>
| |
| |-
| |
| |
| |
| |<math>=P\left((n-1)\cdot1,5\leq\frac{n-1}{\sigma^{2}}\cdot S^{2}\leq(n-1)\cdot1,5\right)</math>
| |
| |}
| |
|
| |
| Mit <math>n - 1 = 14</math> folgt:
| |
|
| |
| <math>P\left(0,5\cdot \sigma^{2}\leq S^{2}\leq1,5\cdot \sigma^{2}\right)=P\left(7\leq\frac{n-1}{\sigma^{2}}\cdot S^{2}\leq21\right)</math>
| |
|
| |
| Die [[Wahrscheinlichkeit]], dass die [[Stichprobenvarianz]] <math>S^{2}\;</math> Werte zwischen <math>0,5\cdot\sigma^{2}</math> und <math>1,5\cdot\sigma^{2}</math> annimmt, ist identisch mit der [[Wahrscheinlichkeit]], dass die transformierte [[Zufallsvariable]] <math>\frac{(n-1)\cdot S^{2}}{\sigma^{2}}</math> Werte zwischen 7 und 21 annimmt.
| |
|
| |
| Die [[Zufallsvariable]] <math>\frac{(n-1)\cdot S^{2}}{\sigma^{2}}</math> ist [[Chi-Quadrat-Verteilung|Chi-Quadrat-verteilt]] mit <math>f = n - 1 = 14</math>
| |
| [[Freiheitsgrad]]en, so dass die gesuchte [[Wahrscheinlichkeit]] mittels Tabellen der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Chi-Quadrat-Verteilung]] bzw. über Computerberechnungen bestimmt werden kann:
| |
|
| |
| {|
| |
| |<math>P\left(0,5\cdot\sigma^{2}\leq S^{2}\leq1,5\cdot \sigma^{2}\right)</math>
| |
| |<math> =P\left( 7\leq\frac{n-1}{\sigma^{2}}\cdot S^{2}\leq21\right)</math>
| |
| |-
| |
| |
| |
| |<math>=P\left( \frac{n-1}{\sigma^{2}}\cdot S^{2}\leq21\right) -P\left( \frac{n-1}{\sigma^{2}}\cdot S^{2}\leq7\right)</math>
| |
| |-
| |
| |
| |
| |<math>\,=0,8984-0,0653=0,8331</math>
| |
| |}
| |
|
| |
| Die [[Wahrscheinlichkeit]], dass die [[Stichprobenvarianz]] <math>S^{2}\;</math> Werte im Intervall <math>\left[0,5\cdot\sigma^{2}; 1,5\cdot\sigma^{2}\right]</math> annimmt, beträgt 0,8331.
| |
|
| |
| Die folgende Grafik zeigt die [[Dichtefunktion (eindimensional)|Dichtefunktion]] der [[Chi-Quadrat-Verteilung]] mit <math>f = 14</math>, wobei <math>Y=\frac{(n-1)S^{2}}{\sigma^{2}}</math> repräsentiert.
| |
|
| |
| {|
| |
| |<R output="display">
| |
| pdf(rpdf,height=7,width=7)
| |
|
| |
| curve(from=0, to=35, dchisq(x, df=14), xaxt="n", , yaxt="n", ylab="f(y)", xlab="y", col="blue", ylim=c(0.0,0.09), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
| |
| axis( side=1, at=3.5*c(0:10), tick=TRUE)
| |
| axis( side=2, at=0.03*c(0:3), tick=TRUE)
| |
|
| |
| par(new=TRUE)
| |
|
| |
| xx <-c(7:21, 21:7)
| |
| yy <-c(c(dchisq(c(7:21), df=14)),c(rep(0,15)))
| |
| polygon(xx, yy, col="palegreen", border=NA)
| |
|
| |
| par(new=TRUE)
| |
|
| |
| curve(from=0, to=35, dchisq(x, df=14), xaxt="n", , yaxt="n", ylab="f(y)", xlab="y", col="blue", ylim=c(0.0,0.09), lty=1, lwd=4, font.lab=2, "xaxs"="i" ,"yaxs"="i", bty="l")
| |
|
| |
|
| |
| abline(v=7, col="black", lwd=1, lty=2)
| |
| abline(v=21, col="black", lwd=1, lty=2)
| |
|
| |
| </R>
| |
| |}
| |
|
| |
| ====Zentrales Schwankungsintervall der Stichprobenvarianz====
| |
|
| |
| Es soll ein [[zentrales Schwankungsintervall]] für die [[Stichprobenvarianz]] <math>S^{2}\;</math> mit der [[Sicherheitswahrscheinlichkeit]] <math>1-\alpha=0.95</math> bestimmt werden, wenn die gleiche [[Grundgesamtheit]] vorausgesetzt und eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 30</math> gezogen wird.
| |
|
| |
| Aufgrund von
| |
|
| |
| <math>P\left( v_{1}\leq\frac{(n-1)\cdot S^{2}}{\sigma^{2}}\leq v_{2}\right)=0,95</math>
| |
|
| |
| und
| |
|
| |
| <math>P\left( \frac{(n-1)\cdot S^{2}}{\sigma^{2}}\leq v_{1}\right) =0,025;\qquad P\left( \frac{(n-1)\cdot S^{2}}{\sigma^{2}}\leq v_{2}\right)=0,975</math>
| |
|
| |
| findet man in der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Chi-Quadrat-Verteilung]] mit <math>f = 29</math> [[Freiheitsgrad]]en:
| |
|
| |
| <math>v_{1}=16,05</math> und <math>v_{2}=45,72</math>.
| |
|
| |
| Damit wird:
| |
|
| |
| <math>P\left( 16,05\leq\frac{(n-1)\cdot S^{2}}{\sigma^{2}}\leq45,72\right)=0,95</math>
| |
|
| |
| Mit einer [[Wahrscheinlichkeit]] von 0,95 nimmt die transformierte [[Zufallsvariable]] <math>\frac{(n-1)\cdot S^{2}}{\sigma^{2}}</math> Werte im Intervall <math>\left[16,05;\; 45,72\right]</math> an.
| |
|
| |
| Durch Umformung ergibt sich ein [[zentrales Schwankungsintervall]] für <math>S^{2}\;</math>:
| |
|
| |
| <math>P\left(\frac{16,05\cdot \sigma^{2}}{n-1}\leq S^{2}\leq\frac{45,72\cdot \sigma^{2}}{n-1}\right)=0,95</math>
| |
|
| |
| <math>P\left(0,5534\cdot \sigma^{2}\leq S^{2}\leq1,5766\cdot \sigma^{2}\right)=0,95\;</math>
| |
|
| |
| Mit einer [[Wahrscheinlichkeit]] von 0,95 nimmt die [[Stichprobenvarianz]] <math>S^{2}\;</math> Werte im Intervall <math>\left[0,5534\cdot \sigma^{2};1,5766\cdot \sigma^{2}\right]</math> an.
| |
|
| |
| Die Grenzen des Intervalls können nur bestimmt werden, wenn die [[Varianz (stochastisch)|Varianz]] <math>\sigma^{2}</math> der [[Zufallsvariable]]n <math>X = \;</math> "benötigte Zeit für einen bestimmten Arbeitsgang" in der [[Grundgesamtheit]] bekannt ist.
| |
Grundbegriffe
Stichprobenvarianz
Gegeben sei eine Grundgesamtheit mit der Zufallsvariablen
mit
und
.
Aus dieser Grundgesamtheit wird eine Zufallsstichprobe vom Umfang
gezogen.
Der Stichprobenvarianz liegt die Summe der quadrierten Abweichungen der Stichprobenvariablen
vom Mittelwert der Grundgesamtheit zugrunde.
Abhängig von den Informationen, die über den Mittelwert bekannt sind, gibt es unterschiedliche Definitionen der Stichprobenvarianz.
Erwartungswert der Grundgesamtheit bekannt
In diesem Fall ist die Stichprobenvarianz gegeben durch
Erwartungswert der Grundgesamtheit unbekannt
Da der Erwartungswert
der Grundgesamtheit unbekannt ist, muss er durch den Stichprobenmittelwert
ersetzt werden.
Es wird dann im Allgemeinen die Stichprobenvarianz
verwendet.
Analog zur deskriptiven Statistik kann die Stichprobenvarianz auch als
definiert werden.
Verteilung der Stichprobenvarianz
Die Ableitung der Verteilung der Stichprobenvarianzen
und
soll für den Fall einer normalverteilten Grundgesamtheit, d.h.
, und einer einfachen Zufallsstichprobe erfolgen.
Entsprechend dieser Voraussetzungen gilt, dass die Stichprobenvariablen
unabhängig voneinander und ebenfalls normalverteilt mit
und
sind:
für alle
Weiterhin ist der Stichprobenmittelwert
normalverteilt mit
und
:
Verteilung der Stichprobenvarianz bei bekanntem Erwartungswert
Aus der Definition der Stichprobenvarianz
folgt:
und nach Division durch
Mit diesem Ergebnis können folgende Aussagen getroffen werden:
Nun ist bekannt, dass die Summe von
voneinander unabhängigen und identisch standardnormalverteilten Zufallsvariablen Chi-Quadrat-verteilt ist.
Damit ergibt sich:
folgt einer Chi-Quadrat-Verteilung mit dem Parameter
.
Die Verteilung von
lässt sich somit nicht direkt, sondern nur über die transformierte Zufallsvariable
angeben.
Da
und
jedoch Konstanten sind, können auch Wahrscheinlichkeitsaussagen für die Stichprobenfunktion
gemacht werden.
Der Parameter
ist die Anzahl der Freiheitsgrade, die der Anzahl der unabhängigen Summanden, d.h.
der Anzahl der standardisierten Zufallsvariablen
, entspricht.
In diesem Fall ist
, da bei einer einfachen Zufallsstichprobe alle Stichprobenvariablen
unabhängig voneinander sind.
Für Erwartungswert und Varianz von
ergibt sich:
Verteilung der Stichprobenvarianz bei unbekanntem Erwartungswert
Die Ableitung der Verteilung der Stichprobenvarianz
erfolgt in analoger Weise.
Aus der Definition der Stichprobenvarianz
folgt:
und nach Division durch
Da für dieses Ergebnis ebenfalls die obigen Aussagen zutreffen, ergibt sich:
folgt einer Chi-Quadrat-Verteilung mit dem Parameter
.
Auch die Verteilung von
lässt sich nicht direkt, sondern nur über die transformierte Zufallsvariable
angeben.
Mit Hilfe der Verteilung von
kann man aber zu Wahrscheinlichkeitsaussagen über die Stichprobenfunktion
gelangen, da
und
Konstanten sind.
Der Parameter
als Anzahl der Freiheitsgrade ist
. Dies lässt sich wie folgt begründen:
Der Stichprobenmittelwert ist als das arithmetische Mittel aus den Stichprobenvariablen definiert:
.
Damit gilt aber die Nulleigenschaft des arithmetischen Mittels, die besagt, dass die Summe der Abweichungen der Stichprobenvariablen vom Stichprobenmittelwert gleich Null ist:
Aufgrund dieser linearen Beziehung sind die Zufallsvariablen
insgesamt nicht mehr unabhängig.
Nur
Zufallsvariablen sind unabhängig, denn sie können frei variieren.
Die Realisation der
-ten Zufallsvariablen liegt dann fest, um die Beziehung einzuhalten.
An dieser Eigenschaft ändert die Quadrierung und die Division durch
nichts, so dass für
die Anzahl der unabhängigen Summanden und damit die Anzahl der Freiheitsgrade
ist.
Für Erwartungswert und Varianz von
ergibt sich:
Zusatzinformationen
Zentrale Schwankungsintervalle
Bei bekannter Varianz
einer normalverteilten Grundgesamtheit lässt sich die
Wahrscheinlichkeit berechnen, dass die Stichprobenvarianz
Werte in einem zentralen Schwankungsintervall mit der Sicherheitswahrscheinlichkeit
annimmt.
Es ist
Die Wahrscheinlichkeit, dass
nach unten bzw. nach oben aus dem Intervall herausfällt, beträgt:
Für
findet man die Grenzen des Intervalls aus der Tabelle der Verteilungsfunktion der Chi-Quadrat-Verteilung als
Damit wird
Durch Umformung ergibt sich ein zentrales Schwankungsintervall für
:
Unter Berücksichtigung von
kann mit gleichen Überlegungen das zentrale Schwankungsintervall
für
bestimmt werden:
Herleitung des Erwartungswertes der Stichprobenvarianz
Bei bekanntem Erwartungswert der Grundgesamtheit
Bei bekanntem Erwartungswert der Grundgesamtheit
ist die Stichprobenvarianz gegeben durch
Für den Erwartungswert von
ergibt sich:
|
|
|
|
|
|
Dabei wurde die Tatsache berücksichtigt, dass alle Stichprobenvariablen
die Varianz
haben.
Bei unbekanntem Erwartungswert der Grundgesamtheit
Bei unbekanntem Erwartungswert der Grundgesamtheit
ist die Stichprobenvarianz gegeben durch
Zunächst einige Zwischenbetrachtungen. Grundsätzlich lässt sich die Varianz einer Zufallsvariablen
wie folgt
schreiben:
|
|
|
|
|
|
Daraus folgt:
Dieses Ergebnis wird auf die Stichprobenvariablen
und den Stichprobenmittelwert
angewandt:
|
|
|
|
Weiterhin ist unter Berücksichtigung dieser Resultate:
|
|
|
|
|
|
|
|
|
|
Somit erhält man für den Erwartungswert der Stichprobenvarianz
:
Herleitung der Varianz der Stichprobenvarianz
Bei bekanntem Erwartungswert in der Grundgesamtheit
Bei bekanntem Erwartungswert der Grundgesamtheit
ist die Stichprobenvarianz gegeben durch
Die Varianz einer Chi-Quadrat-verteilten Zufallsvariable mit dem Parameter
ist
.
Da
einer Chi-Quadrat-Verteilung mit dem Parameter
folgt, ergibt sich:
und damit
Bei unbekanntem Erwartungswert in der Grundgesamtheit
Bei unbekanntem Erwartungswert der Grundgesamtheit
ist die Stichprobenvarianz gegeben durch
Da
einer Chi-Quadrat-Verteilung mit dem Parameter
folgt, ergibt
sich:
und damit
Analog zur deskriptiven Statistik kann die Stichprobenvarianz auch als
definiert werden.
Zur Herleitung des Erwartungswertes
werden alle vorherigen Zwischenergebnisse verwendet, so dass folgt:
Der Erwartungswert dieser Stichprobenvarianz
ist nicht gleich der Varianz der Grundgesamtheit.
Dies ist der Grund dafür, dass sie in der induktiven Statistik weniger Anwendung findet.