Gauß-Test: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
{{Testtheorie}}
{{Testtheorie}}
{{SubpageToc|Beispiele}}


==Grundbegriffe==
==Grundbegriffe==
Zeile 183: Zeile 184:


Analoge Umrechnungen lassen sich für die [[Einseitiger Test|einseitigen Tests]] vornehmen.
Analoge Umrechnungen lassen sich für die [[Einseitiger Test|einseitigen Tests]] vornehmen.
=={{Vorlage:Beispiele}}==
===Problematik der Hypothesenformulierung===
Ein Beispiel soll die Problematik der Wahl von [[Nullhypothese|Null-]] und [[Alternativhypothese]] verdeutlichen.
Ein Unternehmen stellt Autoreifen her. Zur Erhöhung der Lebensdauer eines bestimmten Typs von Autoreifen wurden Materialänderungen vorgenommen.
Die Konkurrenz behauptet nun, dass durch die Materialänderung keine Erhöhung gegenüber der ursprünglichen mittleren Lebensdauer dieses
Reifentyps von 38000 km erreicht wurde.
Der Reifenhersteller lässt deshalb eine Prüfung vornehmen, womit ein [[statistischer Test]] verbunden ist.
Die [[Zufallsvariable]] <math>X\;</math> ist die Lebensdauer des betrachteten Reifentyps.
Vor der Materialänderung betrug die mittlere Lebensdauer des Reifentyps <math>E[X] = \mu_{0} = 38000</math> km. Nach der Materialänderung ist <math>\mu</math> unbekannt, soll jedoch gemäß der Behauptung des Reifenherstellers größer als <math>\mu_{0}</math> sein, d.h. <math>\mu > \mu_{0} = 38000 </math> km.
Wie soll der [[Statistischer Test|statistische Test]] formuliert werden?
* Zunächst ist eindeutig, dass ein [[zweiseitiger Test]] nicht in Frage kommt, da aufgrund der Behauptung des Reifenherstellers nur die Abweichungen in eine Richtung relevant sind. Es ist noch zwischen [[Rechtsseitiger Test|rechts-]] und [[Linksseitiger Test|linksseitigem Test]] zu wählen.
: Die Intention des Reifenherstellers ist, seine Behauptung "statistisch möglichst gesichert zu beweisen". Dabei will er das Risiko einer Fehlentscheidung möglichst klein halten.
: Daraus folgt, dass die Behauptung des Reifenherstellers als [[Alternativhypothese]] zu formulieren ist, woraus sich ein [[rechtsseitiger Test]] ergibt:
: <math>H_{0}:\mu \leq \mu_{0}\quad (= 38000 \mbox{ km})</math>
: <math>H_{1}:\mu > \mu_{0}\quad (= 38000 \mbox{ km})</math>
* Wird im Ergebnis des [[Statistischer Test|Tests]] auf der Basis einer [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> die [[Nullhypothese]] abgelehnt <math>(\mbox{''}H_{1}\mbox{''})</math>, so besteht die Möglichkeit, einen [[Fehler 1. Art]] zu begehen, d.h. die <math>H_{0}</math> abzulehnen, obwohl sie wahr ist.
: Der sich aus der Problemstellung ergebende Inhalt des [[Fehler 1. Art|Fehlers 1. Art]] ist:
: <math>\mbox{''}H_{1}\mbox{''}|H_{0}=</math> "Die Lebensdauer hat sich durch die Materialänderung erhöht" | In Wirklichkeit hat sich die Lebensdauer nicht erhöht.
* Wird im Ergebnis des [[Statistischer Test|Tests]] die [[Nullhypothese]] nicht abgelehnt <math>(\mbox{''}H_{0}\mbox{''})</math>, so bedeutet das nicht, dass sie richtig ist, sondern lediglich, dass das [[Stichprobe]]nergebnis ihr nicht widerspricht.
: Man kann einen [[Fehler 2. Art]] begehen, d.h. die <math>H_{0}</math> beizubehalten, obwohl sie falsch ist. Der Inhalt des [[Fehler 2. Art|Fehlers 2. Art]] ist:
: <math>\mbox{''}H_{0}\mbox{''}|H_{1} =</math> "Die Lebensdauer hat sich nicht erhöht" | In Wirklichkeit hat sich die Lebensdauer durch die Materialänderung erhöht.
Ein Vergleich der beiden Fehler zeigt, dass der [[Fehler 1. Art]] für den Reifenhersteller der schwerwiegendere Fehler ist, denn
* die Konkurrenz schläft nicht und würde für diesen Reifentyp ebenfalls Prüfungen vornehmen (die Konkurrenz würde jedoch einen [[Linksseitiger Test|linksseitigen Test]] verwenden).
* die dauerhafte Verwendung des veränderten Reifens würde bald zeigen, dass die Lebensdauer durch die Materialänderung tatsächlich nicht größer wurde, was dem Ansehen des Reifenherstellers bei seinen Kunden erheblichen Schaden zufügen würde.
Das Risiko, d.h. die [[Wahrscheinlichkeit]] <math>P\left(\mbox{''}H_{1}\mbox{''}|H_{0}\right)</math> für diesen [[Fehler 1. Art]], muss der Reifenhersteller deshalb klein halten, was durch die Vorgabe des [[Signifikanzniveau]]s <math>\alpha</math> (z.B. <math>\alpha = 0,05</math>) erreicht werden kann.
===Mehl===
In einem Unternehmen wird Mehl maschinell in Tüten abgefüllt. Das Sollgewicht beträgt 1000 g, auf das die Maschine justiert wurde.
Das Ist-Gewicht der Mehltüten weist gewisse Schwankungen auf, die im Produktionsprozess nicht vermieden werden können.
Damit ist das Ist-Gewicht eine [[Zufallsvariable]]: <math>X =\;</math>"Ist-Gewicht der Mehltüten".
Der [[Erwartungswert]] des Ist-Gewichts <math>E[X] = \mu</math>, mit dem die Maschine derzeit arbeitet, ist unbekannt. Er soll jedoch dem Sollgewicht entsprechen, d.h. <math>E[X] = \mu_{0} = 1000 \mbox{g}</math>.
Die Konsequenz ist, dass nach einer gewissen Laufzeit der Maschine überprüft werden muss, ob die ursprüngliche Justierung der Maschine noch eingehalten wird oder ob schon erhebliche Abweichungen auftreten.
Dazu wird in gewissen Abständen eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n</math> aus der Produktion entnommen, für die [[Stichprobe]] das durchschnittliche Ist-Gewicht ermittelt und das Ergebnis mit dem Sollwert verglichen.
Bei
erheblichen (signifikanten) Abweichungen muss eine neue Justierung der Maschine vorgenommen
werden.
Aus der Sicht des Unternehmers sind Abweichungen nach beiden Seiten vom Sollwert <math>\mu_{0}= 1000\mbox{g}</math> relevant.
Wird im Mittel zu wenig abgefüllt, würde dieser Umstand über kurz oder lang bei Überprüfungen (z.B. durch Verbraucherorganisationen) bekannt und der Reputation des Unternehmens erheblichen Schaden zufügen.
Wird im Mittel zu viel abgefüllt, schmälert dies den Gewinn des Unternehmers. Es ist somit ein [[zweiseitiger Test]] durchzuführen:
<math>H_{0}:\mu =1000\quad H_{1}:\mu \neq 1000</math>
Der [[Statistischer Test|Test]] soll auf einem [[Signifikanzniveau]] von <math>\alpha = 0,05</math> durchgeführt werden.
Es wird eine [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> gezogen. Aufgrund des großen [[Umfang der Grundgesamtheit|Umfangs der Grundgesamtheit]] (Gesamtproduktion) kann dabei von einer [[Einfache Zufallsstichprobe|einfachen Zufallsstichprobe]] ausgegangen werden.
====Teststatistik und Entscheidungsbereiche====
Als [[Schätzfunktion]] für den unbekannten [[Erwartungswert der Grundgesamtheit|Erwartungswert <math>E[X] = \mu</math> der Grundgesamtheit]] wird der [[Stichprobenmittelwert]] <math>\bar{X}</math> verwendet.
Es sei aufgrund der langjährigen Nutzung der Maschine bekannt, dass das Ist-Gewicht eine [[Normalverteilung|normalverteilte]] [[Zufallsvariable]] mit der [[Standardabweichung (stochastisch)|Standardabweichung]] <math>\sigma = 10\mbox{g}</math> ist.
Dann folgt für die [[Schätzfunktion]] <math>\bar{X}</math>, dass sie ebenfalls [[Normalverteilung|normalverteilt]] ist und eine [[Standardabweichung (stochastisch)|Standardabweichung]] von <math>\sigma\left(\bar{X}\right) = 2\mbox{g}</math> aufweist.
Bei Gültigkeit der [[Nullhypothese]], d.h. wenn die Maschine im Mittel tatsächlich das Sollgewicht von 1000 g einhält, gilt:
<math>\bar{X}\mbox{ ist unter } H_{0}\sim N(1000;\;2)</math>.
Für die [[Teststatistik]]
<math>V=\frac{\bar{X}-\mu_{0}}{\sigma}\cdot\sqrt{n}</math>
folgt:
<math>V \mbox{ ist unter }H_{0}\sim N(0;\;1)</math>.
Aus der Tabelle der [[Verteilungsfunktion (stochastisch, eindimensional)|Verteilungsfunktion]] der [[Standardnormalverteilung]] findet man für <math>P(V \leq c_{o})=1-\frac{\alpha}{2} = 0,975</math> den oberen [[Kritischer Wert|kritischen Wert]] <math>c_{o} = z_{0,975}= 1,96</math>.
Wegen der Symmetrie der [[Normalverteilung]] gilt <math>c_{u}=-z_{1-\frac{\alpha}{2}}=-1,96</math>.
Damit ergeben sich die [[Entscheidungsbereiche]] des [[Statistischer Test|Tests]] zu:
[[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]]<math>:\;\left\{v|-1,96\leq v\leq 1,96\right\}</math>
[[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]<math>:\;\left\{v|v<-1,96 \mbox{ oder }v>1,96\right\}</math>
<iframe k="wiwi" p="examples/stat_Gauß-Test_Gauß-Test_R00480004800000000000000_plot.html" />
[[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]|[[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]]|[[Ablehnungsbereich der Nullhypothese|Ablehnungsbereich der <math>H_{0}</math>]]
====Prüfwert====
Es werden nunmehr die 25 Mehltüten zufällig ausgewählt, ihr Ist-Gewicht festgestellt und das [[Arithmetisches Mittel|arithmetische Mittel]] dieser Gewichte berechnet, für das sich <math>\bar{x} = 996,4 \mbox{ g}</math>  ergeben habe.
Als [[Prüfwert]] erhält man
<math>v=\frac{996,4-1000}{2}=-1,8</math>
====Entscheidungssituationen====
Da <math>v = - 1,8 </math> in den [[Nichtablehnungsbereich der Nullhypothese|Nichtablehnungsbereich der <math>H_{0}</math>]] fällt, wird die [[Nullhypothese]] nicht abgelehnt.
Basierend auf der [[Zufallsstichprobe]] vom [[Stichprobenumfang|Umfang]] <math>n = 25</math> konnte statistisch nicht gezeigt werden, dass der wahre [[Erwartungswert der Grundgesamtheit|Erwartungswert <math>E[X] = \mu</math> in der Grundgesamtheit]] verschieden vom hypothetischen Wert <math>\mu_{0} = 1000\mbox{g}</math> ist, d.h. dass die Maschine den Sollwert von 1000 g nicht einhält.

Aktuelle Version vom 22. November 2018, 15:41 Uhr

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Grundbegriffe

Gauß-Test

Der Gauß-Test ist ein Test auf Mittelwert, wobei die Standardabweichung des Stichprobenmittelwertes als bekannt vorrausgesetzt wird.

Im Folgenden gelten alle Voraussetzungen wie unter "Test auf Mittelwert" diskutiert.

Teststatistik des Gauß-Tests

Bei bekanntem ist die Normalverteilung von vollständig spezifiziert, liegt jedoch für und nicht tabelliert vor.

Es wird deshalb standardisiert und

als Teststatistik verwendet.

Bei Gültigkeit der Nullhypothese ist (zumindest approximativ) standardnormalverteilt:

Für das vorgegebene Signifikanzniveau können die kritischen Werte aus der Tabelle der Standardnormalverteilung entnommen werden.

Entscheidungsbereiche des Gauß-Tests

Für die einzelnen Testmöglichkeiten erhält man die nachstehenden Entscheidungsbereiche bei Gültigkeit der Nullhypothese und vorgegebenem Signifikanzniveau .

Zweiseitiger Test

Die Wahrscheinlichkeit, eine Realisation der Teststatistik aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau :

.

Für findet man den oberen kritischen Wert aus der Tabelle der Verteilungsfunktion der .

Wegen der Symmetrie der Normalverteilung gilt .

Der Ablehnungsbereich der ist gegeben durch

.

Für den Nichtablehnungsbereich der erhält man:

.

Die Wahrscheinlichkeit, dass die Teststatistik eine Realisation aus dem Nichtablehnungsbereich der annimmt, ist

Rechtsseitiger Test

Bei Gültigkeit der Nullhypothese ist und damit .

Zu große Abweichungen nach rechts von sprechen gegen , so dass der Ablehnungsbereich der im positiven Bereich von liegt.

Die Wahrscheinlichkeit, eine Realisation der Teststatistik aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau :

.

Für findet man den kritischen Wert aus der Tabelle der Verteilungsfunktion der .

Der Ablehnungsbereich der ist gegeben durch

.

Für den Nichtablehnungsbereich der erhält man:

.

Die Wahrscheinlichkeit, dass die Teststatistik eine Realisation aus dem Nichtablehnungsbereich der annimmt, ist

Linksseitiger Test

Zu große Abweichungen nach links von sprechen gegen , so dass der Ablehnungsbereich der im negativen Bereich von liegt und der kritische Wert negativ ist .

Die Wahrscheinlichkeit, eine Realisation der Teststatistik aus dem Ablehnungsbereich der zu erhalten, entspricht dem vorgegebenen Signifikanzniveau :

Wegen der Symmetrie der Normalverteilung findet man für den Wert aus der Tabelle der Verteilungsfunktion der , so dass der kritische Wert ist.

Der Ablehnungsbereich der ist gegeben durch

,

Für den Nichtablehnungsbereich der erhält man:

.

Die Wahrscheinlichkeit, dass die Teststatistik eine Realisation aus dem Nichtablehnungsbereich der annimmt, ist

.

Prüfwert des Gauß-Tests

Wenn die Zufallsstichprobe vom Umfang gezogen wurde, liegen die konkreten Stichprobenwerte vor und der Schätzwert für den Stichprobenmittelwert kann berechnet werden:

Einsetzen in die Teststatistik führt zu einem Prüfwert:

Entscheidungssituationen des Gauß-Tests

Es konnte statistisch gezeigt werden, dass der wahre Erwartungswert in der Grundgesamtheit nicht gleich dem hypothetischen Wert ist.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 1. Art zu begehen, wenn in Wirklichkeit die Nullhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 1. Art entspricht dem vorgegebenen Signifikanzniveau .
Das Stichprobenergebnis gibt keine Veranlassung, zu verwerfen:
Es konnte statistisch nicht gezeigt werden, dass der wahre Erwartungswert in der Grundgesamtheit vom hypothetischen Wert abweicht.
Bei dieser Entscheidung besteht die Möglichkeit, einen Fehler 2. Art zu begehen, wenn in Wirklichkeit die Alternativhypothese richtig ist.
Die Wahrscheinlichkeit für einen Fehler 2. Art ist im Allgemeinen nicht bekannt und kann nur für konkrete Alternativwerte berechnet werden.

Zusatzinformationen

Länge der Entscheidungsbereiche

Sowohl für den zweiseitigen als auch für die einseitigen Tests auf hängt die Länge der Entscheidungsbereiche ab:

Je größer , desto größer ist unter sonst gleichen Bedingungen der Ablehnungsbereich der und um so kleiner ist der Nichtablehnungsbereich der , und umgekehrt.
Je größer , desto größer ist unter sonst gleichen Bedingungen der Ablehnungsbereich der und um so kleiner ist der Nichtablehnungsbereich der , und umgekehrt.
Je größer bzw. , desto größer ist unter sonst gleichen Bedingungen der Ablehnungsbereich der und um so kleiner ist der Nichtablehnungsbereich der , und umgekehrt.

Entscheidungsbereiche für die Schätzfunktion

Die kritischen Werte und damit der Ablehnungs- und Nichtablehnungsbereich der Nullhypothese können bei bekanntem auch für die Schätzfunktion angegeben werden, was durch einfache Umformungen erreicht wird. Dies wird für den zweiseitigen Test gezeigt.

Die Teststatistik ergab sich als standardisierte Version der Schätzfunktion :

und damit jede mögliche Realisation von gemäß

Beim zweiseitigen Test besteht der Nichtablehnungsbereich der aus allen Realisationen der Teststatistik , die größer oder gleich jedoch kleiner oder gleich sind:

Aus dieser Formulierung ist ersichtlich, dass die beiden kritischen Werte und mögliche Realisationen der Teststatistik sind.

Für sie gilt ebenfalls die für die Teststatistik vorgenommene Standardisierung:

Da der untere kritische Wert bezüglich ist, wurde mit der untere kritische Wert bezüglich gekennzeichnet. Entsprechendes gilt für den oberen kritischen Wert.

Durch Umformung erhält man:

Damit ergibt sich für den Nichtablehnungsbereich der

und für den Ablehnungsbereich der

Analoge Umrechnungen lassen sich für die einseitigen Tests vornehmen.