Testtheorie/Lösungen

Aus MM*Stat

Wechseln zu: Navigation, Suche

1000g–Portionen





d.h. ist das Quantil der

Anzahl der Kinder

Unter gilt:





– beobachtete absolute Häufigkeit – unter erwartete absolute Häufigkeit
für alle und für mindestens 80% der erwarteten Häufigkeiten erfüllt.


16 25 81 3,24
60 75 225 3,00
92 75 17 289 3,853333
32 25 7 49 1,96

(kein Parameter war zu schätzen)
aus Tabelle der Chi–Quadrat–Verteilung für :

signifikant zum 1%–Niveau

Arbeitsproduktivität

: “Arbeitsproduktivität”,Verteilung unbekannt, Stück/Stunde
: “Durchschnittliche Arbeitsproduktivität bei einer einfachen Zufallsstichprobe vom Umfang ist approximativ (Begründung: Zentraler Grenzwertsatz, );

Ausfallsicherheit


Betriebszeit eines Servers:
maximale mittlere Ausfallzeit lt. Hersteller: 1% von Stunden
Der Hersteller will seine Behauptung statistisch untermauern, wobei er das Risiko einer Fehlentscheidung möglichst klein halten will. Da nur Abweichungen von nach einer Seite von Bedeutung sind, wird ein einseitiger Test durchgeführt. Die Behauptung des Herstellers wird als Alternativhypothese formuliert, womit ein linksseitiger Test resultiert
Stunden Stunden
Die Wahrscheinlichkeit eines Fehlers 1. Art ist das Signifikanzniveau , mit dessen Vorgabe das Risiko eines derartigen Fehlers gering gehalten werden kann. Damit wird die Zielstellung des Herstellers bei der Durchführung des Tests eingehalten. Da der Grundgesamtheit unbekannt ist, folgt die Teststatistik unter einer t–Verteilung mit Freiheitsgraden. Kritischer Wert: Da ist und damit in den Nichtablehnungsbereich von fällt, besteht keine Veranlassung abzulehnen.

Ausgaben für Urlaubsreisen

Auswahlsatz Endlichkeitskorrektur kann vernachlässigt werden; der Grundgesamtheit unbekannt;;
hypothetischer Wert der Gesamtausgaben:
Teststatistik:Wert der Teststatistik für die Stichprobe:

Batterien Lebensdauer

  • –Anpassungstest
  • : Die Stichprobenverteilung der Lebensdauer der Batterien ist normalverteilt

: Die Stichprobenverteilung der Lebensdauer der Batterien ist nicht normalverteilt

  • X: Lebensdauer einer Batterie ist unter –verteilt mit Freiheitsgraden, wenn für alle gilt (I – Anzahl der Klassen, k – Anzahl der zu schätzenden Parameter)
Klassen
1 -300 10 160 1600 0.16 16
2 300-340 10 320 3200 0.12 12
3 340-460 60 400 24000 0.45 45
4 460- 20 560 11200 0.27 27
100 40000
Klassen
1 -300 -6 36 2.25
2 300-340 -2 4 0.33
3 340-460 15 225 5.00
4 460 -7 49 1.82

Approximationsbedingung erfüllt; ;
Nicht–Ablehnungsbereich:
Ablehnungsbereich:

  • " "

Auf einem Signifikanzniveau von 1% und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch bewiesen werden, dass es sich bei der Stichprobenverteilung der Lebensdauer der Batterien nicht um eine Normalverteilung handelt.

  • Weiß man nicht; wir hoffen nicht!

Benzinverbrauch Test

zweiseitiger Test, da Abweichungen von der Behauptung, also nach beiden Seiten; unbekannt;



Chininhaltige Limonade

  • ,

= “Es wird importiert” Kunden werden krank

  • : “Anzahl der Flaschen, die den Vorschriften nicht entsprechen, bei einer Zufallsstichprobe vom Umfang
  • ist unter –verteilt
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Ablehnungsbereich
  • Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass der Anteil der Flaschen, die den Vorschriften nicht entsprechen, kleiner als 10% ist, d.h. der Großhändler sucht sich einen neuen Importeur.
  • ; ;

Dicke der Fahrbahndecke


Der Bauunternehmer muss nachweisen, dass die Fahrbahndecke zu dünn ist, da er nur dann Abzüge hinnehmen muss.
Risikobetrachtung:
||Fahrbahndecke o.k., müsste keine Abzüge hinnehmen
Dies ist für den Bauunternehmer das größere Risiko, das gleich dem Fehler 1. Art ist, für den die Wahrscheinlichkeit mit vorgegeben ist.

Durchmesser von Wellen

  • Ablehnungsbereich:
  • Nicht–Ablehnungsbereich
  • Fehler 2. Art
  • Ablehnungsbereich
  • Fehler 1. Art

Durchschnittsgewicht

: “Gewicht des i-ten Hähnchens”; ;

  • ,

= “Angebot zurückweisen” gutes Geschäft vermasselt

  • : “Durchschnittliches Gewicht eines Hähnchens bei einer Zufallsstichprobe vom Umfang
  • ist unter –verteilt
  • ist unter t–verteilt mit Freiheitsgraden
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Ablehnungsbereich
  • Fehler 2. Art
  • Ablehnungsbereich
  • Fehler 1. Art

Fachgebiete

Anwendung des Chi-Quadrat-Anpassungstests zur Prüfung der Hypothese, ob die von Bärbel beobachtete Verteilung () mit der theoretisch erwarteten Verteilung (Gerdas Behauptung: ) übereinstimmt. Beide Approximationsbedingungen sind erfüllt.
Prüfwert:

FKK

Anwendung des –Unabhängigkeitstests, weil die Beziehung zwischen zwei nominalskalierten Zufallsvariablen zu prüfen ist.
: Neigung zu FKK; : Region
: X und Y sind unabhängig; : X und Y sind nicht unabhängig


XY alt neu
für 20 (26,7) 20 (13,3) 40
gegen 80 (73,3) 30 (36,7) 110
100 50 150

(in Klammern die erwarteten )
ist unter approximativ –verteilt mit Freiheitsgrad.

Ablehnungsbereich der :{}

Ablehnungsbereich
Auf einem Signifikanzniveau von 1% und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch bewiesen werden, dass die Neigung zu FKK von der Region der Befragten abhängig ist.

Gewinnspiel–Automat

, ,
,
,

asymptotisch

daher für



Grönländische Bohrlochkerne

Gegeben: C;C;C (diese Stichprobenergebnisse werden nicht benötigt);C
Da die Forscher nachweisen wollen, dass eine Erwärmung des Eises stattgefunden hat wird ein rechtsseitiger Test durchgeführt:
C) gegen C). Daher .
Es ist der Wert der Gütefunktion C) zu berechnen, denn

  • die Gütefunktion gibt die Wahrscheinlichkeit der Ablehnung von in Abhängigkeit vom Parameter an:
  • für alle zulässigen Werte von gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung der Nullhypothese wird eine richtige Entscheidung getroffen; das ist hier wegen CC gegeben;
  • es ist .

Kaffee Packungen 2

Grundgesamtheit: , Verteilung von unbekannt, , Grundgesamtheit kann als sehr groß angesehen werden, mittleres Füllgewicht unbekannt
hypothetischer Wert:
einfache Zufallsstichprobe: , Stichprobenvariablen sind i.i.d.
linksseitiger Test auf und
Teststatistik : aus Tabelle der Verteilungsfunktion , da aufgrund des großen Stichprobenumfangs und des ZGS die Verteilung von approximativ normalverteilt ist; kritischer Wert: (wegen Symmetrie der Normalverteilung)


Ablehnungsbereich der :
Nichtablehnungsbereich der :


Fehler 2. Art: fälschliche Beibehaltung der , d.h. “; ”|
Inhalt der Gütefunktion:

Es ist (wahr) ; es gilt in Wirklichkeit die Alternativhypothese und mit der Ablehnung von wird eine richtige Entscheidung getroffen. Es ist
Berechnung der Gütefunktion:

Kaffee Packungen

  • g g
    | Abfüllmenge o.k.|ärger mit dem Kunden
    klein halten

  • : Durchschnittliche Füllmenge einer Kaffeepackung in einer einfachen Zufallsstichprobe vom Umfang

    : Füllmenge der i–ten Kaffeepackung;
    für alle i, unabhängig
    ist unter –verteilt.

  • ist unter –verteilt.

  • für aus Tabelle der

    Ablehnungsbereich:
    Nicht–Ablehnungsbereich:
  • Ablehnungsbereiches

  • Auf einem Signifikanzniveau von und basierend auf einem Stichprobenumfang von konnte statistisch bewiesen werden, dass die wahre durchschnittliche Füllmenge einer Packung bei der neuen Kaffeebohnensorte der Norm entspricht.

  • Die Wahrscheinlichkeit für einen Fehler 2. Art ist 93,32%, wenn in Wahrheit die mittlere Abfüllmenge g beträgt.

  • Die Wahrscheinlichkeit für einen Fehler 1. Art (unberechtigte Annahme der ) beträgt , wenn das wahre ist. Die Wahrscheinlichkeit für die berechtigte Annahme der , wenn das wahre ist, beträgt 15,8655%.

Lagerhaltungsprobleme


Chi-Quadrat-Anpassungstest bei Wahl der hypothetischen Verteilung Poisson-Verteilung. Der Parameter ist unbekannt und muss aus der Stichprobe geschätzt werden: . Aus der Tabelle der Verteilungsfunktion der Poisson–Verteilung PO(2,0) lassen sich die unter gültigen Wahrscheinlichkeiten ermitteln. (5. Spalte der folgenden Tabelle). Für alle Klassen ist die Voraussetzung erfüllt. Die Anzahl der Freiheitsgrade des Chi–Quadrat–Anpassungstests beträgt mit der Anzahl der Klassen und der Anzahl der aus der Stichprobe zu schätzenden Parameter. Damit resultiert: .


1 0 17 0 0,1353 13,53
2 1 20 20 0,2707 27,07
3 2 27 54 0,2707 27,07
4 3 18 54 0,1804 18,04
5 4 18 72 0,0902 9,02
6 5 und mehr 0 0 0,0527 5,27
100 200 1,0000 100

Aus der Tabelle der Verteilungsfunktion der Chi–Quadrat–Verteilung findet man:

Mietpreisbindung

  • –Anpassungstest

  • : “Mietpreissteigerung [in %]”
    : Stichprobenverteilung folgt einer Gleichverteilung in
    : Stichprobenverteilung folgt nicht einer Gleichverteilung in
    [%]; [%] [%]

  • ist unter approximativ ( für alle ) –verteilt mit Freiheitsgraden

  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:

  • 1 0-1 0 0,2 20 -20 400 20
    2 1-2 0 0,2 20 -20 400 20
    3 2-3 10 0,2 20 -10 100 5
    4 3-4 10 0,2 20 -10 100 5
    5 4-5 40 0,2 20 20 60 3600 180
    6 5- 40 0 0

    Ablehnungsbereich

  • Auf einem Signifikanzniveau von 0,5% und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch bewiesen werden, dass die Stichprobenverteilung keiner Gleichverteilung im Bereich folgt.

Münzen

: Stichprobenverteilung stimmt mit der vermuteten Verteilung überein

: Stichprobenverteilung stimmt nicht mit der vermuteten Verteilung überein

8 mögliche Ereignisse: ; ; ; ; ; ; ;


1 0 24 1/8 30 -6 36 1,2
2 1 108 3/8 90 18 324 3,6
3 2 85 3/8 90 -5 25 0,277
4 3 23 1/8 30 -7 49 1,633

Ablehnungsbereich: , Nicht–Ablehnungsbereich:
Ablehnungsbereich

Neues Präparat


|Einführung des Präparates|Hersteller lügt; Krankenkassen zahlen, obwohl Heilungsquote minimal

  • Anzahl der Patienten, bei denen Heilerfolg eintritt, bei einer Zufallsstichprobe vom Umfang


  • V ist unter
  • Nicht-Ablehnungsbereich: ; Ablehnungsbereich:

  • *#

Die Wahrscheinlichkeit für einen Fehler 2. Art (unberechtigte Annahme von ) beträgt 91,65%, wenn die wahre Heilungsquote 50% beträgt.

    1. 2.

Die Wahrscheinlichkeit für eine berechtigte Annahme der beträgt 1,16%, wenn die wahre Heilungsquote 40% beträgt.

Paketversandfirma

V ist unter approximativ
; ;
Ablehnungsbereich der
; ;
Ablehnungsbereich
Auf einem Signifikanzniveau von und basierend auf einer Stichprobe vom Umfang konnte statistisch gezeigt werden, dass mehr als 90% der Pakete den Empfänger innerhalb einer Woche erreichen. Das Unternehmen beauftragt die Versandfirma mit dem Versand ihrer Pakete.

Phosphatgehalt der Waschmittel (Gütefunktion)

Der Verlauf der Gütefunktion ist nicht abhängig vom Stichprobenergebnis, aber abhängig vom Stichprobenumfang.

Phosphatgehalt der Waschmittel

: “Phosphatgehalt des i-ten Paketes”;

ist beliebig verteilt mit ; g

  • ,

= “Phosphatgehalt zu hoch” Phosphatgehalt stimmt; dies ist aus Sicht des Fabrikanten die schlimmere Fehlentscheidung.

  • : “Durchschnittlicher Phosphatgehalt eines Paketes bei einer Zufallsstichprobe vom Umfang

ist unter approximativ –verteilt wegen Zentralem Grenzwertsatz,

  • ist unter approximativ –verteilt
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Nicht–Ablehnungsbereich
  • Es konnte statistisch bewiesen werden, dass der Richtwert überschritten wird. Die Firma spricht aber von einem statistischen Beweis, dass der Richtwert eingehalten wird (der !). ist sehr klein! Kommt bei dieser Hypothesenformulierung nur der Firma zugute, d.h. nur bei einem ganz extrem großen Stichprobenwert von muss die Firma das Produkt vom Markt nehmen ().
  • Wenn der wahre Wert des mittleren Phosphatgehalts 21,09g ist, würden 50% der Stichproben einen Mittelwert unter 21,09g und der Rest einen Mittelwert über 21,09g ergeben. Bei nimmt der Prüfwert den Wert an, was genau der Grenze des Ablehnungsbereiches entspricht. Im Fall von 50% der möglichen Stichproben bekommt man also einen Prüfwert, der nicht zum Ablehnungsbereich gehört.

Schlampiges Gepäck-Handling

1 0 460 0,449 449 11 121 0,269
2 1 350 0,360 360 -10 100 0,278
3 2 135 0,144 144 -9 81 0,563
4 3 40 0,038 38 2 4 0,105
5 4 15 0,008 8 7 49 5,125
6 4 0 0,001 1 -1 1 1
  • : Stichprobenverteilung des Gepäckverlustes entspricht einer Poisson-Verteilung,

: Stichprobenverteilung des Gepäckverlustes entspricht nicht einer Poisson-Verteilung

  • ist unter approximativ ( für alle , für der ) –verteilt mit Freiheitsgraden
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • siehe obige Tabelle Ablehnungsbereich
  • läßt sich statistisch nicht beweisen! Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte lediglich statistisch bewiesen werden, dass es sich um eine Poisson-Verteilung handelt.

Schwergewichtsboxer

  • , das will er beweisen
  • : “Anzahl der von J.Knockout gewonnenen Kämpfe bei einer Zufallsstichprobe vom Umfang
  • ist unter –verteilt
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Ablehnungsbereich
  • Fehler 2. Art
  • Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang Kämpfen konnte statistisch nicht gezeigt werden, dass J. Knockout der bessere Boxer ist.

Skirennen (Gütefunktion)

  • ; ;
  • Die Skizze ist in den Lösungen nicht enthalten.

Skirennen

  • ,

= “Hang bleibt wie gesteckt” Krankenhaus überfüllt

  • : “Anzahl der Gäste, die ausscheiden, bei einer Zufallsstichprobe vom Umfang

ist unter –verteilt

  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Ablehnungsbereich
  • Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass die Ausfallquote kleiner als 10% ist.

Sollwerte

  • ,

    : “Füllgewicht der i-ten Konserve”; ;

    : “Durchschnittliches Füllgewicht einer Konserve bei einer Zufallsstichprobe vom Umfang

    ist unter –verteilt unbekannt, aber Verwendung der Normalverteilung ist unter approximativ –verteilt

    Ablehnungsbereich: , Nicht–Ablehnungsbereich:
    Ablehnungsbereich ; Produktionsprozeß stoppen.

  • , (das will Abnehmer beweisen!)

Spezialgefrierschränke (Gütefunktion)

  • **
  • Die Skizze ist in den Lösungen nicht enthalten.

Spezialgefrierschränke

  • C, C

“Kunden zufrieden?” Ruin

  • : “Durchschnittliche Temperatur eines Spezialgefrierschrankes bei einer Zufallsstichprobe : “Temperatur des –ten Spezialgefrierschrankes”; ; ist unter –verteilt
  • ist unter -verteilt
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • ** Ablehnungsbereich
    • Auf einem Signifikanzniveau von 2,275% und basierend auf einer Zufallsstichprobe vom Umfang n = 100 konnte statistisch bewiesen werden, dass die durchschnittliche Temperatur der Geräte unter -25C liegt. Somit keine Produktionsveränderung notwendig.
  • ** Ablehnungsbereich
    • Auf einem Signifikanzniveau von 2,275% und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass die durchschnittliche Temperatur der Geräte unter -25C liegt. Somit Produktionsveränderung notwendig.
    • Fehler 2. Art
    • Frage kann nicht beantwortet werden; Fehler ist unterlaufen oder nicht.
  • ist an der Nahtstelle der Hypothesen stets am größten

Testfunktion

Für den Ablehnungsbereich gilt .
Für jedes ist , d.h. das vorgegebene Signifikanzniveau wird nicht eingehalten.
Oder: ; ,


für , ; für , .


für , .

Torerfolge

: “Torerfolge pro Spiel”


1 0 18 0,0334 10 8 64 6,40
2 1 24 0,1134 34 -10 100 2,94
3 2 56 0,1929 58 -2 4 0,07
4 3 63 0,2187 66 -3 9 0,14
5 4 61 0,1858 56 5 25 0,45
6 5 39 0,1263 38 1 1 0,03
7 6 26 0,0716 21 5 25 1,19
8 7 6 0,0348 10 -4 16 1,60
9 8 5 0,0148 4 1 1 0,25
10 9 (2)2 0,0056 (3)2 -1 1 0,33
11 9 0 0,0027 1

Werte in Klammern, wenn alle Werte mit in einer Klasse.

  • : Stichprobenverteilung entspricht einer

: Stichprobenverteilung entspricht nicht einer

  • ist unter approximativ ( für alle , für mindestens der ) –verteilt mit Freiheitsgraden
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
  • Ablehnungsbereich
  • Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass die Stichprobenverteilung der Torfolge nicht einer entspricht.

Werbeaktion

, ,
, ,
;
asymptotisch:daher für

Wetterlage und Geschäftslage

: “Wetterlage”; : “Geschäftslage”

  • =gut =normal =schlecht
    =Regentag 5 10 5 20
    =Sonnentag 15 5 10 30
    20 15 15 50
  • : Wetter und Geschäftslage sind stochastisch unabhängig
    : Wetter und Geschäftslage sind nicht stochastisch unabhängig

  • ja, da alle ist unter approximativ –verteilt mit Freiheitsgraden.

  • Tabelle mit

    =gut =normal =schlecht
    =Regentag 8 6 6 20
    =Sonnentag 12 9 9 30
    20 15 15 50
    • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
      Ablehnungsbereich

    • Ablehnungsbereich: , Nicht–Ablehnungsbereich:
      Ablehnungsbereich

  • (i) Fehler 2. Art, (ii) Fehler 1. Art

Wocheneinkommen

X:Wocheneinkommen in diesem Stadtteil, Verteilung unbekannt, EUR;
:Durchschnittliches Wocheneinkommen in diesem Stadtteil, ist approximativ (Zentraler Grenzwertsatz, mit
, , , ,

,


Zigarettenpreis

: “Zigarettenkonsum des –ten Rauchers pro Tag”; ;

ist beliebig verteilt mit und

  • , das will der Prokurist beweisen
  • : “Durchschnittlicher Zigarettenkonsum eines Rauchers pro Tag bei einer Zufallsstichprobe vom Umfang
  • ist unter approximativ –verteilt wegen Zentralem Grenzwertsatz und
  • ist unter approximativ
  • Ablehnungsbereich: , Nicht–Ablehnungsbereich: ,

Ablehnungsbereich

  • Fehler 2. Art
  • Auf einem Signifikanzniveau von und basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht gezeigt werden, dass sich der durchschnittliche Zigarettenkonsum verringert hat.

Zugkraft eines Drahtseiles


; ; ; ; ;