Test auf Anteilswert

Aus MM*Stat

Wechseln zu: Navigation, Suche

Testtheorie

Grundbegriffe der Testtheorie • Entscheidungsbereiche • Entscheidungssituationen • Zweiseitiger Test • Einseitiger Test • Gütefunktion • Test auf Mittelwert • Gauß-Test • Gütefunktion des Gauß-Tests • Einstichproben-t-Test • Test auf Anteilswert • Test auf Differenz zweier Mittelwerte • Zweistichproben-Gauß-Test • Zweistichproben-t-Test • Chi-Quadrat-Anpassungstest • Chi-Quadrat-Unabhängigkeitstest • Multiple Choice • Video • Aufgaben • Lösungen
Ablehnungsbereich der Nullhypothese • alpha-Fehler • Alternativhypothese • Anpassungstest • beta-Fehler • Entscheidungsbereiche (Chi-Quadrat-Anpassungstest) • Entscheidungsbereiche (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungsbereiche (Einstichproben-t-Test) • Entscheidungsbereiche (Gauß-Test) • Entscheidungsbereiche (Test auf Anteilswert) • Entscheidungsbereiche (Zweistichproben-Gauß-Test) • Entscheidungsbereiche (Zweistichproben-t-Test) • Entscheidungssituationen (Chi-Quadrat-Anpassungstest) • Entscheidungssituationen (Chi-Quadrat-Unabhängigkeitstest) • Entscheidungssituationen (Einstichproben-t-Test) • Entscheidungssituationen (Gauß-Test) • Entscheidungssituationen (Test auf Anteilswert) • Entscheidungssituationen (Zweistichproben-Gauß-Test) • Entscheidungssituationen (Zweistichproben-t-Test) • Fehler 1. Art • Fehler 2. Art • Goodness-of-fit-Test • Gütefunktion des Tests auf Anteilswert • Hypothese • Kritischer Wert • Linksseitiger Test • Macht eines Tests • Nichtablehnungsbereich der Nullhypothese • Nullhypothese • OC-Kurve • Operationscharakteristik • Parametertest • Prüfgröße • Prüfwert • Prüfwert (Chi-Quadrat-Anpassungstest) • Prüfwert (Chi-Quadrat-Unabhängigkeitstest) • Prüfwert (Einstichproben-t-Test) • Prüfwert (Gauß-Test) • Prüfwert (Test auf Anteilswert) • Prüfwert (Zweistichproben-Gauß-Test) • Prüfwert (Zweistichproben-t-Test) • Rechtsseitiger Test • Signifikanzniveau • Statistischer Test • Testgröße • Teststatistik • Teststatistik (Chi-Quadrat-Anpassungstest) • Teststatistik (Chi-Quadrat-Unabhängigkeitstest) • Teststatistik (Einstichproben-t-Test) • Teststatistik (Gauß-Test) • Teststatistik (Test auf Anteilswert) • Teststatistik (Zweistichproben-Gauß-Test) • Teststatistik (Zweistichproben-t-Test) • Verteilungstest • Zweistichprobentest

Unterseiten

Beispiel: Statistik-Bücher  • Beispiel: Kreditwürdigkeit

Grundbegriffe

Test auf Anteilswert

Vorausgesetzt wird eine dichotome Grundgesamtheit, in der ein unbekannter Anteil von Elementen eine interessierende Eigenschaft aufweist und ein Anteil diese Eigenschaft nicht besitzt.

Über existiert eine Annahme (hypothetischer Wert) . Diese Annahme soll mittels eines statistischen Tests geprüft werden, wobei es sich um einen Parametertest handelt.

Es wird im Weiteren vorausgesetzt, dass der Test auf einer einfachen Zufallsstichprobe vom vorgegebenen Umfang basiert, womit die Stichprobenvariablen , die nur die Werte 0 oder 1 annehmen können, unabhängig und identisch Bernoulli-verteilt sind.

Geprüft wird auf dem Signifikanzniveau .

Je nach Problemstellung können die Tests als zwei- oder einseitige Tests formuliert werden.

  • Zweiseitiger Test
  • Rechtsseitiger Test
  • Linksseitiger Test

Für die Wahl der Hypothesenformulierung gelten die Ausführungen zum "Test auf Mittelwert" in analoger Weise.

Teststatistik des Tests auf Anteilswert

Der Stichprobenanteilswert

ist eine geeignete Schätzfunktion für .

Eine gleichwertige Stichprobenfunktion ist die Zufallsvariable

als Anzahl der Elemente mit der interessierenden Eigenschaft in der Zufallsstichprobe, denn sie unterscheidet sich nur durch den konstanten Faktor vom Stichprobenanteilswert.

Wie bereits gezeigt (siehe Abschnitt "Verteilung des Stichprobenanteilswertes" und "Binomialverteilung"), ist binomialverteilt mit den Parametern und Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \pi:\; X \sim B(n;\pi)} .

Da der Stichprobenumfang vorgegeben ist, muss zur konkreten Angabe der Binomialverteilung noch festgelegt werden.

Die einzige verfügbare Information über ist der hypothetische Wert .

Es wird nun unterstellt, dass der wahre Anteilswert in der Grundgesamtheit ist, d.h. gilt.

Damit folgt:

Die Schätzfunktion kann unmittelbar als Teststatistik verwendet werden, die bei Gültigkeit der Nullhypothese binomialverteilt ist mit den Parametern und .

Entscheidungsbereiche des Tests auf Anteilswert

Der Ablehnungsbereich der Nullhypothese beinhaltet alle Realisationen der Teststatistik , deren aufsummierte Wahrscheinlichkeiten maximal betragen.

Die kritischen Werte findet man aus der Tabelle der Verteilungsfunktion der wie folgt:

Zweiseitiger Test

Der untere kritische Wert ist diejenige Realisation von , für die den Wert gerade überschreitet, so dass gilt:

und .

Der obere kritische Wert ist diejenige Realisation von , für die den Wert gerade erreicht oder überschreitet, so dass gilt:

und .

Der Ablehnungsbereich der ist gegeben durch

mit .

Für den Nichtablehnungsbereich der erhält man:

mit .

Rechtsseitiger Test

Der kritische Wert ist diejenige Realisation von , für die den Wert gerade erreicht oder überschreitet, so dass gilt:

und .

Der Ablehnungsbereich der ist gegeben durch

mit .

Für den Nichtablehnungsbereich der erhält man:

mit .

Linksseitiger Test

Der kritische Wert ist diejenige Realisation von , für die den Wert gerade überschreitet, so dass gilt:

und .

Der Ablehnungsbereich der ist gegeben durch

mit .

Für den Nichtablehnungsbereich der erhält man:

mit .

Prüfwert des Tests auf Anteilswert

Wenn die einfache Zufallsstichprobe vom Umfang gezogen wurde, liegen die konkreten Stichprobenwerte vor und der Prüfwert der entsprechenden Teststatistik kann ermittelt werden.

Entscheidungssituationen des Tests auf Anteilswert

Testentscheidung und Interpretation erfolgen in gleicher Weise wie beim "Test auf Mittelwert".

Gütefunktion des Tests auf Anteilswert

Für die Teststatistik bei genügend großem Stichprobenumfang (Approximation durch die Normalverteilung - siehe unten)

lassen sich für die verschiedenen Testvarianten die Formeln für die Berechnung der Gütefunktion in ähnlicher Weise wie beim Test auf Mittelwert herleiten, worauf an dieser Stelle verzichtet wird.

Wenn die Teststatistik ist, muss auch zur Berechnung der Gütefunktion die Binomialverteilung verwendet werden, d.h. für alle zulässigen Werte und festes .

Für

folgt

,
.

Die Wahrscheinlichkeiten sind aus der Tabelle der Verteilungsfunktion der zu entnehmen.

Die Gütefunktion an der Stelle entspricht stets dem exakten Signifikanzniveau .

Zusatzinformationen

Approximation durch die Normalverteilung

Da eine diskrete Zufallsvariable ist, gilt für alle Testvarianten, dass das vorgegebene Signifikanzniveau nicht notwendig ausgeschöpft und somit nur mit dem sich ergebenden exakten Signifikanzniveau getestet wird.

Für genügend großen Stichprobenumfang wird, ausgehend von der Schätzfunktion die standardisierte Zufallsvariable

als Teststatistik verwendet, wobei die Standardabweichung der Schätzfunktion unter bezeichnet.

ist bei Gültigkeit der Nullhypothese approximativ standardnormalverteilt (siehe Abschnitt Verteilung des Stichprobenanteilswertes). Für das vorgegebene Signifikanzniveau können die kritischen Werte aus der Tabelle der Standardnormalverteilung entnommen werden.

Für die einzelnen Testmöglichkeiten ergeben sich die Entscheidungsbereiche analog zum approximativen Einstichproben-t-Test. Da gilt, wird deutlich, dass eine Hypothese über den Anteilswert einer Hypothese über den Erwartungswert entspricht.

Kreditwürdigkeit

Zu den wichtigsten Aufgaben einer Bank gehört die Bewertung der Kreditwürdigkeit potentieller Kreditnehmer, um Kreditverluste niedrig zu halten.

Die ABC-Bank will eine Verschärfung der Bewertungsrichtlinien der Kreditwürdigkeit vornehmen, wenn der Anteil von gewährten Krediten mit Schwierigkeiten bei der Rückzahlung nicht unter 20% liegt.

Sie lässt deshalb von ihrer Statistik-Abteilung einen Test durchführen. Dabei will die Bank das Risiko, keine Veränderung in den Bewertungsrichtlinien vorzunehmen, obwohl der Anteil 20% und mehr beträgt, gering halten.

Die Zufallsvariable : "Schwierigkeiten bei der Kreditrückzahlung" weist nur die Werte 0 (nein) oder 1 (ja) auf. Der Anteil der Kreditnehmer mit Schwierigkeiten bei der Rückzahlung ist unbekannt.

Die Überprüfung läuft auf einen Test des Anteilswertes einer dichotomen Grundgesamtheit hinaus, wobei der hypothetische Wert ist.

Es sind nur Abweichungen vom hypothetischen Wert nach einer Seite von Bedeutung, so dass ein einseitiger Test durchgeführt wird.

Da die ABC-Bank nachweisen will, dass ihre derzeitigen Bewertungskriterien ausreichend sind, d.h. der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist, wird diese Annahme als Alternativhypothese formuliert, woraus ein linksseitiger Test resultiert:

Über eine Fehlerbetrachtung ist zu prüfen, ob bei dieser Hypothesenformulierung die Vorgabe der Bank eingehalten wird.

Der bei der Ablehnung der mögliche Fehler 1. Art hat folgenden Inhalt:

"Anteil mit Rückzahlungsschwierigkeiten ; Veränderungen in den Bewertungsrichtlinien werden nicht vorgenommen" | in Wirklichkeit ist der Anteil mit Rückzahlungsschwierigkeiten ; Veränderungen in den Bewertungsrichtlinien müssten erfolgen.

Wird im Ergebnis des Tests die Nullhypothese nicht abgelehnt, ist der Inhalt des möglichen Fehlers 2. Art:

"Anteil mit Rückzahlungsschwierigkeiten ; Veränderungen in den Bewertungsrichtlinien sind vorzunehmen"| in Wirklichkeit ist der Anteil mit Rückzahlungsschwierigkeiten ; Veränderungen in den Bewertungsrichtlinien sind nicht notwendig.

Der Fehler 1. Art entspricht der Risikovorgabe der ABC-Bank. Die Wahrscheinlichkeit für den Fehler 1. Art kann über die Festlegung des Signifikanzniveaus gesteuert werden. Die Bank will dieses Risiko klein halten und gibt deshalb vor.

Der Fehler 2. Art hat für die Bank keine schwerwiegenden Folgen, denn eine Verschärfung der Bewertungsrichtlinien, obwohl es aufgrund des gesetzten Kriteriums nicht notwendig gewesen wäre, ist nicht nachteilig.

Von dieser Hypothesenformulierung und dem vorgegebenen Signifikanzniveau wird bei den beiden folgenden Testvarianten ausgegangen.

Für die Durchführung des Tests soll eine einfache Zufallsstichprobe vom Umfang aus den mehr als 10000 Kreditnehmern gezogen werden.

Bei der gegebenen Problemstellung ist es nicht sinnvoll, das Zufallsauswahlmodell mit Zurücklegen anzuwenden. Bei Einhaltung eines Auswahlsatzes von kann jedoch eine Zufallsauswahl ohne Zurücklegen näherungsweise als eine einfache Zufallsstichprobe angesehen werden.

Stichprobenumfang n=30

Um die Kosten für die Überprüfung niedrig zu halten, wird der Stichprobenumfang auf festgelegt. Die Forderung wird eingehalten.

Teststatistik und Entscheidungsbereiche

Die Schätzfunktion "Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in einer Zufallsstichprobe von Umfang " kann unmittelbar als Teststatistik verwendet werden.

ist unter -verteilt.

Eine kleine Anzahl von Kreditnehmern mit Rückzahlungsschwierigkeiten in der Stichprobe spricht dabei gegen die Nullhypothese.

Der kritische Wert ist diejenige Realisation von , für die den Wert gerade überschreitet, so dass gilt:

und .

In der Tabelle der Verteilungsfunktion der findet man .

Damit folgt:

Ablehnungsbereich der : , mit .

Nichtablehnungsbereich der : , mit .

Da eine diskrete Zufallsvariable ist, wird das vorgegebene Signifikanzniveau von nicht voll ausgeschöpft. Es ist nur .

Prüfwert und Testentscheidung

Aus den Kreditnehmern werden 30 zufällig ausgewählt und festgestellt, ob es Schwierigkeiten bei der Rückzahlung gab oder nicht.

Es habe sich als Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in der Zufallsstichprobe ergeben, was gleichzeitig der Prüfwert ist.

Da in den Nichtablehnungsbereich der fällt, wird die Nullhypothese nicht abgelehnt.

Der in der Stichprobe beobachtete Anteil ist zwar kleiner als der hypothetische Wert , die Differenz zwischen beiden wird jedoch auf einem Signifikanzniveau von noch nicht als wesentlich angesehen.

Man beachte, dass bei Tests auf einem vorgegebenen Signifikanzniveau stets Entscheidungsbereiche (Nichtablehnungsbereich bzw. Ablehnungsbereich der ) der Testentscheidung zugrunde liegen und nicht nur die Punktschätzung.

Basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist. Die ABC-Bank wird ihre Bewertungskriterien überarbeiten.

Gütefunktion

Mit der Beibehaltung der Nullhypothese kann ein Fehler 2. Art unterlaufen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit und ) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten beträgt?

Für gilt in Wirklichkeit die Alternativhypothese, so dass die Wahrscheinlichkeit für einen Fehler 2. Art gesucht wird:

Es ist

wobei man in der Tabelle der Verteilungsfunktion der findet.

Im Fall eines wahren Anteils von wird in Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle 84,86%} aller Stichproben vom Umfang Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle n = 30} die Abweichung vom hypothetischen Wert , durch den Test nicht aufgedeckt.

Die Beibehaltung der Nullhypothese im Ergebnis des Tests auf der Basis der konkreten Stichprobe veranlasst die Bank zur Verschärfung der Bewertungsrichtlinien; da jedoch mit in Wirklichkeit die Alternativhypothese wahr ist, wäre die Veränderung der Bewertungsrichtlinien nicht notwendig.

ist somit die Wahrscheinlichkeit für eine nicht notwendige Veränderung der Richtlinien.

Obwohl sie recht hoch ist, stellt sie aber für die Bank bei der Testdurchführung nicht das entscheidende Problem dar (im Vergleich zur Wahrscheinlichkeit eines Fehlers 1. Art).

Mit der Beibehaltung der Nullhypothese kann aber auch eine richtige Entscheidung getroffen werden, wenn in Wirklichkeit die Nullhypothese richtig ist .

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit und ) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten beträgt?

Für gilt in Wirklichkeit die Nullhypothese, so dass folgende Wahrscheinlichkeit gesucht wird:

Es ist

mit aus der Tabelle der Verteilungsfunktion der

Beide Wahrscheinlichkeitsberechnungen können für verschiedene zulässige Werte von durchgeführt werden.

Eine geeignete Berechnungs- und Darstellungsweise ist die Gütefunktion bzw. .

Gültigkeit von
0
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40

Die nachstehende Abbildung zeigt die Gütefunktion für den linksseitigen Test mit und .

Stichprobenumfang n=350

Die Statistik-Abteilung will nicht nur die Wahrscheinlichkeit des für die Bank schwerwiegenden Fehlers 1. Art durch die Vorgabe von niedrig halten, sondern auch erreichen, dass das Risiko für einen Fehler 2. Art nicht zu hoch ausfällt.

Da bekannt ist, dass bei festgelegtem Signifikanzniveau die Wahrscheinlichkeit für einen Fehler 2. Art über die Erhöhung des Stichprobenumfangs verringert werden kann, entscheidet sich die Statistik-Abteilung gleich für einen großen Stichprobenumfang: . Die Forderung wird eingehalten.

Teststatistik und Entscheidungsbereiche

Es wird die Teststatistik

verwendet, die bei Gültigkeit der Nullhypothese approximativ standardnormalverteilt ist, da aufgrund des sehr großen Stichprobenumfanges die Approximationsbedingungen erfüllt sind.

Für findet man aus der Tabelle der Verteilungsfunktion der , so dass wegen der Symmetrie der Normalverteilung der kritische Wert ist.

Der approximative Ablehnungsbereich der ist gegeben durch

Für den approximativen Nichtablehnungsbereich der erhält man

Prüfwert und Testentscheidung

Aus den Kreditnehmern werden 350 zufällig ausgewählt und festgestellt, ob es Schwierigkeiten bei der Rückzahlung gab oder nicht.

Es habe sich als Anzahl der Kreditnehmer mit Rückzahlungsschwierigkeiten in der Zufallsstichprobe ergeben, womit der Anteil in der Stichprobe 0,18 beträgt.

Einsetzen in die Teststatistik führt zu dem Prüfwert:

Da in den Nichtablehnungsbereich der fällt, wird die Nullhypothese nicht abgelehnt.

Basierend auf einer Zufallsstichprobe vom Umfang konnte statistisch nicht bewiesen werden, dass der Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten kleiner als 20% ist.

Die ABC-Bank wird ihre Bewertungskriterien überarbeiten.

Wahrscheinlichkeit eines Fehlers 2. Art

Auch bei dieser Testvariante kann mit der Beibehaltung der Nullhypothese ein Fehler 2. Art unterlaufen, wenn in Wirklichkeit die Alternativhypothese richtig ist.

Analog soll die Frage gestellt werden:

Wie groß wäre die Wahrscheinlichkeit, dass bei diesem linksseitigen Test (mit ) die Nullhypothese nicht verworfen würde, wenn der wahre Anteil der Kreditnehmer mit Rückzahlungsschwierigkeiten beträgt?

Für Fehler beim Parsen (MathML mit SVG- oder PNG-Rückgriff (empfohlen für moderne Browser und Barrierefreiheitswerkzeuge): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „https://wikimedia.org/api/rest_v1/“:): {\displaystyle \pi = 0,15} gilt in Wirklichkeit die Alternativhypothese, so dass die Wahrscheinlichkeit für einen Fehler 2. Art gesucht wird: .

Zunächst wird der kritische Anteilswert bei Gültigkeit der ermittelt, der sich aus der Beziehung zu ergibt.

ist somit die Wahrscheinlichkeit, dass die Schätzfunktion einen Wert im Nichtablehnungsbereich der annimmt, obwohl gilt:

Um diese Wahrscheinlichkeit aus der Tabelle der Standardnormalverteilung entnehmen zu können, muss ebenfalls eine Standardisierung vorgenommen werden, da jedoch gilt mit und :

Aus der Tabelle der Verteilungsfunktion der Standardnormalverteilung findet man und somit

Diese Wahrscheinlichkeit eines Fehlers 2. Art liegt deutlich unter vorheriger Variante mit Stichprobenumfang n=30. Dies resultiert aus der Erhöhung des Stichprobenumfanges.