|
|
Zeile 1: |
Zeile 1: |
| {{Schaetztheorie}} | | {{Schaetztheorie}} |
| | {{SubpageToc|Beispiele}} |
|
| |
|
| =={{Vorlage:Überschrift}}== | | =={{Vorlage:Überschrift}}== |
Zeile 278: |
Zeile 279: |
|
| |
|
| womit die hinreichende Bedingung für ein Maximum erfüllt ist, da <math>n > 0</math> und <math>\lambda> 0</math> sind. | | womit die hinreichende Bedingung für ein Maximum erfüllt ist, da <math>n > 0</math> und <math>\lambda> 0</math> sind. |
|
| |
| =={{Vorlage:Beispiele}}==
| |
|
| |
| ===Autounfälle===
| |
|
| |
| In einem Zeitraum von 50 Tagen wird die Anzahl der Autounfälle pro Tag in einem Ort erfasst. Das Ergebnis wird in der folgenden Tabelle zusammengefasst:
| |
|
| |
| {| border="1" cellpadding="3" style="margin:1em 1em 1em 0; background:#f9f9f9; border:1px #AAA solid; border-collapse:collapse; empty-cells:show;"
| |
| |align="center"|Anzahl der Autounfälle pro Tag
| |
| |align="center"|Anzahl der Tage
| |
| |-
| |
| |align="center"|0
| |
| |align="center"|21
| |
| |-
| |
| |align="center"|1
| |
| |align="center"|18
| |
| |-
| |
| |align="center"|2
| |
| |align="center"|7
| |
| |-
| |
| |align="center"|3
| |
| |align="center"|3
| |
| |-
| |
| |align="center"|4
| |
| |align="center"|1
| |
| |}
| |
|
| |
| Der [[Stichprobe]] liegt ein [[Zufallsexperiment]] zugrunde, bei dem die [[Ereignis]]se (Autounfälle) zufällig und [[Unabhängigkeit (stochastisch)|unabhängig]] voneinander in einem Kontinuum (Zeit) vorgegebenen [[Stichprobenumfang|Umfang]]s (Tag) auftreten können.
| |
|
| |
| Die [[Zufallsvariable]] <math>X\;</math> bezeichne die Anzahl der Autounfälle pro Tag und ist [[Poisson-Verteilung|Poisson-verteilt]]: <math>X\sim PO(\lambda)\;</math>.
| |
|
| |
| Der [[Parameter]] <math>\lambda</math> ist unbekannt und soll mittels der Maximum-Likelihood-Methode geschätzt werden.
| |
|
| |
| Für die [[Likelihood-Funktion]] der [[Realisation|realisierten]] [[Stichprobe]] <math>(x_{1},\ldots,x_{50})</math> folgt:
| |
|
| |
| <math>L\left(\lambda|x_{1},\ldots,x_{50}\right)=\frac{\lambda^{x_{1}+\dots+x_{50}}}{x_{1}!\cdot\ldots\cdot
| |
| x_{50}!}\cdot \exp{\left(-50\lambda\right)}=\frac{\lambda^{45}}{0!\cdot 0!\cdot\dots\cdot3!\cdot4!}\cdot \exp{\left(-50\lambda\right)}</math>
| |
|
| |
| Für die [[Log-Likelihood-Funktion]] ergibt sich:
| |
|
| |
| <math>\ln L(\lambda|x_{1},\ldots,x_{50})=45\ln\lambda-\left[\ln\left(0!\right)+\ln\left(0!\right)+\ldots+\log\left(3!\right)+\ln\left(4!\right)\right]-50\lambda</math>
| |
|
| |
| Differenzieren nach <math>\lambda</math> und Nullsetzen führt zu
| |
|
| |
| <math>\frac{\partial\ln L}{\partial\lambda}=\frac{45}{\lambda}-50</math>
| |
|
| |
| <math>\frac{45}{\widehat{\lambda}}-50=0</math>
| |
|
| |
| und damit
| |
|
| |
| <math>\widehat{\lambda}=\frac{45}{50}=0.9=\bar{x}</math>
| |
|
| |
| Die hinreichende Bedingung für ein Maximum an der Stelle <math>\lambda=\widehat{\lambda}</math>
| |
| ist erfüllt, da
| |
|
| |
| <math>\frac{\partial^{2}\ln L}{\partial\lambda^{2}}=-\frac{1}{\lambda^{2}}\cdot 45<0</math>
| |
|
| |
| ist.
| |
|
| |
| ===Landeabstände===
| |
|
| |
| Herr Businessman hat während einer Dienstreise längeren Aufenthalt auf einem Flughafen.
| |
|
| |
| Um sich die Zeit zu vertreiben, stoppt er die Zeit zwischen zwei landenden Flugzeugen auf derselben Rollbahn.
| |
|
| |
| Er notiert folgende [[Stichprobenwerte]] (in Minuten):
| |
|
| |
| 3, 6, 6, 4, 8, 2, 4, 5, 9, 3.
| |
|
| |
| Die [[Zufallsvariable]] <math>X\;</math> bezeichne das Intervall zwischen zwei aufeinanderfolgenden Landungen und wird als [[Exponentialverteilung|exponentialverteilt]] mit dem unbekannten [[Parameter]] <math>\lambda>0</math> angenommen.
| |
|
| |
| Unter Verwendung der Maximum-Likelihood-Methode schätzt Herr Businessman diesen [[Parameter]]. Die [[Likelihood-Funktion]] für die [[Realisation|realisierte]] [[Stichprobe]] <math>(x_{1},\ldots,x_{10})</math> ist gegeben mit
| |
|
| |
| {|
| |
| |<math>\,L(\lambda| 3,6,6,4,8,2,4,5,9,3)</math>
| |
| |<math>=\lambda e^{-3 \lambda} \cdot\lambda e^{-6 \lambda} \cdot\lambda e^{-6 \lambda}\cdot\lambda e^{-4 \lambda}\cdot\lambda e^{-8 \lambda} \cdot\lambda e^{-2 \lambda} \cdot\lambda e^{-4\lambda} \cdot\lambda e^{-5 \lambda} \cdot\lambda e^{-9 \lambda} \cdot\lambda
| |
| e^{-3 \lambda}</math>
| |
| |-
| |
| |
| |
| |<math> \,= \lambda^{10}\cdot e^{-50 \lambda}</math>
| |
| |}
| |
|
| |
| und die [[Log-Likelihood-Funktion]] mit
| |
|
| |
| <math>\ln L(\lambda)=10\ln\lambda-50\lambda\;</math>
| |
|
| |
| Ableiten nach <math>\lambda</math> und Nullsetzen führt zu
| |
|
| |
| <math>\frac{\partial\ln L(\lambda)}{\partial\lambda}=\frac{10}{\lambda}-50=0</math>
| |
|
| |
| <math>\frac{10}{\widehat{\lambda}}-50=0</math>
| |
|
| |
| Für die [[ML-Schätzung]] <math>\widehat{\lambda}</math> für <math>\lambda</math> der [[Exponentialverteilung|exponentialverteilten]] [[Grundgesamtheit]] resultiert:
| |
|
| |
| <math> \widehat{\lambda}=\frac{10}{50}=0.2=\frac{1}{\bar{x}}</math>
| |
|
| |
| Die zweite Ableitung nach <math>\lambda</math> ergibt:
| |
|
| |
| <math>\frac{\partial^{2}\ln L(\lambda)}{\partial\lambda^{2}}=-\frac{10}{\lambda ^{2}}< 0</math>
| |
|
| |
| womit die hinreichende Bedingung für ein Maximum erfüllt ist.
| |
Grundbegriffe
Maximum-Likelihood-Methode
Die Maximum-Likelihood-Methode ist eines der wichtigsten Verfahren zur Gewinnung von Schätzfunktionen für die Parameter einer Verteilung. Man nennt diese Methode auch Methode der maximalen Mutmaßlichkeit bzw. Größte-Dichte-Methode.
Die diskrete bzw. stetige Zufallsvariable in der Grundgesamtheit habe die Wahrscheinlichkeitsfunktion bzw. die Dichtefunktion .
Die Verteilung muss vom Typ her bekannt sein, was eine wichtige Voraussetzung der Maximum-Likelihood-Methode ist.
Diese Verteilung hängt von einem unbekannten Parameter ab.
- So muss z.B. bekannt sein, dass die Grundgesamtheit binomialverteilt ist. Dann ist die Wahrscheinlichkeitsfunktion der Binomialverteilung , die von dem Parameter abhängt, denn für verschiedene Werte von ergeben sich unterschiedliche Wahrscheinlichkeiten für die Realisationen von .
- Es ist bekannt, dass die Zufallsvariable in der Grundgesamtheit normalverteilt ist, d.h. ist die Dichtefunktion der Normalverteilung. Die Normalverteilung hängt von den Parametern und ab, von denen z.B. der Erwartungswert unbekannt ist.
Likelihood-Funktion
Aus der Grundgesamtheit wird eine einfache Zufallsstichprobe vom Umfang gezogen. Damit sind die Stichprobenvariablen unabhängig und identisch verteilt wie in der Grundgesamtheit:
für alle .
Die gemeinsame Verteilung aller Stichprobenvariablen ergibt sich aufgrund der Unabhängigkeit als das Produkt der einzelnen Verteilungen:
Vor der Ziehung der Stichprobe ist für diskrete Zufallsvariablen die Wahrscheinlichkeit dafür, eine Stichprobe bei festem (unbekanntem) Parameter zu erhalten.
Bei stetigen Zufallsvariablen tritt an die Stelle der Wahrscheinlichkeit eine Dichte .
hängt sowohl von den konkreten Realisierungen der Stichprobenvariablen als auch vom unbekannten Parameter ab.
Nach der Ziehung der Stichprobe liegen die Stichprobenwerte fest vor. Dann hängt das Produkt nur noch von dem Parameter ab. Um dies zu verdeutlichen, schreibt man
Diese Funktion heißt Likelihood-Funktion von und ist das Produkt von identischen Wahrscheinlichkeits- bzw. Dichtefunktionen der Stichprobenvariablen.
Für jeden möglichen Wert gibt die Wahrscheinlichkeit für die konkret realisierte Stichprobe an.
Log-Likelihood-Funktion
Das Prinzip der Maximum-Likelihood-Methode zur Konstruktion von Schätzfunktionen besteht nun darin, denjenigen Wert zu finden, für den die Likelihood-Funktion ihr Maximum annimmt:
Zur konkreten Stichprobe () wird somit derjenige Parameterwert gesucht, der die
plausibelste Erklärung für die Realisierung dieser Stichprobenwerte liefert.
Unter bestimmten Voraussetzungen hat bei festen Werten genau ein Maximum.
Notwendige Bedingung für das Erreichen eines Maximums ist, dass die erste Ableitung von nach gleich Null ist:
Zur Vereinfachung der Ableitung wird oftmals die logarithmierte Likelihood-Funktion, bezeichnet als Log-Likelihood-Funktion verwendet.
Maximum-Likelihood-Schätzung (ML-Schätzung)
Da der Logarithmus einer Funktion eine streng monotone Transformation ist, besitzt sein Maximum genau an der Stelle, an der auch das Maximum der Likelihood-Funktion ist.
Die Bestimmungsgleichung ist dann
Der so gefundene Wert wird als Schätzwert für den unbekannten Parameter gewählt und als Maximum-Likelihood-Schätzung oder kurz als ML-Schätzung bezeichnet.
Maximum-Likelihood-Schätzer (ML-Schätzer)
Die resultierende Schätzfunktion heißt Maximum-Likelihood-Schätzer (ML-Schätzer) für .
Über die zweite Ableitung von nach muss geprüft werden, ob an der Stelle
tatsächlich ein Maximum vorliegt.
Zusatzinformationen
ML-Schätzer bei normalverteilter Grundgesamtheit
Die Zufallsvariable in der Grundgesamtheit sei normalverteilt mit den unbekannten Parametern und und eine einfache Zufallsstichprobe aus dieser Grundgesamtheit.
Dann gilt für jedes :
Für die fest vorgegebene Stichprobe besitzt die Likelihood-Funktion die Form:
|
|
|
|
Logarithmieren ergibt die Log-Likelihood-Funktion:
ML-Schätzer für den Erwartungswert
Damit bei gegebenen maximal wird, ist der Schätzwert so zu wählen, dass die Log-Likelihood-Funktion maximal wird.
Durch partielle Differentiation nach und Nullsetzen der ersten Ableitung folgt:
Das notwendige Kriterium für die Existenz eines Maximums bei lautet:
Daraus erhält man für die ML-Schätzung :
Es ist noch die hinreichende Bedingung für ein Maximum zu prüfen. Ausgehend von der ersten Ableitung erhält man als zweite Ableitung:
Geht man von den Zufallsvariablen und nicht von ihren Realisationen aus, erhält man den bereits bekannten Stichprobenmittelwert
als eine erwartungstreue, absolut effiziente und konsistente Schätzfunktion für .
ML-Schätzer für die Varianz
Im Folgenden substituieren wir mit , also .
Partielles Differenzieren der Log-Likelihood-Funktion nach und Nullsetzen der ersten Ableitung führt zu:
Das notwendige Kriterium für die Existenz eines Maximums bei lautet:
Durch einfaches Umformen erhält man:
wobei die ML-Schätzung für den unbekannten Parameter ist.
Mit diesem Ergebnis lassen sich die ML-Schätzer angeben:
ML-Schätzer bei binomialverteilter Grundgesamtheit
Es wird angenommen, dass die Zufallsvariable in der Grundgesamtheit dichotom mit dem Parameter ist. Der Parameter , der den Anteil der Elemente mit einer bestimmten Eigenschaft angibt, ist unbekannt.
Zu seiner Schätzung wird der Grundgesamtheit eine einfache Zufallsstichprobe vom Umfang entnommen.
Dann ist die Zufallsvariable als Anzahl der Elemente mit der Eigenschaft in der Stichprobe binomialverteilt: .
Für eine konkrete Stichprobe sind die Stichprobenwerte beobachtet worden, deren Summe die realisierte Anzahl von Elementen der betreffenden Eigenschaft ist. Damit ist der beobachtete Anteil .
Für die Likelihood-Funktion erhält man
und für die Log-Likelihood-Funktion
Differentiation nach und Nullsetzen der ersten Ableitung ergibt:
Das notwendige Kriterium für die Existenz eines Maximums bei lautet:
und damit:
Da die zweite Ableitung nach
(stets) negativ ist, liegt an der Stelle ein Maximum der Log-Likelihood-Funktion vor.
Der Stichprobenanteil ist ein ML-Schätzwert für . Der ML-Schätzer ist der bereits bekannte Stichprobenanteilswert
.
ML-Schätzer bei Poisson-verteilter Grundgesamtheit
Es sei eine einfache Zufallsstichprobe vom Umfang aus einer Poisson-verteilten Grundgesamtheit mit dem unbekannten Parameter .
Dann gilt für jedes
Die Likelihood-Funktion für die realisierte Stichprobe ist dann gegeben mit
Für die Log-Likelihood-Funktion folgt:
Differenzieren nach und Nullsetzen führt zu
Das notwendige Kriterium für die Existenz eines Maximums bei lautet:
und damit
Die ML-Schätzung für der Poisson-verteilten Grundgesamtheit ist somit das arithmetische Mittel der Stichprobenwerte.
Wie leicht zu prüfen, ist die hinreichende Bedingung für ein Maximum an der Stelle
erfüllt:
,
da ist und eine Poisson-verteilte Zufallsvariable keine negativen Realisationen annehmen kann.
ML-Schätzer bei exponentialverteilter Grundgesamtheit
Die Zufallsvariable in der Grundgesamtheit sei exponentialverteilt mit dem unbekannten Parameter .
Die Dichtefunktion von lautet:
Die Likelihood-Funktion für die realisierte Stichprobe aus dieser Grundgesamtheit ist dann gegeben mit
und die Log-Likelihood-Funktion mit
Ableiten nach und Nullsetzen führt zu
Das notwendige Kriterium für die Existenz eines Maximums bei lautet:
Für die ML-Schätzung für der exponentialverteilten Grundgesamtheit resultiert:
Die zweite Ableitung nach ergibt
womit die hinreichende Bedingung für ein Maximum erfüllt ist, da und sind.