Regressionsanalyse

Aus MM*Stat

Version vom 5. Juli 2020, 17:04 Uhr von H0130wij (Diskussion | Beiträge)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Regression

Regressionsanalyse • Lineares Regressionsmodell • Schätzung der Regressionsparameter • Güte der Regression • Multiple Choice • Video • Aufgaben • Lösungen
Abhängige Variable • Bestimmtheit der Regression • Bestimmtheitsmaß • Einfache lineare Regressionsfunktion • Endogene Variable • Erklärende Variable • Erklärte Variable • Exogene Variable • Linearer Regressionskoeffizient • Methode der kleinsten Quadrate (Regression) • Multiple lineare Regression • Regressand • Regressionsfunktion • Regressionsgerade • Regressionskonstante • Regressionsparameter • Regressor • Regresswert • Residuum • Restgröße • Unabhängige Variable

Grundbegriffe

Regressionsanalyse

Das Ziel der Regressionsanalyse besteht in einer Beschreibung der mittleren Tendenz bzw. des durchschnittlichen Verlaufs der Abhängigkeit eines metrisch skalierten Merkmals Y\; von ebenfalls metrisch skalierten Merkmalen X_{1},X_{2},\ldots.

Es liegt eine einseitig gerichtete Abhängigkeit vor. Diese Abhängigkeit lässt sich in Form einer allgemeinen Regressionsfunktion wie folgt darstellen:

\hat{y}=f(x_{1},x_{2},\ldots )

Das verwendete \hat{y} bedeutet hierbei, dass die Regressionsfunktion den Beobachtungswerten x_{1},x_{2},\ldots nicht den wahren Beobachtungswert y zuordnet, sondern einen auf der Regressionsfunktion liegenden durchschnittlichen Wert \hat{y}.

Regressionsfunktion

Eine Regressionsfunktion ist die Darstellung der mittleren statistischen Abhängigkeit einer endogenen Variablen von einer (oder mehreren) exogenen Variablen mittels einer Funktion auf der Basis von n Beobachtungsdaten der Variablen.

Im Weiteren werden die Ausführungen auf den Fall beschränkt, dass das Merkmal Y\; nur von einem Merkmal X\; abhängt.

Die Festlegung des Typs der Regressionsfunktion f(x) erfolgt problemabhängig durch den Anwender.

Mögliche Funktionen sind beispielsweise:

Lineare Funktion: \hat{y}=b_{0}+b_{1}\cdot x
Quadratische Funktion: \hat{y}=b_{0}+b_{1}\cdot x+b_{2}\cdot x^{2}
Potenzfunktion: \hat{y}=a\cdot x^{b}
Exponentialfunktion: \hat{y}=b_{0}\cdot {b_{1}}^{x}
Logistische Funktion: \hat{y}= l\cdot (1+e^{a+b\cdot x})

Regressor, exogene, erklärende oder unabhängige Variable

Die Merkmale X_1,X_2,\ldots werden als Regressor, exogene, erklärende oder unabhängige Variable bezeichnet.

Regressand, endogene, erklärte oder abhängige Variable

Das Merkmal Y\; wird als Regressand, endogene, erklärte oder abhängige Variable bezeichnet.

Regresswert

Der Regresswert \hat{y_{i}} stellt den Wert des Merkmals Y\; dar, wenn die Abhängigkeit Y\; von X\; tatsächlich durch eine lineare Funktion repräsentiert werden kann.

Der Beobachtungswert ergibt sich zu:

y_{i}=\hat{y_{i}}+\hat{u_{i}}\quad i=1,\ldots ,n

Restgröße bzw. Residuum

Die Differenz zwischen dem wahren Wert y_{i} und dem Wert der Regressionsfunktion \hat{y_{i}} wird als Restgröße oder Residuum \hat{u_{i}} bezeichnet.

Sie enthält diejenigen Einflüsse, die nicht durch die Regressionsfunktion erfasst werden, d.h. diese Abweichung kann nicht durch die Einflüsse der exogenen Variablen erklärt werden.

\hat{u_{i}}=y_{i}-\hat{y_{i}} \quad (i=1,\ldots ,n)

Beispiele

Regressand und Regressor

Beispiel für eine lineares Regressionsmodell mit der Arbeitszeit als Regressand und der Losgröße als Regressor: