Regression/Aufgaben

Aus MM*Stat

Wechseln zu: Navigation, Suche


Für das Alter (X) und den Händlerverkaufspreis (Y) gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt -5,4; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt.
Wie groß ist die Standardabweichung des Alters?


Arbeitslosenquoten

  (Lösung)


Die folgende Tabelle gibt die Arbeitslosenquoten für Deutschland in den letzten Jahren an:

Jahr Zeitpunkt x_i Arbeitslosenquote in %
1994 0 10,6
1995 1 10,4
1996 2 11,5
1997 3 12,7

(Quelle: Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung)

Passen Sie eine lineare Funktion für die Regression von Arbeitslosenquote Y auf den Zeitpunkt X mit Hilfe der Methode der kleinsten Quadrate an. Prognostizieren Sie mit Hilfe dieser linearen Regression den Wert für 1998.


Gesamtkosten und Produktionsmenge

  (Lösung)


In einem Unternehmen mit einer Vielzahl von Filialen wurden in einem bestimmten Zeitraum für n = 12 Filialen folgende Gesamtkosten in Abhängigkeit von der Produktionsmenge beobachtet:

Filiale i Produktionsmenge x_{i} Gesamtkosten y_{i}
(in Tsd. Stück) (in Tsd. EUR)
1 45 205
2 30 128
3 35 165
4 40 175
5 20 104
6 55 240
7 65 275
8 58 250
9 30 142
10 60 265
11 25 112
12 49 214

Schätzen Sie nach der Methode der kleinsten Quadrate die lineare Gesamtkostenfunktion für das Unternehmen.


Gewinn eines Unternehmens

  (Lösung)


Für den Gewinn (Y) eines Unternehmens ergaben sich im Verlauf von 10 Monaten (X) nachstehende Werte:

X 1 2 3 4 5 6 7 8 9 10
Y -4 -6 -5 -6 0 5 7 6 3 0

Berechnen Sie die lineare Regressionsfunktion (Trend) für den Gewinn in diesen 10 Monaten.


Hypothekenzinssatz

  (Lösung)


Für 6 verschiedene Monate liegen die Daten über den Hypothekenzinssatz X (in %) vor sowie über den saisonbereinigten Auftragseingang Y im Bauhauptgewerbe (in Tsd. EUR), der auf den privaten Wohnungsbau entfällt:

Monat i 1 2 3 4 5 6
x_{i } 6 5 7 7 8 9
y_{i } 3 000 3 200 2 500 2 300 2 000 2 000

Bestimmen Sie hieraus

  • den Korrelationskoeffizienten,
  • die lineare Regressionsfunktion,
  • das Bestimmtheitsmaß,
  • Prognosewerte für den Auftragseingang, der bei einem Hypothekenzinssatz von 4% bzw. von 7.5% zu erwarten ist.


Immobiliensachverständiger

  (Lösung)


Ein Immobiliensachverständiger muss für ein Gutachten den Preis eines Hauses vorhersagen. Er nimmt an, dass das Alter einen Einfluss auf den Preis hat. Er führt unter Verwendung nachstehender Daten eine einfache lineare Regressionsschätzung durch, um diese Abhängigkeit zu ermitteln.

Objekt i Alter in Jahren Preis in 1000 EUR
1 15 190
2 12 210
3 3 400
4 17 125
5 5 300
6 8 197

Das Ergebnis der Regressionsschätzung verwendet er, um den Preis des Hauses, das 1 Jahr alt ist, zu berechnen.
Wie hoch ist der vorhergesagte Preis des Hauses in 1000 EUR?


Konsumausgaben

  (Lösung)


Das verfügbare Gesamteinkommen von 8 privaten Haushalten betrug im März 1992
30 880 EUR. Im gleichen Monat tätigten alle 8 Haushalte Konsumausgaben in Höhe von 26 800 EUR. Pro EUR Einkommenserhöhung wurden von diesen Haushalten durchschnittlich 0,813 EUR für den Konsum ausgegeben.

  • Geben Sie die (ökonomisch sinnvolle) lineare Regressionsfunktion an.
  • Welche Konsumausgaben sind bei einer verfügbaren Einkommenshöhe von 2 800 EUR im Mittel zu erwarten?


Konsumausgaben und verfügbares Einkommen

  (Lösung)


Aus Kenntnis der ökonomischen Theorie vermutet man bei einer bestimmten Gruppe von Haushalten einen linearen Zusammenhang zwischen den Konsumausgaben (Y) und dem verfügbaren Einkommen (X): Y_{i} =\beta_{0} +\beta_{1}X_{i}. Bei der Untersuchung von 8 ausgewählten Haushalten ergaben sich folgende Wertepaare (in 100 EUR):

Konsumausgaben 15 19 21 22 23 28 27 29
verfügbares Einkommen 19 21 23 26 27 31 33 36

Schätzen Sie mittels der Methode der kleinsten Quadrate die lineare Regressionsbeziehung und interpretieren Sie die Werte der Regressionskoeffizienten.


Kosten und Output

  (Lösung)


Ein Unternehmen stellt ein Produkt her. Für die Kalkulation soll eine lineare Regressionsfunktion der Kosten in Abhängigkeit vom Output ermittelt werden. Dafür werden in 10 Perioden die Produktionsmenge in Tonnen und die Gesamtkosten in 1000 Euro registriert.

Periode 1 2 3 4 5
Output 9 12 14 12 12
Kosten 1216 1300 1356 1288 1276
Periode 6 7 8 9 10
Output 13 10 11 12 15
Kosten 1292 1260 1244 1288 1360

Die Varianz der Kosten ist 1801,6. Die Kovarianz zwischen Output und Kosten beträgt 67,2. Bestimmen Sie den Parameter der linearen Regressionsfunktion, der die mittlere Abhängigkeit der Kosten vom Output angibt.


Kunstdünger

  (Lösung)


Auf gleichgroßen Flächeneinheiten eines homogenen Bodens wurden unterschiedliche Mengen eines Kunstdüngers eingesetzt. Für die Mengen des eingesetzten Kunstdüngers (X) in Dezitonne (dt) und das Ernteergebnis (Y) in dt wurden folgende Werte beobachtet:

Kunstdüngereinsatz 1 2 3 5 7 9
Ernteergebnis 24 32 32 47 58 63
  • Prüfen Sie mittels eines Streuungsdiagramms, ob zwischen den Merkmalen eine Abhängigkeit besteht.
  • Berechnen Sie die lineare Regressionsfunktion.
  • Mit welchem Ernteergebnis würden Sie bei einem Kunstdüngereinsatz von 11 dt rechnen?
  • Berechnen Sie das Bestimmtheitsmaß.


Ökonomische Variablen

  (Lösung)


Als Mitarbeiter der volkswirtschaftlichen Abteilung eines Ministeriums möchten Sie den Zusammenhang zwischen zwei ökonomischen Variablen X und Y untersuchen, d.h. Sie interessieren sich für ein Modell der Gestalt y_i=\beta_0+\beta_1x_i+\epsilon_i, wobei \beta_0 und \beta_1 unbekannte Parameter und \epsilon_i ein Störterm sind.
Folgende Daten, die auf einer Stichprobe vom Umfang n=10 basieren, wurden bereits von einem Mitarbeiter des Ministeriums zusammengetragen:\sum_{i=1}^{10}x_i=40\quad\sum_{i=1}^{10}x_i^2=180\quad\sum_{i=1}^{10}y_i=70\quad\sum_{i=1}^{10}y_i^2=522\quad\sum_{i=1}^{10}x_iy_i=304Schätzen Sie auf Basis dieser Angaben die Parameter \beta_0 und \beta_1.


Quadratmetermiete

  (Lösung)


In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer wird die Quadratmetermiete in Abhängigkeit von der Wohnfläche analysiert. Es ergibt sich aus der Auswertung von 10 Mietwohnungen foldgendes Bild:

Wohnfläche (m^2)
x_i
40 12 12 15
60 12
80 10 10
90 9 10 10 10

Welche Regressionsgerade passt die Kleinste–Quadrat–Methode an diese Daten an?


Querschnittsanalyse von 11 Unternehmen

  (Lösung)


In einer Querschnittsanalyse werden 11 Unternehmen einer Branche bezüglich der Abhängigkeit des Umsatzes Y (in Mill. EUR) von den Investitionen X_{1} (in 1 000 EUR), den Aufwendungen für Forschung und Entwicklung X_{2} (in 1 000 EUR) und den Werbeaufwendungen X_{3} (in 1 000 EUR) für einen gegebenen Zeitraum untersucht. Die Werte der erklärenden Variablen X_{1}, X_{2}, X_{3} und der Variablen Y sind in der folgenden Tabelle erfasst.

i y_{i} x_{i1} x_{i2} x_{i3}
1 12,6 117,0 84,5 3,1
2 13,1 126,3 89,7 3,6
3 15,1 134,4 96,2 2,3
4 15,1 137,5 99,1 2,3
5 14,9 141,7 103,2 0,9
6 16,1 149,4 107,5 2,1
7 17,9 158,4 114,1 1,5
8 21,0 166,5 120,4 3,8
9 22,3 177,1 126,8 3,6
10 21,9 179,8 127,2 4,1
11 21,0 183,8 128,7 1,9
  • Bestimmen Sie die einfachen linearen Regressionsfunktionen des Umsatzes bezüglich der Investitionen bzw. der Aufwendungen für Forschung und Entwicklung bzw. der Werbeaufwendungen, sowie die zugehörigen Bestimmtheitsmaße.
  • Berechnen Sie alle einfachen linearen Korrelationskoeffizienten zwischen diesen Merkmalen.


Umsatz und Werbeetat

  (Lösung)


Für die 6 Filialen eines Unternehmens sind aus dem Jahre 2001 nachstehende Angaben über den Umsatz (1000 EUR) und den Werbeetat (100 EUR) bekannt:

Filiale 1 2 3 4 5 6
Umsatz (1000 EUR) 20 16 18 17 12 13
Werbeetat (100 EUR) 29 25 28 26 20 22

Schätzen Sie bei Zugrundelegung einer linearen Beziehung denjenigen Regressionsparameter, der die Abhängigkeit des Umsatzes vom Werbeetat beinhaltet.


Zusätzliche statistische Einheit

  (Lösung)


Die Merkmale X und Y wurden an 9 statistischen Einheiten beobachtet, jedoch liegen nicht die einzelnen Wertepaare (x_i, y_i) vor, sondern die Summen
\sum_{i=1}^9x_i = 34, \sum_{i=1}^9y_i = 60, \sum_{i=1}^9x_i^2 = 144, \sum_{i=1}^9y_i^2 = 422, \sum_{i=1}^9x_iy_i = 244.
Nachträglich stellt sich heraus, dass auch das Wertepaar (x_{10}, y_{10})=(6; 10) zu berücksichtigen ist.
Welche der folgenden Regressionsgeraden y = b_0 + b_1x nach der Methode der kleinsten Quadrate für die 10 Wertepaare (x_i, y_i), i = 1,2,\cdots,10 ist richtig angegeben?


a) y=0,2+1,7x b) y=0,6+1,6x c) y=1,2+1,5x d) y=1,4+1,4x
e) y=1,8+1,3x f) y=2,0+1,8x g) y=2,2+1,2x h) y=2,8+1,0x