Regression/Aufgaben: Unterschied zwischen den Versionen
Aus MM*Stat
(Die Seite wurde neu angelegt: „===Alter und Händlerverkaufspreis=== Für das Alter (<math>X</math>) und den Händlerverkaufspreis (<math>Y</math>) gebrauchter PKW eines bestimmten Typs lie…“) |
Keine Bearbeitungszusammenfassung |
||
Zeile 1: | Zeile 1: | ||
===Alter und Händlerverkaufspreis=== | ===Alter und Händlerverkaufspreis=== | ||
[[Regression/Lösungen#Alter und Händlerverkaufspreis|Lösung]] | |||
Für das Alter (<math>X</math>) und den Händlerverkaufspreis (<math>Y</math>) gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt <math>-5,4</math>; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt.<br /> | Für das Alter (<math>X</math>) und den Händlerverkaufspreis (<math>Y</math>) gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt <math>-5,4</math>; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt.<br /> | ||
Zeile 5: | Zeile 6: | ||
===Arbeitslosenquoten=== | ===Arbeitslosenquoten=== | ||
[[Regression/Lösungen#Arbeitslosenquoten|Lösung]] | |||
Die folgende Tabelle gibt die Arbeitslosenquoten für Deutschland in den letzten Jahren an: | Die folgende Tabelle gibt die Arbeitslosenquoten für Deutschland in den letzten Jahren an: | ||
Zeile 35: | Zeile 37: | ||
===Gesamtkosten und Produktionsmenge=== | ===Gesamtkosten und Produktionsmenge=== | ||
[[Regression/Lösungen#Gesamtkosten und Produktionsmenge|Lösung]] | |||
In einem Unternehmen mit einer Vielzahl von Filialen wurden in einem bestimmten Zeitraum für n = 12 Filialen folgende Gesamtkosten in Abhängigkeit von der Produktionsmenge beobachtet: | In einem Unternehmen mit einer Vielzahl von Filialen wurden in einem bestimmten Zeitraum für n = 12 Filialen folgende Gesamtkosten in Abhängigkeit von der Produktionsmenge beobachtet: | ||
Zeile 100: | Zeile 103: | ||
===Gewinn eines Unternehmens=== | ===Gewinn eines Unternehmens=== | ||
[[Regression/Lösungen#Gewinn eines Unternehmens|Lösung]] | |||
Für den Gewinn (Y) eines Unternehmens ergaben sich im Verlauf von 10 Monaten (X) nachstehende Werte: | Für den Gewinn (Y) eines Unternehmens ergaben sich im Verlauf von 10 Monaten (X) nachstehende Werte: | ||
Zeile 132: | Zeile 136: | ||
===Hypothekenzinssatz=== | ===Hypothekenzinssatz=== | ||
[[Regression/Lösungen#Hypothekenzinssatz|Lösung]] | |||
Für 6 verschiedene Monate liegen die Daten über den Hypothekenzinssatz X (in %) vor sowie über den saisonbereinigten Auftragseingang Y im Bauhauptgewerbe (in Tsd. EUR), der auf den privaten Wohnungsbau entfällt: | Für 6 verschiedene Monate liegen die Daten über den Hypothekenzinssatz X (in %) vor sowie über den saisonbereinigten Auftragseingang Y im Bauhauptgewerbe (in Tsd. EUR), der auf den privaten Wohnungsbau entfällt: | ||
Zeile 169: | Zeile 174: | ||
===Immobiliensachverständiger=== | ===Immobiliensachverständiger=== | ||
[[Regression/Lösungen#Immobiliensachverständiger|Lösung]] | |||
Ein Immobiliensachverständiger muss für ein Gutachten den Preis eines Hauses vorhersagen. Er nimmt an, dass das Alter einen Einfluss auf den Preis hat. Er führt unter Verwendung nachstehender Daten eine einfache lineare Regressionsschätzung durch, um diese Abhängigkeit zu ermitteln. | Ein Immobiliensachverständiger muss für ein Gutachten den Preis eines Hauses vorhersagen. Er nimmt an, dass das Alter einen Einfluss auf den Preis hat. Er führt unter Verwendung nachstehender Daten eine einfache lineare Regressionsschätzung durch, um diese Abhängigkeit zu ermitteln. | ||
Zeile 206: | Zeile 212: | ||
===Konsumausgaben=== | ===Konsumausgaben=== | ||
[[Regression/Lösungen#Konsumausgaben|Lösung]] | |||
Das verfügbare Gesamteinkommen von 8 privaten Haushalten betrug im März 1992<br /> | Das verfügbare Gesamteinkommen von 8 privaten Haushalten betrug im März 1992<br /> | ||
Zeile 214: | Zeile 221: | ||
===Konsumausgaben und verfügbares Einkommen=== | ===Konsumausgaben und verfügbares Einkommen=== | ||
[[Regression/Lösungen#Konsumausgaben und verfügbares Einkommen|Lösung]] | |||
Aus Kenntnis der ökonomischen Theorie vermutet man bei einer bestimmten Gruppe von Haushalten einen linearen Zusammenhang zwischen den Konsumausgaben (<math>Y</math>) und dem verfügbaren Einkommen (<math>X</math>): <math>Y_{i} =\beta_{0} +\beta_{1}X_{i}.</math> Bei der Untersuchung von 8 ausgewählten Haushalten ergaben sich folgende Wertepaare (in 100 EUR): | Aus Kenntnis der ökonomischen Theorie vermutet man bei einer bestimmten Gruppe von Haushalten einen linearen Zusammenhang zwischen den Konsumausgaben (<math>Y</math>) und dem verfügbaren Einkommen (<math>X</math>): <math>Y_{i} =\beta_{0} +\beta_{1}X_{i}.</math> Bei der Untersuchung von 8 ausgewählten Haushalten ergaben sich folgende Wertepaare (in 100 EUR): | ||
Zeile 242: | Zeile 250: | ||
===Kosten und Output=== | ===Kosten und Output=== | ||
[[Regression/Lösungen#Kosten und Output|Lösung]] | |||
Ein Unternehmen stellt ein Produkt her. Für die Kalkulation soll eine lineare Regressionsfunktion der Kosten in Abhängigkeit vom Output ermittelt werden. Dafür werden in 10 Perioden die Produktionsmenge in Tonnen und die Gesamtkosten in 1000 Euro registriert. | Ein Unternehmen stellt ein Produkt her. Für die Kalkulation soll eine lineare Regressionsfunktion der Kosten in Abhängigkeit vom Output ermittelt werden. Dafür werden in 10 Perioden die Produktionsmenge in Tonnen und die Gesamtkosten in 1000 Euro registriert. | ||
Zeile 292: | Zeile 301: | ||
===Kunstdünger=== | ===Kunstdünger=== | ||
[[Regression/Lösungen#Kunstdünger|Lösung]] | |||
Auf gleichgroßen Flächeneinheiten eines homogenen Bodens wurden unterschiedliche Mengen eines Kunstdüngers eingesetzt. Für die Mengen des eingesetzten Kunstdüngers (X) in Dezitonne (dt) und das Ernteergebnis (Y) in dt wurden folgende Werte beobachtet: | Auf gleichgroßen Flächeneinheiten eines homogenen Bodens wurden unterschiedliche Mengen eines Kunstdüngers eingesetzt. Für die Mengen des eingesetzten Kunstdüngers (X) in Dezitonne (dt) und das Ernteergebnis (Y) in dt wurden folgende Werte beobachtet: | ||
Zeile 319: | Zeile 329: | ||
===Ökonomische Variablen=== | ===Ökonomische Variablen=== | ||
[[Regression/Lösungen#Ökonomische Variablen|Lösung]] | |||
Als Mitarbeiter der volkswirtschaftlichen Abteilung eines Ministeriums möchten Sie den Zusammenhang zwischen zwei ökonomischen Variablen <math>X</math> und <math>Y</math> untersuchen, d.h. Sie interessieren sich für ein Modell der Gestalt <math>y_i=\beta_0+\beta_1x_i+\epsilon_i</math>, wobei <math>\beta_0</math> und <math>\beta_1</math> unbekannte Parameter und <math>\epsilon_i</math> ein Störterm sind.<br /> | Als Mitarbeiter der volkswirtschaftlichen Abteilung eines Ministeriums möchten Sie den Zusammenhang zwischen zwei ökonomischen Variablen <math>X</math> und <math>Y</math> untersuchen, d.h. Sie interessieren sich für ein Modell der Gestalt <math>y_i=\beta_0+\beta_1x_i+\epsilon_i</math>, wobei <math>\beta_0</math> und <math>\beta_1</math> unbekannte Parameter und <math>\epsilon_i</math> ein Störterm sind.<br /> | ||
Zeile 324: | Zeile 335: | ||
===Quadratmetermiete=== | ===Quadratmetermiete=== | ||
[[Regression/Lösungen#Quadratmetermiete|Lösung]] | |||
In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer wird die Quadratmetermiete in Abhängigkeit von der Wohnfläche analysiert. Es ergibt sich aus der Auswertung von 10 Mietwohnungen | In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer wird die Quadratmetermiete in Abhängigkeit von der Wohnfläche analysiert. Es ergibt sich aus der Auswertung von 10 Mietwohnungen foldgendes Bild: | ||
{|class="wikitable" | {|class="wikitable" | ||
Zeile 382: | Zeile 394: | ||
===Querschnittsanalyse von 11 Unternehmen=== | ===Querschnittsanalyse von 11 Unternehmen=== | ||
[[Regression/Lösungen#Querschnittsanalyse von 11 Unternehmen|Lösung]] | |||
In einer Querschnittsanalyse werden 11 Unternehmen einer Branche bezüglich der Abhängigkeit des Umsatzes Y (in Mill. EUR) von den Investitionen <math>X_{1}</math> (in 1 000 EUR), den Aufwendungen für Forschung und Entwicklung <math>X_{2}</math> (in 1 000 EUR) und den Werbeaufwendungen <math>X_{3}</math> (in 1 000 EUR) für einen gegebenen Zeitraum untersucht. Die Werte der erklärenden Variablen <math>X_{1}</math>, <math>X_{2}</math>, <math>X_{3}</math> und der Variablen Y sind in der folgenden Tabelle erfasst. | In einer Querschnittsanalyse werden 11 Unternehmen einer Branche bezüglich der Abhängigkeit des Umsatzes Y (in Mill. EUR) von den Investitionen <math>X_{1}</math> (in 1 000 EUR), den Aufwendungen für Forschung und Entwicklung <math>X_{2}</math> (in 1 000 EUR) und den Werbeaufwendungen <math>X_{3}</math> (in 1 000 EUR) für einen gegebenen Zeitraum untersucht. Die Werte der erklärenden Variablen <math>X_{1}</math>, <math>X_{2}</math>, <math>X_{3}</math> und der Variablen Y sind in der folgenden Tabelle erfasst. | ||
Zeile 463: | Zeile 476: | ||
===Umsatz und Werbeetat=== | ===Umsatz und Werbeetat=== | ||
[[Regression/Lösungen#Umsatz und Werbeetat|Lösung]] | |||
Für die 6 Filialen eines Unternehmens sind aus dem Jahre 2001 nachstehende Angaben über den Umsatz (1000 EUR) und den Werbeetat (100 EUR) bekannt: | Für die 6 Filialen eines Unternehmens sind aus dem Jahre 2001 nachstehende Angaben über den Umsatz (1000 EUR) und den Werbeetat (100 EUR) bekannt: | ||
Zeile 495: | Zeile 509: | ||
===Zusätzliche statistische Einheit=== | ===Zusätzliche statistische Einheit=== | ||
[[Regression/Lösungen#Zusätzliche statistische Einheit|Lösung]] | |||
Die Merkmale X und Y wurden an 9 statistischen Einheiten beobachtet, jedoch liegen nicht die einzelnen Wertepaare <math>(x_i, y_i)</math> vor, sondern die Summen<br /> | Die Merkmale X und Y wurden an 9 statistischen Einheiten beobachtet, jedoch liegen nicht die einzelnen Wertepaare <math>(x_i, y_i)</math> vor, sondern die Summen<br /> |
Version vom 18. April 2019, 08:58 Uhr
Alter und Händlerverkaufspreis
Für das Alter () und den Händlerverkaufspreis () gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt ; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt.
Wie groß ist die Standardabweichung des Alters?
Arbeitslosenquoten
Die folgende Tabelle gibt die Arbeitslosenquoten für Deutschland in den letzten Jahren an:
Jahr | Zeitpunkt | Arbeitslosenquote in % |
---|---|---|
1994 | 0 | 10,6 |
1995 | 1 | 10,4 |
1996 | 2 | 11,5 |
1997 | 3 | 12,7 |
(Quelle: Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung)
Passen Sie eine lineare Funktion für die Regression von Arbeitslosenquote auf den Zeitpunkt mit Hilfe der Methode der kleinsten Quadrate an. Prognostizieren Sie mit Hilfe dieser linearen Regression den Wert für 1998.
Gesamtkosten und Produktionsmenge
In einem Unternehmen mit einer Vielzahl von Filialen wurden in einem bestimmten Zeitraum für n = 12 Filialen folgende Gesamtkosten in Abhängigkeit von der Produktionsmenge beobachtet:
Filiale | Produktionsmenge | Gesamtkosten y |
(in Tsd. Stück) | (in Tsd. EUR) | |
1 | 45 | 205 |
2 | 30 | 128 |
3 | 35 | 165 |
4 | 40 | 175 |
5 | 20 | 104 |
6 | 55 | 240 |
7 | 65 | 275 |
8 | 58 | 250 |
9 | 30 | 142 |
10 | 60 | 265 |
11 | 25 | 112 |
12 | 49 | 214 |
Schätzen Sie nach der Methode der kleinsten Quadrate die lineare Gesamtkostenfunktion für das Unternehmen.
Gewinn eines Unternehmens
Für den Gewinn (Y) eines Unternehmens ergaben sich im Verlauf von 10 Monaten (X) nachstehende Werte:
X | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
Y | -4 | -6 | -5 | -6 | 0 | 5 | 7 | 6 | 3 | 0 |
Berechnen Sie die lineare Regressionsfunktion (Trend) für den Gewinn in diesen 10 Monaten.
Hypothekenzinssatz
Für 6 verschiedene Monate liegen die Daten über den Hypothekenzinssatz X (in %) vor sowie über den saisonbereinigten Auftragseingang Y im Bauhauptgewerbe (in Tsd. EUR), der auf den privaten Wohnungsbau entfällt:
Monat | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
6 | 5 | 7 | 7 | 8 | 9 | |
3 000 | 3 200 | 2 500 | 2 300 | 2 000 | 2 000 |
Bestimmen Sie hieraus
- den Korrelationskoeffizienten,
- die lineare Regressionsfunktion,
- das Bestimmtheitsmaß,
- Prognosewerte für den Auftragseingang, der bei einem Hypothekenzinssatz von 4% bzw. von 7.5% zu erwarten ist.
Immobiliensachverständiger
Ein Immobiliensachverständiger muss für ein Gutachten den Preis eines Hauses vorhersagen. Er nimmt an, dass das Alter einen Einfluss auf den Preis hat. Er führt unter Verwendung nachstehender Daten eine einfache lineare Regressionsschätzung durch, um diese Abhängigkeit zu ermitteln.
Objekt | Alter in Jahren | Preis in 1000 EUR |
---|---|---|
1 | 15 | 190 |
2 | 12 | 210 |
3 | 3 | 400 |
4 | 17 | 125 |
5 | 5 | 300 |
6 | 8 | 197 |
Das Ergebnis der Regressionsschätzung verwendet er, um den Preis des Hauses, das 1 Jahr alt ist, zu berechnen.
Wie hoch ist der vorhergesagte Preis des Hauses in 1000 EUR?
Konsumausgaben
Das verfügbare Gesamteinkommen von 8 privaten Haushalten betrug im März 1992
30 880 EUR. Im gleichen Monat tätigten alle 8 Haushalte Konsumausgaben in Höhe von 26 800 EUR. Pro EUR Einkommenserhöhung wurden von diesen Haushalten durchschnittlich 0,813 EUR für den Konsum ausgegeben.
- Geben Sie die (ökonomisch sinnvolle) lineare Regressionsfunktion an.
- Welche Konsumausgaben sind bei einer verfügbaren Einkommenshöhe von 2 800 EUR im Mittel zu erwarten?
Konsumausgaben und verfügbares Einkommen
Aus Kenntnis der ökonomischen Theorie vermutet man bei einer bestimmten Gruppe von Haushalten einen linearen Zusammenhang zwischen den Konsumausgaben () und dem verfügbaren Einkommen (): Bei der Untersuchung von 8 ausgewählten Haushalten ergaben sich folgende Wertepaare (in 100 EUR):
Konsumausgaben | 15 | 19 | 21 | 22 | 23 | 28 | 27 | 29 |
---|---|---|---|---|---|---|---|---|
verfügbares Einkommen | 19 | 21 | 23 | 26 | 27 | 31 | 33 | 36 |
Schätzen Sie mittels der Methode der kleinsten Quadrate die lineare Regressionsbeziehung und interpretieren Sie die Werte der Regressionskoeffizienten.
Kosten und Output
Ein Unternehmen stellt ein Produkt her. Für die Kalkulation soll eine lineare Regressionsfunktion der Kosten in Abhängigkeit vom Output ermittelt werden. Dafür werden in 10 Perioden die Produktionsmenge in Tonnen und die Gesamtkosten in 1000 Euro registriert.
Periode | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Output | 9 | 12 | 14 | 12 | 12 |
Kosten | 1216 | 1300 | 1356 | 1288 | 1276 |
Periode | 6 | 7 | 8 | 9 | 10 |
Output | 13 | 10 | 11 | 12 | 15 |
Kosten | 1292 | 1260 | 1244 | 1288 | 1360 |
Die Varianz der Kosten ist 1801,6. Die Kovarianz zwischen Output und Kosten beträgt 67,2. Bestimmen Sie den Parameter der linearen Regressionsfunktion, der die mittlere Abhängigkeit der Kosten vom Output angibt.
Kunstdünger
Auf gleichgroßen Flächeneinheiten eines homogenen Bodens wurden unterschiedliche Mengen eines Kunstdüngers eingesetzt. Für die Mengen des eingesetzten Kunstdüngers (X) in Dezitonne (dt) und das Ernteergebnis (Y) in dt wurden folgende Werte beobachtet:
Kunstdüngereinsatz | 1 | 2 | 3 | 5 | 7 | 9 |
---|---|---|---|---|---|---|
Ernteergebnis | 24 | 32 | 32 | 47 | 58 | 63 |
- Prüfen Sie mittels eines Streuungsdiagramms, ob zwischen den Merkmalen eine Abhängigkeit besteht.
- Berechnen Sie die lineare Regressionsfunktion.
- Mit welchem Ernteergebnis würden Sie bei einem Kunstdüngereinsatz von 11 dt rechnen?
- Berechnen Sie das Bestimmtheitsmaß.
Ökonomische Variablen
Als Mitarbeiter der volkswirtschaftlichen Abteilung eines Ministeriums möchten Sie den Zusammenhang zwischen zwei ökonomischen Variablen und untersuchen, d.h. Sie interessieren sich für ein Modell der Gestalt , wobei und unbekannte Parameter und ein Störterm sind.
Folgende Daten, die auf einer Stichprobe vom Umfang basieren, wurden bereits von einem Mitarbeiter des Ministeriums zusammengetragen:Schätzen Sie auf Basis dieser Angaben die Parameter und .
Quadratmetermiete
In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer wird die Quadratmetermiete in Abhängigkeit von der Wohnfläche analysiert. Es ergibt sich aus der Auswertung von 10 Mietwohnungen foldgendes Bild:
Wohnfläche (m) | ||||
40 | 12 | 12 | 15 | |
60 | 12 | |||
80 | 10 | 10 | ||
90 | 9 | 10 | 10 | 10 |
Welche Regressionsgerade passt die Kleinste–Quadrat–Methode an diese Daten an?
Querschnittsanalyse von 11 Unternehmen
In einer Querschnittsanalyse werden 11 Unternehmen einer Branche bezüglich der Abhängigkeit des Umsatzes Y (in Mill. EUR) von den Investitionen (in 1 000 EUR), den Aufwendungen für Forschung und Entwicklung (in 1 000 EUR) und den Werbeaufwendungen (in 1 000 EUR) für einen gegebenen Zeitraum untersucht. Die Werte der erklärenden Variablen , , und der Variablen Y sind in der folgenden Tabelle erfasst.
i | ||||
---|---|---|---|---|
1 | 12,6 | 117,0 | 84,5 | 3,1 |
2 | 13,1 | 126,3 | 89,7 | 3,6 |
3 | 15,1 | 134,4 | 96,2 | 2,3 |
4 | 15,1 | 137,5 | 99,1 | 2,3 |
5 | 14,9 | 141,7 | 103,2 | 0,9 |
6 | 16,1 | 149,4 | 107,5 | 2,1 |
7 | 17,9 | 158,4 | 114,1 | 1,5 |
8 | 21,0 | 166,5 | 120,4 | 3,8 |
9 | 22,3 | 177,1 | 126,8 | 3,6 |
10 | 21,9 | 179,8 | 127,2 | 4,1 |
11 | 21,0 | 183,8 | 128,7 | 1,9 |
- Bestimmen Sie die einfachen linearen Regressionsfunktionen des Umsatzes bezüglich der Investitionen bzw. der Aufwendungen für Forschung und Entwicklung bzw. der Werbeaufwendungen, sowie die zugehörigen Bestimmtheitsmaße.
- Berechnen Sie alle einfachen linearen Korrelationskoeffizienten zwischen diesen Merkmalen.
Umsatz und Werbeetat
Für die 6 Filialen eines Unternehmens sind aus dem Jahre 2001 nachstehende Angaben über den Umsatz (1000 EUR) und den Werbeetat (100 EUR) bekannt:
Filiale | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
Umsatz (1000 EUR) | 20 | 16 | 18 | 17 | 12 | 13 |
Werbeetat (100 EUR) | 29 | 25 | 28 | 26 | 20 | 22 |
Schätzen Sie bei Zugrundelegung einer linearen Beziehung denjenigen Regressionsparameter, der die Abhängigkeit des Umsatzes vom Werbeetat beinhaltet.
Zusätzliche statistische Einheit
Die Merkmale X und Y wurden an 9 statistischen Einheiten beobachtet, jedoch liegen nicht die einzelnen Wertepaare vor, sondern die Summen
Nachträglich stellt sich heraus, dass auch das Wertepaar zu berücksichtigen ist.
Welche der folgenden Regressionsgeraden nach der Methode der kleinsten Quadrate für die 10 Wertepaare ist richtig angegeben?
a) | b) | c) | d) |
e) | f) | g) | h) |