Bivariate Statistik/Aufgaben: Unterschied zwischen den Versionen
Aus MM*Stat
Keine Bearbeitungszusammenfassung |
Keine Bearbeitungszusammenfassung |
||
Zeile 327: | Zeile 327: | ||
Wie stark ist die Korrelation zwischen diesen beiden Merkmalen? | Wie stark ist die Korrelation zwischen diesen beiden Merkmalen? | ||
===Körpergröße=== | |||
Die folgende Tabelle gibt die Körpergröße von 5 Kindern in Zoll und cm an (es wird der Einfachheit halber 1 Zoll = 2,5 cm gesetzt): | |||
{|class="wikitable" | |||
! x | |||
! cm | |||
!align="right"| 120 | |||
!align="right"| 130 | |||
!align="right"| 125 | |||
!align="right"| 130 | |||
!align="right"| 135 | |||
|- | |||
| y | |||
| Zoll | |||
|align="right"| 48 | |||
|align="right"| 52 | |||
|align="right"| 50 | |||
|align="right"| 52 | |||
|align="right"| 54 | |||
|} | |||
* Berechnen Sie das arithmetische Mittel, die Standardabweichung und den Variationskoeffizienten für beide Messreihen. | |||
* Welche Beziehung besteht zwischen den jeweiligen Ergebnissen beider Messreihen? Geben Sie diese Beziehung formal an. |
Version vom 18. April 2019, 08:13 Uhr
Verspätungen
Uwe, Jens, Dirk, Paul und Sven kommen nacheinander zu spät in die Statistik–Vorlesung. In der Pause fragt sie der Professor nach ihrer Fahrzeit zur Uni. Uwe gibt 45 Minuten an. Dirk schätzt eine halbe Stunde und Sven 20 Minuten. Paul wohnt gleich um die Ecke und Jens meint, er brauche länger als alle anderen.
Besteht ein Zusammenhang zwischen Fahrzeit und Verspätung?
Sportveranstaltungen
Eine Befragung von 300 Zuschauern bei 2 Arten von Sportveranstaltungen (Tennis und Fu“sball) ergab folgendes Ergebnis: 52 Personen besuchen häufig Tennis und selten Fu”sball, 62 Personen selten Tennis und häufig Fußball, 118 Personen beides häufig und 68 Personen beides selten.
100 der erfassten Personen sind über 30 Jahre alt. Von diesen Personen besuchen 24 häufig Tennis und selten Fu“sball, 14 selten Tennis und häufig Fu”sball, 6 beides häufig und 56 beides selten.
Von den höchstens 30 Jahre alten Personen besuchen 28 häufig Tennis und selten Fu“sball, 48 selten Tennis und häufig Fu”sball, 112 beides häufig und 12 beides selten.
Der Zusammenhang zwischen der Häufigkeit des Besuchs von Tennis– und Fußballveranstaltungen ist:
- für die unaufgegliederte Gesamtheit der Befragten,
- für die über 30 Jahre alten Personen und
- für die höchstens 30 Jahre alten Personen
zu prüfen.
- Bewerten Sie die Ergebnisse von a) – c).
Old Faithful
Die Beobachtung des größten Geysir der Welt, dem Old Faithful im Yellowstone National Park in den USA, brachte einen Touristen auf die Idee, zu untersuchen, ob zwischen der Dauer einer Eruption (in Minuten) – Variable – und der Zeit zwischen zwei Eruptionen (in Minuten) – Variable – ein Zusammenhang besteht.
Er ordnet 8 Eruptionen deren Dauer und die Zeit, die zwischen dem Beginn einer Eruption und dem Beginn der darauf folgenden Eruption verstrichen ist, zu. Aufgrund dieser Beobachtungsdaten stehen Ihnen folgende Ergebnisse zur Verfügung:
Geben Sie mittels eines geeigneten Maßes die Stärke des Zusammenhanges zwischen der Dauer einer Eruption und der Zeit zwischen zwei Eruptionen an.
Alter und Preis eines PKWs
Für das Alter und den Händlerverkaufspreis gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt ; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt. Wie groß ist die Standardabweichung des Alters?
Koeffizienten Vergleich
Folgende Koeffizienten wurden von einem Wirtschaftswissenschaftler mit Hilfe eines Statistikprogrammes für alle Variablen eines Datensatzes berechnet:
- arith. Mittelwert
- Bravais–Pearson K.–koeffizient
- geometr. Mittelwert
- Interquartilsabstand
- Kendalls Rangk.–koeffizient
- Korr. Kontingenzkoeffizient
- Kovarianz
- Median
- Modus
- Quadratische Kontingenz
- Spannweite
- Spearmannsche Rangk.–koeffizient
- Standardabweichung
- Varianz
- keiner der Koeffizienten
Helfen Sie dem Wirtschaftswissenschaftler den/die Koeffizienten herauszusuchen,
- die ein robustes Lagemaß darstellen.
- die als Zusammenhangsmaß für zwei nominal skalierte Variablen benutzt werden können.
- die ein robustes Streuungsmaß für eine metrische Variable darstellen.
- die bei metrischen Variablen unverändert bleiben unter linearen Transformationen der Form .
GM
Ein Anleger aus Deutschland möchte Aktien des amerikanischen Automobil–Herstellers GM kaufen. Der Kurs der Aktie beträgt zur Zeit 100 $ und der Wechselkurs ist 2 EUR/$. Damit kostet ihn eine GM–Aktie 200 EUR. Der Anleger will die Aktie jedoch nur kaufen, wenn deren durchschnittlicher Wert in den letzten Monaten über 225 EUR lag. Ihm steht folgende Häufigkeitstabelle zur Verfügung:
Wechselkurs | |||||
in EUR/$ | 115,00 | 116,25 | 118,00 | 119,15 | 119,75 |
1,90 | 0,02 | 0,06 | 0,010 | 0,04 | 0,070 |
1,95 | 0,04 | 0,12 | 0,020 | 0,08 | 0,140 |
2,00 | 0,01 | 0,03 | 0,005 | 0,02 | 0,035 |
2,02 | 0,01 | 0,03 | 0,005 | 0,02 | 0,035 |
2,04 | 0,02 | 0,06 | 0,010 | 0,04 | 0,070 |
Zusätzlich weiß er, dass der Kurs der Aktie und der Wechselkurs unabhängig sind. Berechnen Sie auf der Basis der gegebenen Tabelle den durchschnittlichen Wert der Aktie in EUR.
Teesorten
Es wurden 7 verschiedene Teesorten auf Geschmack und Bekömmlichkeit untersucht. Eine Jury gab dazu folgende Rangeinteilung:
Sorte–Nr. | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
Geschmack | 4 | 3 | 6 | 2 | 7 | 1 | 5 |
Bekömmlichkeit | 3 | 7 | 4 | 1 | 6 | 2 | 5 |
Besteht bei diesen 7 Teesorten ein Zusammenhang zwischen Geschmack und Bekömmlichkeit?
Buttersorten
Zwei Verbraucherverbände A und B wurden aufgefordert, sieben verschiedene Buttersorten entsprechend der Qualitätseinschätzung in eine Reihenfolge zu bringen. Die Ergebnisse sind wie folgt:
Buttersorte | ||
Verband A | Verband B | |
1 | 2 | 1 |
2 | 1 | 3 |
3 | 3 | 2 |
4 | 4 | 4 |
5 | 5 | 5 |
6 | 6 | 7 |
7 | 7 | 6 |
Wie stark ist die übereinstimmung der Qualitätseinschätzungen der beiden Verbraucherverbände?
Tarifvereinbarungen
In einem Betrieb sind 841 Personen beschäftigt. Der monatliche Durchschnittslohn beträgt 1642,86 Euro bei einer Standardabweichung von 18,95 Euro. Aufgrund einer Tarifverhandlung werden die Löhne linear um 2,9% erhöht. Zusätzlich dazu erhält jede Person noch eine einmalige Lohnzahlung von 50 Euro.
Berechnen Sie den Mittelwert der Löhne nach dem Tarifabschluss.
Cafeteria
Das Studentenwerk in X–Stadt plant eine Erweiterung seiner gastronomischen Einrichtungen und beauftragt Student Schusslig zu ermitteln, welche Präferenzen die Studierenden haben:
- Erweiterung der Mensa, oder
- Einrichtung einer Cafeteria.
Als Student Schusslig am Tag vor seiner Präsentation vor dem Studentenwerk seine Unterlagen sortiert, fällt ihm auf, dass ihm ein Teil der Daten abhanden gekommen ist. Er erinnert sich, dass unter den 200 Befragten nur 37,5% Studentinnen waren. Von den Studentinnen hatten sich 45 für die Einrichtung einer Cafeteria ausgesprochen. Bei der Auswertung der Daten hatte sich ergeben, dass die Präferenzen unabhängig vom Geschlecht (männlich/weiblich) waren.
Wieviele der Befragten haben sich insgesamt für die Erweiterung der Mensa ausgesprochen?
Relationen der Merkmalsausprägungen
Für zwei Merkmale X und Y hat man bei 5 statistischen Einheiten die Paare der Merkmalsausprägungen erfasst. Für die Merkmalsausprägungen gelten folgende Relationen:
und .
Berechnen Sie ein geeignetes Zusammenhangsmaß zwischen X und Y.
Stellung im Beruf
100 nicht selbständig Erwerbstätige eines Berliner Stadtbezirkes wurden per 10.01.2011 nach dem Geschlecht und der Stellung im Beruf befragt. Die Erhebung ergab folgendes Ergebnis:
Geschlecht | |||
Beamte(r) | Angestellte(r) | Arbeiter(in) | |
weiblich | 15 | 20 | 5 |
männlich | 10 | 30 | 20 |
- Bestimmen Sie die marginalen Verteilungen der 100 Erwerbstätigen nach dem Geschlecht bzw. nach der Stellung im Beruf.
- Bestimmen Sie die relative Häufigkeitsverteilung der Stellung im Beruf für die weiblichen Erwerbstätigen.
- Bestimmen Sie die relative Häufigkeitsverteilung des Geschlechts für die Angestellten.
- Prüfen Sie, ob die beiden Merkmale unabhängig sind.
Tekolom und IBBM - Teil II
Herr Sparsam besitzt Aktien der Firma Tekolom und IBBM. Aus jahrelanger Erfahrung weiß man, dass der jährliche Wertzuwachs einer Tekolom–Aktie den Erwartungswert 8 EUR und die Varianz 16 EUR hat und dass der jährliche Wertzuwachs einer IBBM–Aktie den Erwartungswert 5 EUR und die Varianz 1 EUR hat. Darüber hinaus ist bekannt, dass der jährliche Wertzuwachs der Tekolom–Aktien mit dem jährlichen Wertzuwachs der IBBM–Aktie korreliert ist, der Korrelationskoeffizient beträgt 0,2.
Herr Sparsam hält 100 Tekolom–Aktien und 200 IBBM–Aktien. Welche Varianz hat der jährliche Wertzuwachs des gesamten Portfolios von Herrn Sparsam?
Mensaessen
Student Schusslig hat für das Studentenwerk die Essensqualität und das Preis-/Leistungsverhältnis der Mensaessen analysiert. Die ermittelten Daten hat er in der folgenden Tabelle von Rangzahlen zusammengefasst. Leider sind ihm dabei zwei Werte abhanden gekommen:
Merkmal/Essen | Essensqualität | Preis/Leistung |
---|---|---|
Eintopf | 1 | – |
Essen 1 | 5 | – |
Essen 2 | 6 | 3 |
Vegetarisch | 2 | 5 |
Pizza | 3 | 6 |
Salat | 4 | 2 |
Schusslig erinnert sich noch, dass der Spearmansche Rangkorrelationskoeffizient nicht negativ war. Welchen Wert hat dieser Korrelationskoeffizient?
Außentemperatur und Dauer eines Weges
Student E erfasste die Außentemperatur X (in Grad Celsius) und die Dauer seines Weges zur Universität Y (in Minuten):
-20 | -10 | 0 | 10 | 20 | |
---|---|---|---|---|---|
60 | 40 | 35 | 20 | 20 |
Wie stark ist die Korrelation zwischen diesen beiden Merkmalen?
Körpergröße
Die folgende Tabelle gibt die Körpergröße von 5 Kindern in Zoll und cm an (es wird der Einfachheit halber 1 Zoll = 2,5 cm gesetzt):
x | cm | 120 | 130 | 125 | 130 | 135 |
---|---|---|---|---|---|---|
y | Zoll | 48 | 52 | 50 | 52 | 54 |
- Berechnen Sie das arithmetische Mittel, die Standardabweichung und den Variationskoeffizienten für beide Messreihen.
- Welche Beziehung besteht zwischen den jeweiligen Ergebnissen beider Messreihen? Geben Sie diese Beziehung formal an.