Univariate Statistik/Aufgaben: Unterschied zwischen den Versionen

Aus MM*Stat

Wechseln zu: Navigation, Suche
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 680: Zeile 680:
In [Aufgabe12] wurden für die zentralen Universitätsbibliotheken der Bundesrepublik Deutschland unter anderem die beiden Merkmale <math>X</math>: “Öffnungszeiten” und <math>Y</math>: “Ausleihzeiten” untersucht. Beantworten Sie ausgehend von den Häufigkeitsverteilungen der klassierten Daten der Merkmale folgende Frage:
In [Aufgabe12] wurden für die zentralen Universitätsbibliotheken der Bundesrepublik Deutschland unter anderem die beiden Merkmale <math>X</math>: “Öffnungszeiten” und <math>Y</math>: “Ausleihzeiten” untersucht. Beantworten Sie ausgehend von den Häufigkeitsverteilungen der klassierten Daten der Merkmale folgende Frage:


Welches der beiden Merkmale weist die grö&quot;sere Streuung auf Basis der Standardabweichung auf? (Runden Sie für Ihre Berechnungen den zugrundegelegten Mittelwert auf eine Stelle nach dem Komma.)
Welches der beiden Merkmale weist die größere Streuung auf Basis der Standardabweichung auf? (Runden Sie für Ihre Berechnungen den zugrundegelegten Mittelwert auf eine Stelle nach dem Komma.)


===Brutto- und Nettoeinkommen===
===Brutto- und Nettoeinkommen===
Zeile 1.411: Zeile 1.411:
* Berechnen Sie die Standardabweichung des Alters und den Variationskoeffizienten (runden Sie dafür das Durchschnittsalter auf ganze Jahre auf bzw. ab).
* Berechnen Sie die Standardabweichung des Alters und den Variationskoeffizienten (runden Sie dafür das Durchschnittsalter auf ganze Jahre auf bzw. ab).
* In welchem Altersbereich liegen die mittleren 50% der betroffenen Fahrer(innen)?
* In welchem Altersbereich liegen die mittleren 50% der betroffenen Fahrer(innen)?
* Welches Alter höchstens hatten die 50% jüngsten Fahrer(innen) mit Führerschein–Entzug? Welche Ma&quot;szahl haben Sie berechnet?
* Welches Alter höchstens hatten die 50% jüngsten Fahrer(innen) mit Führerschein–Entzug? Welche Maßzahl haben Sie berechnet?
* Berechnen Sie zu der Ma“szahl unter d) ein geeignetes Streuungsma”s.
* Berechnen Sie zu der Ma“szahl unter d) ein geeignetes Streuungsma”s.


Zeile 1.748: Zeile 1.748:
Helfen Sie dem Wirtschaftswissenschaftler den/die Koeffizienten herauszusuchen,
Helfen Sie dem Wirtschaftswissenschaftler den/die Koeffizienten herauszusuchen,


# die ein robustes Lagema&quot;s darstellen.
# die ein robustes Lagemaß darstellen.
# die als Zusammenhangsma&quot;s für zwei nominal skalierte Variablen benutzt werden können.
# die als Zusammenhangsmaß für zwei nominal skalierte Variablen benutzt werden können.
# die ein robustes Streuungsma&quot;s für eine metrische Variable darstellen.
# die ein robustes Streuungsmaß für eine metrische Variable darstellen.
# die bei metrischen Variablen unverändert bleiben unter linearen Transformationen der Form <math>y=x+b</math>.
# die bei metrischen Variablen unverändert bleiben unter linearen Transformationen der Form <math>y=x+b</math>.


===Körpergrö&quot;se===
===Körpergröße===


Die folgende Tabelle gibt die Körpergrö&quot;se von 5 Kindern in Zoll und cm an (es wird der Einfachheit halber 1 Zoll = 2,5 cm gesetzt):
Die folgende Tabelle gibt die Körpergröße von 5 Kindern in Zoll und cm an (es wird der Einfachheit halber 1 Zoll = 2,5 cm gesetzt):


{|class="wikitable"
{|class="wikitable"
Zeile 1.825: Zeile 1.825:
===Kontrollzeiten===
===Kontrollzeiten===


An einem Flie&quot;sband sind sechs Arbeiterinnnen acht Stunden am Tag mit der Kontrolle eines elektronischen Bauteils beschäftigt. Um ein Bauteil zu kontrollieren, benötigen sie folgende Zeiten:
An einem Fließband sind sechs Arbeiterinnnen acht Stunden am Tag mit der Kontrolle eines elektronischen Bauteils beschäftigt. Um ein Bauteil zu kontrollieren, benötigen sie folgende Zeiten:


{|class="wikitable"
{|class="wikitable"
Zeile 1.850: Zeile 1.850:
|}
|}


Berechnen Sie die durchschnittliche Kontrollzeit pro Stück an diesem Flie&quot;sband.
Berechnen Sie die durchschnittliche Kontrollzeit pro Stück an diesem Fließband.


===Kurzarbeiter===
===Kurzarbeiter===
Zeile 1.892: Zeile 1.892:
Keiner der Befragten lernt 12 und mehr Stunden am Tag. Bei 22 Studierenden wurde festgestellt, dass sie sich mindestens 6 Stunden am Tag mit ihrem Studium beschäftigen. Weniger als 3 Stunden am Tag investierten 30% der Befragten in ihr Studium. Die Masse der Studierenden (65%) beschäftigt sich zwischen 3 und 8 Stunden täglich mit Studienangelegenheiten.
Keiner der Befragten lernt 12 und mehr Stunden am Tag. Bei 22 Studierenden wurde festgestellt, dass sie sich mindestens 6 Stunden am Tag mit ihrem Studium beschäftigen. Weniger als 3 Stunden am Tag investierten 30% der Befragten in ihr Studium. Die Masse der Studierenden (65%) beschäftigt sich zwischen 3 und 8 Stunden täglich mit Studienangelegenheiten.


* Wie hei&quot;st das untersuchte Merkmal und wie ist es skaliert?
* Wie heißt das untersuchte Merkmal und wie ist es skaliert?
* Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion. Teilen Sie zu diesem Zweck die Daten in vier Klassen ein.
* Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion. Teilen Sie zu diesem Zweck die Daten in vier Klassen ein.
* Wie viele Stunden höchstens beschäftigt sich genau die Hälfte der Befragten täglich mit dem Studium?
* Wie viele Stunden höchstens beschäftigt sich genau die Hälfte der Befragten täglich mit dem Studium?
* Wie viele der Befragten arbeiten mindestens 5 Stunden täglich für ihr Studium?
* Wie viele der Befragten arbeiten mindestens 5 Stunden täglich für ihr Studium?
* Wie gro&quot;s ist der durchschnittliche Zeitaufwand für das Studium bei den 100 befragten Studierenden?
* Wie groß ist der durchschnittliche Zeitaufwand für das Studium bei den 100 befragten Studierenden?
* Welcher Zeitaufwand für das Studium trat bei den befragten Studierenden am häufigsten auf?
* Welcher Zeitaufwand für das Studium trat bei den befragten Studierenden am häufigsten auf?


Zeile 1.957: Zeile 1.957:
===Merkmalsausprägungen===
===Merkmalsausprägungen===


In einer deutschen Gro&quot;sstadt K wird das Sparverhalten der Erwerbstätigen im März  untersucht.<br />
In einer deutschen Großstadt K wird das Sparverhalten der Erwerbstätigen im März  untersucht.<br />
Durch welche sachlichen, örtlichen und zeitlichen Identifikationskriterien wird die untersuchte Gesamtheit identifiziert?
Durch welche sachlichen, örtlichen und zeitlichen Identifikationskriterien wird die untersuchte Gesamtheit identifiziert?


Zeile 2.046: Zeile 2.046:
Für welche reelle Zahl <math>c</math> ist <math>\sum_{i=1}^8(x_i-c)^2</math> minimal? (ohne Beweis!)
Für welche reelle Zahl <math>c</math> ist <math>\sum_{i=1}^8(x_i-c)^2</math> minimal? (ohne Beweis!)


===Nelkenstrau&quot;s===
===Nelkenstrauß===


Ein Kunde kauft an einem Tag einen Strau“s Nelken für 12 EUR, das Stück zu 0,80 EUR, und am nächsten Tag einen Strau”s Nelken für 26 EUR, das Stück zu 1,04 EUR. Welcher durchschnittliche Preis ist für eine Nelke an diesen beiden Tagen bezahlt worden?
Ein Kunde kauft an einem Tag einen Strau“s Nelken für 12 EUR, das Stück zu 0,80 EUR, und am nächsten Tag einen Strau”s Nelken für 26 EUR, das Stück zu 1,04 EUR. Welcher durchschnittliche Preis ist für eine Nelke an diesen beiden Tagen bezahlt worden?
Zeile 2.247: Zeile 2.247:
Berechnen Sie für jede Putzkolonne aus [Aufgabe27] die Standardabweichung und den Variationskoeffizienten.
Berechnen Sie für jede Putzkolonne aus [Aufgabe27] die Standardabweichung und den Variationskoeffizienten.


Ermitteln Sie anschlie&quot;send unter Verwendung dieser Varianzen die Varianz des zusammengesetzten Datensatzes, d.h. die Varianz für das gesamte Reinigungsunternehmen.
Ermitteln Sie anschließend unter Verwendung dieser Varianzen die Varianz des zusammengesetzten Datensatzes, d.h. die Varianz für das gesamte Reinigungsunternehmen.




Zeile 2.291: Zeile 2.291:
* Wie stark ist der Zusammenhang zwischen Körpergewicht und Laufleistung?
* Wie stark ist der Zusammenhang zwischen Körpergewicht und Laufleistung?
* Bestimmen Sie den Median des Körpergewichts.
* Bestimmen Sie den Median des Körpergewichts.
* Bestimmen Sie das quadratische Streuungsma&quot;s in Bezug auf den Median.
* Bestimmen Sie das quadratische Streuungsmaß in Bezug auf den Median.
* Ist die Varianz des Gewichts grö“ser oder kleiner als die unter c) bestimmte Grö”se? Warum?
* Ist die Varianz des Gewichts grö“ser oder kleiner als die unter c) bestimmte Grö”se? Warum?
* Die zwei Frauen unter den Patienten liefen die Strecke mit Geschwindigkeiten von 2 bzw. 4 Meter pro Sekunde. Wie gro&quot;s war die Durchschnittsgeschwindigkeit der Frauen?
* Die zwei Frauen unter den Patienten liefen die Strecke mit Geschwindigkeiten von 2 bzw. 4 Meter pro Sekunde. Wie groß war die Durchschnittsgeschwindigkeit der Frauen?


===Schafzucht - Teil I===
===Schafzucht - Teil I===


Der schottische Gro&quot;sgrundbesitzer McDuff verdient sein Geld mit der Zucht von Schafen. Er nimmt sich für die nächste Schafsschur vor, sowohl billige irische Wanderarbeiter mit einem Leistungslohn von 15 Pfund pro kg Wolle, als auch einheimische Arbeiter für 20 Pfund pro kg Wolle einzusetzen. Für die Iren will er insgesamt 285 Pfund, für die Schotten insgesamt 260 Pfund an Lohnsumme aufbringen.
Der schottische Großgrundbesitzer McDuff verdient sein Geld mit der Zucht von Schafen. Er nimmt sich für die nächste Schafsschur vor, sowohl billige irische Wanderarbeiter mit einem Leistungslohn von 15 Pfund pro kg Wolle, als auch einheimische Arbeiter für 20 Pfund pro kg Wolle einzusetzen. Für die Iren will er insgesamt 285 Pfund, für die Schotten insgesamt 260 Pfund an Lohnsumme aufbringen.


Wie hoch sind seine durchschnittlichen Lohnkosten pro kg Wolle?
Wie hoch sind seine durchschnittlichen Lohnkosten pro kg Wolle?
Zeile 2.304: Zeile 2.304:
===Schafzucht Teil - II===
===Schafzucht Teil - II===


Fortsetzung der Aufgabe 1-33. Unser schottischer Gro&quot;sgrundbesitzer McDuff (aus Aufgabe 33) verkauft die Wolle an einen Freund auf den Niederländischen Antillen. Im Laufe der letzten fünf Monate erwirtschaftete er folgende Gewinne (in Tsd. Gulden): 5 ; 4 ; 20 ; 6 ; 4.
Fortsetzung der Aufgabe 1-33. Unser schottischer Großgrundbesitzer McDuff (aus Aufgabe 33) verkauft die Wolle an einen Freund auf den Niederländischen Antillen. Im Laufe der letzten fünf Monate erwirtschaftete er folgende Gewinne (in Tsd. Gulden): 5 ; 4 ; 20 ; 6 ; 4.


McDuff tauscht sein Geld stets bei einem Bankier in Edinburgh in Pfund ein. Er wei&quot;s, dass der Wechselkurs stabil ist und er jeden Monat eine feste, vom Umtauschbetrag unabhängige Gebühr zu entrichten hat. In den letzten fünf Monaten hat er insgesamt 15,5 (Tsd.) Pfund ausgezahlt bekommen. Die Varianz betrug 9,44 (Tsd. Pfund)<math>^{\rm 2}</math>.
McDuff tauscht sein Geld stets bei einem Bankier in Edinburgh in Pfund ein. Er weiß, dass der Wechselkurs stabil ist und er jeden Monat eine feste, vom Umtauschbetrag unabhängige Gebühr zu entrichten hat. In den letzten fünf Monaten hat er insgesamt 15,5 (Tsd.) Pfund ausgezahlt bekommen. Die Varianz betrug 9,44 (Tsd. Pfund)<math>^{\rm 2}</math>.


Wie hoch sind Gebühr und Wechselkurs?
Wie hoch sind Gebühr und Wechselkurs?
Zeile 2.426: Zeile 2.426:
===Sportveranstaltungen===
===Sportveranstaltungen===


Eine Befragung von 300 Zuschauern bei 2 Arten von Sportveranstaltungen (Tennis und Fu“sball) ergab folgendes Ergebnis: 52 Personen besuchen häufig Tennis und selten Fu”sball, 62 Personen selten Tennis und häufig Fu&quot;sball, 118 Personen beides häufig und 68 Personen beides selten.
Eine Befragung von 300 Zuschauern bei 2 Arten von Sportveranstaltungen (Tennis und Fu“sball) ergab folgendes Ergebnis: 52 Personen besuchen häufig Tennis und selten Fu”sball, 62 Personen selten Tennis und häufig Fußball, 118 Personen beides häufig und 68 Personen beides selten.


100 der erfassten Personen sind über 30 Jahre alt. Von diesen Personen besuchen 24 häufig Tennis und selten Fu“sball, 14 selten Tennis und häufig Fu”sball, 6 beides häufig und 56 beides selten.
100 der erfassten Personen sind über 30 Jahre alt. Von diesen Personen besuchen 24 häufig Tennis und selten Fu“sball, 14 selten Tennis und häufig Fu”sball, 6 beides häufig und 56 beides selten.
Zeile 2.432: Zeile 2.432:
Von den höchstens 30 Jahre alten Personen besuchen 28 häufig Tennis und selten Fu“sball, 48 selten Tennis und häufig Fu”sball, 112 beides häufig und 12 beides selten.
Von den höchstens 30 Jahre alten Personen besuchen 28 häufig Tennis und selten Fu“sball, 48 selten Tennis und häufig Fu”sball, 112 beides häufig und 12 beides selten.


Der Zusammenhang zwischen der Häufigkeit des Besuchs von Tennis– und Fu&quot;sballveranstaltungen ist:
Der Zusammenhang zwischen der Häufigkeit des Besuchs von Tennis– und Fußballveranstaltungen ist:


* für die unaufgegliederte Gesamtheit der Befragten,
* für die unaufgegliederte Gesamtheit der Befragten,
Zeile 2.684: Zeile 2.684:
Die Bilanz seiner Turnierergebnisse lässt keine Freude bei B.B. aufkommen: Er stand zweimal im Finale und wurde sechsmal erst im Halbfinale von seinem Gegner geschlagen. Zehnmal verlor er jedoch schon in der ersten Runde und sechzehnmal kam für ihn in der 2. Runde das Aus. In der dritten Runde schied er allerdings bei keinem Turnier aus.
Die Bilanz seiner Turnierergebnisse lässt keine Freude bei B.B. aufkommen: Er stand zweimal im Finale und wurde sechsmal erst im Halbfinale von seinem Gegner geschlagen. Zehnmal verlor er jedoch schon in der ersten Runde und sechzehnmal kam für ihn in der 2. Runde das Aus. In der dritten Runde schied er allerdings bei keinem Turnier aus.


* Wie hei&quot;st das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
* Wie heißt das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
* Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion.
* Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion.
* Zeichnen Sie die empirische Verteilungsfunktion.
* Zeichnen Sie die empirische Verteilungsfunktion.
Zeile 2.742: Zeile 2.742:
Ein Wanderer legte 2 Kilometer zur<span>ü</span>ck. Den ersten Kilometer ging er mit einer Geschwindigkeit von 6 km je Stunde, den zweiten mit einer Geschwindigkeit von 4 km je Stunde.
Ein Wanderer legte 2 Kilometer zur<span>ü</span>ck. Den ersten Kilometer ging er mit einer Geschwindigkeit von 6 km je Stunde, den zweiten mit einer Geschwindigkeit von 4 km je Stunde.


Wie gro&quot;s war seine Durchschnittsgeschwindigkeit?
Wie groß war seine Durchschnittsgeschwindigkeit?


===WM–Berichterstattung===
===WM–Berichterstattung===


Um festzustellen, wie viele Stunden pro Spieltag ein Fu“sball–Fan die WM–Berichterstattung im Fernsehen während der letzten Fu”sball–WM verfolgte, wurden 20 Fu&quot;sball–Fans in A–Dorf nach ihrem Fernsehkonsum während der WM befragt. Die Befragung brachte folgendes Ergebnis:
Um festzustellen, wie viele Stunden pro Spieltag ein Fu“sball–Fan die WM–Berichterstattung im Fernsehen während der letzten Fu”sball–WM verfolgte, wurden 20 Fußball–Fans in A–Dorf nach ihrem Fernsehkonsum während der WM befragt. Die Befragung brachte folgendes Ergebnis:


{|class="wikitable"
{|class="wikitable"
Zeile 2.775: Zeile 2.775:
[[File:Bild3.pdf|image]]
[[File:Bild3.pdf|image]]


* Wie hei&quot;st die obige Darstellungsform? Welche Annahmen wurden hinsichtlich der Verteilung innerhalb jeder Klasse getroffen?
* Wie heißt die obige Darstellungsform? Welche Annahmen wurden hinsichtlich der Verteilung innerhalb jeder Klasse getroffen?
* Geben Sie die absoluten und relativen Klassenhäufigkeiten, die Häufigkeitsdichten und die empirische Verteilungsfunktion an.
* Geben Sie die absoluten und relativen Klassenhäufigkeiten, die Häufigkeitsdichten und die empirische Verteilungsfunktion an.
* Geben Sie an, wie hoch der Anteil der Befragten ist, die mindestens 20 Zigaretten pro Tag rauchen.
* Geben Sie an, wie hoch der Anteil der Befragten ist, die mindestens 20 Zigaretten pro Tag rauchen.
Zeile 2.822: Zeile 2.822:


* Berechnen Sie aufgrund der Häufigkeitsverteilung der klassierten Daten für das Erhebungsmerkmal <math>X</math>: “Zugfolgeabstand” der [Aufgabe24] drei aussagekräftige Lageparameter.
* Berechnen Sie aufgrund der Häufigkeitsverteilung der klassierten Daten für das Erhebungsmerkmal <math>X</math>: “Zugfolgeabstand” der [Aufgabe24] drei aussagekräftige Lageparameter.
* Welcher durchschnittlicher Zugfolgeabstand ergibt sich auf der Basis der Urliste? Wie erklären Sie sich den Unterschied zum zahlenmä&quot;sigen Ergebnis des gleichen Mittelwertes aus Frage a)?
* Welcher durchschnittlicher Zugfolgeabstand ergibt sich auf der Basis der Urliste? Wie erklären Sie sich den Unterschied zum zahlenmäßigen Ergebnis des gleichen Mittelwertes aus Frage a)?

Version vom 13. April 2019, 12:32 Uhr

Alter und Preis eines PKWs

Für das Alter und den Händlerverkaufspreis gebrauchter PKW eines bestimmten Typs liegen folgende Informationen vor: Die Kovarianz zwischen Alter und Verkaufspreis beträgt ; die Varianz des Verkaufspreises ist 4. Durch eine lineare Abhängigkeit vom Alter werden 81% der Variation in den Verkaufspreisen erklärt. Wie groß ist die Standardabweichung des Alters?

Anstieg der Produktion

Im Unternehmen U stieg die Produktion des Erzeugnisses E von 2005 bis 2007 im Mittel jährlich um 10%, von 2007 bis 2009 im Mittel jährlich um 20%.

  • Wie hoch war das mittlere Entwicklungstempo der E–Produktion im Unternehmen U von 2005 bis 2009?
  • Auf wieviel Prozent würde die E–Produktion 2011 gegenüber 2007 bei Fortsetzung des mittleren Entwicklungstempos von 2007 bis 2009 steigen?

Arbeitslose

Ein Bundesland ist in zwei Arbeitsamtsbezirke eingeteilt. In diesen werden für einen bestimmten Monat folgende Anteile der Arbeitslosen an den Erwerbspersonen (Arbeitslosenquote) und Arbeitslosenzahlen ermittelt:

Bezirk–Nr. 1 2
Arbeitslosenquote 5% 20%
Arbeitslosenzahl 3000 4000

Bestimmen sie die Arbeitslosenquote für dieses Bundesland.

Außentemperatur und Dauer eines Weges

Student E erfasste die Außentemperatur X (in Grad Celsius) und die Dauer seines Weges zur Universität Y (in Minuten):

-20 -10 0 10 20
60 40 35 20 20

Wie stark ist die Korrelation zwischen diesen beiden Merkmalen?

Auswirkung der Regelstudienzeit

Um die Auswirkung der Regelstudienzeit zu demonstrieren, wurden im Januar  die Studienzeiten von 200 Wirtschaftsingenieuren in der Bundesrepublik Deutschland erhoben, die in den vergangenen 4 Semestern ihr Studium abgeschlossen haben. Es ergaben sich folgende Daten (fiktive Daten):

Semesterzahl 10 11 12 13 14 15
relative Häufigkeit 0,1 0,1 0,4 0,2 0,15 0,05
  • Wie heißt das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Bestimmen Sie die absoluten und relativen Häufigkeiten.
  • Bestimmen Sie die empirische Verteilungsfunktion.
  • Wie viele Semester höchstens benötigten die 10% schnellsten Studenten?
  • Wie viele Semester mindestens benötigten die 80% langsamsten Studenten?
  • Geben Sie die Semesterzahl an, die genau 20% der Studenten benötigten.

Von nun an soll nur noch das Merkmal : “Semesterzahl” mit den Ausprägungen

  • “klein” (weniger als 12 Semester)
  • “mittel” (genau 12 Semester)
  • “groß” (mehr als 12 Semester)

betrachtet werden.

  • Welche Skalierungsart liegt jetzt vor?
  • Zeichnen Sie die Häufigkeitsverteilung.
  • Ist es sinnvoll, bei einem nominalskalierten Merkmal eine Verteilungsfunktion anzugeben? Begründen Sie Ihre Antwort.

Benzinverbrauch

Bei einer Testreihe, die den Benzinverbrauch eines Autotyps in Deutschland erfasste, erhielt man folgende Daten:

  • arithmetisches Mittel: 8,2 [Liter/100km]
  • Standardabweichung: 0,41 [Liter/100km]

Für den Export in die USA müssen die Verbrauchsdaten in Gallonen/100 Meilen angegeben werden (1 Gallone = 3,785 Liter, 1 Meile = 1,609km) Welchen Wert hat der Variationskoeffizient v, wenn der Benzinverbrauch in Gallonen/100 Meilen ausgewiesen wird?

Berliner Bühnen

Die zuständige Abteilung für Finanzen des Senats von Berlin lässt sich für eine statistische Analyse von allen Berliner Bühnen die Höhe der Einnahmen und der Ausgaben im Jahre  melden.

  • Was ist hier die Grundgesamtheit, was sind die einzelnen statistischen Einheiten (Beispiele)?
  • Welche statistischen Merkmale werden betrachtet? Welche Merkmale sind Identifikationskriterien und welche sind Erhebungsmerkmale?
  • Nennen Sie weitere mögliche erfassbare Merkmale in dieser Gesamtheit!

Berliner Luftqualität

An einer Messstation zur Kontrolle des Stickstoffmonoxydgehalts in der Berliner Luft wurden im März  an 15 Tagen die folgenden Werte ermittelt ():

35; 36; 37; 27; 43;
23; 33; 31; 21; 35;
26; 38; 34; 33; 28;
  • Wie lautet das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Fassen Sie die Messwerte in folgende Klassen zusammen:

19,5–29,5;29,5–34,5;34,5–39,5;39,5–44,5

  • Zeichnen Sie für die klassierten Daten die Häufigkeitsverteilung und die empirische Verteilungsfunktion.
  • An wieviel Tagen betrug der Stickstoffmonoxydgehalt der Luft mindestens 34,5 ?
  • Wieviel Stickstoffmonoxydgehalt war an den 80% “saubersten” Tagen höchstens in der Luft?

Statistische Massen

Geben Sie an, ob es sich bei den folgenden statistischen Massen um Bestandsmassen oder Bewegungsmassen handelt:

a) Bierverbrauch der Studierenden der HUB im Jahre
b) Studierende einer Universität
c) Rentenempfänger
d) Geburten in Berlin im Januar
e) Einwohner von Hamburg
f) Verkehrsunfälle in der Bundesrepublik Deutschland im Jahre
g) Todesfälle in einer Stadt
h) Anmeldungen in einem Einwohnermeldeamt
i) wartende Kunden vor einem Postschalter
j) Beschäftigte in einem Unternehmen
k) Maschinenausfälle in einer Werkstatt
l) Freunde der Studentin Erna
m) wahlberechtigte Bürger

Besuche pro Woche

50 Studenten wurden danach gefragt, wie oft sie in der vergangenen Woche ihre Freundin besucht haben. Das Ergebnis ist folgendes:

0; 3; 2; 6; 4; 0; 0; 1; 4; 3;
1; 1; 1; 7; 1; 6; 0; 2; 7; 1;
0; 7; 0; 5; 1; 2; 1; 6; 4; 1;
5; 9; 4; 0; 3; 6; 4; 3; 2; 5;
4; 3; 2; 1; 4; 1; 3; 5; 3; 6;
  • Erstellen Sie die absolute und relative Häufigkeitsverteilung und die empirische Verteilungsfunktion.
  • Wie oft besuchte ein Student durchschnittlich seine Freundin?

Bevölkerungsdichte und Ärztedichte

Für die drei Regionen eines Landes sind jeweils die Bevölkerungsdichte X (Einwohner je km) und die Ärztedichte Y (Ärzte je 1 000 Einwohner) gegeben:

Region Fläche (in km) Bevölkerungs- Ärzte- Ärzte-
dichte zahl dichte
1 10 000 60 300 0,50
2 6 000 200 1 200 1,00
3 4 000 300 1 500 1,25

Berechnen Sie die Bevölkerungsdichte X und die Ärztedichte Y für das gesamte Land.

Bibliotheken - Teil I

Aus der Erhebung “Deutsche Bibliotheksstatistik ”, Berlin , wurden für die zentralen Universitätsbibliotheken nachstehende Angaben über die Öffnungszeiten (Std./Wo.), die Ausleihzeiten (Std./Wo), den Etat für Neuerwerb (Mrd. EUR/Jahr) und die Planstellen entnommen:

Universitätsbibliothek Öffnungszeiten Ausleihzeiten Etat für Neuerwerb Planstellen
RWTH Aachen 66 30 3.31 106
Augsburg 75 75 4.03 101
Bamberg 59 48 4.69 72
Bayreuth 64 64 5.77 72
HU Berlin 53 53 5.86 205
FU Berlin 59 41 4.22 146
TU Berlin 69 42 5.86 181
Bielefeld 111 98 4.44 166
Bochum 59 59 2.73 97
Bonn 63 54 3.26 153
TU Braunschweig 50 50 2.28 74
UB Bremen 59 52 5.59 150
Chemnitz 56 44 1.43 89
Clausthal-Zellerfeld 43 29 1.05 32
TH Darmstadt 54 26 2.25 91
Dortmund 53 53 4.35 143
TU Dresden 59 59 3.00 180
Düsseldorf 59 59 5.97 161
Duisburg 68 49 3.43 74
KU Eichstätt 64 43 4.67 78
Erlangen-Nürnberg 64 45 2.51 157
Essen 65 65 4.44 84
Frankfurt (SB) 61 40 1.58 35
Frankfurt (UB) 69 40 2.76 187
Freiburg 64 43 3.83 119
Gießen 59 45 1.71 77
Greifswald 74 36 1.32 100
Göttingen 60 34 6.56 260
Halle 79 45 1.80 154
Hamburg 63 41 4.05 211
Hannover 48 36 1.79 83
Heidelberg 83 39 4.24 119
Jena 62 32 3.00 158
Kaiserslautern 50 50 2.50 61
Karlsruhe 54 54 2.58 77
GHS Kassel 64 49 3.87 111
Kiel 67 37 2.87 100
Konstanz 89 87 5.51 116
Köln 62 33 3.85 146
Leipzig 72 45 2.20 179
TU Magdeburg 51 51 1.52 53
Mainz 58 48 1.67 108
Mannheim 63 33 1.50 90
Marburg 84 28 1.60 120
LMU München 60 45 1.63 107
TU München 52 37 2.95 99
Münster 69 38 3.67 145
Oldenburg 65 60 3.60 99
Osnabrück 57 43 4.74 99
Paderborn 86 86 3.60 75
Passau 74 41 4.96 70
Regensburg 74 36 4.25 191
Rostock 56 53 3.28 129
Saarbrücken 64 28 3.00 101
Siegen 75 71 3.30 73
Stuttgart 62 34 0.85 78
Stuttgart-Hohenheim 79 76 1.74 41
Trier 73 29 3.76 97
Tübingen 70 38 4.14 139
Ulm 64 64 3.07 66
Würzburg 64 64 1.49 122
Wuppertal 71 60 3.74 74
  • Wie sind die Erhebungsmerkmale skaliert? Sind sie häufbar, nicht häufbar, stetig, diskret (quasi-stetig)?

  • Ermitteln Sie unter Verwendung nachstehender Klassen (von ... bis unter...)

    • “Öffnungszeiten” 40-50, 50–60, 60–70, 70–80, 80–90, 90–115

    • “Ausleihzeiten” 25–30, 30–40, 40–50, 50–60, 60–70, 70–80, 80–100

    • “Etat für Neuerwerb” 0–1, 1–2, 2–3, 3–4, 4–5, 5–6, 6–7

    • “Planstellen” 30–70, 70–80, 80–100, 100–150, 150–200, 200–270

    die absoluten und relativen Klassenhäufigkeiten sowie die empirische Verteilungsfunktion.

    Stellen Sie die Häufigkeitsverteilungen und die empirische Verteilungsfunktion graphisch dar.

  • Berechnen Sie ausgehend von den unter b) erstellten empirischen Verteilungsfunktionen:

    • Welcher Anteil der Universitätsbibliotheken hatte eine Öffnungszeit zwischen 48 und 74 Std./Wo.?

    • Welcher Anteil der Universitätsbibliotheken hatte eine Ausleihzeit über 65 Std./Wo.?

    • Welcher Anteil der Universitätsbibliotheken hatte einen Etat für Neuerwerb von höchstens 2,4 Mrd. EUR/Jahr?

    • Welcher Anteil der Universitätsbibliotheken hatte mehr als 100 Planstellen?

    • Wieviele Planstellen höchstens hatten die 25% personell am schwächsten besetzten Universitätsbibliotheken?

    • Wie lange waren die 15% leserfreundlichsten Universitätsbibliotheken mindestens geöffnet?

Bibliotheken - Teil II

Die folgenden Fragen beziehen sich auf die Häufigkeitsverteilungen der klassierten Daten der [Aufgabe12].

  • Berechnen Sie drei aussagekräftige Mittelwerte für das Erhebungsmerkmal : “Öffnungszeiten”.
  • Ermitteln Sie ebenfalls drei sinnvolle Mittelwerte für das Erhebungsmerkmal : “Ausleihzeiten”.
  • Ist der Modus ein aussagekräftiger Mittelwert für das Erhebungsmerkmal : “Etat für Neuerwerb”?
  • Berechnen Sie für das Merkmal : “Etat für Neuerwerb” die Quartile. Zeichnen Sie einen Boxplot.


Bibliotheken - Teil III

In [Aufgabe12] wurden für die zentralen Universitätsbibliotheken der Bundesrepublik Deutschland unter anderem die beiden Merkmale : “Öffnungszeiten” und : “Ausleihzeiten” untersucht. Beantworten Sie ausgehend von den Häufigkeitsverteilungen der klassierten Daten der Merkmale folgende Frage:

Welches der beiden Merkmale weist die größere Streuung auf Basis der Standardabweichung auf? (Runden Sie für Ihre Berechnungen den zugrundegelegten Mittelwert auf eine Stelle nach dem Komma.)

Brutto- und Nettoeinkommen

Das Bruttoeinkommen aus unselbständiger Arbeit je Beschäftigten und Monat in der Bundesrepublik Deutschland stieg von 3 012 DM im Jahre 1980 auf 4 112 DM im Jahre 1989. Die Nettolohn– und –gehaltssumme je Beschäftigten und Monat veränderte sich von 1 765 DM im Jahre 1980 auf 2 261 DM im Jahre 1989.
Quelle: Zahlen zur wirtschaftlichen Entwicklung der Bundesrepublik
Deutschland 1991, Institut der Deutschen Wirtschaft Köln, S. 30.

Vergleichen Sie das Bruttoeinkommen und das Nettoeinkommen je Beschäftigten bezüglich ihres mittleren Entwicklungstempo im Zeitraum 1980–1989.

Buttersorten

Zwei Verbraucherverbände A und B wurden aufgefordert, sieben verschiedene Buttersorten entsprechend der Qualitätseinschätzung in eine Reihenfolge zu bringen. Die Ergebnisse sind wie folgt:

Buttersorte
Verband A Verband B
1 2 1
2 1 3
3 3 2
4 4 4
5 5 5
6 6 7
7 7 6

Wie stark ist die übereinstimmung der Qualitätseinschätzungen der beiden Verbraucherverbände?

Cafeteria

Das Studentenwerk in X–Stadt plant eine Erweiterung seiner gastronomischen Einrichtungen und beauftragt Student Schusslig zu ermitteln, welche Präferenzen die Studierenden haben:

  • Erweiterung der Mensa, oder
  • Einrichtung einer Cafeteria.

Als Student Schusslig am Tag vor seiner Präsentation vor dem Studentenwerk seine Unterlagen sortiert, fällt ihm auf, dass ihm ein Teil der Daten abhanden gekommen ist. Er erinnert sich, dass unter den 200 Befragten nur 37,5% Studentinnen waren. Von den Studentinnen hatten sich 45 für die Einrichtung einer Cafeteria ausgesprochen. Bei der Auswertung der Daten hatte sich ergeben, dass die Präferenzen unabhängig vom Geschlecht (männlich/weiblich) waren.
Wieviele der Befragten haben sich insgesamt für die Erweiterung der Mensa ausgesprochen?

CDs

In der Umsatzstatistik eines Einzelhändlers für das zurückliegende Geschäftsjahr sind für die drei Sorten CDs folgende Preise und Umsätze ausgewiesen:

Sorte 1 2 3
Preis 3,90 4,50 4,90
Umsatz 1224,60 967,50 519,40
  • Berechnen Sie den Durchschnittspreis für CDs im vergangenen Geschäftsjahr.
  • Berechnen Sie die Standardabweichung des Preises für CDs.

Das erste Tor

Der folgenden Liste ist zu entnehmen, wieviele Minuten man bei jedem von 25 Fußballspielen warten musste, bis das erste Tor fiel:

40; 65; 11; 43; 34; 41; 3; 1; 43; 9;
21; 4; 12; 41; 9; 46; 14; 29; 41; 7;
31; 43; 25; 23; 16

Auf der Grundlage einer Gruppierung mit vier Klassen (1. Klasse: 0 - 15, 2. Klasse: 15 - 30, 3. Klasse: 30 - 45, 4. Klasse: 45 - 90min) beantworten Sie die Frage zu: Wie groß ist der Anteil der Spiele, bei denen man mehr als 20, aber höchstens 60 Minuten auf das erste Tor warten musste?

Ladekabel

In den Städten A, B und C wurden jeweils in mehreren Geschäften die Preise für einen bestimmtes Ladekabel ermittelt. Im Ort A ergab sich aufgrund von 11 Einzelwerten ein Durchschnittspreis von 16,44 EUR. In B betrug der Durchschnittspreis basierend auf 6 Einzelwerten 15,28 EUR und in C wurde nach dem Besuch von 13 Geschäften als Durchschnittspreis 14,86 EUR ermittelt.

Wie hoch ist der Durchschnittspreis des Ladekabels unter Berücksichtigung sämtlicher Preisinformationen aus den Städten A, B und C?

Diskret vs. stetig

Welche der unter [Aufgabe16] genannten Merkmale sind diskret und welche sind stetig?

Drei Betriebe

Für die 3 Betriebe eines Unternehmens liegen folgende Angaben vor (TEUR = 1000 EUR):

Betrieb Materialverbrauch Produktion Materialverbrauch
in EUR je TEUR in TEUR in TEUR
Produktion 2010 2010 2011
1 750 80 400 55 800
2 800 26 600 18 350
3 700 60 000 45 850

Der Materialverbrauch des Unternehmens betrug im Jahre 2007: 135 548 TEUR.

  • Ermitteln Sie den durchschnittlichen Materialverbrauch je TEUR Produktion des Unternehmens für das Jahr 2010.
  • Geben Sie das untersuchte statistische Merkmal an. Wie ist es skaliert?
  • Wie hoch wird voraussichtlich der Materialverbrauch des Unternehmens im Jahre 2013 sein, wenn das mittlere jährliche Entwicklungstempo des Zeitraumes 2007 – 2011 weiterhin beibehalten wird?

Drei Stichproben

Von drei verschiedenen Stichproben mit nur positiven Beobachtungswerten sind folgende Informationen gegeben:

Stichprobe 1 2 3
Stichprobenumfang 10 40 50
arithmetisches Mittel 51 53 54
Varianz 21 22 23

Die drei Stichproben werden zu einer einzigen Stichprobe vereinigt. Berechnen Sie die Varianz für die gesamte Stichprobe.

Eine Befragung von Studierenden - Teil I

Für eine Untersuchung von Studierenden an einer deutschen Hochschule wurden im Juni 25 Studierende nach dem Studiengang, der Anzahl der Geschwister und nach dem Einkommen befragt. Das Ergebnis war:

Name Studiengang Zahl der Einkommen
Geschwister
1 Martin A. VWL 0 924
2 Ute A. Sozialwiss. 1 789
3 Wilhelm A. BWL 0 1 365
4 Kurt B. BWL 1 683
5 Sylvia B. Polit.Wiss. 1 744
6 Elke D. Polit.Wiss. 2 640
7 Klaus D. Sozialwiss. 2 631
8 Theo E. VWL 1 814
9 Jean F. Polit.Wiss. 1 778
10 Elvira G. BWL 0 1 062
11 Karl H. BWL 0 1 230
12 Andreas K. VWL 1 700
13 Thomas K. BWL 0 850
14 Chris L. Sozialwiss. 3 641
15 Uwe L. Polit.Wiss. 2 640
16 Axel M. BWL 0 850
17 Maria M. BWL 1 683
18 Ruth M. Sozialwiss. 0 616
19 Bärbel N. BWL 1 683
20 Armin R. BWL 2 683
21 Christa R. VWL 1 660
22 Bernd S. BWL 1 1 440
23 Claudia S. Sozialwiss. 3 794
24 Erich T. VWL 0 660
25 Claudia W. Polit.Wiss. 1 640
  • Was ist bei dieser Befragung die Grundgesamtheit, was sind die einzelnen statistischen Einheiten? Durch welche Identifikationskriterien ist die untersuchte Grundgesamtheit festgelegt?
  • Wie ist das Erhebungsmerkmal “Studiengang” skaliert? Ermitteln Sie aus der obigen Urliste die absolute und relative Häufigkeitsverteilung für dieses Merkmal. Stellen Sie die Häufigkeitsverteilung graphisch dar.
  • Wie ist das Erhebungsmerkmal “Anzahl der Geschwister” skaliert? Ermitteln Sie die absolute und relative Häufigkeitsverteilung für dieses Merkmal. Erstellen Sie die empirische Verteilungsfunktion. Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar.
  • Wie viele Studierende haben höchstens 2 Geschwister? Wie viel Prozent der Studierenden haben mindestens 2 Geschwister? Wie viel Prozent der Studierenden haben ein oder zwei Geschwister?
  • Wie ist das Erhebungsmerkmal “Einkommen” skaliert? Ermitteln Sie die absolute und relative Häufigkeitsverteilung für dieses Merkmal unter Verwendung folgender Einkommensklassen (von ... bis unter ...): 600–650, 650–700, 700–900, 900–1200, 1200–1450. Erstellen Sie die empirische Verteilungsfunktion. Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar.
  • Berechnen Sie ausgehend von der Einkommensverteilung unter e):
    • Welcher Anteil der Studierenden hat ein Einkommen von mindestens 750 und höchstens 1300 EUR?
    • Welcher Anteil der Studierenden hat ein Einkommen von mehr als 800 EUR?
    • Welches Einkommen hatten die 50% einkommensschwächsten Studierenden höchstens?
    • Welches Einkommen hatten die 20% einkommensstärksten Studierenden mindestens?


Eine Befragung von Studierenden - Teil II

Bezogen auf die [Aufgabe23]

  • Ermitteln Sie einen geeigneten Lageparameter für das Erhebungsmerkmal : “Studiengang”.
  • Ermitteln Sie drei geeignete Lageparameter für das Erhebungsmerkmal : “Anzahl der Geschwister”.
  • Berechnen Sie basierend auf der Urliste das durchschnittliche Einkommen eines/einer Studierenden.
  • Berechnen Sie basierend auf der Häufigkeitsverteilung der klassierten Daten des Erhebungsmerkmals : “Einkommen” zwei aussagekräftige Lageparameter, die Quartile und das 90%–Quantil.
  • Geben Sie für das Merkmal “Einkommen” die 5 - Zahlen - Zusammenfassung (Min, Max, Median, unteres und oberes Quartil) an und zeichnen Sie den Box–Plot.


Einkommen der Beamten

In der Auswertung einer statistischen Erhebung vom April 2012 erhielt die Hälfte der befragten Beamten in einer Region ein monatliches Nettoeinkommen unter 2590 EUR. 1/4 der Beamten erhielten mehr als 3590 EUR. Während die gesamte Einkommensspannweite mit 8000 EUR angegeben wird, wird für die mittleren 50% der Beamten eine Einkommensspannweite von 1770 EUR ausgewiesen. Das geringste Einkommen lag bei 500 EUR. Die Standardabweichung der Nettoeinkommen wird mit 1620 EUR angegeben. Das sind 54% des durchschnittlichen Nettoeinkommens.
Bestimmen Sie das 25%–Quartil des Nettoeinkommens der befragten Beamten.

Einkommensgleichheit

Ein Ökonom möchte die relative Einkommensgleichheit auf den drei melanesischen Inseln Atoll A, B und C vergleichen. Auf jeder Insel leben 8 Personen. Zahlungsmittel auf den Inseln sind Kauri Schnecken. Als geeignetes Maß erscheint dem Ökonomen der Variationskoeffizient. Berechnen Sie diesen für Atoll A mit folgender Einkommenstabelle.

Atoll A Einkommen
Person in Kauri Schnecken
1 225
2 185
3 250
4 150
5 237
6 100
7 87
8 305

Einkommen und Alter

50 Personen wurden nach dem Einkommen (EUR) und dem Alter (Jahre) befragt. Im Ergebnis ergab sich nachstehende Korrelationstabelle:

Einkommen
20–30 30–40 40–50 50–60 60–70
0–1000 1 2 1 1 1
1000–1500 2 4 4 3 1
1500–2000 3 6 6 3 2
2000–3000 1 3 2 2 2
  • Erstellen Sie die Korrelationstabelle mit den relativen Häufigkeiten.
  • Bestimmen Sie die Randverteilungen.
  • Bestimmen Sie für jede Altersgruppe die bedingte Verteilung des Einkommens.
  • Bestimmen Sie für jede Einkommensgruppe die bedingte Verteilung des Alters.
  • Berechnen Sie das durchschnittliche Einkommen der 50 Personen.
  • Berechnen Sie das durchschnittliche Alter der 50 Personen.
  • Bestimmen Sie das am häufigsten aufgetretene Einkommen.
  • Welches Einkommen höchstens hatten die 50% ärmsten Personen?
  • Berechnen Sie die durchschnittlichen bedingten Einkommen je Altersgruppe.
  • Berechnen Sie die Standardabweichung des Einkommens.
  • Berechnen Sie die Kovarianz zwischen Einkommen und Alter.

Einwohnerzahlen

Für das Jahr 1980 wurden nachstehende Einwohnerzahlen (in Millionen) im Fischer–Weltalmanach 2000 veröffentlicht.

Land Einwohner Land Einwohner
(Millionen) (Millionen)
Bangladesh 87 Indonesien 148
Brasilien 122 Japan 117
China 981 Pakistan 83
Deutschland 78 Russland 139
Indien 687 USA 227

Berechnen Sie einen aussagekräftigen Mittelwert.

Eiskugelkonsum

Der Eisverkäufer Hardy möchte seinen Kunden täglich frisches Eis verkaufen. Damit er immer die richtigen Mengen vorrätig hat und in Zukunft besser planen kann, zählt er an einem Tag bei 200 Kunden den Eiskugelkonsum:

Kein Kunde hat genau 2 oder mehr als 6 Kugeln verlangt. Je 20% der Kunden wollten 1 Kugel oder mindestens 5 Kugeln. Höchstens 3 Kugeln verlangten 45% der Kunden. Die Summe der Anteile der Kunden, die 4 bzw. 6 Kugeln wollten, war zehnmal so hoch wie der Anteil der Kunden, die 5 Kugeln verlangten.

  • Wie lautet das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Bestimmen sie tabellarisch die absoluten und relativen Häufigkeiten sowie die empirische Verteilungsfunktion.
  • Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar.
  • Wie viel Prozent der Kunden kauften höchstens 5 Kugeln Eis?
  • Wie viele Kugeln Eis mindestens kauften 80% der Kunden?
  • Wie viele Kugeln Eis kauften genau 35% der Kunden?

Erdbeerplantage - Teil I

Der Student Alois besitzt eine Erdbeerplantage in Bayern, um sich damit sein Studium zu finanzieren. Da das Ernteergebnis je nach “Qualität des Sommers” verschieden ist, notierte sich Alois, wie viele Stunden die Sonne in der diesjährigen Saison pro Tag auf seine Beeren einwirkte:

Sonnenstunden pro Tag
von ... bis unter ... Anzahl der Tage
0 – 2 20
2 – 3 15
3 – 5 20
5 – 8 35
8 – 12 10

Mit der Auswertung der Daten erhofft er sich Aufschlüsse über den zu erwartenden Ertrag seiner Plantage.

  • Wie lautet das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Stellen Sie die Häufigkeiten aus der Tabelle graphisch dar.
  • Zeichnen Sie die empirische Verteilungsfunktion.
  • An wie vielen Tagen der Saison schien die Sonne mindestens 4 Stunden?
  • Wie lange höchstens schien die Sonne an den 40 sonnenärmsten Tagen der Saison?
  • An wie vielen Tagen in dieser Saison schien die Sonne prozentual 4 und 9 Stunden?


Erdbeerplantage - Teil II

Der Student Alois aus [Aufgabe13] möchte wissen:

  • Wie viele Stunden schien die Sonne durchschnittlich pro Tag in der Saison?
  • Wie lange schien die Sonne höchstens an den 50% sonnenärmsten Tagen der Saison?


Familienstand

Sie sollen die Studierenden des Fachbereiches Wirtschaftswissenschaften der Humboldt-Universität zu Berlin im Sommersemester  bezüglich des Familienstandes untersuchen.

Definieren Sie die Begriffe Grundgesamtheit, Identifikationskriterien, statistische Einheit, statistisches Merkmal und Merkmalsausprägung konkret für die Aufgabenstellung.

Festgeldkonten

Eine internationale Bank, die in 5 Ländern agiert, bietet Festgeldkonten an. Die Einlagen werden länderabhängig mit einem variablen Zinssatz verzinst, wobei der länderspezifische, variable Zinssatz, ein länderunabhängiger Zinsatz und der Median der Zinssätze für Einlagen im jeweiligen Land sind. Der länderunabhängige Zinssatz beträgt . Die länderspezifischen Verteilungen der Einlagezinssätze sind in nachfolgender Tabelle gegeben:

Zinssätze Land 1 Land 2 Land 3 Land 4 Land 5
4,0 – 4,5% 0,200 0,050 0,020 0,150 0,275
4,5 – 5,0% 0,240 0,110 0,055 0,350 0,375
5,0 – 5,5% 0,300 0,340 0,300 0,350 0,350
5,5 – 6,0% 0,260 0,500 0,625 0,150 0,000

Berechnen Sie den durchschnittlichen variablen Zinssatz für Festgeldkonten dieser internationalen Bank.

Fließband

An einem Fließband sind 6 Arbeiter acht Stunden am Tag mit der Kontrolle eines elektronischen Bauteils beschäftigt. Um ein Bauteil zu kontrollieren, benötigen sie folgende Zeiten:

Arbeiter Stückzeit (in Minuten)
A 2
B 4
C 8
D 10
E 8
F 5

Berechnen Sie einen geeigneten Mittelwert für die Kontrollzeit pro Stück an diesem Fließband.

Führerschein–Entziehungen

Promille gefährden den Führerschein!

Bei den im Jahre 1990 durchgeführten Kontrollen wurde für die angegebenen Altersklassen nachstehende Anzahlen von Führerschein–Entziehungen registriert.
nach: Berliner Zeitung vom 29.2./1.3.1992

Alter (Jahre) Führerschein–Entziehungen
20 – 30 40 500
30 – 40 29 200
40 – 50 22 100
50 – 60 12 600
  • Berechnen Sie das Durchschnittsalter der betroffenen Fahrer(innen).
  • Berechnen Sie die Standardabweichung des Alters und den Variationskoeffizienten (runden Sie dafür das Durchschnittsalter auf ganze Jahre auf bzw. ab).
  • In welchem Altersbereich liegen die mittleren 50% der betroffenen Fahrer(innen)?
  • Welches Alter höchstens hatten die 50% jüngsten Fahrer(innen) mit Führerschein–Entzug? Welche Maßzahl haben Sie berechnet?
  • Berechnen Sie zu der Ma“szahl unter d) ein geeignetes Streuungsma”s.

Gartenzwerg–Großhandel

Herr Meier besitzt einen Gartenzwerg–Großhandel mit drei Filialen: Berlin, New York und Flensburg. Am Ende des Geschäftsjahres möchte er einen Überblick über die Geschäftslage erhalten und fordert deshalb in allen drei Filialen Informationen über die innerhalb des letzten Jahres eingegangenen Aufträge an.

  • Seine Berliner Filiale übermittelt ihm folgende Informationen:

    Auftragshöhe in EUR
    von...bis unter... Anzahl der Aufträge
    0 – 20 000 15
    20 000 – 50 000 30
    50 000 – 150 000 45
    150 000 – 300 000 10
    • Wie heißt das untersuchte statistische Merkmal und wie ist es skaliert?

    • An welchen statistischen Einheiten wurde dieses Merkmal erhoben?

    • Berechnen Sie die durchschnittliche Auftragshöhe.

  • Die New Yorker Filiale antwortet auf Herrn Meiers Anfrage kurz und bündig: : “Auftragshöhe [in $] pro Auftrag”; 95 Aufträge; .
    Um besser vergleichen zu können, möchte Herr Meier diese Angaben in EUR kennen. Berechnen Sie die durchschnittliche Auftragshöhe, wenn folgender Dollarkurs gilt: 1 $ = 1,5 EUR.

  • Aus Flensburg erhält Herr Meier folgende Daten:
    2 000 EUR; 12 000 EUR; 17 000 EUR; 12 000 EUR; 200 000 EUR.

    • Welche(n) Mittelwert(e) können Sie in diesem Fall sinnvoll angeben? Begründen Sie für jeden die Vor– und Nachteile in Situation !

    • Ein Fernschreiben korrigiert die Höhe des letzten Auftrages auf 2 000 EUR. Berechnen Sie aus den korrigierten Daten die durchschnittliche Auftragshöhe.

  • Berechnen Sie die durchschnittliche Auftragshöhe für das gesamte Unternehmen.

Gefahrene Strecke

Bei 20 Vertretern eines Versicherungsunternehmens verteilt sich die in einer Woche mit dem Firmenwagen gefahrene Strecke wie folgt:

Gefahrene Strecke in km Anzahl Vertreter
0-50 3
50-100 5
100-300 6
300-500 4
500-1000 2

Geben Sie die Länge des Bereiches an, in dem die 50% der Vertreter mit den mittleren gefahrenen Streckenlängen liegen.

Gleisbaubetrieb

Der Direktor eines Gleisbaubetriebes erhält folgende Information:

In der letzten Schicht von 8 Stunden haben die drei Bauzüge des Betriebes beim Verlegen von Gleisen im Mittel 180,6 Minuten pro Gleis benötigt, wobei Bauzug A 250 Minuten/Gleis, Bauzug B 166,7 Minuten/Gleis und Bauzug C 125 Minuten/Gleis brauchte.

Überprüfen Sie den angegebenen Mittelwert und korrigieren Sie ihn gegebenenfalls mit einer exakten Begründung.

Glücksspielautomaten

In der Lieblingskneipe der Studentin Fritzi stehen zwei Glücksspielautomaten. Beide Automaten erwarten den gleichen Einsatz pro Spiel. Um ihre Gewinnchancen zu optimieren, spielt Fritzi mit jedem der Automaten für eine Weile. Folgende Gewinne erzielt sie in den einzelnen Spielen:

Automat A:0,01,52,01,52,02,55,51,0
Automat B:6 mal 0,5; 5 mal 1,0; 1 mal 7,5; 2 mal 5,5

Welchen Median hat der Automat mit dem größten durchschnittlichen Gewinn?

GM

Ein Anleger aus Deutschland möchte Aktien des amerikanischen Automobil–Herstellers GM kaufen. Der Kurs der Aktie beträgt zur Zeit 100 $ und der Wechselkurs ist 2 EUR/$. Damit kostet ihn eine GM–Aktie 200 EUR. Der Anleger will die Aktie jedoch nur kaufen, wenn deren durchschnittlicher Wert in den letzten Monaten über 225 EUR lag. Ihm steht folgende Häufigkeitstabelle zur Verfügung:

Wechselkurs
in EUR/$ 115,00 116,25 118,00 119,15 119,75
1,90 0,02 0,06 0,010 0,04 0,070
1,95 0,04 0,12 0,020 0,08 0,140
2,00 0,01 0,03 0,005 0,02 0,035
2,02 0,01 0,03 0,005 0,02 0,035
2,04 0,02 0,06 0,010 0,04 0,070

Zusätzlich weiß er, dass der Kurs der Aktie und der Wechselkurs unabhängig sind. Berechnen Sie auf der Basis der gegebenen Tabelle den durchschnittlichen Wert der Aktie in EUR.

Grafische Darstellung

Gegeben sind folgende Daten des statistischen Bundesamtes von 1998 über das Alter der im Straßenverkehr Getöteten innerhalb von Ortschaften.

Alter unter 15 15 - 18 18 - 25 25 - 65 65 - 90
Anzahl 126 76 258 808 638

Welche der folgenden grafischen Darstellungen beschreibt die Häufigkeitsverteilung der Daten korrekt?

image

Häufbare Variablen

Welche der unter [Aufgabe16] genannten Merkmale sind häufbar?

Histogramm

Für das Merkmal “Einwohnerzahl” von 110 Gemeinden eines Landkreises liegt folgendes Histogramm vor:

Datei:Bild5.pdf

Welche Anzahl von Gemeinden hat mindestens 5000 und höchstens 16000 Einwohner?

Intercity – Zug

Ein Intercity – Zug legt 300 km in vier Abschnitten zurück, wobei die Geschwindigkeit wegen unterschiedlicher Streckenbeschaffenheit jeweils verschieden ist:

Streckenabschnitt Streckenlänge Geschwindigkeit
(in km) (in km/h)
A 100 150
B 60 120
C 50 100
D 90 90

Berechnen Sie die Durchschnittsgeschwindigkeit für die Gesamtstrecke.

Internetstunden

Das folgende Histogramm gibt die Häufigkeitsverteilung von Internetstunden pro Woche für eine Grundgesamtheit von 100 Informatikstudenten an.

Datei:Bild7.pdf

Bestimmen Sie den Median aus diesen Daten.

Kaltmieten

In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer sollen die Kaltmieten analysiert werden. Aus einer ersten Auswertung ergibt sich folgende Tabelle:

Kaltmiete (pro m)
von …bis unter … Anzahl
0–6 5
6–8 10
8–10 30
10–13 30
13–16 20
16–20 5

Bestimmen Sie den Median aus diesen Daten.

Kartoffeln

An zwei Verladestellen für Kartoffeln der Deutschen Bahn wurden folgende Angaben ermittelt:

Verlade- Kosten gesamt Kosten je Kosten je verladene Tonne
stelle (EUR) Stunde (EUR/h) (EUR/t)
1 16 000 40 1,00
2 27 000 45 0,75
  • Berechnen Sie die durchschnittlichen Kosten je verladene Tonne der beiden Verladestellen.
  • Wieviel Tonnen wurden durchschnittlich je Stunde bei beiden Verladestellen verladen?

Kaufkurs der Aktien

Zu Börsenbeginn am gestrigen Tag betrug der Kurs von 4 Aktien, die in Zeile 2 der Tabelle angegebenen Werte. Jemand kaufte zu diesen Kursen die Aktien zu den Kaufbeträgen, die in der Zeile 3 der Tabelle enthalten sind.

Aktie A B C D
Kurs (in Euro) 500 600 400 700
Kaufbetrag (in Euro) 45000 84000 3600 14000

Berechnen Sie den mittleren Kaufkurs der Aktien.

Koeffizienten Vergleich

Folgende Koeffizienten wurden von einem Wirtschaftswissenschaftler mit Hilfe eines Statistikprogrammes für alle Variablen eines Datensatzes berechnet:

  1. arith. Mittelwert
  2. Bravais–Pearson K.–koeffizient
  3. geometr. Mittelwert
  4. Interquartilsabstand
  5. Kendalls Rangk.–koeffizient
  6. Korr. Kontingenzkoeffizient
  7. Kovarianz
  8. Median
  9. Modus
  10. Quadratische Kontingenz
  11. Spannweite
  12. Spearmannsche Rangk.–koeffizient
  13. Standardabweichung
  14. Varianz
  15. keiner der Koeffizienten

Helfen Sie dem Wirtschaftswissenschaftler den/die Koeffizienten herauszusuchen,

  1. die ein robustes Lagemaß darstellen.
  2. die als Zusammenhangsmaß für zwei nominal skalierte Variablen benutzt werden können.
  3. die ein robustes Streuungsmaß für eine metrische Variable darstellen.
  4. die bei metrischen Variablen unverändert bleiben unter linearen Transformationen der Form .

Körpergröße

Die folgende Tabelle gibt die Körpergröße von 5 Kindern in Zoll und cm an (es wird der Einfachheit halber 1 Zoll = 2,5 cm gesetzt):

x cm 120 130 125 130 135
y Zoll 48 52 50 52 54
  • Berechnen Sie das arithmetische Mittel, die Standardabweichung und den Variationskoeffizienten für beide Messreihen.
  • Welche Beziehung besteht zwischen den jeweiligen Ergebnissen beider Messreihen? Geben Sie diese Beziehung formal an.

Körperschaftssteueraufkommen

Über das Körperschaftssteueraufkommen einer Stadt, angegeben nach den Rechtsformen der körperschaftssteuerpflichtigen Gesellschaften, sind nachstehende Maßzahlen bekannt:

Rechtsform steuer- mittleres Steuer- Standard-
pflichtige aufkommen abweichung
Fälle (TEUR) (TEUR)
AG, KGaA 100 9500 1000
GmbH 9500 100 80
eG 300 200 100
sonstige 100 400 250

Berechnen Sie die Standardabweichung des Körperschaftssteueraufkommens für die gesamte Stadt.

Kontrollzeiten

An einem Fließband sind sechs Arbeiterinnnen acht Stunden am Tag mit der Kontrolle eines elektronischen Bauteils beschäftigt. Um ein Bauteil zu kontrollieren, benötigen sie folgende Zeiten:

Arbeiterin Stückzeit
Frau Arbeitsam 0,2 min
Frau Beeilung 0,4 min
Frau Chaos 0,8 min
Frau Durchschnitt 0,5 min
Frau Emsig 0,5 min
Frau Faultier 0,8 min

Berechnen Sie die durchschnittliche Kontrollzeit pro Stück an diesem Fließband.

Kurzarbeiter

Im März  wurden in den fünf neuen Bundesländern folgende Anzahlen von Kurzarbeitern nach dem Arbeitsausfall (in %) registriert (fikitve Daten):

Arbeitsausfall (%) Anzahl der Kurzarbeiter
10 – 25 461 200
25 – 50 687 400
50 – 75 385 200
75 – 100 233 200
  • Berechnen Sie den durchschnittlichen Arbeitsausfall der Kurzarbeiter im März  in den fünf neuen Bundesländern.
  • Welcher Arbeitsausfall ergibt sich, wenn 50% der Kurzarbeiter einen geringeren Arbeitsausfall und 50% der Kurzarbeiter einen höheren Arbeitsausfall hatten?

Leichtathletikabteilung

Die Leichtathletikabteilung des Sportvereins Z ist spezialisiert auf das Training von 100 m – LauferInnen. Nach einem Jahr intensivsten Trainings wurden die Zeiten der 20 LäuferInnen des Vereins gestoppt. Dabei ergab sich folgende Verteilungsfunktion:

Datei:Bild4.pdf

  • Zeichnen Sie die zur Verteilungsfunktion gehörige Häufigkeitsverteilung.
  • Welche Zeit höchstens benötigen die 80% schnellsten Läufer?
  • Berechnen Sie die mittlere quadratische Abweichung bezogen auf das arithmetische Mittel und auf den Median.
  • Welche Grö“senbeziehung besteht zwischen den beiden Ergebnissen von c)? Gilt diese Grö”senbeziehung stets? Wenn ja, zeigen Sie dies.

Lernzeit

Ein Universitätspräsident gibt eine statistische Untersuchung in Auftrag, mit der festgestellt werden soll, wie viel Zeit die Studierenden für ihr Studium aufwenden. Die Befragung von 100 Studierenden dieser Universität brachte folgendes Ergebnis:
Keiner der Befragten lernt 12 und mehr Stunden am Tag. Bei 22 Studierenden wurde festgestellt, dass sie sich mindestens 6 Stunden am Tag mit ihrem Studium beschäftigen. Weniger als 3 Stunden am Tag investierten 30% der Befragten in ihr Studium. Die Masse der Studierenden (65%) beschäftigt sich zwischen 3 und 8 Stunden täglich mit Studienangelegenheiten.

  • Wie heißt das untersuchte Merkmal und wie ist es skaliert?
  • Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion. Teilen Sie zu diesem Zweck die Daten in vier Klassen ein.
  • Wie viele Stunden höchstens beschäftigt sich genau die Hälfte der Befragten täglich mit dem Studium?
  • Wie viele der Befragten arbeiten mindestens 5 Stunden täglich für ihr Studium?
  • Wie groß ist der durchschnittliche Zeitaufwand für das Studium bei den 100 befragten Studierenden?
  • Welcher Zeitaufwand für das Studium trat bei den befragten Studierenden am häufigsten auf?

Lineares Streuungsmaß

Von den der Größe nach aufsteigend geordneten fünf Werten eines Merkmals X sind nur die ersten vier lesbar:

3 7 17 19 ??

Wie lautet der 5. Wert, wenn bekannt ist, dass die durchschnittliche absolute Abweichung (lineares Streuungsmaß) der fünf Werte – bezogen auf den Median – gleich 8 ist?

Maschinen

In einer Fabrik stehen zwei Maschinen, die Motorenhauben stanzen: die erste Maschine für den Fiat mit einer durchschnittlichen Länge von 80 cm, die zweite für den Mercedes mit einer durchschnittlichen Länge von 300 cm. Die erste Maschine produziert mit einer Standardabweichung von 4 cm, die zweite mit einer Standardabweichung von 6 cm.

Welche Maschine arbeitet zuverlässiger?

Mensaessen

Student Schusslig hat für das Studentenwerk die Essensqualität und das Preis-/Leistungsverhältnis der Mensaessen analysiert. Die ermittelten Daten hat er in der folgenden Tabelle von Rangzahlen zusammengefasst. Leider sind ihm dabei zwei Werte abhanden gekommen:

Merkmal/Essen Essensqualität Preis/Leistung
Eintopf 1
Essen 1 5
Essen 2 6 3
Vegetarisch 2 5
Pizza 3 6
Salat 4 2

Schusslig erinnert sich noch, dass der Spearmansche Rangkorrelationskoeffizient nicht negativ war. Welchen Wert hat dieser Korrelationskoeffizient?

Merkmalsausprägungen

In einer deutschen Großstadt K wird das Sparverhalten der Erwerbstätigen im März  untersucht.
Durch welche sachlichen, örtlichen und zeitlichen Identifikationskriterien wird die untersuchte Gesamtheit identifiziert?

Miete und Wohnfläche

In einem Wohnviertel mit Häusern verschiedener Wohnungseigentümer wird die Quadratmetermiete in Abhängigkeit von der Wohnfläche analysiert. Es ergibt sich aus der Auswertung von 10 Mietwohnungen folgendes Bild:

Wohnfläche (m)
40 12 12 15
60 12
80 10 10
90 9 10 10 10

Der Makler möchte wissen, wie die Abhängigkeit von Miete und Wohnfläche ist. Bestimmen Sie für ihn die Kovarianz der Merkmale.

Minimale Summe

Für ein metrisches Merkmal hat man folgende Urliste

1 2 3 4 5 6 7 8
5 7 9 10 10 12 13 14

Für welche reelle Zahl ist minimal? (ohne Beweis!)

Nelkenstrauß

Ein Kunde kauft an einem Tag einen Strau“s Nelken für 12 EUR, das Stück zu 0,80 EUR, und am nächsten Tag einen Strau”s Nelken für 26 EUR, das Stück zu 1,04 EUR. Welcher durchschnittliche Preis ist für eine Nelke an diesen beiden Tagen bezahlt worden?

Neubauwohnungen

Über die Bauzeiten der im Jahre  in der Stadt C errichteten Neubauwohnungen liegen folgende Angaben vor:


Bauzeit Anteil der neugebauten
(in Monaten) Wohnungseinheiten (in Prozent)
2–4 3,7
4–6 13,1
6–8 27,5
8–10 21,1
10–12 16,0
12–14 6,4
14–16 5,3
16–18 6,9

Berechnen Sie drei aussagekräftige Mittelwerte zur Beantwortung der Frage:

Wie viele Monate Bauzeit wurden im Mittel für die im Jahre  in der Stadt C errichteten Wohnungseinheiten benötigt?

Old Faithful

Die Beobachtung des größten Geysir der Welt, dem Old Faithful im Yellowstone National Park in den USA, brachte einen Touristen auf die Idee, zu untersuchen, ob zwischen der Dauer einer Eruption (in Minuten) – Variable – und der Zeit zwischen zwei Eruptionen (in Minuten) – Variable – ein Zusammenhang besteht.
Er ordnet 8 Eruptionen deren Dauer und die Zeit, die zwischen dem Beginn einer Eruption und dem Beginn der darauf folgenden Eruption verstrichen ist, zu. Aufgrund dieser Beobachtungsdaten stehen Ihnen folgende Ergebnisse zur Verfügung:

Geben Sie mittels eines geeigneten Maßes die Stärke des Zusammenhanges zwischen der Dauer einer Eruption und der Zeit zwischen zwei Eruptionen an.

Perlenkette

Agathe hat von ihrem Freund eine Perlenkette geschenkt bekommen. Um sich einen Überblick über den Wert der Kette zu verschaffen, misst sie die Durchmesser (in mm) der Perlen:

3,1 4,2 3,7 6,8 7,3 5,2 5,4 4,5 3,9 3,3
5,0 3,7 6,9 6,1 4,0 4,1 6,1 6,0 5,7 5,2
5,6 4,4 4,2 3,7 5,3 3,4 6,8 6,3 4,1 3,3
4,2 5,8 5,6 3,2 5,5 4,5 5,1 4,6 5,3 3,4
6,5 6,2 4,0 3,6 4,9 4,8 4,9 4,6 4,7 4,8
4,5 5,4 3,5 5,8 4,9 5,0 3,6 7,5 3,2 3,2
3,4 3,5 3,2 5,1 5,5 4,3 4,5 3,8 5,1 3,8
7,2 5,9
  • Erstellen Sie eine Häufigkeitstabelle bei Zugrundelegung von Klassen mit 1 mm Klassenbreite.
  • Berechnen Sie basierend auf den klassierten Daten den durchschnittlichen Durchmesser der Perlen.
  • Welcher Durchmesser trat bei dieser Perlenkette am häufigsten auf?
  • Welchen Durchmesser höchstens haben 50% der kleinsten Perlen?

Produktionsleistung einer Maschine

An einer neu angeschafften Maschine, die pro Tag maximal 300 Produkteinheiten herstellen kann, werden an insgesamt 20 Tagen folgende Stückzahlen produziert:

Anzahl der Tage 6 3 5 4 2
produzierte Stück/Tag 296 297 298 295 299
  • Der Abteilungsleiter behauptet gegenüber dem Firmenchef, dass die Maschine im Durchschnitt pro Tag über 98% ihrer Produktionsleistung erbringt. Überprüfen Sie diese Aussage!
  • Berechnen Sie den Median und die mittlere absolute Abweichung vom Median der produzierten Stückzahlen/Tag.

Reinigungsunternehmen - Teil I

Für die Angestellten der drei Putzkolonnen eines Reinigungsunternehmens ergeben sich aufgrund von Alter, Betriebszugehörigkeit und Einsatzgebiet folgende Einkommen (in EUR) pro Monat:

  • 2 624, 2 830, 2 386, 2 395, 2 147, 2 546
  • 2 936, 2 758, 2 774, 2 822
  • 2 325, 2 536, 2 395, 2 454, 2 640.

Berechnen Sie für jede Putzkolonne und für das gesamte Reinigungsunternehmen das durchschnittliche Einkommen und den Median des Einkommens.


Reinigungsunternehmen - Teil II

Berechnen Sie für jede Putzkolonne aus [Aufgabe27] die Standardabweichung und den Variationskoeffizienten.

Ermitteln Sie anschließend unter Verwendung dieser Varianzen die Varianz des zusammengesetzten Datensatzes, d.h. die Varianz für das gesamte Reinigungsunternehmen.


Relationen der Merkmalsausprägungen

Für zwei Merkmale X und Y hat man bei 5 statistischen Einheiten die Paare der Merkmalsausprägungen erfasst. Für die Merkmalsausprägungen gelten folgende Relationen:
und .
Berechnen Sie ein geeignetes Zusammenhangsmaß zwischen X und Y.

Sanatorium

In einem Sanatorium wird ein kleiner Wettlauf der Patienten über 50m durchgeführt. Die folgende Tabelle gibt in der Reihenfolge ihres Eintreffens am Ziel das Gewicht (in kg) der Patienten an:

Patient 1 2 3 4 5 6 7 8 9 10 11
Gewicht 70 60 80 77 82 81 78 100 83 110 79
  • Wie stark ist der Zusammenhang zwischen Körpergewicht und Laufleistung?
  • Bestimmen Sie den Median des Körpergewichts.
  • Bestimmen Sie das quadratische Streuungsmaß in Bezug auf den Median.
  • Ist die Varianz des Gewichts grö“ser oder kleiner als die unter c) bestimmte Grö”se? Warum?
  • Die zwei Frauen unter den Patienten liefen die Strecke mit Geschwindigkeiten von 2 bzw. 4 Meter pro Sekunde. Wie groß war die Durchschnittsgeschwindigkeit der Frauen?

Schafzucht - Teil I

Der schottische Großgrundbesitzer McDuff verdient sein Geld mit der Zucht von Schafen. Er nimmt sich für die nächste Schafsschur vor, sowohl billige irische Wanderarbeiter mit einem Leistungslohn von 15 Pfund pro kg Wolle, als auch einheimische Arbeiter für 20 Pfund pro kg Wolle einzusetzen. Für die Iren will er insgesamt 285 Pfund, für die Schotten insgesamt 260 Pfund an Lohnsumme aufbringen.

Wie hoch sind seine durchschnittlichen Lohnkosten pro kg Wolle?


Schafzucht Teil - II

Fortsetzung der Aufgabe 1-33. Unser schottischer Großgrundbesitzer McDuff (aus Aufgabe 33) verkauft die Wolle an einen Freund auf den Niederländischen Antillen. Im Laufe der letzten fünf Monate erwirtschaftete er folgende Gewinne (in Tsd. Gulden): 5 ; 4 ; 20 ; 6 ; 4.

McDuff tauscht sein Geld stets bei einem Bankier in Edinburgh in Pfund ein. Er weiß, dass der Wechselkurs stabil ist und er jeden Monat eine feste, vom Umtauschbetrag unabhängige Gebühr zu entrichten hat. In den letzten fünf Monaten hat er insgesamt 15,5 (Tsd.) Pfund ausgezahlt bekommen. Die Varianz betrug 9,44 (Tsd. Pfund).

Wie hoch sind Gebühr und Wechselkurs?


Schulbezirke

Aus einem Datensatz mit nicht klassierten Daten über 506 Schulbezirke in einer Großstadt wurden folgende Variablen zur Analyse ausgewählt:

  • : der Schulbezirk liegt verkehrsgünstig (1) oder nicht (0)
  • : durchschnittliche Anzahl von Räumen pro Haus im Schulbezirk

Für diese Variablen wurden folgende Maßzahlen berechnet:

Maßzahl
arithmetischer Mittelwert 0,07 6,28
Maximum 1,00 8,78
Median 0,00 6,21
Minimum 0,00 3,56
Modus 0,00 5,71
Spannweite 1,00 5,22
Standardabweichung 0,00 0,70
Varianz 0,07 0,49
25%-Quartil 0,00 5,88
75%-Quartil 0,00 6,63

Begründen Sie kurz, welche Maßzahlen für welche Variable sinnvoll sind.

Skalierung

Gegeben sind die folgenden Merkmale:

1. Geschlecht
2. Temperatur in Celsius
3. Körpergrö“se
4. Kinderzahl
5. Postleitzahl
6. Schulnote
7. Betriebsgrö”senklasse
8. Normabweichung
9. Länge eines Werkstückes
10. abonnierten Zeitungen
11. Nationalität
12. Wahlergebnis einer Partei
13. Militärdienstgrad
14. Fahrpreise
15. Freizeitbeschäftigung
16. Bücherbestand einer Bibliothek
17. Windstärke
18. Geschwindigkeit
19. Rückennummern von Fu“sballspielern
20. Schwierigkeitsgrad einer Klettertour
21. Kraftstoffverbrauch eines PKW auf 100 km
22. Tarifklassen bei der Kfz-Haftpflicht
23. Güteklasse
24. Preis einer Ware
25. Lebensalter
26. Einkommen
27. Familienstand
28. erlernter Beruf
29. Geburtsjahrgang
30. Seitenzahl eines Buches
31. Todesursache
32. Jahresumsatz
33. Grundstücksgrö”se
34. Studienfach
35. Breitengrade der Erde
36. Handelsklasse bei Obst
37. Augenfarbe
38. Wohnsitz
39. Telefonnummer
40. Aggressivität
41. Rechtsform einer Unternehmung
42. Intelligenz
43. sozialer Status
44. Finanzierung des Studiums
45. Produktionsdauer
46. Semesterzahl
47. Klausurpunkte

  • Geben Sie die Skalierung der Merkmale an.
  • Welche der Merkmale sind häufbar?
  • Welche der genannten Merkmale sind diskret und welche sind stetig?

Sportveranstaltungen

Eine Befragung von 300 Zuschauern bei 2 Arten von Sportveranstaltungen (Tennis und Fu“sball) ergab folgendes Ergebnis: 52 Personen besuchen häufig Tennis und selten Fu”sball, 62 Personen selten Tennis und häufig Fußball, 118 Personen beides häufig und 68 Personen beides selten.

100 der erfassten Personen sind über 30 Jahre alt. Von diesen Personen besuchen 24 häufig Tennis und selten Fu“sball, 14 selten Tennis und häufig Fu”sball, 6 beides häufig und 56 beides selten.

Von den höchstens 30 Jahre alten Personen besuchen 28 häufig Tennis und selten Fu“sball, 48 selten Tennis und häufig Fu”sball, 112 beides häufig und 12 beides selten.

Der Zusammenhang zwischen der Häufigkeit des Besuchs von Tennis– und Fußballveranstaltungen ist:

  • für die unaufgegliederte Gesamtheit der Befragten,
  • für die über 30 Jahre alten Personen und
  • für die höchstens 30 Jahre alten Personen

zu prüfen.

  • Bewerten Sie die Ergebnisse von a) – c).

Stellung im Beruf

100 nicht selbständig Erwerbstätige eines Berliner Stadtbezirkes wurden per 10.01.2011 nach dem Geschlecht und der Stellung im Beruf befragt. Die Erhebung ergab folgendes Ergebnis:

Geschlecht
Beamte(r) Angestellte(r) Arbeiter(in)
weiblich 15 20 5
männlich 10 30 20
  • Bestimmen Sie die marginalen Verteilungen der 100 Erwerbstätigen nach dem Geschlecht bzw. nach der Stellung im Beruf.
  • Bestimmen Sie die relative Häufigkeitsverteilung der Stellung im Beruf für die weiblichen Erwerbstätigen.
  • Bestimmen Sie die relative Häufigkeitsverteilung des Geschlechts für die Angestellten.
  • Prüfen Sie, ob die beiden Merkmale unabhängig sind.

Streuungsmaß

Gegeben sind Beobachtungswerte eines Merkmals X. Zur Konstruktion eines Streuungsmaßes sollen die absoluten (d.h. ohne Berücksichtigung des Vorzeichens) Abweichungen eines jeden Beobachtungswertes von jedem anderen Beobachtungswert ermittelt werden.

  • Wie groß ist die Anzahl der zu ermittelnden absoluten Abweichungen? Begründen Sie diese Anzahl mittels der Kombinatorik.
  • Welche Skalierung ist für das Merkmal X erforderlich, um ein solches Streuungsmaß zu konstruieren?

Tägliche Arbeitswege - Teil I

Der Direktor einer Bank möchte sich über die täglich anfallenden Anfahrtswege seiner Mitarbeiter zum Arbeitsplatz informieren. Von der Personalabteilung wird ihm auf seine Anfrage folgende Tabelle übersandt.

Anfahrtsweg (km) Anzahl der
Beschäftigten
0 – 1 7
1 – 5 24
5 – 15 35
15 – 30 18
30 – 50 16
  • Nennen Sie die statistischen Einheiten und das untersuchte statistische Merkmal. Wie ist das Merkmal skaliert?
  • Ermitteln Sie die absoluten und relativen Häufigkeiten, die Häufigkeitsdichten und die empirische Verteilungsfunktion. Stellen Sie die Häufigkeitsverteilung und die empirische Verteilungsfunktion graphisch dar.
  • Berechnen Sie den durchschnittlichen Anfahrtsweg.
  • Welcher Anfahrtsweg tritt bei den Beschäftigten dieser Bank am häufigsten auf? Wie wird dieser Parameter genannt?
  • Welcher Anfahrtsweg ergibt sich, wenn 50% der Beschäftigten einen kürzeren bzw. 50% einen weiteren Anfahrtsweg haben?
  • Berechnen Sie die p–Quantile für .


Tägliche Arbeitswege - Teil II

Berechnen Sie, ausgehend von [Aufgabe26]

  • den Quartilsabstand
  • die mittlere absolute Abweichung vom Median

des Anfahrtsweges/Beschäftigter der betrachteten Bank.


Tarifvereinbarungen

In einem Betrieb sind 841 Personen beschäftigt. Der monatliche Durchschnittslohn beträgt 1642,86 Euro bei einer Standardabweichung von 18,95 Euro. Aufgrund einer Tarifverhandlung werden die Löhne linear um 2,9% erhöht. Zusätzlich dazu erhält jede Person noch eine einmalige Lohnzahlung von 50 Euro.
Berechnen Sie den Mittelwert der Löhne nach dem Tarifabschluss.

Tarifverhandlungen

Ein Großunternehmen veröffentlicht folgende Angaben über die Verteilung der Jahresbruttolöhne seiner Lohnempfänger im Jahre 2011: Von den insgesamt 20000 Lohnempfängern bezogen 16000 einen Jahresbruttolohn von mindestens 9600 EUR. Der durchschnittliche Jahresbruttolohn betrug 21200 EUR.
Bei den nächsten Tarifverhandlungen wird folgendes vereinbart: Alle Lohnempfänger erhalten 5% mehr Bruttolohn. Weiter erhalten alle Lohnempfänger mit einem bisherigen Bruttolohn unter 9600 EUR zusätzlich einen Festbetrag von jährlich 200 EUR mehr.
Unterstellen Sie, dass außer den vereinbarten Tarifänderungen keine weiteren Anderungen (Zahl und Struktur der Lohnempfänger, Klasseneinteilung) eintreten.
Wie groß ist dann der durchschnittliche Jahresbruttolohn nach dem Tarifabschluß?

Teesorten

Es wurden 7 verschiedene Teesorten auf Geschmack und Bekömmlichkeit untersucht. Eine Jury gab dazu folgende Rangeinteilung:

Sorte–Nr. 1 2 3 4 5 6 7
Geschmack 4 3 6 2 7 1 5
Bekömmlichkeit 3 7 4 1 6 2 5

Besteht bei diesen 7 Teesorten ein Zusammenhang zwischen Geschmack und Bekömmlichkeit?

Tekolom und IBBM - Teil I

Herr Sparsam besaß im letzten Jahr Aktien der Firma Tekolom und IBBM. Für die beiden Aktien ist die folgende gemeinsame Häufigkeitsverteilung beobachtet worden:

Anzahl Kurs der Kurs der
der Tage Tekolom-Aktie IBBM-Aktie
73 35 EUR 120 EUR
146 40 EUR 130 EUR
146 45 EUR 125 EUR

Stellen Sie fest, ob die Kurse der beiden Aktien korreliert sind. Berechnen Sie den Korrelationskoeffizienten nach Bravais–Pearson.


Tekolom und IBBM - Teil II

Herr Sparsam besitzt Aktien der Firma Tekolom und IBBM. Aus jahrelanger Erfahrung weiß man, dass der jährliche Wertzuwachs einer Tekolom–Aktie den Erwartungswert 8 EUR und die Varianz 16 EUR hat und dass der jährliche Wertzuwachs einer IBBM–Aktie den Erwartungswert 5 EUR und die Varianz 1 EUR hat. Darüber hinaus ist bekannt, dass der jährliche Wertzuwachs der Tekolom–Aktien mit dem jährlichen Wertzuwachs der IBBM–Aktie korreliert ist, der Korrelationskoeffizient beträgt 0,2.
Herr Sparsam hält 100 Tekolom–Aktien und 200 IBBM–Aktien. Welche Varianz hat der jährliche Wertzuwachs des gesamten Portfolios von Herrn Sparsam?


Telefonanbieter

Familie Sparsam nutzt fleißig die Niedrigpreise verschiedener Telefonanbieter. Im Monat Februar 2015 ergibt ihre Telefonrechnung folgende Daten für Ferngespräche:

Anbieter Minutenpreis Rechnungsbetrag
(in EUR) (in EUR)
0,10 20,00
0,15 11,25
0,19 47,50

Berechnen Sie den von Familie Sparsam im Februar bezahlten Durchschnittspreis für eine Minute Ferngespräch.

Telefon–Interviews

Eine Marketing-Firma führt häufig Telefon-Interviews in Berlin durch. Hierbei werden folgende Entgelte an die Telekom bezahlt: im Tagestarif (9-18 Uhr) 12 Cent/90 Sekunden und im Freizeittarif (5-9 Uhr und 18-21 Uhr) 12 Cent/150 Sekunden.
Es soll ausdrücklich darauf hingewiesen werden, dass bei der Telekom jede angefangene 90– bzw. 150–Sekundeneinheit voll bezahlt werden muss.
Die Interviews dauern entweder genau 10 oder genau 20 Minuten. An einem zufällig ausgewählten Tag werden die Telefongespräche wie folgt geführt:

Zeitbereich 10-Min.-Interviews 20-Min.-Interviews
7-8 Uhr 3 1
11-14 Uhr 10 20
19-20 Uhr 15 10

Wie hoch sind die mittleren Telefonkosten für ein Interview an diesem Tag?

Tennis Turniere

Tennis–As B.B. blickt auf eine völlig missglückte Saison zurück. Insgesamt nahm er an 40 Turnieren in aller Welt teil. Jedes Turnier ging über 6 Runden:

1. Runde
2. Runde
3. Runde = Achtelfinale
4. Runde = Viertelfinale
5. Runde = Halbfinale
6. Runde = Finale

Gespielt wurde in jeder Runde im k.o.–Verfahren, d.h. der Spieler, der seine Partie verlor, schied aus.

Die Bilanz seiner Turnierergebnisse lässt keine Freude bei B.B. aufkommen: Er stand zweimal im Finale und wurde sechsmal erst im Halbfinale von seinem Gegner geschlagen. Zehnmal verlor er jedoch schon in der ersten Runde und sechzehnmal kam für ihn in der 2. Runde das Aus. In der dritten Runde schied er allerdings bei keinem Turnier aus.

  • Wie heißt das untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion.
  • Zeichnen Sie die empirische Verteilungsfunktion.
  • Bei wieviel Prozent der Turniere schied B.B. vor dem Achtelfinale aus?
  • Bei wieviel Prozent der Turniere erreichte B.B. mindestens das Halbfinale?
  • Bei wie vielen Turnieren spielte B.B. noch in der 2. Runde mit?
  • In welcher Runde spätestens schied B.B. bei 80% der Turniere aus?
  • In welcher Runde schied B.B. bei genau 40% der Turniere aus?
  • Interpretieren Sie – bezogen auf den Aufgabentext – kurz den Funktionswert an der Stelle .

Verspätungen

Uwe, Jens, Dirk, Paul und Sven kommen nacheinander zu spät in die Statistik–Vorlesung. In der Pause fragt sie der Professor nach ihrer Fahrzeit zur Uni. Uwe gibt 45 Minuten an. Dirk schätzt eine halbe Stunde und Sven 20 Minuten. Paul wohnt gleich um die Ecke und Jens meint, er brauche länger als alle anderen.

Besteht ein Zusammenhang zwischen Fahrzeit und Verspätung?

Wählerverhalten

Ein Meinungsforschungsinstitut führt vor einer Bundestagswahl eine Befragung über das Wählerverhalten durch.

Geben Sie für diese Problemstellung die sachliche, räumliche und zeitliche Abgrenzung der Grundgesamtheit an.

Walzabteilung

In einer Walzabteilung bedienen 4 Arbeiter (A, B, C und D) unterschiedlich moderne Maschinen. Sie benötigen jeweils folgende Durchschnittszeiten zum Walzen eines Stückes Blech:

A: 20 Sek/Stück B: 30 Sek/Stück
C: 60 Sek/Stück D: 60 Sek/Stück

I. Betrachten Sie die Variable X: “Bearbeitungszeit in sec/Stück”.

  • Angenommen die Arbeiter arbeiten gleichlange, welche Durchschnittszeit pro Stück wird in der Abteilung benötigt?

  • Angenommen den Arbeitern sind folgende Stückkontingente vorgegeben:

    A: 1000 Stück B: 500 Stück
    C: 300 Stück D: 200 Stück

    welche Durchschnittszeit pro Stück wird in der Abteilung jetzt benötigt?

II. Betrachten Sie die Variable Y: “hergestellte Stück pro Stunde”.

  • Angenommen die Arbeiter arbeiten gleichlange, wie viel Stück werden im Durchschnitt pro Stunde gewalzt?
  • Angenommen den Arbeitern sind die Stückkontingente von I b) vorgegeben, wie viel Stück pro Stunde werden jetzt im Durchschnitt gewalzt?

Wanderer

Ein Wanderer legte 2 Kilometer zurück. Den ersten Kilometer ging er mit einer Geschwindigkeit von 6 km je Stunde, den zweiten mit einer Geschwindigkeit von 4 km je Stunde.

Wie groß war seine Durchschnittsgeschwindigkeit?

WM–Berichterstattung

Um festzustellen, wie viele Stunden pro Spieltag ein Fu“sball–Fan die WM–Berichterstattung im Fernsehen während der letzten Fu”sball–WM verfolgte, wurden 20 Fußball–Fans in A–Dorf nach ihrem Fernsehkonsum während der WM befragt. Die Befragung brachte folgendes Ergebnis:

Stunden 0 1 2 3 4
relative Häufigkeit 0.05 0.1 0.4 0.2 0.25
  • Wie lautet das hier untersuchte statistische Merkmal und wie ist es skaliert? Ist es häufbar, nicht häufbar, stetig oder diskret?
  • Bestimmen Sie tabellarisch die absoluten und relativen Häufigkeiten und die empirische Verteilungsfunktion.
  • Wieviele Stunden sehen 10% der Befragten höchstens fern?
  • Geben sie an, wieviele Stunden 85% der Befragten mindestens fernsehen.
  • Geben Sie die Stundenzahl an, die genau 20% der Befragten fernsehen.

Zigaretten

Im Rahmen einer medizinischen Untersuchung in S–Stadt im Januar wurden 200 Personen zufällig befragt, wieviele Zigaretten sie pro Tag rauchen. Das Ergebnis dieser Untersuchung sei in folgender Graphik beschrieben:
Datei:Bild3.pdf

  • Wie heißt die obige Darstellungsform? Welche Annahmen wurden hinsichtlich der Verteilung innerhalb jeder Klasse getroffen?
  • Geben Sie die absoluten und relativen Klassenhäufigkeiten, die Häufigkeitsdichten und die empirische Verteilungsfunktion an.
  • Geben Sie an, wie hoch der Anteil der Befragten ist, die mindestens 20 Zigaretten pro Tag rauchen.

Zuckergewicht

Das Füllgewicht von 75 maschinell abgepackten Paketen Zucker wurde kontrolliert. Die Messwerte ergeben folgende Häufigkeitsverteilung:

Füllgewicht (in g) Anzahl der Pakete
980 – 990 5
990 – 995 12
995 – 1000 23
1000 – 1005 22
1005 – 1010 11
1010 – 1020 2

Berechnen Sie den Modus, den Median und das arithmetische Mittel des Füllgewichts.

Zugfolge - Teil I

An einer Schranke der Bahnstrecke von A nach B wurden am 20.1.folgende Abstände der Zugfolge in Minuten gemessen:

59; 43; 36; 63; 23; 4; 29; 41; 43; 31; 29; 69; 57; 36; 112; 43; 14; 11; 18; 77; 81; 47; 12; 43; 44; 16; 80; 6; 52; 5; 5; 6; 21; 43; 44; 46; 51

  • Wie ist das Erhebungsmerkmal skaliert? Ist es häufbar, nicht häufbar, stetig, diskret?
  • Ermitteln Sie die absolute und relative Klassenhäufigkeiten unter Verwendung von Klassen der Breite 30 Minuten. Stellen Sie die Häufigkeitsverteilung graphisch dar.
  • Geben Sie die empirische Verteilungsfunktion an und stellen Sie diese graphisch dar.


Zugfolge - Teil II

  • Berechnen Sie aufgrund der Häufigkeitsverteilung der klassierten Daten für das Erhebungsmerkmal : “Zugfolgeabstand” der [Aufgabe24] drei aussagekräftige Lageparameter.
  • Welcher durchschnittlicher Zugfolgeabstand ergibt sich auf der Basis der Urliste? Wie erklären Sie sich den Unterschied zum zahlenmäßigen Ergebnis des gleichen Mittelwertes aus Frage a)?