Distribuzione di frequenze di variabili continue

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Le modalità osservate del carattere continuo vengono classificate in classi con estremi e ampiezza . La modalità appartiene alla classe , se . Il valore centrale della classe à indicato .

Tabella delle frequenze

La tabella delle frequenze per variabili continue rappresenta le frequenze associate alle classi.

Classe # Classe Frequenze assolute Frequenze relative
Totale

Rappresentazione grafica

Istogramma

L’istogramma permette di visualizzare le variabili continue suddivise in classi attraverso dei rettangoli; puà essere utilizzato anche per variabili discrete considerate quasi-continue e classificate quindi come se fossero continue in quanto presentano numerose osservazioni. Gli estremi della classe vengono riportati sull’asse delle ascisse e in corrispondenza di questi si disegnano i rettangoli con altezza pari alla distribuzione di frequenze. La frequenza associata a ciascuna classe viene rappresentata dall’area del rettangolo. L’uso della distribuzione delle frequenze à necessario se l’ampiezza delle classi à variabile. Nel caso in cui sia stata scelta una sola ampiezza per tutte le classi à possibile rappresentare le frequenze (assolute o relative) in base all’altezza dei rettangoli. L’istogramma seguente illustra 716 osservazioni del reddito netto mensile (DM):

En fe 22 1.gif

Diagramma Stem-and-Leaf

Il diagramma stem-and-leaf à una rappresentazione grafica dei valori di una serie di osservazioni. Le osservazioni vengono suddivise in due gruppi. La prima variabile viene illustrata con un piccolo esempio. La seconda verrà invece illustrata nella sezione “Explained”. Serie statistica :

Frequenza Stem & Leave
* 22
. 56
* 04
. 78
* 3
. 77
Estremi (100), (105)

Stem width: 10,00 Each leaf: 1 case(s) Il diagramma si compone quindi di una parte detta di tronco (stem) e delle foglie (Leaves). A pià del diagramma viene data l’indicazione dell’ampiezza del tronco (l’unità di misura). Il diagramma qui presentato ha per esempio un’ampiezza (stem width) di 10 che significa che lo stem indica le cifre decimali e le leaves le unità. In questo esempio lo stem à diviso in due righe; le righe contrassegnate da un asterisco (*) indicano le leaves da 0 fino a 4, mentre le righe contrassegnate da un punto (.) indicano le leaves da 5 a 9. Per esempio un’osservazione del valore di 47 avrà uno stem di 4 e una leave di 7. Ciascuna leave indica un’osservazione (“Each leaf: 1 case(s)”). Il valore 32 compare due volte. Inoltre ci sono due valori estremi (100 e 105) che vengono indicati come tali.

Dotplots

Un dotplot à una rappresentazione duedimensionale di dati unidimensionali. Sulle ascisse vengono indicati gli intervalli entro i quali ricadono le variabili. Per evitare il sovrapporsi di pià punti, questi vengono distribuiti (in base a una distribuzione casuale di solito nell’intervallo [1,0]) anche lungo l’asse verticale. Il dotplot qui di seguito rappresenta 150 osservazioni sul salario orario statunitense. Il secondo grafico distingue tra uomini (blu) e donne (rosso).

En folimg49.gif

In questo esempio interattivo le osservazioni su una variabile sono riassunte in un istogramma. Lo studente puà scegliere la variabile da illustrare con un istogramma e puà cambiare l’ampiezza della classe.

It folnode3 b k 1 2.gif

Su 74 macchine viene rilevato il consumo di benzina in “miles per gallon (MPG)”. Conversione in litri per 100 km: (3,785*100)/(x*1,61). Il risultato dell’inchiesta à presentato nella seguente tabella delle frequenze:

: Consumo di benzina (MPG) Frequenza assoluta Frequenza relativa
(Totale)

Usando un’ampiezza costante delle classi di 3 MPG si puà riportare sull’asse delle ordinate la frequenza e rappresentare graficamente la distribuzione di frequenza con un istogramma. Sia dalla tabella che dal grafico si puà dedurre che la maggior parte della macchine percorre da 18 a 21 miglia per gallone.

Unità statistica: intervistato di nazionalità tedesca residente nei vecchi Land tedeschi di età minima di 18 anni.
Variabile statistica: reddito netto mensile (DM)
Numero delle osservazioni 716

Le variabili vengono ripartite in classi di reddito di pari ampiezza; questo permette di porre sull’asse delle ordinate le frequenze assolute della classe. Se perà si vuole disporre di una visione pià accurata dei dati bisogna preferire una classe di ampiezza pià ridotta (e di conseguenza aumentare il numero delle classi). Come si puà evincere dai grafici, l’ampiezza della classe influenza il grado di precisione del grafico. Variando l’ampiezza della classe bisognerebbe riuscire ad ottenere un istogramma che riesca a dare una visione d’insieme abbastanza sintetica senza peraltro perdere preziose informazioni.

Diagramma Stem-and-leaf

Il seguente diagramma Stem-and-Leaves rappresenta tutte e 716 le osservazioni. Nel diagramma ogni tronco (stem) viene suddiviso in 5 righe. La prima righa (*) indica le foglie 0 e 1, la seconda (t) le foglie 2 e 3, la terza (f) 4 e 5, la quarta (s) 6 e 7 e la quinta (.) 8 e 9. Le unità del tronco sono le migliaia quindi le foglie indicano le centinaia. Ogni foglia indica due osservazioni. Per esempio ci sono sei persone che hanno un reddito tra 2400 fino a 2500 (non incluso) e vengono indicate come Stem 2 f 444. Il simbolo & indica che ci sono osservazioni supplementari che perà non sono propriamente classificabili. Per esempio se si osserva la righa corrispondente a Stem ‘4 t’ la foglia à 2&. Cià significa che ci sono 2 persone (si ricorda che ogni foglia indica due osservazioni) che hanno un reddito mensile tra 4200 fino a 4300 le altre due persone indicate da & non possono essere classificate chiaramente. Una persona ricade pienamente nella righa ‘4 t’ mentre l’altra ha un reddito compreso tra 4300 e 4400. Siccome ciascuna foglia rappresenta due osservazioni queste due persone non possono essere divise anche se una apparterebbe ad una foglia 2 e l’altra ad una foglia 3. Vengono poi indicati altri 17 valori estremi.