Le tabelle di frequenza bidimensionali

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Siano dati: il carattere con valori
il carattere con valori

Realizzazioni

Il numero delle possibili realizzazioni à uguale a tutte le possibili combinazioni dei valori assunti da entrambi i caratteri (il prodotto del numero dei valori assunti da per il numero dei valori assunti da ).

Frequenza assoluta

La frequenza assoluta à il numero di unità statistiche che presentano una determinata combinazione dei valori

Frequenza relativa

La frequenza relativa à la proporzione di osservazioni che presentano una determinata combinazione dei valori

Proprietà:

Una distribuzione di frequenze bidimensionale à il numero totale di tutte le combinazioni di caratteri verificatesi e le corrispondenti frequenze assolute e relative.

La tabella di contingenza bidimensionale

La tabella di contingenza bidimensionale à il modo appropriato di rappresentare la distribuzione congiunta di frequenze di due caratteri ordinati secondo una scale nominale o ordinale (DM= distribuzione marginale):

Carattere DM
DM

Esempio:

Tabella di contingenza 5x3 - professione (misurata sulla scala nominale) - attività sportiva (misurata sulla scala nominale) = 1000 lavoratori

professione DM
raramente qualche volta regolarmente
operaio 240 120 70 430
impiegato 160 90 90 340
impiegato pubblico 30 30 30 90
contadino 37 7 6 50
lavoratore autonomo 40 32 18 90
DM 570 279 214 1000

La tabella di correlazione bidimensionale

La tabella di correlazione bidimensionale à il modo appropriato di rappresentare la distribuzione congiunta di frequenze di due caratteri misurati sulla scala metrica:

Variabile Variabile

Esempio:

Abbiamo rilevato il reddito mensile netto (misurato sulla scala metrica) e le spese medie (misurate sulla scala metrica) di 10 famiglie composte da due persone:

famiglie 1 2 3 4 5 6 7 8 9 10
reddito medio netto in DM 3.500 5.000 4.300 6.100 1.000 4.800 2.900 2.400 5.600 4.100
spese in DM 2.000 3.500 3.100 3.900 900 3.000 2.100 1.900 2.900 2.100

Con questo esempio si ha la possibilità di creare una distribuzione di frequenze bidimensionale, utilizzando i dati rilevati nei seguenti campi:

Studenti

Su 107 studenti sono state rilevate le seguenti variabili: facoltà, sesso, età, numero di semestri, cittadinanza, situazione sociale (molto buona/buona, discreta, cattiva), situazione psicologica (molto instabile, instabile, stabile, molto stabile) e il giudizio sui propri studi (molto buono/buono, soddisfacente, cattivo).

Informazioni

941 persone sono state intervistate per sapere se sono abbonate a un giornale o meno; se hanno un lavoro o meno (occupato, disoccupato), l’età (con le classi 18 - 29, 30 - 39, 40 - 49), il livello di istruzione (scuole elementari, medie, superiori/università)

Stazioni di servizio

Sono state osservate 700 stazioni di servizio. I caratteri rilevati sono: la località dove si trovano (“piccola” se ha meno di 100000 abitanti, “grande” se ha almeno 100000 abitanti) il tipo di strada (autostrada/nazionale, di campagna, strada principale), il tipo di servizio offerto (self-service o normale servizio) e le vendite (basse, medie, elevate). Anzitutto bisogna scegliere il campo desiderato. Selezionati i dati da esporre, verranno fornite le distribuzioni di frequenza per le coppie di variabili desiderate. Dai dati registrati da un grande magazzino selezioniamo casualmente clienti e registriamo i seguenti caratteri:

lcl Variabili& & possibili realizzazioni


sesso & &- maschio
& &- femmina

modo di pagamento & &- contanti
& &- bancomat
& &- carta di credito

domicilio & &- Berlino
& &- fuori Berlino
Le tre possibili distribuzioni di frequenza bidimensionali che possono essere costruite con i dati a disposizione sono mostrate nelle seguenti tabelle. Le frequenze assolute sono indicate con e le frequenze relative con (in parantesi e arrotondate di tre decimali). La distribuzione di frequenze bidimensionale per le variabili sesso e modo di pagamento à una tabella di contingenza 23.

sesso DM
maschio 31 (0,188) 32(0,194) 23(0,139 86 (0,521)
femmina 30 (0,182) 29(0,176) 20 (0,121) 79 (0,479)
DM 61 (0,370) 61(0,370) 43 (0,260) 165

La distribuzione di frequenze per le variabili sesso e domicilio à una tabella di contingenza 22.

sesso DM
Berlàno fuori Berlàno
maschio 50 (0,303) 36 (0,218) 86 (0,521)
femmina 37 (0,224) 42 (0,255) 79(0,429)
DM 87 (0,527) 78 (0,473) 165 (1,00)

La distribuzione di frequenze per le variabili domicilio e modo di pagamento à una tabella di contigenza 23.

domicilio DM
Berlino 44 (0,267) 22(0,133) 21(0,127) 87(0,527)
fuori Berlàno 17(0,103) 39(0,237) 22(0,133) 78(0,473)
DM 62(0,370) 61(0,370) 43(0,260) 165(1,00)

Per persone scelte casualmente rileviamo se fumano e se soffrono di cancro ai polmoni. Le variabili sono X - Fumatore con i risultati = sà e = no Y - Cancro ai polmoni con i risultati = sà e = no La distribuzione di frequenze bidimensionale à una tabella di contingenza 22

cancro ai polmoni cancro ai polmoni DM
Sà () No ()
Fumatore sà () 10 15 25
Fumatore no () 5 70 75
DM 15 85 100


I numeri nella tabella hanno il seguente significato: tra i fumatori 10 hanno un cancro ai polmoni. Di tutte le persone intervistate 25 fumano. 85 persone non hanno il cancro ai polmoni.

Osservazioni bidimensionali:

La variabile assume il valore e simultaneamente la variabile assume il valore . Il numero totale delle possibili osservazioni à se la variabile puà assumere valori e la variabile puà assumere valori.

La frequenza assoluta:

Numero di unità statistiche che assumono i valori e .

La frequenza relativa:

La frazione di unità statistiche sui elementi che costituiscono la popolazione o il campione che assumono i valori e . Il modo appropriato per rappresentare una distribuzione di frequenze bidimensionale di variabili misurabili su scale nominale e ordinale o anche metrica con pochi caratteri à la tabella di contingenza detta anche cross-table. Le sue caselle possono contenere frequenze assolute o relative. La distribuzione marginale à la distribuzione unidimensionale rispettivamente delle variabili e .