Distribuzioni marginali e condizionate

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


La distribuzione marginale

Data una distribuzione di frequenze bidimensionale di due variabili e ; la distribuzione marginale di (rispettivamente di ) à la distribuzione semplice della variabile (rispettivamente ), nella quale consideriamo il verificarsi della variabile (rispettivamente ). La distribuzione marginale risulta dalla somma delle distribuzioni di frequenza per i diversi valori assunti, per esempio per la distribuzione marginale di :

Distribuzione marginale di
Variabile
Distribuzione marginale di

Distribuzione marginale per la variabile con i valori : Distribuzione marginale della variabile con i valori : Numero totale dei possibili valori di e (uguale a ):

La distribuzione condizionata

Data una distribuzione di frequenze duedimensionale delle due variabili e ; la distribuzione di frequenze di (rispettivamente ), che risulta per un certo valore di (rispettivamente ) à detta distribuzione condizionata di (rispettivamente ) per un dato (rispettivamente ). Distribuzione condizionata di frequenze relative di per un dato : Distribuzione condizionata di frequenze relative di per un dato : Le distribuzioni condizionate sono unidimensionali. Esempio: Utilizziamo questa tabella di contingenza 53 per i caratteri: - professione (misurato su scala nominale)
- attività sportiva (misurato su scala nominale) che sono stati osservati su lavoratori.

professione attività sportiva DM
raramente qualche volta regolarmente
operaio 120 70 430
impiegato 160 90 90 340
impiegato statale 30 30 30 90
contadino 37 7 6 50
autonomo 40 32 18 90
DM 507 279 214 1000

Distribuzione condizionata del carattere (attività sportiva) per un dato (professione):

professione attività sportiva DM
raramente qualche volta regolarmente
operaio 0,56 0,28 0,16 1,00
impiegato 0,47 0,26 0,26 1,00
impiegato statale 0,33 0,33 0,33 1,00
contadino 0,74 0,14 0,12 1,00
autonomo 0,44 0,36 0,20 1,00

In un sondaggio su 941 persone, sono stati rilevati i seguenti caratteri: l’età (divisa in classi 18-29, 30-39 e 40-49) il livello di educazione scolastica raggiunto (università, scuola superiore, scuola media, elementari). Le frequenze osservate sono indicate nella seguente tabella di contingenza  :

università scuola superiore scuola media elemenstari DM (età)
18–29 38 93 134 42 307
30–39 23 94 168 70 355
40–49 12 39 129 99 279
DM (educazione) 73 226 431 211 941

Le distribuzioni condizionate del carattere educazione, data l’età, sono indicate nella tabella seguente:

università scuola superiore scuola media elementari
18–29 0,124 0,303 0,436 0,137 1,000
30–39 0,065 0,265 0,473 0,197 1,000
40–49 0,043 0,140 0,462 0,355 1,000


I valori sono calcolati come quozienti delle diverse caselle e il corrispontende valore della distribuzione marginale della classe di età. La tabella indica per esempio che nel gruppo di età 18-29 il 12,4% ha frequentato l’università, il 30,3% ha un diploma di scuola superiore e il 43,6% ha frequentato solo le scuole medie. Nel gruppo di età 40-49 la percentuale di persone che ha una laurea à solo del 4,3%. Similmente possiamo calcolare la distribuzione condizionata dell’età per un determinato livello di formazione scolastica:

università scuola superiore scuola media elementari
18–29 0,521 0,411 0,311 0,199
30–39 0,315 0,416 0,390 0,332
40–49 0,164 0,173 0,299 0,469
1,000 1,000 1,000 1,000

Possiamo quindi vedere che le persone che hanno solo un diploma di scuola superiore appartengono per il 41,1% alla classe di età 18-29, per il 41,6% alla classe di età 30-39 e per il 17,3% alla classe 40-49. Scegliamo casualemente persone sulle quali rileviamo se sono fumatori o no e se hanno un cancro ai polmoni. Le variabili sono X - Fumatore con i possibili risultati = sà e = no Y - Cancro ai polmoni con i possibili risultati = sà e = no La distribuzione di frequenza bidimensionale à una tabella di contingenza 22

cancro ai polmoni cancro ai polmoni DM
sà () no()
fumatore sà () 10 15 25
fumatore no () 5 70 75
DM 15 85 100

Le distribuzioni condizionate della variabile (fumatore) per dati (cancro ai polmoni) sono mostrate nella seguente tabella:

cancro ai polmoni cancro ai polmoni
no
fumatore sà 0,667 0,176
fumatore no 0,333 0,824
1,000 1,000

I valori della distribuzione sono calcolati come quoziente delle caselle e il corrispondente valore della distribuzione marginale (cancro ai polmoni sà risp. no). Dalla tabella deduciamo che 66,7% di tutte le persone che soffrono di cancro ai polmoni sono fumatori. 82,4% delle persone sane sono non fumatori. La distribuzione condizionata della variabile (cancro ai polmoni), per un determinato valore (fumatore/ non fumatore) viene costruita analogamente:

cancro ai polmoni cancro ai polmoni
no
fumatore sà 0,400 0,600 1,000
fumatore no 0,067 0,933 1,00

Possiamo concludere che il 40% di tutti i fumatori ma solo il 6,7% dei non fumatori hanno il cancro ai polmoni.

En folnode4 c k 1.gif

In una indagine su 107 studenti sono stati rilevati i caratteri: facoltà scelta e sesso. I dati sono stati raccolti nella seguente tabella di contingenza :

femmine maschi DM (facoltà)
scienze sociali 12 13 25
ingegneria 1 1 2
giurisprudenza 8 13 21
medicina 6 4 10
scienze naturali 1 8 9
psicologia 3 8 11
altro 1 0 1
teologia 7 2 9
economia e commercio 5 14 19
DM (sesso) 44 63 107

Qual’à la proporzione delle donne risp. uomini nelle diverse facoltà? La distribuzione condizionata del sesso, data la facoltà ci fornisce le informazioni richieste. I valori di questa distribuzione vengono calcolati come quozienti delle diverse caselle con il corrispondente valore della distribuzione marginale della facoltà.

femmine maschi DM (facoltà)
scienze sociali 0,480 0,520 1,000
ingegneria 0,500 0,500 1,000
giurisprudenza 0,381 0,619 1,000
medicina 0,600 0,400 1,000
scienze naturali 0,111 0,889 1,000
psicologia 0,273 0,727 1,000
altro 1,000 1,000 1,000
teologia 0,778 0,222 1,000
economia e commercio 0,263 0,737 1,000
totale 0,411 0,589 1,000

I risultati mostrano che la facoltà di economia à dominata da uomini. Gli uomini costituiscono il 73,7% degli studenti in questa facoltà. Al contrario nella facoltà teologia la maggioranza à costituita da donne (77,8%).