Le variabili casuali duedimensionali

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Consideriamo due variabili casuali e . La funzione di probabilità di due variabili discrete puà essere definita come segue: La funzione di probabilità congiunta delle variabili e indica la probabilità che la varibile assuma il valore e congiuntamente la variabile assuma il valore . Date le seguenti condizioni da soddisfare: La funzione di probabilità duedimensionale puà essere rappresentata molto chiaramente in una tabella a doppia entrata.

: : :
: : :


La densità di probabilità di due variabili casuali continue à data da: La funzione di ripartizione di una coppia di variabili casuali puà essere definita come: La funzione di ripartizione indica con quale probabilità la variabile assume valori non pià grandi di e congiuntamente la variabile assume valori non pià grandi di . La funzione di ripartizione di due variabili casuali discrete à data da: La funzione di ripartizione di due variabili casuali continue à data da: La distribuzione marginale La distribuzione marginale di una variabile casuale discreta indica la probabilità che assuma il valore indipendentemente, senza prendere in considerazione i valori assunti da . La stessa definizione à applicabile a per la variabile . Di conseguenza le distribuzioni marginali sono distribuzioni unidimensionali.

MR
: : : :
: : : :
MR 1,00


Similarmente otteniamo le densità di probabilità marginali densità di probabilità marginali per una coppia di variabili casuali continue e : La funzione di ripartizione marginale La funzione di ripartizione marginale della variabile indica la funzione di ripartizione della variabile casuale indipendentemente dai valori assunti dalla variabile e viene definita come: La funzione di ripartizione marginale della variabile casuale puà essere definita analogamente:

En s2 14 e 1.gif

Un cardiologo elabora l’ipotesi che l’età sia connessa ad alcuni disturbi cardio circolatori. Per poter investigare questa relazione raccoglie i dati su 100 pazienti. indica l’età dei pazienti e i disturbi cardio circolatori con valori . Il primo passo di questa investigazione consiste nell’elaborare la distribuzione di probabilità congiunta delle due variabili in una tabella a doppia entrata. Per semplicità, la variabile età viene suddivisa in classi di ampiezza di 5 anni ad eccezione della prima e dell’ultima che sono di 10 anni: La tabella a doppia entrata risulta quindi come segue:

Età DM
(sani) (malati)
20-29 0,09 0,01 0,10
30-34 0,13 0,02 0,15
35-39 0,09 0,03 0,12
40-44 0,10 0,05 0,15
45-49 0,07 0,06 0,13
50-54 0,03 0,05 0,08
55-59 0,04 0,13 0,17
60-69 0,02 0,08 0,10
DM 0,57 0,43 1,00


Ogni casella di questa tabella contiene la probabilità che la variabile casuale assuma valori che ricadano nella classe e contemporaneamente che la variabile sia uguale a . Si ricorda che stiamo utilizzando la definizione statistica di probabilità. Per esempio la casella (2,1) indica che la probabilità che un paziente selezionato a caso abbia un’età comresa tra 30 e 34 anni e non presenti disturbi cardio circolatori à dello 0.13. La distribuzione marginale (DM) di descrive la distribuzione di probabilità della variabile “età”: la probabilità che un paziente selezionato a caso abbia un’età compresa tra 30 e 34 anni à dello 0.15. La distribuzione marginale (DM) di fornisce la probabilità che un paziente sia malato indipendentemente dall’età: 0.43. Nel seguente grafico sono rappresentate le probabilità duedimensionali delle due variabili.

En s2 14 e 2.gif

Per esperienza, il cardiologo sa che le persone sopra i 55 anni sono pià soggette ai disturbi cardiocircolatori e quindi cambia la classificazione della variabile età nel seguente modo: meno 40 anni, 41–54 anni, pià di 55 anni. Utilizzando questa classificazione semplificata otteniamo la seguente distribuzione di probabilità congiunta:

Età DM
(sani) (malati)
meno di 40. 0,32 0,07 0,39
41–54 0,19 0,15 0,34
pià di 55 0,06 0,21 0,27
DM 0,57 0,43 1,00


La rappresentazione grafica à la seguente:

En s2 14 e 3.gif

Conclusioni:
Per variabili casuali discrete con un numero molto elevato di possibili valori à necessaria una suddivisione in classi per poter elaborare una tabella a doppia entrata. La qualità delle informazioni che si possono avere da una tabella a doppia entrata dipende da questa classificazione: à quindi consigliabile ripetere l’analisi statistica per diverse classificazioni. In un’inchiesta sono state rilevate sugli abitanti di una città le seguenti informazioni

En s2 14 f 7.gif

  • la partecipazione alle ultime elezioni (variabile casuale con possibili valori )
  • interesse alla politica (variabile casuale con possibili valori )

La distribuzione di probabilità congiunta di entrambe le variabili casuali à indicata nella seguente tabella a doppia entrata:

Partecipazione elettorale DM
molto sopra alla media medio poco nessun
sà () 0,107 0,196 0,398 0,152 0,042 0,895
no () 0,006 0,011 0,036 0,031 0,021 0,105
DM 0,113 0,207 0,434 0,183 0,063 1,000


Ogni casella contiene la probabilità che la variabile casuale assuma il valore e congiuntamentela variabile assuma il valore .
Per esempio la casella indica che la probabilità che un cittadino scelto a caso con un interesse per la politica sopra la media abbia votato alle ultime elezioni à di 0.196. La distribuzione marginale (DM) di ci dà le probabilità delle realizzazioni della variabile “partecipazione alle elezioni”. Per esempio la probabilità che un cittadino non vada a votare à di . La distribuzione marginale (DM) à la distribuzione di probabilità della variabile “interesse alla politica”. La probabilità che un cittadino selezionato a caso abbia poco interesse per la politica à di . La funzione di probabilità duedimensionale à illustrata dal seguente grafico.

En s2 14 f 1.gif

Date due variabili casuali continue e con densità di probabilità congiunta: di conseguenza abbiamo: Nel grafico à mostrata la funzione di probabilità duedimensionale di e .

En s2 14 f 4.gif

Come distribuzioni marginali abbiamo: e