Indipendenza stocastica

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


L’indipendenza di due variabili casuali e viene definita grazie al teorema delle probabilità composte per eventi indipendenti. Dati due eventi indipendenti e , la probabilità che questi due eventi si verifichino congiuntamente à data dal prodotto delle loro probabilità: Considerati i due eventi e possiamo definire l’indipendenza di due variabili casuali discrete e come segue: se per ogni coppia di possibili risultati delle variabili casuali e vale la relazione o equivalentemente le due variabili sono indipendenti. Se questa condizione non à soddisfatta per almeno una coppia le variabili sono dipendenti. Si puà procedere analogamente per le variabili casuali continue. Due variabili casuali continue e sono indipendenti date le relative densità di probabilità e , se per ogni coppia di numeri reali vale la relazione:

La distribuzione condizionata

Indichiamo con la probabilità che la variaibile casuale discreta assuma il valore a condizione che la variabile casuale discreta assuma il valore . Analogamente indichiamo con la probabilità che la variabile casuale discreta assuma il valore a condizione che . Utilizzando i concetti di calcolo delle probabilità introdotti nei precedenti capitoli abbiamo: Nel caso di variabili discrete per e : Per le variabili continue: Le funzioni di ripartizione condizionate sono:

En s2 55 e 3.gif

Nel 1991 sono stati intervistati 3000 cittadini tedeschi. La domanda posta era la seguente: come giudica la condizione economica attuale in Germania? Le possibili risposte erano:
1–molto buona, 2–buona, 3–cosà cosà, 4–cattiva, 5–molto cattiva.
Definiamo la variabile come la “condizione economica attuale” con i possibili risultati indicati. Nell’intervista si tiene inoltre conto della provenienta della persona intervistata: dai nuovi Lànder (incluso Berlino Est) o dai vecchi Lànder (incluso Berlino Ovest). Definiamo quindi la variabile “provenienza” con i possibili valori – Ovest, – Est. La distribuzione congiunta delle due variabili à data dalla tabella 1. L’aspetto interessante di questa indagine à quello di capire se la valutazione della condizione economica dipende dalla zona di provenienza dell’intervistato. Per questo motivo nella tabella 1. sono indicate anche le probabilità che si otterrebbero se le due variabili fossero indipendenti () indicate con “valutata”. Table 1: La condizione economica attuale () e la provenienza dell’intervistato () nel 1991

DM
Ovest Est
molto buona osservata 0,072 0,056 0,128
valutata 0,063 0,065
buona osservata 0,257 0,204 0,461
valutata 0,228 0,233
cosà cosà osservata 0,151 0,227 0,378
valutata 0,187 0,191
cattiva osservata 0,012 0,014 0,026
valutata 0,013 0,013
molto cattiva osservata 0,002 0,005 0,007
valutata 0,003 0,004
DM 0,494 0,506 1,000


Il grafico seguente fornisce una rappresentazione della funzione di probabilità congiunta delle due variabili casuali.

En s2 15 e 1.gif

Per poter verificare l’indipendenza delle variabili casuali calcoliamo le due distribuzioni condizionate indicate nella tabella 2. Tabella 2: Distribuzioni condizionate , valori arrotondati (1991)

Condizione economica DM
Ovest Est
molto buona 0,563 0,437 1,000
buona 0,558 0,442 1,000
cosà cosà 0,399 0,601 1,000
cattiva 0,462 0,538 1,000
molto cattiva 0,286 0,714 1,000


Dalla Tabella 1 possiamo dedurre che:
La probabilità che un cittadino selezionato a caso provenga dalla Germania Ovest e giudichi la condizione economica come “buona” à dello 0.257. Per variabili indipendenti questa probabilità sarebbe dello 0.228. Dalla Tabella 2 possiamo dedurre che:
Un cittadino selezionato casualmente che giudica l’attuale condiziona economica “buona” ha una probabilità dello 0.558 di proveniere dalla Germania Ovest e dello 0.442 di provenire dalla Germania Est. Queste probabilità non coincidono con i valori della distribuzione marginale di indicati dall’ultima righa della Tabella 1. Cià significa che le due variabili e non sono indipendenti e la valutazione della condizione economica della Germania dipende dal Land di provenienza dell’intervistato. L’indagine à stata ripetuta su altre 3000 persone nel 1996. La distribuzione congiunta delle due variabili à indicata nella Tabella 3. La Tabella 4 contiene invece le distribuzioni condizionate . Table 3: Condizione economica attuale () provenienza dell’intervistato () nel 1996

DM
Ovest Est
molto buona osservata 0,006 0,002 0,008
valutata 0,05 0,003
buona osservata 0,082 0,036 0,118
valuatata 0,078 0,040
cosà cosà osservata 0,314 0,175 0,489
valuatata 0,323 0,166
cattiva osservata 0,215 0,104 0,319
valutata 0,211 0,108
molto cattiva osservata 0,044 0,022 0,066
valutata 0,044 0,022
DM 0,661 0,339 1,000


Tabella 4: Distribuzione condizionata , arrotondata (1996)

Condizione economica DM
Ovest Est
molto buona 0,750 0,250 1,000
buona 0,558 0,305 1,000
cosà cosà 0,358 0,601 1,000
cattiva 0,462 0,326 1,000
molto cattiva 0,667 0,333 1,000


La rappresentazione grafica della distribuzione duedimensionale delle due variabili à la seguente:

En s2 15 e 2.gif

Anche nel 1996 i valori osservati si differenziano da i valori valutati nel caso di indipendenza. Inoltre le distribuzioni condizionate differiscono dalle distribuzioni marginali di . Cià significa che anche nel 1996 la valutazione della condizione economica dipende dal Land di provenienza dell’intervistato. Le conclusioni a riguardo dell’indipendenza delle due variabili causali “condizione economica” e “provenienza” valgono solo per le 3000 persone incluse nell’indagine! Questo esempio verrà analizzato ulteriormente nel capitolo sul “test di indipendenza ”. In un’inchiesta à stato chiesto ai cittadini di una certa città En s2 45 f 4.gif

  • se hanno votato alle ultime elezioni parlamentari (variabile casuale con possibili valori )
  • se hanno interesse per la politica (variabile casuale con possibili risultati

La distribuzione congiunta di probabilità à data dalla seguente tabella:

Partecipazione alle elezioni DM
molto sopra la media medio poco nessun
sà () 0,107 0,196 0,398 0,152 0,042 0,895
no () 0,006 0,011 0,036 0,031 0,021 0,105
DM 0,113 0,207 0,434 0,183 0,063 1,000


Da questa distribuzione congiunta di probabilità otteniemo le seguenti distribuzioni condizionate:

a) La distribuzione condizionata

Partecipazione alle elezioni
molto sopra la media medio poco nessun
sà () 0,120 0,219 0,444 0,170 0,047 1,00
no () 0,057 0,105 0,343 0,295 0,200 1,00


Un cittadino selezionato casualmente che ha votato alle ultime elezioni () ha una probabilità dello 0.219 di mostrare un interesse per la politica sopra la media. D’altra parte la probabilità che un cittadino selezionato a caso che non ha partecipato alle elezioni () abbia un interesse sopra la media à solo dello 0.105.

b) La distribuzione condizionata

Partecipazione alle elezioni
molto sopra la media medio poco alcuno
sà () 0,947 0,947 0,917 0,831 0,667
no () 0,053 0,053 0,083 0,169 0,333
1,000 1,000 1,000 1,000 1,000


Un cittadino selezionato casualmente che ho poco interesse () per la politica avrà partecipato alle elezioni con una probabilità dello 0.831 (). Confrontando le due distribuzioni condizionate e possiamo già affermare che le due variabili non sono indipendenti in quanto le due distribuzioni condizionate differescono la una dall’altra. La dipendenza puà essere verificata anche usando la formula: per ogni e . Per esempio , che à diverso da della distribuzione congiunta. Le due variaibili non sono indipendenti. Date due variabili casuali continue e con densità di probabilità congiunta e con distribuzioni marginali e Fig. 1: Densità di probabilità congiunta:

En s2 15 f 5.gif

Fig. 2: Distribuzione marginale di :

En s2 15 f 6.gif

Fig. 3: Distribuzione marginale di :

En s2 15 f 7.gif

Per dimostrare che due variabili sono indipendenti dobbiamo verificare che : Le due variabili non sono indipendenti. L’indipendenza di variabili casuali à definita grazie all’indipendenza degli eventi. Per stabilire l’indipendenza (dipendenza) delle variabili casuali calcoliamo le distribuzioni marginali delle variabili e le moltiplichiamo: se il risultato corrisponde alla distribuzione congiunta per tutte le coppie di valori abbiamo indipendenza. Nel caso di distribuzioni duedimensionali abbiamo spesso interesse a trovare non solo la distribuzione congiunta ma anche quella di una singola variabile. L’altra variaible non viene considerata quindi otteniamo una distribuzione unidimensionale detta distribuzione marginale. Le distribuzioni univimensionali vengono quindi indicate nella tabella a doppia entrata. Quando invece si osserva la distribuzione di una variabile dato il valore assunto dall’altra variabile abbiamo la distribuzione condizionata di per un dato valore di . Per ottenere la probabilità delle distribuzioni condizionate si divide la distribuzione duedimensionale congiunta per le probabilità della distribuzione marginale. Nel caso di variabili continue possiamo utilizzare le stesse formule ottenendo perà non una probabilità condizionata ma una funzione di densità condizionata.