La distribuzione normale

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


La variabile casuale continua X ha una distribuzione normale con i parametri e e viene indicata con se la sua densità di probabilità à la seguente: La funzione di distribuzione à la seguente: Dalle due formule date à chiaro che la distribuzione normale dipende dai due parametri e . Ovvero la speranza matematica e la deviazione standard della variabile casuale X. Speranza matematica , varianza e deviazione standard sono: Due importanti proprietà della distribuzione normale sono:

  • Trasformazioni lineari

    Sia X una variabile normale, , e Y una sua combinazione lineare: , allora Y à anche una variabile normale con parametri:

    Y N(a + b, b .

    La combinazione lineare non cambia il tipo di distribuzione mentre i valori dei parametri di Y possono essere calcolati partendo dai parametri di X usando le regole sui valori attesi e la varianza:
    E(a + bX) = a + b E(X)
    Var(a + bX) = Var(X) = .

  • La somma di variabili normali indipendenti

    Date n variabili causali normali: , la somma delle n variabili normali indipendenti , ovvero
    per almeno un i, ha anche una distribuzione normale.

I grafici seguenti mostrano la densità di probabilità e la funzione di distribuzione di N(2;1). Densità di probabilità di N(2;1):

En s2 26 12.gif

Funzione di distribuzione di N(2;1):

En s2 26 13.gif

La variabile casuale standardizzata: La variabile casuale Z indica i valori standardizzati della variabile casuale X come deviazioni dalla media.
Se X à una variabile normale allora anche Z avrà una distribuzione normale.
La variabile normale standardizzata: La variabile normale standardizzata Z viene indicata con N(0;1).
La densità di probabilità à: La funzione di distribuzione à: La speranza matematica e la varianza sono: E(Z) = 0 Var(Z) = 1 I valori della funzione di ripartizione di una variabile normale standardizzata sono presentati in tavole.
La densità di probabilità e la funzione di ripartizione sono rappresentate di seguito.
Densità di probabilità N(0;1)

En s2 26 14.gif

Funzione di ripartizione N(0;1)

En s2 26 15.gif

Il passaggio da una variabile normale N() si puà effettuare come segue:
z Cià implica che: Intervalli di confidenza: Un intervallo di confidenza per la variabile casuale X à dato da un intervallo con estremi e (l sta per lower = inferiore e u per upper = superiore), che contiene i valori della variabile casuale X con una specificata probabilità 1 - , ovvero (1 -) 100% di tutti i valori di X ricadono in questo intervallo e 100% ne restano esclusi. viene solitamente indicato come livello di significatività.
Data la speranza matematica della variabile casuale X, l’intervallo viene costruito in modo tale che la probabilità /2 delle due regioni escluse dall’intervallo sia la stessa. L’intervallo cosà costruito [] = [] à centrato sulla media (quindi simmetrico) ed ha un livello di significatività di
P() = 1 - . Per evidenziare l’importanza della deviazione standard come parametro di variabilità si misura la deviazione di X da il suo valore atteso in multipli di . L’intervallo di confidenza à quindi: [ - c X + c] Se la variabile casuale X à normale N(), allora per x = + c abbiamo e P(Z z) = (z) = 1 - /2 . Il valore puà essere trovato per una determinata probabilità 1 - /2 sulle tavole della variabile normale standardizzata. In questo modo otteniamo l’intervallo di confidenza per la variabile normale: [ X ] e la probabilità di questo intervallo à: P( X ) = 1 - Intervallo di confidenza per una variabile normale:

En s2 26 11.gif

Dato che P(-z Z z) = P(Z z) - P(Z -z) = P(Z z) - [1 - P(Z z)] = 2P(Z z) -1 ,
otteniamo che . Per ogni data z possiamo determinare il livello di significatività dell’intervallo di confidenza:

Al contrario per dati livelli di significatività 1- possiamo trovare il corrispondente valore di z:
= 0.95, z = 1.96. I parametri e determinano

  • la forma
  • la posizione e
  • la variabilità

di una distribuzione normale. In questo esempio interattivo lo studente ha la possibilità di cambiare uno o entrambi i parametri e osservare la rappresentazione grafica della corrispondente densità di probabilità della distribuzione . Per effettuare un raffronto viene sempre indicata anche la distribuzione standardizzata (in nero). Si consiglia di cambiare un parametro per volta per osservarne l’effetto sulla funzione. Si possono inoltre calcolare le probabilità che la variabile casuale ricada in qualche intervallo. Consideriamo la variabile casuale normale con distribuzione .

  1. Vogliamo trovare per :

    En s2 26 f 2.gif

    La variabile à inferiore a 125 con una probabilità del 99.38%.

  2. Vogliamo trovare per :

    En s2 26 f 4.gif

    La variabile casuale assume valori superiori a 115,6 con una probabilità del 5.94% .

  3. Calcoliamo la probabilità per :

    En s2 26 f 6.gif

    La variabile assume valori inferiori a 80 con una probabilità del 2.275%.

  4. Calcoliamo per :

    En s2 26 f 8.gif

    La probabilità che la variabile casuale assuma valori maggiori a 94.8 à del 69,85% .

  5. Calcoliamo la probabilità per e :

    En s2 26 f 10.gif

    La variabile casuale ricade nell’intervallo con una probabilità del 86.8% .

  6. Calcoliamo per e (intervallo di probabilità centrato sulla media):

    En s2 26 f 12.gif

    La variabile casuale ricede nell’intervallo con una probabilità del 95% .

  7. Vogliamo adesso trovare l’intervallo simmetrico rispetto alla media che contiene il 99% dei valori di :

    In corrispondenza del valore 0.995 (per la probabilità) troviamo nelle tavole della variabile normale standardizzata il valore abbiamo quindi: e quindi .

    En s2 26 f 14.gif

    La variabile causale ricade nell’intervallo con una probabilità del 99%.

  8. Troviamo tale che il 76,11% dei valori di siano inferiori a :

    Per la probabilità 0.7611 abbiamo nelle tavole della variabile normale standardizzata il valore e di conseguenza: e quindi .

    En s2 26 f 16.gif

    La variabile ha valori inferiori a 107.1 con una probabilità del 76.11%.

  9. Troviamo tale che il 3,6% dei valori di à maggiore di :

    Tenendo presente che , troviamo nelle tavole della distribuzione normale standardizzata il valore con probabilità 0.964. Quindi, e .

    En s2 26 f 18.gif

    La variabile casuale assume valori maggiori di 118 con una probabilità del 3,6% .

La distribuzione normale à la distribuzione pià importante per diverse ragioni:

  • nella pratica molti comportamenti osservati presentano o si avvicinano ad una distribuzione normale
  • la distribuzione nomale permette un’approssimazione di molte altre distribuzioni
  • costituisce il modello di riferimento in problemi inferenziali se il campione à abbastanza ampio

una variabile normale puà teoreticamente assumere tutti i valori tra e quindi il suo campo di definizione à illimitato.
La distribuzione normale à nota anche come distribuzione di Gauss e la sua densità di probabilità à detta anche campana di Gauss. La densità e la funzione di ripartizione sono determinate dai parametri e . Da cià si puà dedurre che esiste una famiglia di variabili normali.
Il seguente grafico mostra 5 densità di probabilità normali dati diversi valori per i parametri e .

En s2 26 m 1.gif

Il parametro influenza la posizione della distribuzione sulle ascisse: cambiando la campana si sposta senza peraltro cambiare di forma. Il parametro modifica invece la forma allungandola o allargandola e quindi aumentando o diminuendo il punto di massimo. Quando pià grande à tanto pià piatta e allargata à la curva e di conseguenza tanto pià piccola à tanto pià stretta e alta à la curva.
Altre caratteristiche della distribuzione normale sono:

  • la curva di densità ha il suo massimo globale nel punto .
  • la curva à simmetrica rispetto al punto x = . Data la simmetria segue che la mediana coincide alla media .
  • la curva ha nei punti e due punti di flesso
  • per e la curva si avvicina allo 0.

I seguenti grafici illustrano queste proprietà per

En s2 26 m 2.gif


En s2 26 m 3.gif

Per quanto riguarda la distribuzione normale standardizzata:
Il calcolo della funzione di distribuzione della variabile normale per tutti i valori di e non à possibile; si puà perà trasformare la variabile normale e poi tabellarla. La variabile normale standardizzata à semplicemente una determinata variabile normale con media 0, E(X) = = 0 e deviazione standard 1, = 1, ( N(0,1)) e viene indicata solitamente solo con Z.
La variabile casuale Z fornisce i valori della variabile X come deviazioni dalla sua media in termini di deviazione standard (diviso per ). Se la variabile casuale x à normale allora anche Z lo à.
Quindi per ogni variabile casuale normale X esiste una variabile normale standardizzata Z derivata dalla trasformazione lineare di X. utilizzando le tavole della normale standardizzata per la densità di probabilità e la funzione di ripartizione si puà notare che sono indicati solo i valori positivi di Z. i valori negativi non sono chiaramente necessari data la simmetria della distribuzione normale: .