La distribuzione della varianza campionaria

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Consideriamo una variabile con e . Estraiamo dalla popolazione a cui appartiene un campione di numerosità . Il calcolo della varianza campionaria si basa sulla somma degli scostamenti delle variabili campionarie dalla media elevati al quadrato. A seconda delle informazioni di cui si dispone sulla media abbiamo diverse definizioni della varianza campionaria.

  1. Se la media della popolazione à conosciuta, la varianza campionaria à data da

  2. Se à sconosciuta la estimiamo con la media campionaria e la varianza campionaria risulta

    In analogia con la statistica descrittiva, la varianza campionaria puà anche essere calcolata come Per ulteriori informazioni a riguardo questo tipo di calcolo della varianza campionaria cliccate sulla sezione “Information”.

Deriviamo la distribuzione delle varianze campionarie e per una popolazione distribuita normalmente , e un campionamento casuale semplice. A queste condizioni le variabili campionarie sono distribuite indipendentemente e normalmente con e : Inoltre lo stimatore media campionaria à anch’esso distribuito normalmente con e :

Distribuzione della varianza campionaria

Dalla definizione di segue che: e dividendo per In base a questi risultati possiamo trarre le seguenti conclusioni:

  • sono variabili casuali standardizzate
  • Queste variabili sono distribuite normalmente in quanto sono variabili normali.
  • Sono indipendenti in quanto il metodo di campionamento à casuale semplice.
  • à la somma dei quadrati di variabili normali standardizzate indipendenti.

Come sappiamo la somma dei quadrati di variabili normali standardizzate indipendenti ha una distribuzione di chi-quadrato , di conseguenza anche ha una distribuzione di chi-quadrato con parametro . Chiaramente la distribuzione di non puà essere derivata direttamente ma solo attraverso la variabile casuale trasformata . Tuttavia dato che e sono solo delle costanti possiamo ancora trarre delle conclusioni sulla probabilità di . I gradi di libertà indicano il numero di variabili indipendenti sommate ossia il numero delle variabili standardizzate . In questo caso in quanto in un campione casuale semplice tutte le variabili sono indipendenti e e sono solo delle costanti. La speranza matematica e la varianza di sono:

Distribuzione della varianza campionaria

La distribuzione di puà essere derivata in modo analogo a quella di Dalla definizione di segue che: e dividendo per Le conclusioni di cui sopra valgono anche in questo caso e quindi:
ha una distribuzione di Chi-quadrato con gradi di libertà. Anche la distribuzione di deve essere derivata indirettamente attraverso l’uso della variabile casuale trasformata . Tuttavia possiamo ancora trarre delle conclusioni sulla probabilità di in quanto e sono solo delle costanti. I gradi di libertà sono pari a in quanto la media campionaria à la media di variabili campionarie: . In base alle proprietà della media campionaria abbiamo che la somma degli scostamenti delle variabili campionarie dalla media campionaria à uguale a zero: data questa relazione lineare, le variabili casuali non sono pià collettivamente indipendenti; in altre parole solo variabili sono indipendenti e possono variare liberamente mentre l’-esima dovrà assumere quel valore che rende la somma nulla. Questa proprietà rimane invariata anche se si eleva al quadrato e si divide per e di conseguenza per il numero di variabili indipendenti e quindi i gradi di libertà sono . Il valore atteso e la varianza di sono:

Intervallo di confidenza per la varianza:

Se la varianza della popolazione à conosciuta e la popolazione à distribuita normalmente possiamo calcolare la probabilità che la varianza campionaria ricada in un determinato intervallo centrato sulla media con una probabilità di La probabilità che cada all’esterno dall’intervallo à data da: Nelle tavole della distribuzione Chi-quadrato troviamo per gli estremi dell’intervallo: Di conseguenza: L’intervallo di confidenza per à: Considerando che otteniamo:

En s2 33 f 9.gif

Per misurare l’uniformità del tempo richiesto per completare alcuni compiti al lavoro viene solitamente utilizzata la varianza. Il tempo impiegato dai lavoratori per completare un certo compito à la variabile casuale distribuita normalmente con e . Estraiamo un campione casuale di numerosità . La popolazione à costituita da tutte le possibili misure del tempo rilevate per lo stesso compito, eseguito dallo stesso lavoratore. Possiamo quindi considerare la popolazione come molto grande e limitarci all’analisi di campioni casuali semplici. Le variabili campionarie = “i-esima misura del tempo necessariao per completare il compito" () sono indipendenti e identicamente distribuite normalmente.

Problema 1:

Estraiamo un campione casuale di numerosità .
Qual’à la probabilità che la varianza campionaria assuma valori compresi nell’intervallo ? La probabilità desiderata à .
Ogni membro della disegueglianza viene diviso per : Utilizzando abbiamo: La probabilità che assuma valori tra e à identica alla probabilità che la variabile casuale trasformata assuma valori tra 27 e 21. La variabile casuale ha una distribuzione di Chi-quadrato con gradi di libertà. Possiamo quindi trovare la probabilità cercata nelle tavole della distribuzione di Chi-quadrato o calcolarla con un computer. La probabilità che la varianza campionaria assuma un valore nell’intervallo e à pari a 0,8331. Il seguente grafico mostra la densità di probabilità della distribuzione di Chi-quadrato con , dove indica .

En s2 33 f 8.gif

Problema 2:

Determiniamo adesso un intervallo di confidenza per la varianza campionaria con una probabilità predeterminata nel caso in cui abbiamo la stessa popolazione e un campione di Dato che e troviamo nelle tavole della distribuzione di Chi-quadrato con gradi di libertà i seguenti valori e . Possiamo quindi calcolare, La variabile casuale trasformata assume valori compresi nell’intervallo con una probabilità dello 0,95. Modificando un po’ la formula abbiamo: La varianza campionaria assume valori nell’intervallo con una probabilità dello 0,95. Gli estremi dell’intervallo possono essere determinati solo se la varianza della variabile casuale = “tempo richiesto per un determinato compito” à conosciuta.

à conosciuta

La varianza campionaria à data da Nel calcolo si deve tenere presente che tutte le variabili campionarie hanno la stessa varianza .
La varianza di una variabile casuale di Chi quadrato con parametro à . ha una distribuzione di Chi-quadrato con parametro e quindi: e di conseguenza

à sconosciuta

La varianza campionaria à ora data da
La varianza di una variabile campionaria puà essere scritta come segue: da cià segue che Applichiamo questo risultato alle variabili campionarie e alla media campionaria : Con tali risultati possiamo inoltre ottenere Abbiamo quindi come speranza matematica della varianza campionaria :


ha una distribuzione di Chi-quadrato con gradi di libertà la cui varianza à di conseguenza

(3) à sconosciuta

Osserviamo ora la varianza campionaria: Per derivare la speranza matematica utilizziamo tutti i risultati presentati fino ad ora: Il valore atteso della varianza campionaria non à uguale alla varianza della popolazione, per questo motivo non viene utilizzato spesso nella statistica induttiva.