Distribuzione dello stimatore frequenza relativa campionaria o proporzione

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Consideriamo una popolazione composta di unità classificate secondo un carattere dicotomico che ne vede unità con l’attributo A e senza. Selezionando casualmente un elemento di questa popolazione creiamo una variabile casuale che assume il valore 1 se l’elemento estratto presenta il carattere A e il valore 0 altrimenti. Ripetendo l’estrazione volte otteniemo variabili casuali che possono solo assumere il valore 1 o 0. Se indica il numero degli elementi che presentano la caratteristica A (ovvero la frequenza relativa) in un campione di numerosità allora à la proporzione, ovvero la frequenza relativa degli elementi con carattere A nel campione. Dopo aver estratto il campione abbiamo un numero concreto di elementi con il carattere A e possiamo tradurre lo stimatore frequenza campionaria in una stima Gli stimatori e sono funzioni di variabili campionarie e variano da campione a campione (con la stessa numerosità). Come variabili casuali possono essere definiti dalla loro distribuzione campionaria, dalla speranza matematica e dalla varianza. La distribuzione campionaria dipende fondamentalmente da:

  • le modalità di estrazione del campione (estrazione bernoulliana o in blocco) e
  • la numerosità della popolazione
  1. Campioni semplici casuali (con reinserimento)
    La modalità di estrazione con reinserimento corrisponde ad un esperimento bernoulliano. Tutte le variabili campionarie hanno la seguente distribuzione con speranza matemetica e varianza .

    Date queste condizioni, lo stimatore ha una distribuzione binomiale con parametri e : con Dato che dove à solo una costante, lo stimatore frequenza campionaria ha la stessa funzione di probabilità di La speranza matematica e la varianza di sono:

    In base al teorema del limite centrale, possiamo, in campioni abbastanza grandi, approssimare la distribuzione binomiale con una distribuzione normale: e rispettivamente. Il campione à considerato abbastanza grande se e .

    Per migliorare la nostra approssimazione dovremmo utilizzare la correzione di continuità, ovvero per la determinazione di dovremmo, utilizzando la distribuzione normale standardizzata, calcolare e per la probabilità

  2. Campionamento casuale senza reinserimento o in blocco

    La modalità di estrazione senza reinserimento à importante solo per popolazioni finite. Se à la numerosità della popolazione, il numero degli elementi con carattere A e la numerosità del campione, allora à la proporzione degli elementi con carattere nella popolazione. Lo stimatore e sono definiti come sopra.

    In un campionamento in blocco ha una distribuzione ipergeometrica con parametri , e :

    La speranza matematica e la varianza dello stimatore con distribuzione ipergeometrica sono: Lo stimatore ha la stessa funzione di probabilità di La speranza matematica e la varianza di sono:

    Per grandi e e piccoli tassi di campionamento la distribuzione ipergeometrica converge verso una distribuzione binomiale con . Regola generale per una buona approssimazione à: .

  3. In base al teorema del limite centrale possiamo, per campioni abbastanza grandi, approssimare la distribuzione ipergeometrica con una distribuzione normale anche nel caso di estrazion in in blocco.

    e rispettivamente. Il campione à considerato abbastanza grande se . Per un’approssimazione pià accurata bisogna utilizzare al correzione di continuità.

Estraiamo da un’urna senza reinserimento palline con una proporzione di palline rosse e numerosità del campione . Calcoliamo la probabilità di ottenere dei campioni con una proporzione di palline rosse compresa tra e .

Problema 1:

Da una popolazione con numerosità e estraiamo senza reinserimento un campione di numerosità . La variabile casuale à data dalla somma di 3 variabili campionarie e fornisce il numero di palline rosse nel campione mentre la variabile casuale ci fornisce la proporzione di palline rosse nel campione.

  • Qual’à rispettivamente la distribuzione della proporzione e del numero delle palline rosse nel campione?
  • Qual’à la probabilità che la proporzione di palline rosse sia tra 1/3 e 2/3?

La popolazione à finita e l’estrazione avviene senza reinserimento, di conseguenza lo stimatore frequenza relativa ha una distribuzione ipergeometrica: , e .
Cerchiamo la probabilità . Dato che ne consegue che e , e la probabilità da calcolare corrisponde a .

En s2 32 e 1.gif

Problema 2:

Da una popolazione di numerosità e proporzione estraiamo in blocco un campione di numerosità . La variabile casuale à la somma delle 4 variabili campionarie e indica il numero di palline rosse nel campione mentre la variabile casuale ci fornisce la proporzione delle palline rosse nel campione.

  • Qual’à rispettivamente la distribuzione della proporzione e del numero delle palline rosse nel campione?
  • Qual’à la probabilità che la proporzione di palline rosse sia tra 0,25 e 0,75?

La modalità di estrazione à senza reinserimento e la popolazione à finita, di conseguenza ha una distribuzione ipergeometrica .
Bisogna perà tenere in considerazione il fatto che la popolazione à piuttosto grande e il tasso di campionamento piccolo e quindi la popolazione puà essere considerata come infinita e possiamo utilizzare una distribuzione binomiale ovvero . Possiamo utilizzare la stessa distribuzione di probabilità per Cerchiamo la probabilità . Dato che e di conseguenza e , la probabilità desiderata corrisponde a . e si trovano nelle tavole della distribuzione binomiale .

En s2 32 e 2.gif

Problema 3:

Da una popolazione di numerosità e proporzione estraiamo in blocco un campione di numerosità . La variabile casuale à la somma delle 100 variabili campionarie e indica il numero di palline rosse nel campione mentre la variabile casuale ci fornisce la proporzione delle palline rosse nel campione.

  • Qual’à rispettivamente la distribuzione della proporzione e del numero delle palline rosse nel campione?
  • Qual’à la probabilità che la proporzione di palline rosse sia tra 0,25 e 0,75?

La modalità di estrazione à senza reinserimento e la popolazione à finita, di conseguenza ha una distribuzione ipergeometrica .
Dato che il campione à grande e i criteri , e sono soddisfatti, possiamo utilizzare una distribuzione normale con

.
Approssimiamo la distribuzione ipergeometrica con la distribuzione normale . Per non complicare troppo il problema tralasciamo la correzione di continuità. La probabilità ricercata puà essere calcolata utilizzando e e otteniamo e possono essere letti dalle tavole della distribuzione normale standardizzata.

En s2 32 e 3.gif

Secondo i dati dell’ufficio di statistica federale tedesco, nell’aprile 1996 vivevano in Germania 37,3 millioni di famiglie delle quali il 35% era composto da un solo membro.

Problema 1:

Da questa popolazione estraiamo senza reinserimento un campione di famiglie.

  • Qual’à rispettivamente la distribuzione di (il numero delle famiglie composte da un solo membro) e di (proporzione delle famiglie composte da un solo membro nel campione)?
  • Si calcoli la speranza matematica, la varianza e la deviazione standard di queste distribuzioni.
  • Qual’à la probabilità che la proporzione delle famiglie con un solo membro nel campione sia maggiore di 0,2 ma inferiore di 0,5?

Abbiamo una popolazione finita di numerosità milioni nella quale famiglie hanno un solo membro. Estraendo 10 volte una famiglia otteniamo 10 variabili casuali campionarie che possono assumere il valore se la famiglia estratta ha un solo componente e altrimenti. La variabile casuale à la somma delle 10 variabili casuali e indica il numero di famiglie composte da un solo componente, mentre indica la loro proporzione nel campione. Se la modalità di estrazione à senza reinserimento ha una distribuzione ipergeometrica: .
Lo stimatore ha la stessa funzione di probabilità di . Dato che la popolazione à molto grande e il tasso di campionamento molto piccolo, possiamo considerare la popolazione come infinita e utilizzare una distribuzione binomiale con : . La stessa distribuzione di probabilità vale per

Speranza matematica, varianza e deviazione standard

La probabilità desiderata à
Dato che abbiamo che e , e la probabilità desiderata corrisponde a . e sono indicati nelle tavole della funzione di ripartizione per la distribuzione binomiale .

Problema 2:

Dalla popolazione di cui sopra estraiamo senza reinserimento il campione di numerosità .

  • Qual’à rispettivamente la distribuzione di (il numero delle famiglie composte da un solo membro) e di (proporzione delle famiglie composte da un solo membro nel campione)?
  • Si calcoli la speranza matematica, la varianza e la deviazione standard di queste distribuzioni.
  • Qual’à la probabilità che la proporzione delle famiglie con un solo membro nel campione sia maggiore-uguale a 700 ma inferiore-uguale a 725, ovvero  ?

Gli stimatori e sono definiti come nel Problema 1. Anche in questo caso il tasso di campionamento à molto piccolo e la popolazione puà essere considerata come infinita e di conseguenza non ha importanza il fatto che l’estrazione sia senza reinserimento. Possiamo quindi utilizzare una distribuzione binomiale.

Speranza matematica, varianza e deviazione standard

La funzione di ripartizione per la distribuzione binomiale non à presente nelle tavole e quindi abbiamo utilizzato un computer per calcolare: dato che la numerosità del campione à grande e i criteri e sono soddisfatti possiamo approssimare la distribuzione binomiale con una distribuzione normale con ne segue che Utilizzando una distribuzione normale introduciamo un errore trascurabile.