I processi di stima

From MM*Stat International

Revision as of 10:52, 23 March 2020 by Siskosth (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Data una popolazione con funzione di ripartizione e corrispondenti parametri (speranza matematica , varianza e frequenza relativa ), non possiamo conoscere tali parametri e tale funzione di ripartizione se non effettuiamo una rilevazione totale. Tuttavia come spiegato nel capitolo precedente possiamo dedurre informazioni sulla popolazione dal campione attraverso un processo detto induttivo o indiretto. I risultati che otteniamo attraverso un processo induttivo sono soggetti al rischio di contenere degli errori. Il grado di rischio puà, a determinate condizioni, essere misurato grazie al calcolo delle probabilità. La determinazione approssimativa della distribuzione o dei parametri della popolazione sulla base dei dati campionari à detta stima.
Il nostro obiettivo à quello di trovare il parametro incognito della popolazione . Il valore di questo parametro deve essere stimato sulla base di un campione. i metodi di stima possono essere di due tipi: la stima puntuale e la stima per intervalli.

La stima puntuale

Le stime puntuali sfruttano le informazioni campionarie per assegnare un singolo valore ad un parametro della popolazione. Questo valore deve chiaramente essere il pià possibile plausibile. La stima avviene sulla base di un campione casuale semplice di numerosità con le variabili campionarie .

Lo stimatore

La funzione dei dati campionari che risulta adeguata ad assegnare un valore al parametro della popolazione à definita stimatore. Lo stimatore à una funzione di variabili casuali ( le variabili campionarie ) e quindi à a sua volta una variabile casuale. Per ogni campione con realizzazioni abbiamo una stima della funzione utilizzata : à detto stima puntuale del parametro incognito nella popolazione . La stima puntuale quindi dipende dalla numerosità e dai valori assunti dalle variabili campionarie. Le stime puntuali calcolate come realizzazioni di variabili casuali corrispondono raramente ai veri parametri della popolazione. Ripetendo il campionamento otteniemo diversi valori per le variabili casuali campionarie e quindi anche diverse stime che si distribuiscono pià o meno vicino ai veri valori dei parametri della popolazione. Il problema fondamentale della stima puntuale à la scelta dei migliori stimatori. Per ottenere una stima utilizziamo la funzione di stima (stimatore) che corrisponde al parametro da stimare e che presenta proprietà interessanti. Per esempio se si vuole stimare la speranza matematica sconosciuta della popolazione possiamo utilizzare la media campionaria come media aritmetica delle variabili campionarie . Supponiamo di avere una popolazione composta di persone. Nella popolazione vengono rilevati i caratteri = età (in anni) e = reddito netto (in DM). La speranza matematica e la varianza di entrambi le variabili sono sconosciute. Per stimare i parametri della popolazione estraiamo un campione casuale. Dobbiamo quindi specificare

  • la numerosità del campione e
  • la variabile (età o reddito netto).

Per la stima di (rispettivamente ) utilizziamo lo stimatore e per la stima di (rispettivamente ) lo stimatore . Come risultato otteniamo i valori e come stime puntuali di e . Ripetendo l’estrazione di un campione si puà capire meglio il concetto di stima puntuale.

En s2 40 f 5.gif

Data una popolazione di famiglie, definiamo la variabile casuale come il reddito netto famigliare (in DM). Il reddito netto medio famigliare di questa popolazione, ovvero la speranza matematica , à sconosciuto e deve essere stimato. Per stimare utilizziamo lo stimatore media campionaria Un campione casuale di numerosità ci fornisce i valori . Sostituendo questi valori nella funzione dello stimatore otteniamo la stima come stima puntuale del reddito netto famigliare medio.

  1. Campione casuale di numerosità
    Un campione casuale di famiglie estratte dalla popolazione di cui sopra fornisce i seguenti valori:
    Tabella 1: Valori dei redditi famigliari di un campione di numerosità (ordinati per grandezza):

    Reddito famigliare netto (DM) Reddito famigliare netto (DM)
    1 800 11 2500
    2 1200 12 2500
    3 1400 13 2500
    4 1500 14 2700
    5 1500 15 2850
    6 1500 16 3300
    7 1800 17 3650
    8 1800 18 3700
    9 2300 19 4100
    10 2400 20 4300

    Il reddito famigliare netto medio di questo campione à DM ed à una stima per il reddito netto medio della popolazione. Come si puà facilmente riconoscere il calcolo corrisponde alla media aritmetica utilizzata nella statistica descrittiva. La sola differenza sta nel fatto che nella statistica descrittiva il lavoro à completato quando si giunge all’affermazione “il reddito famigliare netto medio delle 20 famiglie osservate à 2415 DM”, mentre nel nostro caso utilizziamo questo risultato per inferire il reddito netto medio di tutte e 2000 le famiglie della popolazione e utilizziamo come stima di . Pià tardi indagheremo la precisione e l’adeguatezza di questa stima.

    Per meglio comprendere la problematica della stima puntuale estraiamo dalla stessa popolazione altri 24 campioni casuali di numerosità e calcoliamo il reddito netto medio di ciascun campione. La seguente Tabella contiene il reddito netto medio di tutti e 25 i campioni estratti.

    Tabella 2: Reddito netto medio (in DM) in 25 campioni casuali di numerosità (ordinati in base alla grandezza):

    Campione Campione Campione
    1 1884,90 10 2241,15 18 2395,25
    2 1915,30 11 2243,15 19 2413,40
    3 2060,90 12 2267,75 20 2415,00
    4 2062,15 13 2298,80 21 2567,50
    5 2110,30 14 2317,00 22 2607,25
    6 2126,50 15 2319,55 23 2635,00
    7 2163,10 16 2361,25 24 2659,00
    8 2168,50 17 2363,50 25 2774,30
    9 2203,85

    Osservando questi risultatui à evidente la natura casuale della stima. Lo stimatore à una variabile casuale in quanto per ogni campione fornisce una stima diversa sulla base dei diversi valori campionari estratti . Di conseguenza assegniamo al parametro incognito della popolazione un valore (la stima) che dipende dai valori estratti nel campione e che solitamente non coincide con il vero valore del parametro cercato (il reddito netto medio della popolazione). Dobbiamo quindi completare le informazioni sulla stima fornendo anche indicazioni sulla sua precisione (come la deviazione standard dello stimatore) o utlizzando anche altri stimatori.

    Il seguente grafico contiene le stime dei 25 campioni (indicate con punti). Per evidenziare la deviazione delle stime dall’effettivo valore della media nella popolazione, il valore di à indicato con una linea tratteggiata.

    Fig. 1: Stime da 25 campioni casuali di numerosità

    En s2 40 f 3.gif

  2. Camponi casuali di numerosità
    Dalla stessa popolazione estraiamo 100 campioni di numerosità e calcoliamo il reddito netto medio in ciascuno. Senza riportare tutti i risultati numerici, ci limitiamo a indicarli nel grafico. Il valore effetivo di à indicato con una linea tratteggiata.

    Fig. 2: Stime da 100 campioni di numerosità

    En s2 40 f 4.gif