Le stime per intervalli

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


Con una stima puntuale otteniamo per il parametro sconosciuto un valore come realizzazione di una variabile casuale. Anche se lo stimatore presenta “buone” proprietà la probabilità che la stima ottenuta corrisponda al valore effettivo del parametro à piuttosto piccola nel caso in cui la variabile casuale nella popolazione sia discreta ed à addirittura nulla nel caso in cui la variabile sia continua. Per ovviare a questa inadeguatezza e dare un’indicazione della precisione della stima, si usano solitamente degli intervalli di confidenza. Con una stima per intervalli, stimiamo un parametro in modo tale che:

  • otteniamo come risultato un intervallo di valori
  • la probabilità che l’intervallo stimato contenga il valore effettivo del parametro ignoto à determinata a priori pari a .

Tale intervallo à detto intervallo di confidenza. La stima di un intervallo si basa su:

  • un campione casuale semplice di dimensione con le variabili campionarie ,
  • la determinazione di due stimatori per gli estremi inferiore e superiore.

Se entrambi gli stimatori soddisfano le seguenti condizioni:

  • per tutti i valori osservabili e
  • dove la probabilità deve poter essere determinata (almeno approssimativamente) senza conoscere il parametro incognito ,

allora determina un intervallo per con coefficiente di confidenza . Per un campione di osservazioni abbiamo un intervallo di confidenza . La seconda condizione prevede che il livello di confidenza (o di significatività) sia almeno corrispondente alla probabilità data . Questo livello di confidenza viene determinato a priori con valori molto alti, per esempio: . Per una corretta interpretazione bisogna considerare i seguenti punti:
gli estremi dell’intervallo sono variabili casuali. Essendo e funzioni di variabili campionarie ( e quindi casuali), sono anch’essi delle variabili casuali. Di conseguenza à un intervallo casuale sul quale possono essere fatte previsioni probabilistiche. à la probabilità che la procedura di stima ci dia un intervallo nel quale ricade il parametro incognito . In altre parole: il coefficiente di confidenza ci indica la proporzione di tutti i possibili intervalli che contengono il parametro . , al contrario, à la probabilità che la procedura di stima ci dia un intervallo nel quale non ricade il parametro incognito . In altre parole: indica la proporzione di tutti i possibili intervalli che non contengono il parametro . In questo senso viene indicato come margine di errore. Se il processo di stima viene ripetuto pià volte si ottiene nel dei casi un intervallo che contiene e quindi nel dei casi che non contiene . disponiamo delle osservazioni . Inserendo questi valori al posto degli stimatori e otteniamo le stime e e quindi l’intervallo di confidenza . Gli estremi dell’intervallo stimato e sono adesso dei valori fissi non soggetti al calcolo di probabilità. Abbiamo solo due alternative: il parametro incognito ricade all’interno dell’intervallo oppure no. Scegliendo un coefficiente di confidenza prossimo a uno, supponiamo di avere (per il determinato campione) un intervallo che contiene . Se nel singolo caso questa supposizione sia corretta o meno non puà essere verificato. Conosciamo solo l’errore medio percentuale , che risulta dall’osservazione di diversi campioni di dimensione . Se lasciamo uno degli estremi indeterminato abbiamo un intervallo di confidenza unilaterale:

  • , con per ogni campione con il corrispondente intervallo di confidenza , e
  • , con per ogni campione con il corrispondente intervallo di confidenza .

Gli intervalli di confidenza unilaterali sono utilizzati in problemi che indagano la deviazione solo in una direzione. In tutti gli altri casi si considerano intervalli bilaterali , dove le deviazioni in entrambe le direzioni possono avere pratiche conseguenze. Nel caso di intervalli bilaterali, à indicata come ampiezza dell’intervallo di confidenza. In molti casi l’ampiezza dell’intervallo di confidenza dipende dal coefficiente di confidenza e dalla dimensione del campione . Se si mantiene la dimensione del campione costante e si aumenta il coefficiente di confidenza si ottiene normalmente un intervallo di confidenza con ampiezza maggiore. In questo caso combiniamo una pià grande sicurezza che il parametro incognito ricada nell’intervallo con una maggiore imprecisione circa la sua posizione. Se manteniamo il coefficiente di confidenza costante e aumentiamo la dimensione del campione riduciamo l’ampiezza dell’intervallo il che significa una maggiore precisione. Casi particolari sono gli intervalli simmetrici o intervalli centrali di confidenza. La loro caratteristica à che la probabilità che il parametro incognito ricada al di sotto dell’estremo inferiore à uguale alla probabilità che ricada al di sopra dell’estremo superiore. Considerando che la probabilità che ricada all’esterno dell’intervallo à data del margine d’errore abbiamo: e di conseguenza Bisonga considerare che la caratteristica della simmetria si riferisce alla probabilità e non a e .
Nel seguito ci limiteremo a considerare intervalli di confidenza simmetrici. In molti casi, si utilizza lo stesso stimatore che à stato utilizzato per la stima puntule per determinare gli estremi dell’intervallo. La precisione del processo di stima viene misurata dalla deviazione standard dello stimatore e dal coefficiente di confidenza determinato come multiplo della deviazione standard. Se e indicano un multiplo della deviazione standard dello stimatore e e , abbiamo un intervallo di confidenza dato da: con il corrispondente livello di confidenza: In un tale intervallo gli estremi e dipendono dai seguenti fattori:

  1. dalla deviazione standard dello stimatore .

Quanto pià grande (piccola) à la deviazione standard dello stimatore, tanto pià ampio (ristretto) à, a parità di condizioni, l’intervallo di confidenza. Quanto pià grande (piccolo) à il coefficiente di confidenza, tanto pià ampio (ristretto) à, a parità di condizioni, l’intervallo di confidenza. La distribuzione dello stimatore dipende dalla distribuzione delle variabili campionarie e queste a loro volta dipendono dalla distribuzione della variabile casuale , di conseguenza normalmente à richiesta la conoscenza della distribuzione della popolazione. Intervallo di oscillazione centrale e intervallo di confidenza centrale In diversi paragrafi precedenti (per esempio quando abbiamo parlato della diseguaglianza di Tschebyschev, della distribuzione normale o delle distribuzioni campionarie) abbiamo già parlato di un intervallo di oscillazione centrale per un variabile casuale. Se la variabile casuale à uno stimatore per il parametro incognito ci chiediamo perchà non possiamo utilizzare un tale intervallo di oscillazione per la stima per intervalli. Ricordiamo brevemente la definizione di un intervallo di oscillazione centrale. Un intervallo centrale di oscillazione per lo stimatore à una regione con determinati limiti centrata sul parametro nella quale la variabile casuale assume valori con una predeterminata probabilità e le due regioni esterne ai limiti posti hanno la stessa probabilità : con probabilità dove e Di conseguenza l’intervallo centrale di oscillazione puà essere determinato solo se le distribuzioni delle variabili casuali e del parametro sono conosciute. Due caratteristiche dell’intervallo di oscillazione sono in contraddizione con la ricerca di un intervallo di confidenza:

  • il parametro della popolazione deve essere conosciuto, cosa che non si verifica nel caso di una stima per intervallo.
  • l’intervallo di oscillazione à un’area nella quale lo stimatore assume valori con una predeterminata probabilità , mentre nell’intervallo di confidenza determiniamo un’area nella quale ricade il parametro sconosciuto con una data probabilità.

Tuttavia trasformando leggermente la diseguaglianza della probabilità possiamo facilmente derivare un intervallo di confidenza centrale. Prima sottraiamo e poi da entrambe le parti della diseguaglianza: Dato che nel termine centrale abbiamo il valore negativo di , moltiplichiamo entrambe le parti per e invertiamo la diseguaglianza: Riscrivendo otteniamo: che determina il coefficiente di confidenza al quale appartiene l’intervallo di confidenza centrale A differenza dell’intervallo di oscillazione, nel quale i limiti sono valori fissi, nell’intervallo di confidenza, gli estremi sono variabili casuali in quanto contengono la variabile casuale .