Prova delle ipotesi sulla media della popolazione.

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands


In questo test proviamo ipotesi su un parametro incognito della popolazione, si tratta quindi di un test parametrico. Il parametro incognito à la speranza matematica della variabile casuale nella popolazione: . I test si basano su campioni casuali semplici di numerosità , con le variabili campionarie , e livello di significatività .

Formulazione delle ipotesi

In base all’ipotesi da verificare possiamo formulare test unilaterali o bilaterali.

1) Test bilaterali

2) Test unilaterale destro

3) Test unilaterale sinistro

Nella formulazione di un test unilaterale (destro o sinistro) poniamo nell’ipotesi alternativa l’assunzione che vogliamo confermare statisticamente. Spesso consideriamo il rischio connesso alle decisioni sbagliate che possiamo prendere e poniamo la decisione sbagliata con le conseguenze pià gravi pari all’errore di prima specie. Cià si spiega con il fatto che la probabilità per l’errore di prima specie viene mantenuta piccola dalla predeterminazione di . In base a queste considerazioni decidiamo se effettuare un test destro o sinistro.

Determinazione del test statistico, la sua distribuzione, zona di accettazione e regione critica dell’ipotesi nulla

Dato che ogni test si basa sui dati campionari, necessitiamo innanzitutto di una grandezza che contenga le informazioni fornite dal campione. In un test parametrico utilizziamo a questo scopo uno stimatore. Come già illustrato lo stimatore media campionaria fornisce una stima puntuale adatta per la speranza matematica incognita della popolazione in quanto lo stimatore à corretto e consistente. La varianza e la deviazione standard di sono in caso di un campione casuale dati da (vedi sezione ??)

Utilizziamo quindi la media campionaria per costruire il nostro test statistico.

Per poter procedere stabiliamo le seguenti condizioni:

  • la variabile casuale à distribuita normalmente e quindi anche à una variabile normale o
  • à sufficientemente grande per permetterci di applicare il teorema del limite centrale e considerare come approssimativamente normale a prescindere dalla distribuzione della variabile casuale (in questo caso si tratta di un test approssimativo)

Abbiamo quindi:
à (almeno approssimativamente) distribuito normalmente con speranza matematica e varianza . Per poter determinare concretamente la distribuzione di dobbiamo specificare il valore numerico di . Tuttavia, l’unica informazione disponibile su à il valore ipotetico . Supponiamo che sia il valore atteso effettivo della popolazione, ovvero che valga . Cià corrisponde esattamente, in un test bilaterale, all’ipotesi nulla . In un test unilaterale rappresenta il valore limite della zona sotto l’ipotesi nulla. Possiamo quindi riassumere: in presenza dell’ipotesi nulla, à (almeno approssimativamente) distribuito normalmente con e varianza . La determinazione di un test statistico dipende dalla deviazione standard della variabile casuale nella popolazione. à quindi importante distinguere tra il caso in cui la deviazione standard di e quindi la deviazione standard della media campionaria à conosciuta e quello in cui non lo à. Data , abbiamo pienamente definito la distribuzione di . I valori della distribuzione, non sono tuttavia disposti in tavole per ogni e . Ricorriamo quindi alla standardizzazione di : e lo utilizziamo come test statistico. In presenza di , ha una distribuzione (almeno approssimativamente) normale standardizzata: Dato il livello di significatività scelto possiamo trovare i valori critici nelle tavole della distribuzione normale standardizzata. Possiamo quindi determinare la zona di accettazione e la regione critica per ciascun test in presenza di , data . 1) Test bilaterale La probabilità che il valore assunto dal test statistico ricada nella regione critica di deve corrispondere al dato livello di significatività : Per possiamo trovare la soglia discriminante nelle tavole della funzione di ripartizione della distribuzione normale standardizzata : . Data la simmetria della distribuzione normale abbiamo . La regione critica di à quindi data da La zona di accettazione di à La probabilità che assuma un valore che ricade nella regione critica di à 2) Test destro Se l’ipotesi nulla à vera abbiamo e quindi . Uno scostamento troppo grande alla destra di ci portano a rifiutare e quindi la regione critica di corrisponde a valori positivi di . La probabilità di ottenere un valore di che ricade nella regione critica di corrisponde al livello di significatività : Per troviamo la soglia discriminante nelle tavole della distribuzione normale standardizzata : . La regione critica di à data da e la zona di accettazione à La probabilità che assuma un valore nella zona di accettazione di à 3) Test sinistro Grossi scostamenti di a sinistra di ci portano a rifiutare e la regione critica di corrisponde a valori negativi di . La soglia discriminante à negativa . La probabilità che il test statistico assuma valori che ricadono nella regione critica di corrisponde al dato livello di significatività . Data la simmetria della distribuzione normale troviamo nelle tavole della distribuzione per il valore : e il valore critico à . La regione critica di à data da e la zona di accettazione di à La probabilità che assuma valori che ricadono nella zona di accettazione di à Se non conosciamo a priori la deviazione standard dobbiamo stimarla dai dati campionari per poter standardizzare la variabile casuale Uno stimatore corretto della varianza della popolazione à Utilizziamo quindi il test statistico: Se l’ipotesi nulla à vera, ha (almeno approssimativamente) una distribuzione t di Student con gradi di libertà (vedi sezione ???). Per il dato livello di significatività e i gradi di libertà , possiamo trovare la soglia discriminante nelle tavole della distribuzione t di Student. Possiamo quindi determinare le zone di accettazione e le regioni critiche per i diversi test in presenza dell’ipotesi nulla . 1) Test bilaterale Regione critica di : . Zona di accettazione di : 2) Test destro Regione critica di : Zona di accettazione di : 3) Test sinistro Regione critica di : Zona di accettazione di : Si noti che per una numerosità campionaria grande (), à, in presenza dell’ipotesi nulla, approssimativamente distribuito normalmente dato il teorema del limite centrale. Possiamo quindi trovare i valori critici (soglie discriminanti) dalle tavole della distribuzone normale standardizzata e quindi utilizzare le regole di decisione e le zone di accettazione / rifiuto date nel caso A ( conosciuta).

Estrazione di un campione e calcolo del valore del test

Quando estraiamo un campione casuale di numerosità , otteniamo le osservazioni , con le quali possiamo poi calcolare le stime della media campionaria e della deviazione standard: e Inserendo tali valori nel test statistico otteniamo un valore:

  • A. à conosciuta
  • B. à incognita

Decisone e interpretazione del test

Se ricade nella regione critica di , rifiutiamo l’ipotesi nulla sulla base delle informazioni di un campione casuale di numerosità dato un livello di significatività : . Possiamo dimostrare statisticamente che la vera speranza matematica nella popolazione non corrisponde all’ipotetica . In questo caso esiste la possibilità che abbiamo commesso un errore di prima specie se l’ipotesi nulla non à effettivamente vera. La probabilità di commettere un errore di prima specie à data da : . Se, d’altra parte ricade nella zona di accettazione di , accettiamo l’ipotesi nulla sulla base dei dati di un campione di numerosità dato il livello di significatività : . In questo caso non possiamo dimostrare statisticamente che il vero valore della speranza matematica nella popolazione si discosta dal valore ipotetico (). Esiste quindi la possibilità che stiamo commettendo un errore di seconda specie se nella situazione vera vale l’ipotesi alternativa. La probabilità di un errore di seconda specie à in generale incognita e puà essere calcolata solo per singoli parametri dell’ipotesi alternativa .

Potenza del test

Per valutare la potenza di un test à decisivo conoscere le deviazioni del vero parametro dal valore ipotetico . Ci interessa quindi la probabilità di accettare sulla base del test l’ipotesi alternativa se il vero parametro si discosta dal parametro ipotetico . Possiamo misurare questa probabilità con una funzione di potenza . Dati conosciuto, il valore ipotetico , il livello di significatività e la numerosità campionaria possiamo calcolare i valori della funzione di potenza inserendo uno dopo l’altro tutti i possibili valori di . La potenza del test puà essere calcolata prima di estrarre un campione in quanto non dipende da particolari valori assunti dal test statistico . La funzione di potenza del test ci fornisce la probabilità di rifiutare l’ipotesi nulla a seconda del valore di : 1) Test bilaterale In un test bilaterale l’ipotesi nulla à vera nella situazione reale solo se e quindi rifiutare l’ipotesi nulla comporta un errore di prima specie: Per tutti gli altri possibili valori di vale l’ipotesi alternativa e rifiutando l’ipotesi nulla prendiamo una decisione corretta: Abbiamo quindi La funzione di potenza per test bilaterali puà essere calcolata come segue dati diversi valori di : La probabilità di commettere un errore di seconda specie puà essere determinata con la funzione di potenza: Le proprietà della funzione di potenza per i test bilaterali sono:

  • per , la funzione assume il suo valore minimo pari a .
  • la funzione à simmetrica rispetto al valore ipotetico
  • la funzione cresce in accordanza alla distanza tra il vero parametro e il valore ipotetico e assume alla fine il valore di uno.

Il grafico dell funzione di potenza per test bilaterali à dato nella figura seguente.

En s2 51 14.gif

Nel grafico sono considerati due possibili valori alternativi del parametro e . Se nella siuazione reale il vero parametro della popolazione à abbiamo uno scostamento piuttosto grande . La probabilità di aver preso una decisione giusta accettando l’ipotesi alternativa à elevata e quindi la probabilità di commettere un errore di seconda specie à piccola. Se nella situazione reale il vero parametro della popolazione à , la distanza , à raltivamente piccola. La probabilità , di aver preso una decisione giusta accettando l’ipotesi alternativa à piccola e quindi la probabilità di commetttere un errore di seconda specie , à grande. Intuitivamente cià à chiaramente plausibile un quanto deviazioni piccole sono difficili da rilevare con il test. 2) Test destro. In un test destro l’ipotesi nulla à vera se il vero parametro à minore o uguale al valore limite ipotetico , ovvero se . In questo caso (l’ipotesi nulla à vera) la probablità di commettere un errore di prima specie, rifiutando l’ipotesi nulla à al massimo pari al livello di significatività : Per tutti i valori vale l’ipotesi alternativa e con il rifiuto dell’ipotesi nulla prendiamo una decisione corretta. In questo caso abbiamo: Se consideriamo questi due spazi parametrici abbiamo la funzione di potenza: La funzione di potenza per i test destri puà essere calcolata per dati valori di come segue: Nel grafico seguente à rappresentata la tipica funzione di potenza per i test destri.

En s2 51 17.gif

Per tutti i valori possibili dell’ipotesi alternativa, ovvero la funzione di potenza cresce e assume infine il valore di uno. Tanto pià grande la distanza , tanto maggiore diviene la probabilità di prendere una decisione corretta e accettare l’ipotesi alternativa e quindi tanto minore diviene la probabilità di commettere un errore di seconda specie . Per il valore della funzione corrisponde al dato livello di significatività . Per tutti i possibili valori dell’ipotesi nulla ovvero , la funzione di potenza à minore di . Tanto pià grande à la differenza tanto pià piccola diventa la probabilità di commettere un errore di prima specie . 3) Test sinistro In un test sinistro, l’ipotesi nulla à vera per valori del parametro per i quali vale . In questo caso rifiutare l’ipotesi nulla significherebbe commettere un errore di prima specie con una probabilità al massimo pari a : Per tutti i valori del parametro della popolazione per cui vale , vale in realtà l’ipotesi alternativa e con il rifuto dell’ipotesi nulla prendiamo una decisone corretta: Per l’intero spazio parametrico abbiamo quindi: La funzione di potenza per test sinistri puà essere calcolata come segue dati diversi valori di : Il grafico della funzione di potenza dei test sinistri à data di seguito.

En s2 51 19.gif

L’interpretazione del grafico à simile a quella per il test destro. Cliccando su START si puà scegliere tra due concetti correlati di test di prova delle ipotesi:

  • la funzione di potenza
  • la probabilità di un errore di seconda specie.

Se decidete di analizzare la funzione di potenza si puà sceglere tra diversi tipi di test:

  • test bilaterale:
  • test sinistro:
  • test destro:

Determinate inoltre la numerosità campionaria , il livello di significatività e il valore di per i quali volete calcolare la funzione di potenza. La deviazione standard à conosciuta e pari a . Come risultato otteniamo in un display a due finistre:

  • nel display superiore abbiamo:
    • la distribuzione della media campionaria per (curva blu)
    • la distribuzione della media campionaria per il parametro scelto (curva rossa)
    • la(e) soglia(e) critica(he) (linee verticali) e
    • la probabilità di rifiutare l’ipotesi nulla quando il parametro scelto à vero (aree tratteggiate rosse)
  • nel display sottostante abbiamo:
    • la funzione di potenza per tutti i valori di compresi tra e ,
    • il valore della funzione di potenza per il parametro scelto indicato come punto rosso sulla curva,
    • una linea tratteggiata da questo punto verso l’asse verticale (valore della funzione di potenza) e
    • una linea tratteggiata da questo punto verso l’asse orizzontale (sul possibile valore di )

Nel seguito si puà cambiare il valore di e analizzare come la scelta di influenza la funzione di potenza per data numerosità campionaria e livello di significatività . Se decidete di studiare l’errore di seconda specie consideriamo il seguente test destro: La deviazione standard à conosciuta e pari a . La numerosità campionaria e il livello di significatività devono ancora essere determinati. In questo esempio si ha la possibilità di analizzare come la probabilità di un errore di seconda specie viene influenzata da

  • la numerosità campionaria ,
  • il livello di significatività ,
  • la scelta di dall’insieme di valori attesi dell’ipotesi alternativa, ovvero .

Dopo aver scelto , e si ottiene un grafico con i seguenti dati

  • la distribuzione della media campionaria in presenza di (curva rossa),
  • la distribuzione della media campionaria in presenza di con scelta (curva blu),
  • la soglia discriminante (linea verticale nera) per la quale l’ipotesi nulla viene rifiutata se la media campionaria cade oltre la soglia,
  • la probabilità di un errore di prima specie (area rossa sotto alla curva rossa),
  • la probabilità di un errore di secoda specie (area blu sotto alla curva blu).

Cambiando , e , si puà osservare l’impatto di questi parametri del test sulla probabilità di un errore di seconda specie. Suggeriamo di modificre sempre solo uno dei parametri per confrontarne l’effetto con i risultati precedenti (nel display superiore). Data una popolazione di linee di credito in una banca, ipotizziamo che la variabile casuale abbia una distribuzione normale con una speranza matematica incognita e una deviazione standard conosciuta paria a . Sulla base di un campione casuale semplice di numerosità dobbiamo verificare se la speranza matematica della popolazione corrisponde al valore ipotetico dato il livello di significatività : Il test puà essere ripetuto pià volte sulla base di diversi campioni osservando diverse opzioni:

  • mantenere il livello di significatività e la numerosità campionaria constanti,
  • cambiare il livello di singificatività e mantenere costante la numerosità campionaria ,
  • cambiare la numerosità campionaria e mantenere costante il livello di significatività ,
  • cambiare sia il livello di significatività che la numarosità campionaria .

En s2 51 e 8.gif

Con questo esempio vogliamo illustrare l’influenza esercitata dalle informazioni disponibili sulla popolazione sulla scelta del test statistico, sulle zone di decisione e possibilmente, a seconda dei risultati campionari, sulla decisone del test. Una ditta produttrice di pneumatici cambia i materiali utilizzati sperando di aumentare la durata di vita di un determinato tipo di pneumatici. La concorrenza afferma che cambiando i materiali non à stata aumentata la durata media dei pneumatici che era, prima di effettuare questo cambiamento, di . La variabile casuale , rappresenta la durata media dei pneumatici e ha un valore atteso ipotetico pari a . La ditta afferma che la durata media dopo il cambiamento dei materiali usati à aumentata: . Per verificare questa affermazione e non dare adito a discussioni con la concorrenza, la ditta considerata, effettua un test mantenendo la probabilità di un errore il pià possibile ridotta.

Formulazione delle ipotesi

Oggetto di discussione con la concorrenza sono solo le deviazioni della media in una direzione; effettuiamo quindi un test unilaterale. L’affermazione della ditta viene formulata come ipotesi alternativa e otteniamo quindi un test destro: dove . Nella considerazione degli errori dobbiamo verificare che l’intenzione della ditta considerata di ottenere un test il pià potente possibile sia rispettata. In caso di rifiuto dell’ipotesi nulla il possibile errore di prima specie ha il seguente contenuto: Se in base ai risultati campionari accettiamo l’ipotesi nulla il possibile errore di seconda specie diventa: Per la ditta produttrice, commettere un errore di prima specie ha conseguenze pià gravi di commetterne uno di seconda specie, in quanto l’uso prolungato dei pneumatici modificati, rivelerebbe ben presto che la durata media non à aumentata, e l’immagine della ditta ne verrebbe danneggiata. La probabilità di un errore di prima specie corrisponde al livello di significatività . Scegliendo il livello di significatività piccolo conteniamo il rischio di commettere un errore di prima specie. La probabilità di commettere un errore di seconda specie , à incognita in quanto il vero valore del parametro à sconosciuto. Questa probabilità corriponde al rischio di non riconoscere un effettivo aumento della durata dei pneumatici. La ditta deve accettare questo rischio in quanto ha già posto altre priorità nell’esecuzione del test. In questo caso dovranno essere effettuati altri controlli tecnici.

1ma variante

Livello di significatività e numerosità campionaria

Il test viene eseguito con un livello di significatività di . Il campione casuale ha una numerosità di . Dato che la popolazione à piuttosoto grande (sono già state prodotte un paio di migliaia di pneumatici) possiamo considerare il campione casuale come semplice.

Test statistico e sua distribuzione, zone di accettazione e di rifiuto

Dalle diverse investigazioni effettuate sui pneumatici prima della modificazione sappiamo che la durata media ha una distribuzione normale con una deviazione standard di . Ipotizziamo che cià valga anche dopo aver modificato la miscela dei materiali. Abbiamo quindi per la media campionaria: In presenza di , il test statistico ha una distribuzione normale: Il valore critico che soddisfa puà essere trovato nelle tavole della distribuzione normale standardizzata in corrispondenza del 95 % quantile: . Le regole di decisione risultati sono: Zone di accettazione di : . Regione critica di : .

Estrazione di un campione casuale e determinazione del valore del test

La durata media di pneumatici estratti a caso à . Il valore del test statistico à quindi

Decisione e interpretazione

ricade nella regione critica di , e quindi rifiutiamo l’ipotesi nulla. Dato il livello di significatività e la numerosità campionaria abbiamo dimostrato statisticamente che il vero valore atteso della durata dei pneumatici aumenta modificando la miscela dei materiali ed à maggiore del valore ipotetico . Il risultato del test ci porta ad accettare l’ipotesi alternativa . In pratica perà l’ipotesi nulla puà essere vera ( e il produttore corre il rischio di commettere un errore di prima specie (). La probabilità di un errore di prima specie à stata mantenuta piccola ponendo un livello di significatività pari a . Se in realtà l’ipotesi alternativa à vera abbiamo effettuato una decisione corretta: . La probabilità puà essere calcolata solo se specifichiamo un valore alternativo di . Se per esempio la durata media à diventata , otteniamo grazie alla funzione di potenza Tanto pià grande à l’aumento della durata dovuto alla modifica della miscela dei materiali e tanto pià elevata à la probabilità . Per esempio se raggiungiamo una durata di la funzione di potenza diventa : .

2nda variante

Manteniamo il livello di significatività pari a e la numerosità campionaria pari a e consideriamo la distribuzione della durata dei pneumatici normale. La deviazione standard puà perà essersi modificata e non la conosciamo.

Test statistico e sua distribuzione in presenza dell’ipotesi nulla e determinazione delle zone di decisione dell’ipotesi nulla

Dobbiamo ora stimare la deviazione standard e quindi utilizziamo il test statistico che in presenza dell’ipotesi nulla , ha una distribuzione di Student con gradi di libertà. Troviamo la soglia discriminante che soddisfa sulle tavole della distribuzione di Student con gradi di libertà in corrispondenza del quantile . Le zone di decisione sono quindi: Zona di accettazione di : . Regione critica di : . Possiamo chiaramente osservare che la zona di accettazione della seconda variante à molto pià grande di quella della prima variante mentre la regione critica à diventata pià piccola. Cià à da ricondurre al fatto che non abbiamo informazioni su . Come conseguenza dato lo stesso livello di sgnificatività e la stessa numerosità accettiamo l’ipotesi nulla pià spesso.

Estrazione di un campione casuale e calcolo del valore del test

Assieme alla media campionaria dobbiamo stimare la deviazione standard . Abbiamo e . Quindi il valore del test diventa is

Decisione e interpretazione

ricade nella regione critica dell’ipotesi nulla che viene quindi rifiutata. Dato il livello di significatività e la numerosità campionaria possiamo dimostrare statisticamente che il vero valore atteso della durata dei pneumatici dopo la modifica apportata ai materiali utilizzati à maggiore del valore ipotetico . Anche in questo caso esiste la possibilità di commettere un errore di prima specie nel caso in cui l’ipotesi nulla sia vera. La probabilità viene tuttavia mantenuta ridotta ponendo . Se in realtà l’ipotesi alternativa à vera abbiamo effettuato una decisione corretta . La probabilità , puà essere calcolata solo per valori alternativi di concreti e supponendo che la stima puntuale della deviazione standard corrisponde a quella della popolazione .

3rza variante

Abbandoniamo ora l’ipotesi di una popolazione distribuita normalmente, osservando quindi una situazione molto comune nella pratica. Per poter eseguire un test su dobbiamo estrarre un campione di numerosità maggiore di in modo tale che possiamo applicare il teorema del limite centrale. La ditta considerata decide di estrarre un campione di numerosità . Verificare la durata dei pneumatici à in questo caso molto pià costoso come conseguenza di non disporre di informazioni complete sulla popolazione. Come livello di significatività scegliamo .

Test statistico e sua distribuzione, regioni di decisione dell’ipotesi nulla

Come nella seconda variante dobbiamo utilizzare il test statistico Avendo estratto possiamo utilizzare il teorema del limite centrale e approssimare la distribuzione del test con una distribuzione normale standardizzata: “as” significa asintoticamente. La soglia discriminante che soddisfa à quindi il quantile della distribuzione normale standardizzata , e abbiamo le seguenti zone di decisione: Zona di accettazione di : . Regione critica di : .

Estrazione del campione e calcolo del test statistico

Come nella seconda variante dobbiamo stimare sia che la deviazione standard . Supponiamo che il loro valore sia e . Il valore del test à

Decisione e interpretazione

ricade nella regione critica e quindi rifiutiamo l’ipotesi nulla. Dato un campione di e un livello di significatività di possiamo dimostrare statisticamente che il vero valore atteso della durata dei pneumatici dopo la modifica della miscela di materiali usata à maggiore del valore ipotetico . Se l’ipotesi nulla à vera e la rifiutiamo commettiamo un errore di prima specie la cui probabilità corriponde al livello di significatività . Se in realtà à vera l’ipotesi alternativa abbiamo preso una decisoone corretta: . La probabilità , puà solo essere determinata per dati valori alternativi di e supponendo che la stima puntuale della deviazione standard sorrisponde alla deviazione della popolazione : . Un’impresa impacchetta farina in sacchetti da grammi (g) . Il peso dei diversi sacchetti di farina varia notevolmente e puà essere considerato come una variabile casuale: = {Peso dei sacchetti di farina}. Il valore atteso del peso dei sacchetti à . A intervalli regolari bisogna controllare i macchinari per verificare se necessitano una regolazione. Periodicamente estraiamo quindi dalla produzione un campione casuale di numerosità ne calcoliamo il peso medio e lo confrontiamo con i previsti grammi. In caso di grossi scostamenti dobbiamo regolare i macchinari.

Formulazione delle ipotesi

Per gli amministratori della nostra impresa sono rilevanti gli scostamenti dal peso previsto in entrambe le direzioni. Se i sacchetti contengono troppo poca farina, le organizzazioni dei consumatori potrebbero rovinare la reputazione dell’impresa. Se al contrario riempiamo i sacchetti troppo riduciamo chiaramente il profitto. Dobbiamo quindi effettuare un test bilaterale: dove .

Numerosità campionaria e livello di significatività

Decidiamo di effettuare il test con un livello di significatività di su un campione di sacchetti. Dato che la popolazione puà essere considerata infinita (la produzione di sacchetti) possiamo considerare il nostro campione come casuale semplice.

Test statistico, sua distribuzione in presenza dell’ipotesi nulla e determinazione delle zone di decisione

Come stimatore per la speranza matematica della popolazione utilizziamo la media campionaria . Per esperienza sappiamo che il peso effettivo dei sacchetti ha una distribuzione normale con deviazione standard . Anche lo stimatore à quindi normalmente distribuito con deviazione standard . Sotto , ovvero quando i macchinari riescono effettivamente a mantenere in media il peso dei sacchetti di con una deviazione abbiamo: Il test statistico à: ha una distribuzione normale standardizzata: Nelle tavole della distribuzione normale standardizzata troviamo per la soglia discriminante superiore . Data la simmetria della curva di Gauss, la soglia inferiore à . Le zone di decisione sono quindi: la zona di accettazione di : e la regione critica di : .

En s2 51 f 4.gif

Regione critica di | zona di accettazione di | regione critica di

Estrazione del campione e calcolo del test statistico

Estraiamo casualmente 25 sacchetti, ne rileviamo il peso e calcoliamo la media aritmetica . Il valore del test statistico à

Decisione e interpretazione

ricade nella zona di accettazione di , quindi accettiamo l’ipotesi nulla. Sulla base di un campione casuale di non possiamo dimostrare statisticamente che la media della popolazione si discosta significativamente dal valore ipotetico ; in altre parole non possiamo dimostrare che i sacchetti hanno un peso che si discosta da quello previsto.

Potenza

Non avendo rifiutato l’ipotesi nulla, assumiamo il rischio di commettere un errore di seconda specie: , nel caso in cui sia vera l’ipotesi alternativa. L’accettazione dell’ipotesi nulla puà quindi essere giudicata adeguata solo se prendiamo in considerazione la probabilità di un tale errore. La probabilità di un errore di seconda specie à tuttavia incognita in quanto il vero valore di à sconosciuto. Possiamo perà determinare la funzione di potenza per diversi valori di e trovare la probabilità di un errore di seconda specie con come funzione di . Se per esempio nella popolazione , in realtà à vera l’ipotesi alternativa e la funzione di potenza in tale punto ci dà la probabilità di effettuare una decisione corretta e accettare l’ipotesi alternativa: Inserendo , , e nella formula per la potenza abbiamo La probabilità di commettere un erroe di seconda specie se la vera media della popolazione à , à quindi Il vero peso medio à di , circa l’83 % di tutti i campioni di non indicherà nel test lo scostamento dal peso indicato di . La probabilità di commettere un errore di seconda specie à molto alta dato che la differenza à piuttosto piccola. Se, d’altra parte la media effettiva à pari a grammi, ci dà la probabilità di effettuare una scelta giusta accettando l’ipotesi alternativa: , e possiamo calcolare Solo lo 0.02% di tutti i campioni di numerosità non indicheranno nel test lo scostamento dal peso indicato di e quindi la probabilità di commettere un errore di seconda specie à molto piccola in quanto la differenza à grande. Nella tabella seguente abbiamo indicato i valori di e per alcuni valori della media della popolazione , dati , e .

Ipotesi vera

Nel grafico abbiamo la funzione di potenza.

En s2 51 f 6.gif

Possiamo modificare la forma della funzione di potenza mantenendo il livello di significatività incrementando la numerosità . Illustriamo l’effetto di una diversa numerosità campionaria nel caso in cui la popolazione abbia effettivamente come media o . Gli altri parametri sono mantenuti constanti: , e .

Il prossimo grafico mostra la funzione di potenza per alternative dimensioni campionarie.

En s2 51 f 7.gif

Se per esempio ipotizziamo che i macchinari utilizzati si discostano dal peso indicato solo minimamente, à consigliabile aumentare la dimensione campionaria per rilevare tali scostamenti e nel caso di accettazione dell’ipotesi nulla ridurre la probabilità di un errore di seconda specie anche se in tale modo innalziamo i costi di controllo dei macchinari.

Formulazione dell’ipotesi

Illustriamo la problematica della scelta dell’ipotesi nulla e di quella alternativa con un esempio. Consideriamo una ditta che produce pneumatici. Per aumentare la durata di vita dei pneumatici la ditta pianifica di modificare la miscela dei materiali usati. La concorrenza afferma che tale modifica non produrrà nessun miglioramento della durata media dei pneumatici che à di kilometri (km) prima della modifica. La ditta decide di effettuare un test per verificare tale ipotesi. La variabile casuale rappresenta la durata media dei pneumatici. La durata media prima della modifica à di . Dopo la modifica della miscela non conosciamo la speranza matematica della durata , tuttavia secondo la ditta produttrice dovrebbe essere superiore a , ovvero . Come possiamo formulare il nostro test? Innanzi tutto à evidente che non possiamo utilizzare un test bilaterale in quanto per la ditta produttrice sono interessanti solo gli scostamenti in una direzione. Dobbiamo quindi scegliere tra test sinistro e destro. La ditta vuole dimostrare la sua ipotesi con una certa “sicurezza statistica” e quindi mantenere il rischio di una decisione sbagliata il pià possibile ridotto. Di conseguenza l’ipotesi della ditta produttrice di pneumatici sarà la nostra ipotesi alternativa e otteniamo un test destro: con . Se in base ai dati campionari otteniamo un risultato del test che ci porta a rifiutare l’ipotesi nulla (), possiamo incorrere in un errore di prima specie (rifiutare l’ipotesi nulla anche se in realtà questa à vera). Scritto altrimenti: Se in base al test accettiamo l’ipotesi nulla, cià non significa che questa à vera ma solo che il risultato del test non la contraddice. Possiamo commettere un errore di seconda specie accettando l’ipotesi nulla anche se questa à falsa: Confrontando i due errori notiamo che un errore di prima specie ha le conseguenze pià pesanti per la ditta produttrice in quanto

  • la concorrenza puà effettuare a sua volta dei test su tali pneumatici (utilizzando tuttavia un test sinistro)
  • a lungo termine l’uso dei pneumatici rivelerebbe che la durata non à effettivamente aumentata e l’immagine della ditta ne verrebbe danneggiata.

La ditta produttrice deve quindi mantenere il rischio di un errore di prima specie il pià piccolo possibile determinando un livello di significatività pari a .

Zone di decisione

Sia per i test bilaterali che per i test unilaterali sulla media, la lunghezza delle zone di decisione dipende da:

  • il dato livello di significatività : a parità di condizioni, se à grande la regione critica di , sarà pià ampia riducendo la zona di accettazione dell’ipotesi nulla e viceversa,
  • la dimensione campionaria : a parità di condizioni una numerosità grande porta a una regione critica di pià corta aumentando la zona di accettazione dell’ipotesi nulla e viceversa.
  • la dispersione della varibile nella popolazione e quindi nel campione: a parità di condizioni, una variabilità () elevata causa un incremento della lunghezza della regione critica di , diminuendo la lunghezza della zona di accettazione e viceversa.

Le soglie discriminanti e quindi le zone di decione di possono essere calcolate facilmente per lo stimatore , se la varianza della popolazione à conosciuta. Mostriamo il calcolo per il test bilaterale. Il test statistico à dato dalla standardizzazione dello stimatore : e quindi per tutte le realizzazioni di : In un test bilaterale, la zona di accettazione di consiste di tutti valori di maggiori o uguali a e minori o uguali a : Diventa quindi chiaro che le soglie discriminanti e sono possibili realizzazioni di . Sono quindi standardizzazioni dei valori assunti da : à il valore critico inferiore per , e quindi à il valore critico inferiore per . (Lo stesso vale per il valore critico superiore - upper ). Abbiamo quindi: La zona di accettazione di à: e la regione critica à Possiamo effettuare una trasformazione analoga anche per i test unilaterali.

Potenza

Deriviamo ora la formula della funzione di potenza per un test bilaterale. Abbiamo Se à il vero parametro della popolazione abbiamo Modifichiamo il termine centrale con e otteniamo Analogamente possiamo derivare le formule della funzione di potenza per i test unilaterali. Per massimizzare la potenza di un test à preferibile che la probabilità di rifiutare correttamente l’ipotesi nulla cresca velocemente con una crescente distanza tra il vero parametro e il valore ipotetico , ovvero che la curva della funzione di potenza sia il pià possibile “ripida”. Abbiamo due modi per influenzare la funzione di potenza. 1) Aumentando la numerosità campionaria Come si puà dedurre dalle formule appena date, la funzione di potenza dipende ad eccezione del punto dalla numerosità campionaria . A parità di condizioni la funzione diventa pià ripida per crescente il che implica che per ogni valore di (con nei test bilaterali e nei test destri e nei test sinistri) abbiamo una probabilità maggiore di rifiutare l’ipotesi nulla e una minore probabilità di commettere un errore di seconda specie. La probabilità di riconoscere le differenze tra il vero parametro e quello ipotetico cresce con il crescere del campione. Dato un livello di significatività fisso possiamo ridurre la probabilità di un errore di seconda specie aumentando la numerosità campionaria. Il seguente grafico mostra la funzione di potenza di un test bilaterale per quattro campioni dato il livello di significatività .

En s2 51 m 9.gif

2) variando il livello di significatività A parità di condizioni, aumentare il livello di significatività (la probabilità di un errore di prima specie) significa spostare il grafico della funzione di potenza verso l’alto e quindi per ogni valore di (con nei test bilaterali e nei test destri e nei test sinistri) la probabilità di rifiutare aumenta e la probabilità di un errore di seconda specie diminuisce. Data una numerosità campionaria fissa non possiamo quindi mantenere contemporaneamente entrambi i tipi di errori piccoli. Nel seguente grafico viene mostrata la funzione di potenza di un test bilaterale per due diversi livelli di significatività data la numerosità campionaria :
La curva rossa rappresenta per , la blu per .

En s2 51 m 10.gif