Glossary/it

From MM*Stat International

Jump to: navigation, search
English
Português
Français
‎Español
Italiano
Nederlands

A

Vedi estremi di una classe. sotto alcune condizioni possiamo sostituire alcune distribuzioni troppo complicate o sconosciute con altre conosciute e pià semplici (solitamente la distribuzione normale).

  • Area di supporto L’area di supporto di una serie temporale à l’insieme dei dati originali utilizzati per calcolare la media ponderata (metodo della media mobile). Se l’area di supporto à ampia possiamo calcolare solo pochi valori del trend e quindi la serie filtrata sarà pià piatta.

[B]

B

  • Boxplot Rappresentazione grafica di alcuni indici di localizzazione e di varibilità selezionati della distribuzione di frequenza di una variabile casuale misurata sulla scala metrica. Il boxplot fornisce una rappresentazione della distribuzione e della struttura dei dati osservati.

[C]

C

Il calcolo combinatorio indaga tutti i possibili modi di estrarre e raggruppare elementi. Tale calcolo à un instrumento essenziale del calcolo delle probabilità. Vedi anche permutazioni, disposizioni e combinazioni. Il calcolo delle probabilità analizza grazie a dei modelli quantitativi i risultati di esperimenti aleatori). Metodo di campionamento nel quale ogni elemento ha una probabilità non nulla di venir selezionato. Le probabilità non devono essere tutte uguali. Metodo di campionamento dove ogni elemento ha la stessa probabiltà prima di venir selezionato, tale probabilità cambia dopo cha abbiamo estratto ciascun elemento. Metodo di campionamento casuale nel quale ogni elemento ha pari probabilità di venir selezionato e ogni elemento viene selezionato indipendentemente dagli altri (con reinserimento). Metodo di estrazione di un campione nel quale ciascun elemento dopo essere stato estratto viene reinserito nella popolazione prima che venga estratto il prossimo elemento. Corrisponde al campione casuale semplice. (o estrazione in blocco) Metodo di estrazione di un campione nel quale gli elementi selezionati non vengono reinseriti nella popolazione prima di estrarre i prossimi elementi. Corrisponde al campione casuale rappresentativo. Il campionamento si dice totale se considera tutti gli elementi dello spazio campionario. Sottoinsieme dello spazio campionario costituito dagli elementi selezionati per l’investigazione statistica. Campione casuale costituito di variabili casuali distribuite identicamente X_1, \dots, X_n che non devono necessariamente essere indipendenti. Campione casuale costituito da variabili casuali indipendenti e identicamente distribuite X_1, \dots, X_n. “Distribuite identicamente” significa che le variabili casuali hanno la stessa funzione di ripartizione F(x). Insieme di unità statistiche che rimangono nello stesso stato durante l’investigazione. Insieme di tutte le unità statistiche selezionate in base a caratteri qualitativi, spaziali e temporali. Carattere che definisce chiaramente la popolazione statistica e identifica le unità statistiche in relazione alla loro appartenenza alla popolazione. Il carattere scelto rimane lo stesso per tutte le unità statistiche e non varia durante l’investigazione. Carattere di interesse nell’indagine statistica. Osserviamo i valori che il carattere investigato assume per ogni unità statistica della popolazione.

  • Carattere statistico Proprietà dell’unità statistica. Nel caso il carattere assuma solo modalità qualitative, siano esse nominali oppure ordinali, vengono indicati come mutabili. I caratteri quantitativi che possono essere misurati sulla scala metrica sono detti variabili. Distinguiamo inoltre tra caratteri identificativi e di rilevanza.

Intervallo di valori di variabili misurate sulla scala metrica (vedi anche classificazione). Raggruppamento di osservazioni uguali o simili in una classe. Vedi anche Limite di una classe. Probabilità che un intervallo di confidenza calcolato dai dati campionari includa il valore effettivo del parametro stimato. Coefficiente che misura l’intensità della relazione tra due variabili casuali misurate sulla scala nominale. Viene calcolato utilizzando la contingenza quadrata e assume valori compresi tra 0 e 1 dove 0 significa che le variabili sono statisticamente indipendenti. Il coefficiente di contingenza non assume in pratica mai il valore 1 (dipendenza totale), di conseguenza utilizziamo il coefficiente di contingenza corretto. Misura l’intensità e la direzione della dipendenza della relazione tra due variabili casuali misurate sulla scala metrica. à composto dal rapporto della covarianza (variabilità congiunta) delle due variabili e dal prodotto delle singole deviazioni standard. Assume valori compresi tra -1 e 1.

  • Coefficiente di correlazione di Kendall Il coefficiente di correlazione del rango di Kendall si basa sul confronto della graduatoria o gerarchia di tutte le coppie di osservazioni di due caratteri. Le coppie di osservazioni sono concordanti (risp. discordanti) se presentano la stessa relazione d’ordine (risp. una relazione d’ordine inversa). Inoltre alcune coppie possono avere gli stessi valori. Il coefficiente di correlazione di Kendall à dato dal rapporto della differenza tra il numero delle coppie concordanti e quelle discordanti e la somma di tutte le coppie.
  • Coefficiente di correlazione di Spearman Coefficiente che misura l’intensità della correlazione lineare tra due variabili casuali ordinali. Corrisponde al coefficiente di correlazione di Bravais-Pearson applicato sui valori dei ranghi. Assume valori compresi tra -1 e 1.

Il coefficiente di determinazione misura la bontà di adattamento ai dati osservati della funzione di regressione scelta. Viene definito dal rapporto della variabilità spiegata dal modello di regressione proposto e la variabilità totale. Rappresenta quindi quanta parte della variabilità della variabile dipendente à spiegata dal modello. Assume valori compresi tra 0 e 1. Per valori prossimi a 1 abbiamo un buon modello. nella regressione lineare, il coefficiente di determinazione à uguale al quadrato del coefficiente di correlazione.

  • Coefficiente di variazione Indice di variabilità relativo ad un valore medio dato dal rapporto della deviazione standard e media aritmetica. Tale indice ci permette di confrontare la variabilità di diverse distribuzioni.
  • Combinazioni Si dicono combinazioni di n elementi di classe (o ordine) k il numero di gruppi che si possono formare con gli n elementi ponendone k in ogni gruppo e considerando distinti i gruppi solo per la presenza di elementi diversi e non per l’ordine. Possiamo avere combinazioni con ripetizione e semplici a seconda se gli elementi in una classe possono ripetersi o meno. Vedi anche calcolo combinatorio.

Vedi Fluttuazioni periodiche. In una serie temporale distinguiamo tra componenti sistematici (trend, fluttuazioni periodiche) e fluttuazioni irregolari residue. Proprietà di uno stimatore di un parametro incognito. Dato un numero crescente di osservazioni il valore atteso di uno stimatore consistente converge verso il vero valore del parametro e la sua varianza converge verso zero. Variabile ausiliaria usata nel calcolo del coefficiente di contingenza di variabili nominali. La contingenza quadratica à data dalla somma degli scarti quadratici delle frequenze assolute (relative) osservate dalle frequenze assolute (relative) attese sotto l’ipotesi di indipendenza. Proprietà di uno stimatore in base alla quale il valore atteso dello stimatore corrisponde al vero valore del parametro stimato. Proprietà di uno stimatore. Aumentando la numerosità campionaria il valore atteso dello stimatore converge verso il vero parametro della popolazione. Indice della variabilità congiunta di una coppia di variabili casuali misurate sulla scala metrica. Indica sia l’intensità che la direzione della dipendenza. Il coefficiente di correlazione puà essere usato per confrontare diverse covarianze. Vedi tabella di contingenza. [D]

D

In caso di dati suddivisi in classi la densità di frequenze à data dal rapporto delle frequenze assolute o relative di una certa classe e il range della classe.

Rappresentazione in parte grafica del valore della serie osservata di una variabile casuale misurata su scala metrica.

  • Differenza interquartile Differenza tra il quartile superiore e quello inferiore. Ci fornisce l’ampiezza di un intervallo nel quale ricade il 50% centrale dei valori osservati.
  • Differenza logica la differenza logica di due eventi A e B à data dall’evento che A si verifichi ma non B.

Stima della probabilità che una variabile casuale X distribuita a piacere assuma un valore all’interno (o all’esterno) di un intervallo centrato sul valore atteso della distribuzione.

  • Disposizioni numero di gruppi che si possono formare con n elementi ponendone k in ogni gruppo e considerando i gruppi distinti sia per la presenza di diversi elementi che per l’ordine in cui questi si succedono. Distinguiamo disposizioni semplici e con ripetizione. Vedi anche calcolo combinatorio.

Distribuzione di una variabile casuale discreta con i parametri n e p che fornisce il numero di volte che un determinato evento si verifica ripetendo n volte in modo indipendente l’esperimento. L’evento si manifesta in ogni singolo esperimento con la probabilità p. Distribuzione di una funzione campionaria. Nel quadro di una distribuzione di frequenza duedimensionale, à la distribuzione della variabile X (risp. Y) dato un determinato (fisso) valore assunto dalla variabile Y (risp. X). La variabile di chi-quadrato deriva dalla somma di n variabili casuali normali standardizzate indipendenti tra di loro. Il parametro n à detto gradi di libertà.

  • Distribuzione di frequenze Ordinando i dati osservati e indicando le associate frequenze assolute o relative otteniamo la distribuzione di frequenze del carattere investigato. A seconda del numero di caratteri investigati abbiamo distribuzioni di frequenze uni o pluridimensionali. Una tabella delle frequenze ci aiuta a rendere le informazioni sulla distribuzione di frequenze pià sistematiche e accessibili.

Distribuzione di una variaile casuale discreta con parametro \lambda che descrive il numero di volte che un evento si verifica. L’evento si ripete in modo casuale e indipendente in una prefissata unità dimensionale. La distribuzione di probabilità si ottiene assegnando le probabilità ai valori ordinati della variabile casuale discreta. Distribuzione di varibili casuali continue con parametro \lambda. Rappresenta la distribuzione di probabilità della distanza di due eventi susseguenti in un processo di Poisson. Distribuzione di variabili casuali continue che rappresenta il rapporto di due varaibili di chi-quadrato indipendenti con f_1 e f_2 gradi di libertà. La distribuzione ha come parametri i gradi di libertà f_1 e f_2. Distribuzione di una varibile casuale discreta con i parametri M, N e n che descrive il numero di volte in cui si presenta la modalità considerata nelle n prove di un esperimento aleatorio. Le prove sono esaustive (non indipendenti) e la probabilità del singolo evento non à costante. Per una distribuzione di frequenze bidimensionale, la distribuzione marginale à la distribuzione unidimensionale della variabile X (o Y) che non contiene nessuna informazione sulla distribuzione dell’altra variabile Y (o X). Distribuzione di una variabile casuale continua con parametri \mu e \sigma. Il parametro \mu rappresenta il valore atteso e \sigma la deviazione standard della variabile casuale. Distribuzione normale di una variabile casuale continua con i particolari parametri \mu = 0 e varianza \sigma = 1. Distribuzione di una variabile casuale continua con parametro f (gradi di libertà). La variabile t di Student à data dal rapporto di una variabile casuale normale standardizzata e una variabile di chi-quadrato indipendente dalla prima. Nel caso di variabili discrete: ogni possible valore della variabile ha pari probabiltià di manifestarsi. Nel caso di variabili continue: variabile casuale con densità costante.

  • Dotplot Rappresentazione grafica duedimensionale di dati unidimensionali. Sull’asse delle ascisse si trovano i valori osservati mentre sull’asse delle ordinate i valori vengono disposti in ordine casuale per poterli distinguere li uni dagli altri.

[E]

E

Proprietà di uno stimatore corretto. Uno stimatore à detto efficiente se la sua varianza à inferiore a quella degli altri stimatori corretti dello stesso parametro.

  • Equivalenza Due eventi si dicono equivalenti se osservando l’evento A, possiamo osservare anche l’evento B e viceversa. In questo caso A à un sottoinsieme di B e B à un sottoinsieme di A. Vedi anche implicazione.

Un esperimento aleatorio à un esperimento reale o immaginario che puà essere ripetutto a piacimento sotto le stesse condizioni e il cui risultato non puà essere previsto con sicurezza. Rifiuto dell’ipotesi nulla quando questa à vera. Accettazione dell’ipotesi nulla quando questa à falsa. Vedi intersezione Un evento à definito come ogni possibile risultato di un esperimento aleatorio. Eventi elementari non possono essere suddivisi in altri eventi parziali; elementi elementari sono quindi sempre disgiunti. L’evento complementare à l’insieme di eventi elementari dello spazio degli eventi S che non sono contenuti nell’evento investigato. Gli eventi sono sottoinsiemi dello spazio campionario e possiamo applicare ad essi diverse funzioni. (Vedi anche implicazione, equivalenza, unione, intersezione, differenza logica.) Vedi Spazio degli eventi. Vedi evento. Vedi evento. Vedi spazio degli eventi. [F]

F

  • Filtro Insieme di pesi utilizzati per calcolare le medie mobili di una serie temporale. La scelta del filtro dipende dal tipo di fluttuazioni stagionali e dall’appiattimento della serie desiderato. Solitamente si usano filtri simmetrici.

(anche fluttuazioni stagionali) Elementi di influenza a breve termine delle serie temporali che si ripetono in modo regolare. La lunghezza di tale periodo nei dati economici à solitamente di un anno.

  • Frequenza assoluta Numero delle osservazioni che presentano un determinato carattere o combinazione di caratteri.

Variabile casuale definita da una funzione di variabili campionarie X_1, \dots, X_n.

  • Frequenza cumulata Somma di tutte le frequenze delle osservazioni inferiori o uguali a un certo valore, oppure nel caso di variabili suddivise in classi, inferiori o uguali all’estremo superiore della classe. La frequenza cumulata à definita per varibili misurate almeno sulla scala ordinale. Possiamo distinguere tra frequenza cumulata assoluta o relativa.

Funzione che, in base al vero valore del parametro sul quale formuliamo un’ipotesi, ci fornisce la probabilità di rifiutare l’ipotesi nulla. Funzione che fornisce la probabilità che la variabile casuale X assuma il valore x_j. Funzione che descrive analiticamente la correlazione tra la variabile dipendente o spiegata e una o pià variabili esplicative (variabile indipendente regressori). La funzione à solitamente lineare, si basa su n osservazioni e assegna ai valori della variabile esogena valori interpolati (valori medi che si trovano sulla funzione di regressione). Tali valori si differenziano dai valori effettivi della varibile endogena. La differenza tra il valore osservato sperimentalmente e i valori interpolati viene indicata come residuo. La probabilità cumulata F(x) (la variabile assume valori minori o uguali a x) della variabile casuale X. Rapporto tra la frequenza assoluta e il totale delle osservazioni. Media aritmetica di variabili campionarie X_1, \dots, X_n di un campione casuale estratto da una popolazione dicotomica. Funzione che determina la probabilità (densità) per un concreto campione (con variabili campionarie distribuite indipendentemente e identicamente) in rapporto a valori alternativi del parametro incognito della popolazione. [G]

G

Test statistico per verificare l’ipotesi che la vera distribuzione ignota à uguale a quella specificata. [H]

H

I

Relazione tra eventi: se l’evento A si verifica allora anche l’evento B deve verificarsi. Si puà anche dire che A à un sottoinsieme di B (Vedi anche equivalenza).

L’intervallo centrale di probabilità à un intervallo con determinati estremi x_l e x_u (x_l \leq x_u) tale che la probabilità che una variabile casuale ricada in tale intervallo à pari a 1 - \alpha e che entrambi gli intervalli esterni all’intervallo centrale abbiano la stessa probabilità pari a \alpha/2. Intervallo casuale che risulta da una stima per intervalli di un parametro sconosciuto. Intervallo con determinati estremi x_l e x_u (x_l \leq x_u) tale che la variabile casuale ricade in tale intervallo con probabilità 1 - \alpha. à l’ipotesi antagonista all’ipotesi nulla in un test statistico. Formulazione statistica di una supposizione o ipotesi sulla popolazione che viene verificata con un test statistico.

  • Istogramma Rappresentazione grafica delle frequenze di variabili continue suddivise in classi. Sull’asse delle ascisse vengono riportate le classi e l’altezza dei rettangoli (con base la classe) rappresenta la corrispondente densità di frequenza della classe. L’istogramma possono essere utilizzati anche per la rappresentazione delle frequenze di variabili discrete con molte osservazioni.

[J]

J

K

L

Il limite o estremo di un gruppo di variabili misurate sulla scala metrica à un valore che limita il gruppo verso l’alto (limite superiore) o verso il basso (limite inferiore). La differenza tra il limite superiore e quello inferiore à detta ampiezza del gruppo. Probabiltà che il valore assunto dal test statistico ricada nella regione critica se l’ipotesi nulla à vera. [M]

M

Metodo per la determinazione di uno stimatore di un parametro incognito di una varibile casuale con distribuzione conosciuta. Il parametro incognito viene determinato tale che esso renda massima la probabilità di generare in un campione esattamente uguale ai valori ottenuti sperimentalmente.

  • Matrice di scatterplot Rappresentazione grafica della relazione di pià di due variabili casuali misurate sulla scala metrica. La matrice à composta da tanti scatterplot quanti le coppie di variabili analizzate. Nota: per un numero elevato di variabili la matrice di scatterplot risulta poco intellegibile e complessa.

La media aritmetica di un insieme di valori à l’invariante rispetto alla somma, esprime quindi equiripatizione del totale di tutte le osservazioni su ogni unità statistica. La media aritmetica puà essere calcolata solo per variabili misurate sulla scala metrica.

Media aritmetica delle variabili campionarie X_1, \dots, X_n. La media geometrica à l’invariante rispetto al prodotto di variabili casuali misurate almeno su scala metrica dei rapporti e che assumono valori positivi. Il logaritmo della media geometrica à uguale alla media aritmetica dei logaritmi dei valori osservati.

  • Mediana Valore medio che in una serie ordinata di osservazioni (per variabili misurate almeno sulla scala ordinale) suddivide la serie esattamente in due. Tale valore medio à insensibile a valori estremi e corrisponde al secondo quartile.
  1. Metodo di determinazione di uno stimatore di un parametro incognito di una variabile casuale che si basa sulla minimizzazione della somma delle deviazioni quadrate tra valori campionari e i valori di una funzione del parametro.
  • Moda Rappresenta la modalità pià diffusa ovvero con la massima frequenza. Puà essere determinata anche per mutabili misurate su scala nominale o ordinale. Per mutabili nominali rappresenta l’unico valore medio possibile. La moda non risente di valori estremi.

[N]

N

Numero di elementi contenuti nel campione. [O]

O

P

  • Permutazioni Sono disposizioni nelle quali tutti e n gli elementi disponibili vengono posti nei gruppi che quindi si distinguono solo per l’ordine. Distinguiamo permutazioni semplici e con ripetizione. Vedi anche calcolo combinatorio.
  • Popolazione Insieme di tutte le unità statistiche rilevanti per almeno una caratteristica nell’investigazione statistica che dobbiamo eseguire.
  • Probabilità Misura P che quantifica la certezza (o incertezza) del verificarsi di un determinato evento in un esperimento aleatorio.

Probabilità che un certo evento si verifichi dato il verificarsi di una altro evento. Vedi livello di confidenza. [Q]

Q

Il quantile x_p à il valore che suddivide i dati ordinati in modo crescente (variabile almeno ordinale) nel rapporto p : (1 - p), dove p à compreso tra 0 e 1. Quantili particolari sono i quartili, i quintili e i decili. Quantile per il quale vale p = 0.25, p = 0.5, e p = 0.75. le osservazioni ordinate in modo crescente vegnono divise dai quartili in quattro parti uguali. Il quartile x_{0,25} à il quartile inferiore, x_{0,75} quello superiore e x_{0,5} à la mediana. Quantile per il quale vale p = 0.2, 0.4, 0.6, e 0.8. I quintili suddividono le osservazioni ordinate in modo crescente in cinque parti uguali. [R]

R

Indice di variabilità definito dalla differenza tra il valore massimo della distribuzione e quello minimo. Valori del test statistico che portano al rifiuto dell’ipotesi nulla. La variabile indipendente in un modello di regressione. Vedi anche funzione di regressione. [S]

S

Proiezione di un insieme di numeri sulle unità statistiche investigate tale che i rapporti tra esse sono preservati e resi pià chiari. Vedi anche scala nominale, scala ordinale, scala metrica, scala metrica per intervalli, scala metrica per rapporti, e scala assoluta. Una scala metrica che contiene un punto di zero naturale e una unità di misura naturale à detta scala assoluta. (vedi anche scala). Vedi scala metrica.

In questo tipo di scala possiamo misurare e interpretare le differenze tra i valori delle variabili casuali. Le variabili misurate su tale scala non hanno nà un punto naturale di zero e nà una unità di misura naturale. (Vedi anche scala). La scala metrica per rapporti permette di ordinare le osservazioni, misurare le distanze tra esse e i rapporti tra i valori misurati possono essere interpretati. Le variabili misurate su tale scala hanno un punto naturale di zero ma non hanno una unità di misura naturale.

  1. Valore atteso degli scarti quadratici dello stimatore dal valore effettivo del parametro da stimare.

Rappresentazione grafica dei valori osservati di una coppia di variabili casuali misurate su scala metrica. I valori sono rappresentati da un punto nel sistema di coordinate cartesiano. Lo scatterplot permette di visualizzare la correlazione tra due variabili. Lo scatterplot a 3D permette di visualizzare la relazione di tre variabili. Serie ordinata o meno dei dati osservati. Serie statistica i cui valori sono ottenuti in una sequenza di punti nel tempo. Vedi anche Componenti di una serie temporale. Insieme di tutti i possibili eventi di un esperimento aleatorio. Ogni evento à quindi un sottoinsieme dello spazio degli eventi. L’evento impossibile à un insieme vuoto, mentre l’evento certo à costituito dall’intero spazio degli eventi.

  • Statistica Scienza che produce, rappresenta, elabora e analizza informazioni empiriche, obiettive e adatte all’uso in modelli teorici attraverso l’analisi di fenomeni collettivi parzialmente aleatori.
  • Statistica descrittiva Insieme di metodi statistici mirati alla raccolta di dati e alla loro descrizione. I risultati ottenuti in tale tipo di analisi si riferiscono solo ai dati investigati.
  1. Il calcolo delle probabilità ci permette di associare (e quantificare) alle conclusioni tratte dal campione un grado di rischio con una certa precisione.

Applicazione della funzione di stima sui valori campionari. Procedimento di stima di un parametro incognito che prevede la stima di un intervallo nel quale, con una determinata probabilità, ricade il vero valore del parametro. Risultato che si ottiene applicando lo stimatore di un parametro incognito ai valori campionari. Funzione delle variabili campionarie adatta ad effettuare una stima del parametro incognito della distribuzione investigata. [T]

T

Vedi distribuzione di frequenze. La tabella di contingenza indica la distribuzione di frequenza congiunta di due variabili casuali misurate su scala nominale o ordinale. Tabella che mostra la distribuzione di frequenze congiunta di due varibili casuali misurate su scala metrica. Rapporto tra la numerosità campionaria n e il numero di elementi nella popolazione N. Il teorema permette di approssimare la somma di variabili casuali con una distribuzione normale a condizione che le variabili sommate siano abbastanza numerose. Test statistico che afferma nell’ipotesi nulla che due variabili casuali sono indipendenti. Il test ha una distribuzione di chi-quadrato. Test statistico che afferma nell’ipotesi nulla che la vera distribuzione dei dati osservati à uguale a una data distribuzione teorica. Il test ha una distribuzione di chi-quadrato. Test statistico di verifica di un’ipotesi su un determinato parametro della popolazione. Funzione applicata sui dati campionari usata in un test statistico di prova delle ipotesi. Metodo statistico che ci permette di verificare un’ipotesi sulla distribuzione dell’intera popolazione o sui suoi parametri grazie alle informazioni contenute in un campione casuale estratto da tale distribuzione.

  • Trend Tendenza a lungo termine della serie temporale osservata. Il trend à solitamente stimato con il metodo delle medie mobili o con il metodo dei minimi quadrati (vedi anche filtri).

[U]

U

L’unione di due eventi A e B à l’insieme di tutti gli elementi elementari che appartengono ad A o B e di quelli dati dall’intersezione dei due insiemi A e B.

  • Unità statistica Singolo oggetto dell’investigazione statistica che contiene le informazioni di interesse nell’esperimento.

[V]

V

Valore della variabile casuale che supponiamo questa assuma prima di effettuare l’esperimento casuale. Corrisponde alla media aritmetica della distribuzione di frequenze. Realizzazioni (valori assunti) delle variabili campionarie X_1, \dots, X_n (dopo aver estratto n elementi). Il valore centrale à il valore che rappresenta una classe dato dalla media aritmetica dei suoi estremi superiore e inferiore. Vedi mediana. Valori del test statistico che separano la zona di accettazione dalla regione critica e che dipendono dalla distribuzione di probabilità del test statistico e dal dato livello di significatività. Valore medio della variabile dipendente che si trova sulla funzione di regressione per dati valori della variabile esplicativa (regressore). Vedi anche funzione di regressione. I valori medi ci forniscono informazioni sulla localizzazione delle distribuzioni di frequenza. Il valore medio ha la stessa unità di misura del carattere investigato. Tra i valori medi pià usati abbiamo la moda, la mediana, e la media aritmetica. Vedi valore interpolato. (anche variabile dicotomica) Si tratta di una variabile casuale che assume solo uno di due possibili valori solitamente “0”,“1” o “vero”,“falso”. Variabile campionaria X_i che rappresenta, prima di estrarre un campione, i possibili valori assunti dalla variabile casuale X della popolazione. La variabile casuale X à il valore reale x assegnato a ciascun evento elementare.

  • Variabile continua Variabile casuale misurata su scala metrica che puà assumere ogni possibile valore compreso in un intervallo.

Vedi variabile binaria. La variabile dipendente in un modello di regressione à anche detta la variabile spiegata. Vedi anche funzione di regressione.

  • Variabile discreta Definiamo una variabile casuale misurata su scala metrica se questa puà assumere un numero finito o un’infinità numerabile di valori.

La varianza à la media del quadrato degli scarti dei valori osservati dalla loro media aritmetica. Varianza empirica delle variabili campionarie X_1,\dots,X_n. [W]

W

X

Y

Z

di una ipotesi nulla consiste in un insieme di punti. Se il test statistico ricade in questo insieme accettiamo l’ipotesi nulla, in caso contrario la rifiutiamo.