test
test in statistica, procedura inferenziale che utilizza le osservazioni campionarie per accettare o respingere una ipotesi statistica (→ ipotesi), cioè un’asserzione su una o più caratteristiche di una popolazione. La procedura di verifica di un’ipotesi statistica può essere esemplificata come segue: si supponga che una caratteristica (per esempio la media o la varianza) di una popolazione sia ignota; su di essa sono formulate un’ipotesi, detta ipotesi nulla e convenzionalmente indicata con H0, e una ipotesi alternativa H1 a essa complementare. Al fine di stabilire la plausibilità dell’ipotesi nulla, si estrae un → campione dalla popolazione e se i risultati osservati differiscono in modo notevole da quelli che si sarebbero attesi sulla base dell’ipotesi formulata, si dirà che le differenze osservate sono significative e si rifiuterà l’ipotesi emessa; in caso contrario, la si accetterà. In sostanza, la verifica delle ipotesi avviene attraverso un test statistico, cioè attraverso una regola di decisione quantitativa, legata a un determinato livello di → significatività α che rappresenta la probabilità di rifiutare H0 nel caso in cui H0 sia vera e quindi la probabilità di rifiutare erroneamente l’ipotesi nulla. Poiché il valore campionario di un test varia da campione a campione, il test stesso costituisce una variabile aleatoria con una determinata distribuzione di probabilità, rappresentata dalla distribuzione campionaria del test, che va confrontata con la distribuzione teorica di riferimento (che, a seconda dei casi, può essere la → distribuzione normale, la distribuzione t di → Student, la distribuzione F di → Fisher, o altre).
Un test ripartisce lo spazio campionario in due sottoinsiemi complementari: un insieme A costituito dai valori del test che sono compatibili con H0, detta regione di accettazione, e l’insieme R che raggruppa i restanti valori non compatibili con l’ipotesi nulla. Quest’ultimo insieme è detto regione critica o regione di rifiuto e quando il valore campionario stimato cade in tale regione l’ipotesi nulla è rifiutata. Quando si mettono a confronto gli indici sintetici di una distribuzione campionaria (media, percentuale, varianza ecc.) con quelli dell’intera popolazione o con quelli di un altro campione si parla di test parametrico; quando invece si mettono a confronto due o più distribuzioni (generalmente di frequenze) si parla di test non parametrico.
Occorre distinguere tra due tipi di test:
• test a due code: sono i test nei quali si richiede se un valore appartiene o meno a un certo intervallo simmetrico rispetto al valore puntale intermedio. Le zone di rifiuto sono due, simmetriche e collocate agli estremi della distribuzione teorica scelta. Tali test hanno senso quando la distribuzione teorica di riferimento, come la distribuzione normale standardizzata o la t di Student, comprende valori sia positivi sia negativi;
• test a una coda: sono i test nei quali si richiede se un valore “supera” o “non supera” un valore predeterminato. La zona di rifiuto è una sola, collocata a uno dei due estremi della curva della distribuzione teorica.