inferenza statistica
Procedura attraverso cui dalle caratteristiche osservate di un campione si cerca di risalire a quelle della popolazione di riferimento. Un primo aspetto importante delle procedure inferenziali riguarda le modalità di estrazione del campione (➔ campione statistico).
Tale scelta dipende dalle caratteristiche di interesse della popolazione. Queste possono essere sintetizzate da un singolo parametro (per es., la media), da un vettore di parametri (per es., media e varianza) o da una intera funzione (per es., la funzione di densità che descrive la distribuzione della popolazione). Una volta definita la natura del parametro di interesse, la scelta della procedura cambia a seconda del tipo di problema inferenziale e del tipo di approccio che si intende utilizzare.
Si possono individuare due tipi di problemi inferenziali: la stima del parametro oggetto di interesse (scalare, vettore o funzione) e la verifica di ipotesi circa il parametro stesso. Il primo problema consiste nell’utilizzo dei dati per produrre un singolo valore plausibile (stima puntuale), oppure un insieme di valori plausibili (stima per intervalli) per il parametro. La funzione dei dati scelta per effettuare la stima puntuale è chiamata stimatore (➔). La stima per intervalli consiste nella scelta dell’intervallo con ampiezza minima tra tutti quelli che racchiudono il vero parametro a una probabilità prefissata (generalmente tra il 90% e il 99%). L’intervallo ottenuto si dice intervallo di confidenza (➔ confidenza, intervallo di). Questo problema è equivalente a quello della costruzione della regione di rifiuto di un test statistico. La verifica delle ipotesi consiste nel decidere, in base all’evidenza empirica e con un ragionevole grado di sicurezza (chiamato livello di significatività), se rifiutare o meno una o più ipotesi sul parametro. Per la verifica di ipotesi si usano solitamente una funzione dei dati, chiamata statistica test, e un’area, chiamata regione di rifiuto, che determina tutti i valori che comportano il rifiuto dell’ipotesi nulla.
Per ogni famiglia di problemi precedentemente analizzati, si possono individuare due diversi approcci: l’approccio classico o frequentista, e quello bayesiano (➔ bayesiani, metodi). Nell’approccio frequentista il processo di apprendimento che deriva dai dati campionari si basa sulla assunzione teorica di poter ripetere l’esperimento infinite volte nelle medesime condizioni. Nell’approccio bayesiano, il processo di apprendimento deriva da un ‘aggiornamento’ dell’informazione iniziale tramite l’evidenza empirica. Come conseguenza, nell’approccio frequentista assumono particolare rilievo le proprietà campionarie (asintotiche o per campioni finiti) di una procedura statistica. Tali proprietà riflettono l’incertezza dovuta al campionamento: il campione è soltanto uno dei possibili risultati ottenibili tramite il processo di estrazione dalla popolazione. Non c’è incertezza riguardo al parametro che, anche se incognito, non ha le caratteristiche di un fenomeno aleatorio. Nell’approccio bayesiano invece, l’incertezza è anche sul parametro, per il quale viene ipotizzata una distribuzione di probabilità, detta a priori, che riflette le informazioni iniziali di chi conduce l’indagine. L’aggiornamento di tali informazioni iniziali avviene attraverso il calcolo della distribuzione a posteriori, cioè la distribuzione di probabilità del parametro condizionata ai dati. Tale distribuzione si ottiene usando la formula di Bayes, da cui l’approccio prende il nome (➔ Bayes, Thomas). Il risultato dell’i. bayesiana è l’intera distribuzione di probabilità a posteriori. Da questa, si possono ottenere, attraverso opportune trasformazioni, le stime o i test statistici. Per meglio illustrare le diverse procedure, si immagini che il parametro di interesse sia l’età media di una popolazione e che si disponga di un campione casuale semplice di n=100 unità.
Per quanto riguarda l’approccio frequentista, uno stimatore plausibile per la media μ è la media aritmetica o media campionaria bar . Sotto condizioni generali, bar è uno stimatore non distorto, consistente (➔ consistenza) e asintoticamente normale (➔ asintotica, distribuzione) per μ. L’approccio bayesiano standard necessita della definizione di una distribuzione di probabilità a priori per il parametro incognito μ e di un modello statistico per i dati, tramite i quali si otterrà poi la distribuzione a posteriori. Se si assume un modello gaussiano sia per i dati sia per il parametro μ, cioè se μ ∼ N(μ0, σ20) e X∣μ ∼N(μ, 1), dove i parametri della distribuzione a priori μ0 e σ02 sono supposti noti, si ottiene una distribuzione a posteriori gaussiana per μ, ossia μ∣X∼N(μ0, σ21), dove μ1=(σ−20 μ0+100 )/(σ−20+100) e σ21=1/(σ−20+100). Una possibile stima puntuale bayesiana è per es. la media a posteriori μ1; ciò che però conta nel metodo bayesiano è la distribuzione a posteriori, non il modo in cui si decida di sintetizzarla in un unico valore.
Si assuma di avere osservato =48 e di volere verificare l’ipotesi che la media della popolazione sia μ≥50 contro l’alternativa μ<50, con un livello di significatività pari al 95%. Il livello di significatività è uguale alla probabilità di rifiutare l’ipotesi nulla quando è vera. Nell’approccio frequentista, un test statistico deve tenere conto non soltanto della stima puntuale, ma anche della variabilità della stessa, derivante dal processo di campionamento: si può osservare un valore <50 per il solo effetto del caso. Si usa quindi la statistica test T=(−μ)/10, che sotto l’ipotesi nulla si distribuisce come una variabile aleatoria gaussiana standardizzata (assumendo la varianza della popolazione nota e uguale a 1). Si verifica successivamente se il valore di T corrispondente ai dati campionari (nell’esempio T=−0,2) cade nell’area di rifiuto, definito da quel valore z0,05 che soddisfa P(T<z0,05)=0,05. Nell’approccio bayesiano, in virtù della diretta interpretabilità della distribuzione a posteriori, il test ha forma semplice: si valuta la probabilità a posteriori
(μ≥50∣X)=ʃ50 −∞ p(μ∣X)dμ
e si rifiuta l’ipotesi nulla μ≥50 se tale valore risulta inferiore al livello critico prefissato (nell’esempio in questione, α=0,05).