verosimiglianza
Funzione dei parametri di un modello statistico (➔) che può essere interpretata come la probabilità (➔) di ottenere esattamente i dati effettivamente osservati.
Per formalizzare, si consideri un modello parametrico F={f(x;θ),θ∈Θ} per la distribuzione di una variabile aleatoria X (➔ variabile aleatoria), dove f è una funzione di massa di probabilità, se X è una variabile aleatoria discreta o una densità, se X è continua, θ è il parametro o il vettore di parametri che identificano univocamente la distribuzione, e Θ è lo spazio dei parametri. Dato un valore x della variabile casuale, la funzione di v. è la funzione di θ definita da L(θ;x)=f(x;θ). In altre parole, la funzione di v. misura la ‘plausibilità’ dell’ipotesi che la distribuzione della popolazione sia proprio f(.;θ) (cioè che il parametro sia θ), avendo osservato X=x. Per es., si consideri il lancio di una moneta e la variabile aleatoria X che prende valore 1 se il risultato è testa e 0 altrimenti. Tale variabile casuale segue una legge di Bernoulli (➔ Bernoulli, distribuzione di) con parametro p, dove p è la probabilità di osservare testa (p=1/2 corrisponde al caso di una moneta perfettamente bilanciata). Avendo osservato X=1, la funzione di v. è uguale a L(p;1)=P(X=1)=p. La v., quindi, è massima, e uguale a 1, se p=1, mentre è nulla se p=0, cioè è inverosimile che la probabilità di ottenere ‘testa’ nel lancio di una moneta sia uguale a 0 visto che il risultato del lancio è stato proprio ‘testa’.
La v. ha un ruolo fondamentale nell’inferenza statistica (➔). Essa è alla base del metodo di stima, detto della massima verosimiglianza (➔ verosimiglianza massima, metodo della), che propone di stimare θ con il valore più ‘plausibile’ nello spazio dei parametri, cioè quello che massimizza la verosimiglianza. La funzione di v. è anche la base di un insieme di metodi per la verifica di ipotesi annidate (➔ ipotesi statistica), di cui fanno parte il metodo del rapporto delle v., il metodo di Wald, e il metodo dei moltiplicatori di Lagrange (➔ test basati sulla funzione di verosimiglianza). Dato un particolare campione x=(x1,...,xn) tratto in modo casuale dal modello statistico F={f(x;θ),θ∈Θ} (➔ campione statistico), la funzione di v. calcolata in θ risulta L(θ;x)=Πni=1f(xi;θ). Ritornando all’esempio del lancio di una moneta, si assuma di avere osservato 3 lanci con i risultati x1=testa, x2=croce e x3=testa. Se la probabilità di ottenere testa è p in ciascun lancio, allora la funzione di v. è uguale a L(p;x1,x2,x3)=p2(1−p). Poiché il punto di massimo di questa funzione soddisfa la condizione del primo ordine 2p−3p2=0, lo stimatore di massima v. di θ è p^=2/3 e coincide quindi con la frequenza relativa del numero di teste osservate sui 3 lanci. In molte situazioni è più conveniente lavorare con il logaritmo della funzione di v., detta anche funzione di logverosimiglianza. Se infatti la funzione di v. viene definita dalla produttoria L(θ;x)=Πni=1f(xi;θ), allora la logverosimiglianza viene definita dalla sommatoria logL(θ;x)=Σni=1 log(f(xi;θ)), che è generalmente più semplice da trattare. Un altro metodo per ottenere la stima di massima v. è, equivalentemente, quello di massimizzare una qualunque di queste due funzioni.