perdita, funzione di
Detta anche funzione di danno (loss function), è concetto di primaria importanza nella teoria delle decisioni statistiche, in particolare nei problemi inferenziali di stima e di verifica di ipotesi.
Si consideri di trovarsi di fronte a un fenomeno aleatorio governato da una distribuzione di probabilità di tipo assegnato ma con un parametro incognito θ (per es., normale con varianza nota e media incognita) che può assumere un continuo di valori. Sulla base di una n-pla (di un vettore n dimensionale x) di osservazioni statistiche, che si considerano tipicamente estrazioni indipendenti ed equidistribuite, condizionatamente a ogni possibile valore di θ, si vuole procedere a una stima t del parametro. La funzione di p. associa a ogni coppia ordinata (θ,t) un numero reale L(θ,t). Esso ha il significato di p. collegata alla decisione di scegliere come stima del parametro il valore t quando esso ha il valore θ. ● Le funzioni di p. più frequentemente utilizzate sono: L1(θ,t)=k(θ−t)2; L2(θ,t)=k|(θ−t)| con k costante positiva moltiplicativa del quadrato dell’errore di stima o del suo valore assoluto; L3(θ,t)=0, se |(θ−t)|≤c, =1 se |(θ−t)|>c, dove c è una fissata soglia positiva di accettabilità dell’errore di stima. In tutte queste formulazioni la funzione di p. è simmetrica, cioè penalizza allo stesso modo scostamenti positivi (sottovalutazioni, θ>t) e negativi (sopravvalutazioni θ<t). Ma in molte applicazioni e in particolare nel settore delle previsioni di grandezze chiave della politica economica, come la crescita del PIL o il saggio di inflazione, si è riscontrato che vari agenti (centri studi di analisi economica, istituzioni sopranazionali e esponenti di governi), sembrano operare sulla base di funzioni di p. asimmetriche, per es. tendono a sovrastimare sistematicamente la crescita del PIL. In questi casi si suggerisce di utilizzare funzioni di perdita del tipo L(θ,t)=exp(a(θ−t))−a(θ−t)+1, dove a è un parametro positivo; essa ha andamento esponenziale per sottovalutazioni e lineare per sopravvalutazioni e quindi incentiva le seconde. La funzione di p. è alla base della soluzione del problema decisionale di scelta di t. La soluzione t* (dove con t* si intende uno specifico valore di t) è quella che minimizza rispetto a t il valore medio (rispetto alla distribuzione di probabilità condizionata all’informazione, g(θ/x)), del danno E(L(θ,t))=ʃθ (L(θ,t) g(θ/x)dθ). L’impostazione oggettivistica rifiuta l’attribuzione di una distribuzione di probabilità al parametro e propone come criterio di scelta quello (pessimistico) della decisione t che realizza il minimax (➔ ottimizzazione p) della funzione di p., ovvero il valore t per cui è minimo il max rispetto a θ di L(θ,t). ● Il termine loss, con il significato di ‘danno’ o di ‘sinistro’, compare spesso nel linguaggio delle assicurazioni contro i danni: loss ratio è il rapporto in un certo esercizio fra sinistri e premi; loss reserves sono le riserve sinistri nel bilancio di una compagnia di assicurazioni; stop loss è una modalità di riassicurazione non proporzionale che pone un tetto (percentuale prefissata dei premi) alla responsabilità della compagnia che si riassicura; loss distribution è una distribuzione di probabilità singola o cumulata di danno. L’espressione p. condizionata al verificarsi di insolvenza (loss given default) indica una misura di rischio.