curtosi
In statistica, la pesantezza delle code di una distribuzione (➔ coda) in relazione al suo addensamento intorno al valore centrale. La c. è solitamente definita dall’indice κ=μ4/(μ2)2, dove μ2 e μ4 sono rispettivamente la varianza (momento secondo) e il momento quarto centrato (➔ momenti, funzione generatrice dei). L’indice di c. è normalmente confrontato con il valore della distribuzione gaussiana (➔ gaussiana, distribuzione), per la quale κ=3. Per questo motivo, talvolta si usa anche l’indice κ−3 (excess kurtosis), in modo che la distribuzione di riferimento (gaussiana) abbia indice pari a 0. Una distribuzione si dice leptocurtica oppure platicurtica a seconda che l’indice di c. sia maggiore o minore del valore di riferimento.
Uno dei limiti dell’indice di c. è la sua difficile interpretazione, specialmente nel caso di distribuzioni che si allontanano dalla normale. L’indice di c. dipende infatti in modo complesso dall’interazione tra il momento quarto e la varianza. Per costruzione, esso misura uno spostamento di massa che non incide sulla varianza della distribuzione. ● L’interpretazione dell’indice di c. è relativamente semplice se la distribuzione è unimodale e simmetrica (➔ skewness). In questo caso un indice di c. positivo (κ>3) si traduce in code più pesanti rispetto a quelle della normale e, al tempo stesso, in un picco più alto in corrispondenza del valore modale. Al contrario, una distribuzione platicurtica ha code meno pesanti rispetto alla normale e la densità (➔ distribuzione di probabilità) ha un picco più basso e più ampio intorno alla moda. Esempi di distribuzioni leptocurtiche sono la t di Student (➔ Student, t di), che ha code tanto più pesanti quanto più bassi sono i gradi di libertà, la distribuzione logistica e quella di Laplace o doppio esponenziale (➔ Laplace, distribuzione di), mentre distribuzioni platicurtiche sono, per es., l’uniforme e la distribuzione di Bernoulli con parametro p=1/2, che ha κ=1 (➔ Bernoulli, distribuzione di). Una distribuzione bimodale e simmetrica tende a essere platicurtica. Questa non è tuttavia una regola, poiché esistono distribuzioni simmetriche bimodali e, al tempo stesso, leptocurtiche.
Un altro limite dell’indice di c. è il fatto che esso è calcolabile soltanto per distribuzioni con momento quarto finito e quindi, per es., non è definito per la distribuzione t di Student con un numero di gradi di libertà inferiore a 5. Nonostante i suoi limiti, l’indice di c. è il più popolare indicatore della pesantezza delle code di una distribuzione e non esiste pacchetto statistico che non lo includa. Poiché molti modelli statistici si basano sull’ipotesi di normalità delle osservazioni, la presenza di leptocurtosi in una distribuzione può comportare un’eccessiva presenza di valori ‘anomali’, cioè di valori corrispondenti alle code della distribuzione, causando pertanto problemi di robustezza (➔ robustezza statistica) dello stimatore o della statistica di interesse.