confidenza, intervallo di
In statistica, insieme dei valori plausibili per il parametro di interesse, dato il campione. Indicando con θ il parametro della popolazione del quale si cerca di ricavare informazioni attraverso la rilevazione campionaria, l’intervallo di c. a un livello prefissato, per es. il 95%, è un intervallo (a1, a2), in cui i valori a1 e a2 sono funzioni delle osservazioni campionarie, e pertanto delle variabili casuali, ed è costruito in modo tale che il parametro θ sia incluso con probabilità pari al 95%. Se θ ̂ è uno stimatore consistente per il parametro θ, e se indichiamo con σθ la sua deviazione standard, la formula generale per un intervallo di c. è [θ ̂−p0.025σθ; θ ̂+p0.975σθ] dove pα indica il quantile α-esimo della distribuzione campionaria dello stimatore standardizzato (θ ̂−θ)/σθ ossia il valore tale che P((θ ̂−θ)/σθ≤pα)=α. Esiste uno stretto legame tra un intervallo di c. di livello 1−α e la zona di accettazione di un test statistico del tipo θ=θ0 al livello di significatività α:: se infatti il valore θ0 non è contenuto nell’intervallo di c., ciò significa che non è plausibile, alla luce delle osservazioni campionarie, e in tal caso si rifiuta l’ipotesi nulla θ=θ0 (➔ ipotesi statistica).
Di solito la deviazione standard esatta dello stimatore θ ̂ non è nota, e a maggior ragione non si conosce, per una arbitraria dimensione campionaria, il valore pα. In tal caso si ricorre alla sostituzione di σθ con una sua stima consistente e, per i quantili pα, all’utilizzo dei quantili di una distribuzione che approssima bene la distribuzione di θ ̂. Se lo stimatore θ ̂ è asintoticamente normale e la dimensione campionaria è ragionevolmente elevata, allora possono essere usati i quantili della distribuzione gaussiana. Questi sono convenzionalmente indicati con zα, dove zα è tale che α=P(Z≤zα) e Z è una variabile aleatoria normale standardizzata. I valori zα, per i quali non esiste una formula chiusa, sono riportati in apposite tavole statistiche.