efficienza statistica
Proprietà associata a una statistica (uno stimatore o una statistica test) che ne indica una maggiore precisione rispetto a una statistica alternativa. È quindi una proprietà importante nella scelta di una procedura per la stima o la verifica di ipotesi. Si considerino separatamente i concetti di efficienza di uno stimatore e di una statistica test (➔).
Per uno stimatore, una definizione di efficienza, frequentemente utilizzata, è legata a una particolare misura di rischio statistico (➔ rischio, misure di ) chiamata errore quadratico medio. Dato uno stimatore T di un parametro θ, si chiama errore quadratico medio o MSE (Mean Squared Error) la quantità MSE (T)=E(T−θ)2. Si può mostrare che il MSE è uguale alla somma della varianza di T e di (θ−E(T))2, chiamato distorsione, che misura la distanza tra la media di T e il valore da stimare θ. Si dice che T è uno stimatore non distorto per θ quando questo secondo termine è zero, cioè E(T)=θ, e in tal caso il MSE coincide con la varianza di T. Se T e T′ sono due stimatori alternativi di un parametro θ della popolazione, si dice che T è più efficiente di T′ se MSE(T)T′). In particolare, se T e T′ sono stimatori non distorti per θ, allora T è più efficiente di T′ se ha una varianza inferiore rispetto a T′. Più in generale, il problema dell’efficienza può fare riferimento a un’intera classe di stimatori. Per es., si prenda il caso in cui il parametro θ è la media della popolazione. Un’importante classe di stimatori è quella che comprende tutti gli stimatori che sono definiti da una funzione lineare (➔ linearità) delle osservazioni, cioè T=Σi ciXi, e che sono non distorti per θ. La media campionaria appartiene a tale classe e, sotto l’ipotesi di campionamento (➔ campione statistico) casuale semplice, è lo stimatore a varianza minima all’interno di essa (BLUE, Best Linear Unbiased Estimator).
Se si assume inoltre che la popolazione abbia distribuzione gaussiana, allora la media campionaria è lo stimatore a varianza minima all’interno della classe degli stimatori non distorti per la media, che include anche quelli che non sono lineari. Questa proprietà è chiamata UMVU (Uniform Minimum Variance Unbiased). Dato un modello parametrico {f(x;θ):θ∈Θ} che gode di certe proprietà di regolarità, esiste un criterio tramite il quale è a volte possibile stabilire se uno stimatore non distorto sia anche UMVU. Questo consiste nel confrontare la sua varianza con una quantità, nota come limite inferiore di Cramér-Rao, la cui espressione dipende dal modello parametrico in questione. Se uno stimatore non distorto raggiunge il limite inferiore di Cramér-Rao, allora è UMVU. Il raggiungimento del limite di Cramér-Rao è condizione sufficiente ma non necessaria perché uno stimatore sia UMVU. Un esempio è lo stimatore non distorto della varianza, s2=Σni=1(Xi−X_)2 /(n−1) che è UMVU nel caso del modello gaussiano, ma raggiunge il limite inferiore di Cramér-Rao solo quando la dimensione campionaria tende a infinito.
Per quanto riguarda i test, una definizione di efficienza può essere basata sul confronto della loro potenza. Per illustrare il concetto consideriamo il caso in cui l’ipotesi nulla è θ=θ0, mentre l’alternativa è θ≠θ0, dove θ è un parametro della distribuzione. Una procedura per la verifica dell’ipotesi è definita da una statistica test T e da una regione di rifiuto R (➔ test). Per ogni procedura, si hanno probabilità di errore di prima specie, cioè la probabilità di rifiutare l’ipotesi nulla quando questa è vera (α), e di seconda specie, cioè è la probabilità di non rifiutare l’ipotesi nulla se questa è falsa (β). È chiamata potenza la quantità 1−β, che è la probabilità di rifiutare un’ipotesi nulla falsa. Date due statistiche test T e T′ e le associate regioni di rifiuto R e R′, si dice che il test T è più efficiente di T′ se, a parità di errore di prima specie, T è più potente di T′. Data una classe di test statistici, si dice che T è uniformemente più potente (Uniformly Most Powerful, UMP) se è più potente di qualsiasi altro test T′ nella stessa classe, che abbia un errore di prima specie non superiore a quello di T. In casi molto particolari (ipotesi unidirezionali su un solo parametro) il test del rapporto delle verosimiglianze è UMP. Nella maggior parte dei casi però un test UMP non esiste.