ricampionamento, metodi di
Tecniche basate sull’utilizzo di sottoinsiemi di dati (➔), che possono essere estratti sia casualmente sia secondo una procedura sistematica, allo scopo di approssimare alcune caratteristiche della distribuzione campionaria (➔) di una statistica (➔), un test o uno stimatore, quali per es., la varianza e i quantili, per validare un modello (➔ modello statistico). Si può distinguere tra metodi basati sull’estrazione casuale di sottoinsiemi dei dati campionari e metodi nei quali il r. avviene secondo una procedura non randomizzata. Appartengono alla prima categoria il bootstrap (➔ bootstrap, metodo) e sue varianti come il subsampling. Rientrano invece nella seconda procedure come il jackknife e la cross-validazione. Sono annoverati nella famiglia dei metodi di r. anche test statistici detti test di permutazione o esatti.
Metodo usato, come il bootstrap e il subsampling, per stimare caratteristiche come la distorsione e l’errore standard (➔ deviazione standard) di una statistica. Il jackknife consente di ottenere le stime desiderate senza ricorrere necessariamente ad assunzioni parametriche. A differenza degli altri due metodi, il jackknife si basa sul calcolo della statistica di interesse per sottocampioni ottenuti, lasciando fuori un’osservazione campionaria alla volta. Quando la statistica di interesse è lineare nelle osservazioni, il jackknife e il bootstrap danno risultati molto simili, tuttavia il primo ha una maggiore semplicità di implementazione.
Metodo usato in procedure di selezione del modello basate sul principio dell’accuratezza predittiva (➔ predittore). Si suddivide un campione in due sottoinsiemi, dei quali il primo (insieme di training) viene usato per la costruzione e la stima, mentre il secondo (insieme di validazione) viene usato per verificare l’accuratezza delle predizioni del modello stimato. Attraverso una sintesi delle ripetute predizioni si ottiene una misura dell’accuratezza del modello. Un metodo di cross-validazione è simile al jackknife, poiché lascia fuori un’osservazione alla volta. In un altro metodo, K-fold validation, si divide il campione in K sottoinsiemi e, a turno, ciascuno di essi è lasciato fuori come insieme di validazione.