Valutazione
Valutazione formativa
In linea generale, per v. s'intende la procedura diretta a verificare una situazione data, un processo, un'ipotesi di lavoro. Essa ha lo scopo di accertare la validità, l'efficacia, l'efficienza di un programma o di un servizio. In campo educativo, la v. costituisce un momento significativo del più generale processo di istruzione o di formazione. Al momento formativo vero e proprio, centrato sull'attività di insegnamento-apprendimento, deve essere strettamente connesso il momento valutativo dell'attività messa in atto e dei risultati raggiunti. La v. tradizionalmente si limitava a certificare, sulla base di criteri soggettivi e non verificabili, il livello degli apprendimenti acquisiti dagli allievi al termine di un corso di studi oppure di una sua fase. A partire dalla metà del 20° sec., la ricerca educativa ha dapprima cercato di definire strumenti il più possibile oggettivi di misurazione delle capacità e competenze acquisite, e successivamente di individuare corrette metodologie di analisi riguardanti non più solo il momento conclusivo, ma tutte le fasi del processo di formazione: dall'analisi delle condizioni di partenza alla progettazione e attuazione degli interventi, fino ai criteri di accertamento degli esiti individuali e collettivi dell'attività di formazione. La v. consuntiva o sommativa evidentemente non scompare dall'orizzonte, ma assume rilievo pedagogico soltanto nel quadro più comprensivo di quella che ormai viene denominata valutazione formativa, cioè della v. che accompagna l'intero processo di formazione. Tale è in sostanza la dimensione pedagogica della v., la quale si è giovata non soltanto degli studi e della sperimentazione docimologica, ma anche della ricerca relativa agli obiettivi educativi (v. obiettivo), delle teorie curricolari, dell'elaborazione di nuove metodologie didattiche (v. didattica) e di altri settori della ricerca educativa (v. ricerca).
L'interesse per le procedure valutative si è poi esteso dal versante strettamente pedagogico a quello sociopolitico dei sistemi di istruzione. In questo caso vengono in primo piano la qualità e l'efficienza dei servizi di istruzione, la loro riuscita in relazione ai bisogni sociali della comunità e alle attese del mondo dell'economia e del lavoro, la congruità delle risorse impiegate e della spesa pubblica sostenuta per il settore. In questo caso non si tratta più di valutare l'attività formativa nei suoi svolgimenti interni, né i suoi effetti sui singoli allievi, ma di analizzare la situazione educativa nel suo complesso. In tale prospettiva, molti Paesi si stanno attrezzando sul piano normativo e istituzionale (in Italia è stato fondato nel 1999 un Istituto nazionale per la valutazione del sistema di istruzione, al quale la l. 28 marzo 2003 nr. 53, di riforma scolastica, attribuisce il compito di effettuare verifiche sulle conoscenze e abilità degli studenti e sulla qualità complessiva dell'offerta formativa). Sul piano internazionale, poi, al fine di rendere possibile le comparazioni fra i sistemi educativi, si è resa necessaria la messa a punto di indicatori internazionali di vario tipo in grado di far riconoscere i punti deboli, ma anche quelli di efficienza, dei diversi sistemi e delle relative politiche. Le indagini svolte dalla IEA (International Association for the Evaluation Achievement) e le comparazioni fra i sistemi scolastici e universitari condotti per conto dell'OCSE (Organizzazione per la cooperazione e lo sviluppo economico) dal CERI (Centre for Educational Research and Innovation) sono fra gli strumenti più indicativi disponibili in materia.
Orientamenti metodologici della ricerca valutativa
Gli studi contemporanei sulla v. educativa hanno preso vigore soprattutto da quando alcune ricerche su larga scala hanno potuto dimostrare che esiste una certa correlazione fra determinati esiti scolastici e l'ambiente sociale e familiare di provenienza degli allievi. Nella scuola tradizionale, caratterizzata da modelli consolidati d'insegnamento-apprendimento, quella relazione non presentava particolari problemi, almeno ai livelli più alti di istruzione. Le capacità, verbali e non verbali, degli studenti non si differenziavano molto fra loro, soprattutto perché trovavano una quasi naturale corrispondenza nello status di genitori in larga misura provvisti di un titolo di studio medio-alto. La situazione si è venuta modificando con la progressiva estensione della scolarizzazione di massa.
Accanto alla necessità di mettere a punto delle nuove metodologie d'insegnamento in grado di corrispondere ai bisogni di una popolazione scolastica assai diversificata, si è anche avvertita l'esigenza di disporre di prove meno soggettive di verifica degli apprendimenti. D'altra parte, i suggerimenti e le proposte elaborati dalla ricerca docimologica sono risultati il più delle volte di assai complessa e laboriosa applicazione sul piano della pratica didattica. La costruzione di strumenti di verifica che siano precisi e validi richiede un notevole impegno di tempo, tanto da condizionare non poco il normale carico di lavoro dei docenti. Una parte della critica, poi, ha dovuto segnalare i limiti dei test oggettivi riguardo all'accertamento di competenze non elementari e di più elevato profilo, quali, per es., la capacità critica, di sintesi, di orientamento culturale e così via. La progressiva estensione dell'indagine dalla v. dei risultati del profitto dell'apprendimento a quella dell'intero processo formativo ha fatto proliferare i modelli di ricerca e reso più complesse le procedure di analisi. Gli studiosi si sono divisi in parte fra chi considera irrinunciabile una metodologia di tipo quantitativo e chi al contrario predilige una metodologia di tipo qualitativo. La prima metodologia, propria degli indirizzi sperimentali, tende a escludere oppure a ridurre al massimo qualsiasi intervento soggettivo ed è fondamentalmente orientata alla descrizione dei fenomeni. La metodologia qualitativa, privilegiata da orientamenti fenomenologici e interazionistici, più che alla misurazione, punta alla comprensione dei fenomeni, ed è maggiormente disposta a rivalutare l'elemento soggettivo e valoriale. Non sono pochi, peraltro, gli indirizzi volti a combinare insieme descrizione e interpretazione, indagini di tipo quantitativo e indagini qualitative.
I modelli della ricerca valutativa variano non solamente in ragione dei metodi impiegati e dei loro obiettivi, ma anche in ragione degli oggetti da valutare e della funzione stessa della v., nonché delle tecniche adottate. Padri fondatori della ricerca valutativa contemporanea sono considerati L.J. Crombach, D.L. Stufflebeam, M. Scriven, R.E. Stake, che hanno promosso l'impostazione di differenti modelli teorici e avviato specifiche scuole di ricerca. Per parte sua, E.R. House ha cercato di cogliere elementi di continuità fra le diverse impostazioni e ha proposto una specie di indagine bipolare nel tentativo di superare la cesura esistente fra oggettivismo e soggettivismo. M. Huberman e U. Margiotta hanno tentato di impostare concezioni valutative di tipo sistemico. Tenendo conto delle riflessioni di House, nonché della proposta tassonomica di B.R. Worthen e J.R. Sanders, lo studioso italiano F. Tessaro ha proposto una classificazione dei modelli di v., che di seguito si propone nelle sue linee essenziali.
Modelli di comparazione obiettivi-risultati. - Lo scopo principale di questo metodo valutativo consiste nell'individuare i livelli di discrepanza che si verificano fra obiettivi predefiniti e risultati raggiunti (non tanto dal singolo, quanto da un gruppo di allievi). Rientrano in questo indirizzo: il metodo sperimentale di D.T. Campbell e J.C. Stanley, in base al quale la comparazione viene effettuata fra i risultati di due gruppi di allievi (uno sperimentale e uno di controllo) che seguono programmi diversi; la cosiddetta procedura razionale di R.W. Tyler, che serve a mettere bene in evidenza soprattutto quali obiettivi sono stati raggiunti dagli studenti che hanno seguito un certo programma; il modello della discrepanza di M.M. Provus, che mira a superare il tema della v. finale prendendo in considerazione la comparazione obiettivi-risultati nelle diverse fasi dell'iter formativo. Sono questi i metodi per lo più applicati nelle sperimentazioni didattiche avviate negli anni Ottanta-Novanta del 20° secolo.
Modelli orientati alle decisioni. In questo caso, scopo della v. è di fornire ai responsabili delle politiche scolastiche informazioni utili per migliorare l'efficacia degli interventi. In particolare, è da segnalare il modello disegnato e successivamente perfezionato da Stufflebeam, che presenta la sigla CIPP (Context, Input, Process, Product), per il fatto che comprende quattro differenti tipologie di v., a ciascuna delle quali corrisponde un certo tipo di decisioni da prendere. Rientrano in questo medesimo indirizzo di v. destinata a orientare le decisioni dell'amministrazione pubblica, il tipo di ricerche condotte in Italia da agenzie quali l'ISFOL (Istituto per lo sviluppo e la formazione dei lavoratori) e il CENSIS (Centro studi investimenti sociali).
Modelli orientati sulla domanda e sull'offerta di formazione. - L'interesse della ricerca può spostarsi all'esterno del sistema formativo, al fine di valutare i reali bisogni degli utenti, e quindi di individuare le caratteristiche che deve assumere la formazione da offrire. In questo caso, come segnala Scriven, entra in gioco non già la comparazione con gli obiettivi di un certo programma determinato, bensì l'analisi dei bisogni e delle motivazioni, da un lato, e quella degli effetti previsti e imprevisti sui 'consumatori', dall'altro. La difficoltà consiste nel comprendere ('illuminare') tali effetti alla luce degli interventi messi in atto e giungere così a una v. di merito delle strategie adottate e del loro impatto sui fruitori. Nello stesso indirizzo rientra anche la v. del software didattico (G. Dotti Martinengo, M. Pellerey).
Modelli interessati alle transazioni. L'obiettivo di questo tipo di metodologie è di tenere conto prioritariamente dell'ambiente relazionale in cui si svolge l'esperienza formativa, servendosi dell'analisi dei processi intra- e inter-personali, con riguardo a emozioni, sentimenti, vissuti individuali ecc., che incidono nelle reali situazioni a volte più che i programmi e i metodi didattici. Per la comprensione di tali fenomeni servono ben poco i test e le metodologie sperimentali, considerati meccanicistici, quanto piuttosto la raccolta sistematica di informazioni soggettive, la descrizione delle situazioni e l'espressione di giudizi, che tuttavia devono essere sottoposti, secondo Stake, a una duplice analisi, quella detta di congruenza (per definire tipi di accordo o di disaccordo fra i diversi soggetti) e quella di contingenza (per delineare i passaggi dagli antecedenti alle transazioni e da queste agli esiti). Modelli relazionali sono anche quelli proposti da M. Parlett e D. Hamilton (diretto a comprendere la complessità dei processi relazionali), da R.M. Rippey (indirizzato prevalentemente alla negoziazione e al superamento dei conflitti) e da J. Cardinet (volto a spiegare i risultati attraverso le condizioni nelle quali sono stati ottenuti).
Modelli interessati allo sviluppo organizzativo. - Questo indirizzo è stato stimolato dalla consapevolezza maturata in merito all'influenza della struttura organizzativa sull'efficacia dell'azione formativa. Un particolare rilievo ha conseguito il progetto ISIP (International School Improvement Project), patrocinato dall'OCSE e coordinato dal CERI, che ha visto coinvolti per un certo periodo diversi Paesi occidentali. In tale quadro, speciale importanza ha assunto l'autoanalisi di istituto, che si presenta come un'indagine sistematica del funzionamento effettivo di una istituzione scolastica. Fra i modelli più strutturati di autoanalisi figura quello proposto da D. Hopkins, che prevede una sequenza di fasi.
Aspetti della procedura valutativa
La concreta attività di v., al di là delle differenti impostazioni teoriche e di metodo, coinvolge una serie di soggetti, di compiti, di aspetti procedurali e di strumenti. La prima considerazione da fare riguarda il soggetto della v., colui o coloro che eseguono la procedura valutativa. Tale soggetto o attore può essere interno o esterno al processo, e può operare da solo o insieme ad altri. La v. interna è quella svolta dal docente oppure dal gruppo di docenti di una classe, dai formatori di un corso professionale o dall'incaricato di uno stage aziendale. La v. esterna è quella svolta da una commissione di esaminatori diversi dai docenti incaricati, ovvero quella affidata a un esperto o agenzia specializzata. Osservazioni critiche vengono mosse all'una e all'altra possibilità: la v. interna viene favorita dalla migliore conoscenza dello studente; quella eseguita da esaminatori esterni può risultare più imparziale, ma può dar luogo a distorsioni di giudizio proprio per la non conoscenza della personalità dell'esaminando. Un caso a sé è l'ipotesi della autovalutazione, sia del discente che valuta il proprio apprendimento, sia del docente che analizza l'efficacia dei suoi metodi. L'autovalutazione dell'alunno, che di norma deve svolgersi con l'assistenza dell'insegnante, è considerato un momento di grande rilievo sotto il profilo pedagogico, in quanto concorre a promuovere la presa di coscienza di sé e sviluppa il senso di responsabilità dello studente (Calonghi 1976, 19838). La forma di v. maggiormente studiata è quella esercitata dagli insegnanti. Gli analisti hanno spesso segnalato i limiti e gli errori a cui vanno incontro i docenti. Si è rilevato, per es., il frequente disaccordo registrato fra docenti che esaminano lo stesso compito, e anche il disaccordo di un correttore con sé stesso in momenti diversi della sua attività valutativa (Grandi 1977). D'altra parte, come già è stato osservato, l'adozione di test e di altri strumenti di v. cosiddetti oggettivi risolvono soltanto in parte tali inconvenienti e, nel contempo, ne aprono altri, specialmente nei casi in cui è impossibile prescindere totalmente da un giudizio soggettivo del docente.
Altro aspetto da considerare è l'oggetto della v., che evidentemente varia in ragione del destinatario della v. stessa. Il destinatario può essere il singolo allievo, la classe, il docente oppure il gruppo di docenti, l'istituto nel suo complesso, il progetto oppure la metodologia didattica, l'organizzazione o l'amministrazione. D'altra parte, oggetto di v. possono essere le conoscenze acquisite, le competenze oppure le abilità, i comportamenti, i ritmi di apprendimento, gli interessi o motivazioni, l'ambiente formativo interno, l'ambiente familiare e così via. Non v'è dubbio che l'interesse maggiore si concentri di norma sul processo di apprendimento, sul suo andamento e i suoi risultati. Dopo essere stato a lungo stigmatizzato (peraltro non sempre a ragione) il tipo di v. selettiva adottato dalla scuola tradizionale, l'attenzione si è concentrata sulla distinzione fra v. formativa e v. sommativa o complessiva (Scriven, B.S. Bloom, G. De Landsheere, B. Vertecchi e altri ancora). Si è registrato un largo accordo a privilegiare la v. formativa, che in sostanza coincide con la cosiddetta v. continua. Quest'ultima è tale in quanto accompagna i diversi momenti dell'insegnamento-apprendimento, e ne rappresenta una verifica in sequenza. Essa facilita l'adeguamento in corso del piano d'insegnamento e consente l'attivazione di tempestive misure di sostegno o di recupero nei confronti degli allievi in ritardo. Diversamente dalla precedente, la v. sommativa ha le sue ragioni in quanto necessario bilancio di una tappa importante e di una fase conclusiva del percorso di studio. Assume di solito valore certificativo, ma anche orientativo ai fini del percorso successivo da intraprendere. Si può anche pensare, in determinate circostanze, a una specifica forma di v. orientativa. La v. formativa assume particolare rilievo nella strategia del mastery learning (apprendimento per la padronanza) sperimentato da Bloom, J. Carrol e loro collaboratori.
L'aspetto più controverso è quello degli strumenti della valutazione. Il tipo di strumento varia a seconda che siano da accertare dimensioni cognitive, comportamentali, affettive della personalità degli allievi, o anche dimensioni sociali (come capacità relazionali, di adattamento ecc.). Gli strumenti tradizionalmente più usati nella scuola sono l'interrogazione orale (per alcuni versi irrinunciabile, ma considerata lacunosa perché scarsamente ponderata sul livello di difficoltà delle domande poste), la prova scritta, comprendente vari tipi di saggi (che pone altri problemi, e tuttavia anch'essa risulta utile se commisurata al tipo di accertamento disciplinare da verificare), le prove pratiche (proprie delle discipline tecnico-pratiche e in parte anche di quelle tecnico-artistiche). Gli studi docimologici preferiscono mettere l'accento sull'uso dei test di profitto. Il test consiste, di norma, nella somministrazione di questionari identici per tutti gli esaminandi. Sono chiamati test standardizzati quelli accompagnati da una precisa tecnica di v. dei risultati. Essi differiscono dalle altre prove oggettive per le loro caratteristiche metrologiche e le elaborazioni statistiche cui sono sottoposti. Proprio per questa loro complessità, sono raramente usati nella concreta prassi didattica. Le cosiddette prove oggettive (ormai di largo impiego) comportano una semplificazione delle modalità di risposta (lo studente non è chiamato a 'costruire' una risposta, ma a sceglierla fra alcune alternative proposte), permettono che la correzione avvenga in modo oggettivo, consentono inoltre un notevole risparmio di tempo. Ma si segnalano pure i limiti di questo tipo di prove 'a risposta chiusa': la quasi impossibilità di risalire al processo intellettivo seguito dal soggetto e, soprattutto, di accertare le sue capacità di rielaborazione e di organizzazione dei dati culturali acquisiti (Grandi 1977). I questionari 'a risposta aperta', che possono anche coincidere con il saggio breve, sono considerati più positivamente, pur costituendo un tipo di prova parzialmente oggettiva.
Le fasi della valutazione
Condizione preliminare di ogni procedura valutativa è l'identificazione degli obiettivi formativi. Occorre che questi non restino semplicemente delle indicazioni generiche, ma si traducano in obiettivi operativi, prefigurando requisiti, qualità o comportamenti determinati. Anche a questo fine sono state proposte varie tassonomie di obiettivi educativi (v. obiettivo: Obiettivi educativi), e altre sono state sperimentate nella concreta pratica didattica. Tenuto conto, poi, del fatto che i processi formativi risentono anche dei fattori esterni all'attività didattica (fattori familiari, ambientali, sociali), è opportuno intraprendere una corretta analisi della situazione di partenza. Emerge allora l'importanza della fase di progettazione e programmazione dell'attività formativa, nella quale i differenti fattori devono essere riconsiderati in un quadro di compatibilità. La fase centrale e più delicata della procedura valutativa è costituita da quel complesso di operazioni che prende il nome di misurazione. Essa consiste nella raccolta e analisi dei dati informativi necessari a raggiungere giudizi ponderati, oltre che a decidere delle eventuali misure di rinforzo. La misurazione implica in primo luogo la 'stimolazione' delle competenze da verificare, che è ottenuta attraverso la somministrazione di uno o più strumenti di accertamento. Segue la registrazione degli esiti, ossia delle risposte fornite dalle prove, e quindi la elaborazione dei risultati ottenuti dall'allievo in comparazione con quelli dei suoi compagni. Quest'ultima richiede a rigore l'impiego di alcuni indici tecnici (media aritmetica, scarto quadratico medio ecc.). Alcune ricerche in campo psicologico hanno mostrato che l'imposizione di rigidi termini di tempo per lo svolgimento delle prove può nuocere alla precisione dei risultati, che possono essere migliori se agli alunni viene concesso un tempo elastico di svolgimento del compito, in modo da avere il tempo di rivedere il lavoro svolto (Gattullo 1967, 19797). Si distinguono quattro tipi di scale di misurazione: la 'scala nominale', che registra la presenza o assenza di una determinata competenza; la 'scala ordinale', che consente di formare delle graduatorie; la 'scala a intervalli', che consente anche di disporre di unità di misura per individuare gli intervalli fra un grado e l'altro della scala. La fase conclusiva riguarda in modo specifico l'interpretazione dei dati della misurazione. Tale fase prende la denominazione di valutazione dei risultati. Ai dati acquisiti mediante le diverse prove viene attribuito un valore sulla base del criterio prescelto. Il criterio può essere assoluto, quando, per es., si giudica la prova del singolo allievo indipendentemente da quella dei suoi compagni; può essere invece relativo, quando discende dal confronto fra gli allievi appartenenti a una classe.
Un aspetto delicato, e però difficilmente risolvibile, è l'individuazione del limite che discrimina fra il livello di sufficienza e quello di insufficienza degli apprendimenti acquisiti. Molto dipende dall'uso selettivo o meno del controllo: nel primo caso, il giudizio di insufficienza diventa senz'altro giudizio di non superamento della prova ('bocciatura'); nel secondo caso, il giudizio di insufficienza può assumere valore orientativo o diagnostico in vista di nuove iniziative da assumere. In tale prospettiva rientra la tendenza a convertire i risultati negativi o parzialmente negativi in 'debiti formativi' da soddisfare nella fase successiva del percorso di istruzione. Il 'giudizio' può essere espresso in vari modi: in 'voti' (in Italia, per es., su scala decimale nella scuola secondaria superiore oppure in trentesimi nell'istruzione universitaria), mediante 'aggettivi', ovvero mediante 'giudizi e profili' insieme (i quali esprimono in modo discorsivo i risultati dell'apprendimento). Ognuna di queste modalità di espressione del giudizio presenta sia vantaggi sia svantaggi e è stata oggetto tanto di apprezzamenti quanto di critiche.
bibliografia
M. Gattullo, Didattica e docimologia: misurazione e valutazione nella scuola, Roma 1967, 19797.
R.W. Tyler, R.M. Gagné, M. Scriven, Perspectives of curriculum evaluation, Chigago 1967.
D.L. Stufflebeam, W.G. Foley, W.J. Gephart et al., Educational evaluations and decision making, Itasca (IL) 1971.
B.R. Worthen, J.R. Sanders, Educational evaluation. Theory and practice, Belmont 1973.
L. Calonghi, Valutazione, Brescia 1976, 19838; G. Grandi, Misurazione e valutazione, Firenze 1977.
L.J. Crombach, Designing evaluations of education and social programs, San Francisco (CA) 1982.
Evaluation models, ed. M.S. Scriven, D.L.Stufflebeam, Boston 1983.
B. Vertecchi, Manuale della valutazione: analisi degli apprendimenti, Roma 1984.
D.L. Stufflebeam, A.J. Shinkfield, Sistematic evaluation, Boston 1985.
M.C. Alkin, Debates on evaluation, London 1990.
U. Margiotta, Valutazione di sistema ed autoanalisi d'istituto, Atti del seminario I.R.R.S.A.E. Emilia-Romagna, Bologna 10-11 marzo e 20-25 maggio 1988, Bologna 1990.
W.R. Shadish, T.D. Cook, L.C. Leviton, Foundations of program evaluation. Theories of practice, Newbury Park 1991.
La valutazione nella scuola dell'obbligo, Studi e documenti degli Annali della pubblica istruzione, Firenze 1993.
F. Tessaro, La valutazione dei processi formativi, Roma 1997.
CEDE (Centro europeo dell'educazione), Monitoraggio multilab, a cura di R. Bolletta, 2 voll., Frascati 1999.
G. Domenici, La valutazione come risorsa: analisi degli apprendimenti e autovalutazione d'istituto, Napoli 2000.
M. Castoldi, Autoanalisi di istituto: percorsi e strumenti per l'autovalutazione, Napoli 2002.
G. Domenici, Valutazione della scuola, in Voci della scuola 2004, a cura di G. Cerini, M. Spinosi, Napoli 2003, p. 406.
S. Auriemma, Valutazione sistema istruzione, in Repertorio 2005, a cura di S. Auriemma, Napoli 2005, pp. 936-40.
M. Spinosi, Valutazione e portfolio, Napoli 2005.