Psicometria
Il termine psicometria indica, in senso lato, l'insieme dei metodi d'indagine psicologica tendenti al raggiungimento di valutazioni quantitative del comportamento umano o animale; più precisamente, la psicometria si propone di misurare aspetti elementari o complessi dell'attività psichica, del comportamento e della personalità attraverso la costruzione, l'applicazione e la verifica di reattivi psicologici o, usando il termine inglese ormai correntemente adottato, test. Introdotti in psicologia sperimentale a partire dalla fine dell'Ottocento e in seguito sempre più utilizzati in psicologia applicata, i test psicologici costituiscono strumenti di misura atti a consentire l'osservazione accurata di segmenti di comportamento.
Dalla sua nascita come disciplina scientifica, nella seconda metà dell'Ottocento, la psicologia ha dovuto conciliare il rigore del metodo, garantito dalla sua obiettività e quantificabilità, con la natura soggettiva dei processi di cui si occupa. Anche se l'affermarsi dei concetti di comportamento e di personalità, accanto a quello di attività psichica, e l'apporto sempre più sofisticato delle procedure statistiche hanno modificato i termini del problema, quella della misurazione ha continuato a rappresentare un'area aperta alla discussione, per la difficoltà di dimostrare che l'obiettività non si ottiene attraverso una forzatura dei fenomeni studiati tale da portare a un loro snaturamento. Il problema della misurazione in psicologia è stato affrontato inizialmente attraverso la definizione delle scale di valutazione - nominali, ordinali, di intervallo, di rapporto -, che si sono proposte di stabilire il carattere, i limiti, il significato delle differenze di tipo psicofisico e psicofisiologico, e ha comportato, in seguito, l'avvento della psicometria come aspetto fondamentale dell'area metodologica, tramite la messa a punto dei test psicologici. Il test psicologico consiste essenzialmente in una misurazione obiettiva e standardizzata di un campione di comportamento (Anastasi 1995) e, attraverso questo, dell'attività psichica e della personalità. Obiettività e standardizzazione sono i requisiti necessari a garantire il carattere scientifico di tale misurazione. Il termine test venne proposto per la prima volta dallo psicologo americano J.M. Cattel in un articolo comparso, nel 1890, sulla rivista Mind, e nei suoi elementi fondamentali il suo significato non è andato incontro a sostanziali modifiche durante gli oltre cento anni di applicazione, di elaborazione e anche di polemiche sul metodo. Ancora oggi la concezione e quindi anche la definizione di test psicologico non sono identiche per i diversi autori e specialmente per tutte le scuole, ma le differenze riguardano solitamente caratteri marginali, oppure si riferiscono all'estensione e ai limiti da dare al concetto. Non è possibile, infatti, porre limiti rigidi, netti fra i metodi di studio o d'indagine che si possono annoverare fra i test e quelli che, al contrario, debbono essere esclusi da questa categoria. Talvolta può essere difficile stabilire quale sia il grado di standardizzazione necessario e sufficiente perché una situazione possa considerarsi un test; d'altra parte, il comportamento deve potersi valutare obiettivamente, ma spesso tale valutazione è influenzata in maggiore o minore misura dalle caratteristiche individuali dell'esaminatore; infine, il comportamento stimolato deve contemplare implicazioni psicologiche. Gli elementi fondamentali e necessari perché si possa parlare correttamente di test sono la standardizzazione delle situazioni stimolanti e una serie di prove, di numero e di valore tali da permettere una valutazione statisticamente significativa. I test psicologici, che sono sorti nell'ambito della psicologia sperimentale ma che ormai da lungo tempo sono penetrati nell'uso della psicologia applicata - in ambito scolastico, lavorativo, clinico, giudiziario -, sono l'espressione del più efficace tentativo di omogeneizzazione e standardizzazione dei dati ricavati dallo psicologo operante in una delle aree sopra indicate: omogeneizzazione e standardizzazione si riferiscono sia alla raccolta sia alla valutazione e all'interpretazione dei dati. I test possiedono inoltre il notevole vantaggio pratico della semplicità e relativa rapidità di applicazione, nonché la proprietà di essere strettamente determinati in rapporto alla qualità o alla funzione da esaminare e alle condizioni dell'esame. Di contro, i limiti maggiori che i test presentano riguardano: il presumere identici per ogni soggetto una situazione che, nella realtà, difficilmente può essere tale, e il significato da assegnarsi alla medesima risposta, rispetto a una determinata variabile, data da soggetti diversi (per significato è da intendere l'empirico significato medio-statistico della variabile in questione); la necessità (almeno per molti test) che il soggetto comprenda ciò che da lui si desidera e collabori nel senso richiesto dall'esaminatore. Le qualità che si richiedono a un test sono sostanzialmente la validità, l'attendibilità e la taratura.
a) Validità. È il grado di precisione con cui una prova consente di valutare una determinata capacità. Se ne può dedurre che un test è valido quando misura effettivamente quello che dice di misurare. Per verificare la validità di un test si può utilizzare un mezzo di paragone (criterio) con il quale confrontare i risultati ottenuti dall'applicazione del test stesso (per es., per valutare la validità di un test psicopatologico si possono usare come criterio le conclusioni cui ha portato l'esame clinico in diversi pazienti esaminati con tale prova), oppure il metodo dell'analisi fattoriale, introdotto da Ch.E. Spearman fin dal 1904, che, specialmente grazie ai contributi di L.L. Thurstone, H. Hotelling e K.J. Holzinger, ha assunto un'importanza sempre crescente in psicologia. L'analisi fattoriale, i cui presupposti e la cui elaborazione matematica sono oggi universalmente accettati, si può attualmente considerare come un mezzo efficace e, specialmente, come un metodo dalle grandi possibilità nello studio della psicologia; essa è invece ancora discussa per quanto riguarda l'interpretazione dei dati ricavati ed elaborati con metodi matematici, per quanto riguarda cioè il significato da attribuire a ogni singolo fattore.
b) Attendibilità o fedeltà. Esprime la costanza dei risultati ottenuti con un determinato test, quando esso sia applicato più volte al medesimo soggetto (a meno che quest'ultimo si sia nel frattempo modificato). Un test si dice attendibile quando fornisce gli stessi risultati in occasioni diverse. L'attendibilità non ha un coefficiente fisso assoluto per ciascun test, ma esprime una valutazione relativa che varia a seconda che il test sia applicato a un gruppo di soggetti piuttosto che a un altro; ne consegue che il medesimo test può essere discretamente attendibile per un gruppo, scarsamente per un altro. I metodi principali per saggiare l'attendibilità di un test sono: 1) il metodo della riapplicazione del test, che non ha valore elevato perché sul rendimento dei soggetti nella riapplicazione influisce sia ciò che essi possono aver appreso dopo la prima applicazione, sia l'elevarsi o l'abbassarsi del livello motivazionale degli individui esaminati; 2) il metodo dei test equivalenti, consistente nell'applicare al medesimo gruppo di soggetti due serie equivalenti dello stesso test e nel calcolare la correlazione fra i risultati così ottenuti; anche se la somiglianza tra le prove delle due serie può comportare inconvenienti analoghi a quelli del primo metodo, questi si possono considerare superati se nella seconda serie il miglioramento osservato è sistematico e parallelo per tutti i soggetti; 3) il metodo della divisione a metà delle prove, che si può considerare il più efficace, e consiste nel suddividere il test in due metà strettamente confrontabili (per es., tutte le prove dispari da una parte, tutte le pari dall'altra), nel valutarle separatamente e nel calcolare, infine, la correlazione fra i risultati delle due metà che rappresentano due serie di prove equivalenti e applicate contemporaneamente.
c) Taratura. È il procedimento per rendere il test significativo non solo rispetto a un determinato gruppo di soggetti, ma anche nei riguardi della popolazione statistica cui quel gruppo appartiene. Si attua, secondo una procedura statistica ben definita, applicando il test a campioni della popolazione in esame e confrontando e integrando i risultati ottenuti in modo da poter giungere a una rappresentazione, in miniatura ma presumibilmente fedele, di quelle che sono le caratteristiche di tutta la popolazione rispetto al test. Esistono vari criteri per la classificazione dei test. In linea con quanto indicato dai più accreditati studiosi della materia, se ne possono riconoscere due grandi categorie: i test che studiano aspetti cognitivi, o test di efficienza, e quelli che studiano aspetti affettivo-motivazionali, o test di personalità. Entrambe le categorie presentano forme da applicare individualmente nonché altre ad applicazione collettiva.
Sono i test, indicati talvolta come scale, che valutano il livello mentale, le attitudini, le conoscenze dei soggetti esaminati per ciò che si riferisce alle loro capacità. Comprendono sia test omogenei, costituiti dallo stesso tipo di problema presentato in forme progressivamente più difficoltose, sia test eterogenei, articolati in problemi di tipo diverso. Questo tipo di test è stato inizialmente utilizzato per valutare il grado di sviluppo mentale dei bambini, cioè il quoziente intellettivo (QI), espresso dal rapporto tra età mentale (EM) ed età cronologica (EC), secondo la formula QI = EM/EC x 100: ciò allo scopo di individuare i soggetti ritardati. È stata impiegata per prima la scala Binet-Simon, comprendente serie di prove tali da essere superate dalla maggioranza dei bambini di una certa età e non da quelli più giovani. Successivamente questi test sono stati estesi a valutare l'efficienza intellettiva degli adulti e degli anziani, allo scopo di stabilire se una data persona rientrasse o meno intellettualmente nella normalità definita per i suoi coetanei, e se presentasse segni di decadimento mentale. Fra i test omogenei, i più usati sono le matrici progressive di Raven, composte di serie di figure rappresentanti problemi spaziali. Ai test eterogenei appartengono le scale di intelligenza, che si possono considerare esempi paradigmatici per la valutazione del livello intellettivo e si avvalgono di una ricchissima casistica. La prima di queste scale venne pubblicata, nel 1939, da D. Wechsler come scala Wechsler-Bellevue: essa si compone di undici subtest, di cui sei verbali, consistenti in domande o quesiti orali, e cinque manuali, richiedenti un'attività di scelta o di organizzazione di un determinato materiale. I subtest verbali sono: 1) cultura generale: si sottopongono al soggetto venticinque domande di argomento vario; 2) comprensione: si chiede quale sarebbe l'atteggiamento del soggetto rispetto a dieci situazioni particolari; 3) memoria di cifre: l'esaminatore elenca ad alta voce alcune serie di cifre, di numero progressivamente crescente, e chiede al soggetto di ripeterle immediatamente, prima nello stesso ordine, poi in ordine inverso; 4) ragionamento aritmetico: il soggetto è chiamato a risolvere dieci problemi numerici; 5) analogie: si presentano al soggetto dodici coppie di sostantivi e gli si chiede di trovare, per ciascuna di esse, un elemento che accomuni i due componenti; 6) definizione di vocaboli: si chiede al soggetto di dare un'esatta definizione di quarantadue vocaboli elencati dall'esaminatore (questo è un subtest supplementare). I subtest manuali sono: 1) riordinamento di figure: il soggetto deve riordinare sei serie di figure, ognuna delle quali rappresenta una storia brevissima; 2) completamento di figure: quindici figure sono presentate al soggetto affinché colga l'elemento essenziale mancante in ciascuna di esse; 3) disegno con cubetti: compito del soggetto è di riprodurre sette disegni servendosi di alcuni cubetti dalle facce variamente colorate; 4) ricostruzione di figure: al soggetto è chiesto di ricostruire tre figure in cartone, ciascuna delle quali previamente suddivisa in sei frammenti; 5) associazione di simboli e numeri: in un'apposita chiave sono indicati simboli particolari per ogni cifra dall'uno al nove e il soggetto deve, in un tempo definito, associare, in una serie di cifre disposte senza alcun ordine, il simbolo corrispondente a ciascuna di esse. I punteggi 'grezzi', per ogni subtest, vengono trasformati, mediante un'apposita tabella, in punti confrontabili, dai quali è possibile ricavare i valori della scala verbale, della scala manuale e della scala totale.
Da questi valori si possono poi ottenere, utilizzando altre tabelle, il quoziente d'intelligenza, l'indice di efficienza (che confronta il punteggio del soggetto con la media di quelli della popolazione cui esso appartiene), la validità interna (deviazione media dei valori corrispondenti agli undici subtest dal valore medio aritmetico degli stessi) e l'indice di decadimento mentale (rapporto fra i valori dei subtest che non declinano con l'età e quelli dei subtest che declinano). Questo calcolo permette di stabilire se un quoziente di intelligenza con valore nettamente inferiore alla media per una determinata età anagrafica esprima un'insufficienza intellettuale che si è mantenuta negli anni (a indicare l'esistenza di una frenastenia) o una perdita di capacità connessa all'instaurarsi di una malattia (a indicare una condizione di demenza): se cioè al decadimento fisiologico (determinato dal passare degli anni) si sia aggiunto un decadimento patologico. I subtest che misurano aspetti dell'intelligenza che non declinano con l'invecchiamento sono quelli di cultura generale e di vocabolario; quelli che misurano aspetti sensibili all'età sono i subtest che valutano l'apprendimento e la memoria. A ogni quoziente d'intelligenza corrisponde un determinato punto centile, che permette di collocare esattamente il livello mentale del soggetto fra quelli caratteristici per la popolazione cui appartiene, che ci consente cioè di giudicare se un soggetto statisticamente sia normale o anormale (in più o in meno) per ciò che concerne la propria attività intellettiva e di che grado sia la sua eventuale anormalità. I punteggi confrontabili ottenuti da un dato soggetto in ciascun subtest possono essere espressi mediante un grafico, rappresentati cioè in un sistema di coordinate cartesiane, in modo che sull'ascissa siano disposti i titoli degli undici subtest e sull'ordinata i valori confrontabili ricavati. Il grafico consente di richiamare brevemente il concetto di dispersione (scatter), che tanta importanza ha assunto nella pratica diagnostica odierna. Si è potuto infatti rilevare che ai fini di una diagnostica differenziale, per es. fra due forme diverse di malattie mentali, più che al risultato complessivo in un determinato test di frequente è utile riferirsi al rapporto reciproco dei risultati ottenuti dal medesimo soggetto, sia in differenti prove di uno stesso test (come nel caso dei subtest della scala Wechsler-Bellevue), sia in differenti test appartenenti a una batteria. L'insieme dei risultati rivela una certa struttura (pattern), tale che la dispersione dei singoli risultati assume appunto un significato diagnostico, chiaramente documentato da D. Rapaport nella sua ricchissima casistica clinica. Lo scatter può essere espresso, oltre che con un profilo, anche siglando il risultato di ciascun subtest (o, nel caso di una batteria, il risultato di ciascun test) in modo diverso a seconda che esso rientri nella media complessiva del test (o della batteria) o si scosti in più o in meno da essa. Praticamente, si indicano con 0 i valori che corrispondono alla media o se ne scostano entro limiti previamente fissati; con + e + + quelli che se ne scostano per eccesso (+ e + + rappresentano due gradi di tale spostamento); con ‒ e ‒ ‒ quelli che se ne scostano per difetto. Disponiamo così di un insieme di undici segni, che possono avere il significato di sintomi e che servono quindi a integrare il quadro clinico di una determinata forma patologica. Accanto a molti altri che riproducono fondamentalmente le caratteristiche proprie della scala Wechsler-Bellevue, sono poi da ricordare, sempre per quanto concerne gli aspetti cognitivi, i test denominati di formazione di concetti, o di pensiero concettuale. Secondo i fautori di questi metodi, dal momento che il distacco dalla realtà caratterizzante le più gravi malattie della mente agisce principalmente e precocemente sul processo di formazione dei concetti, notevoli debbono essere i vantaggi presentati da test mediante i quali, attraverso la risoluzione di problemi particolari, è possibile evidenziare il processo in questione. Tra i test di pensiero concettuale si può citare, a scopo esemplificativo, il test Hanfmann-Kasanin nel quale vengono utilizzati ventidue blocchetti che differiscono per il colore (cinque colori differenti), la forma (sei forme differenti), l'altezza (due altezze differenti), la larghezza (due larghezze differenti). Ciò che si richiede al soggetto è di suddividere i blocchetti in quattro raggruppamenti. L'unica soluzione che soddisfi tale richiesta consiste nel suddividerli a seconda dell'altezza e della larghezza, trascurando l'elemento forma e l'elemento colore. Lo scopo della prova è quello di rilevare attraverso quali tappe successive il soggetto arrivi alla determinazione e alla scelta dei criteri che debbono essere utilizzati. Fra i test di efficienza rientrano anche quelli di profitto, che valutano le conoscenze acquisite (per es. in un programma scolastico), nonché quelli attitudinali, che si propongono di misurare, esprimendole nel profilo attitudinale, le potenziali competenze specifiche di una persona che le consentano di seguire un determinato percorso scolastico o lavorativo.
In questa categoria si possono distinguere i test analitici (fondati cioè su una concezione articolata della personalità) dai test sincretici (fondati su una concezione globale della personalità): i primi sono di origine per lo più anglosassone, i secondi svizzero-tedesca. I test analitici sono presentati in gran parte sotto forma di questionari, cioè di metodi che consentono una standardizzazione dell'esame psicologico o psichiatrico e richiedono il calcolo di indici relativi alla coerenza e alla sincerità delle risposte. Essi possono consistere in: una serie di domande aperte, alle quali l'esaminato può dare una qualsiasi risposta; domande a scelta multipla, in cui la risposta deve essere scelta in una serie già prefigurata; ovvero una serie mista, in parte del primo tipo e in parte del secondo. Fra i test a carattere clinico rientra un questionario largamente diffuso nel continente americano e applicato in seguito sistematicamente anche nei paesi europei: il Minnesota multiphasic personality inventory. In base alle risposte date dal soggetto ad alcune centinaia di domande si ricava un profilo delle sue tendenze patologiche. È infatti possibile valutare quantitativamente il livello raggiunto dagli aspetti isterici, ipomaniacali, depressivi, paranoici ecc. della sua personalità e giungere, considerando ogni singolo aspetto e soprattutto comparando il ruolo svolto dalle diverse tendenze patologiche, a una diagnosi che si può ritenere statisticamente convalidata; è altresì possibile il riconoscimento, negli individui non malati, delle tendenze patologiche più rilevanti al momento della prova.
Ai questionari di carattere clinico si aggiungono quelli che esaminano gli interessi, le opinioni, gli atteggiamenti, le motivazioni. Fra i test sincretici rientrano i cosiddetti test proiettivi, che si propongono di ottenere la conoscenza della personalità dei soggetti utilizzando appunto il meccanismo della proiezione. Quest'ultimo termine deve essere inteso non nel ristretto senso psicoanalitico, come meccanismo di difesa da perturbamenti degli strati profondi della personalità, e neppure nel significato estensivo del pensiero comune, che rinvia alla concezione secondo la quale in ogni atto umano si esprimono elementi della personalità. La proiezione che caratterizza questa categoria di test è quella che si attua (Rapaport 1948) quando la struttura psicologica del soggetto diviene evidente nelle sue azioni, nelle sue scelte, nei suoi prodotti e creazioni. Una tecnica capace di realizzare questa evenienza è detta appunto tecnica proiettiva. Il materiale usato in tale tecnica funge da lente di proiezione e i dati registrati rappresentano lo schermo con l'immagine della personalità, messa a fuoco e ingrandita, proiettata su di esso. Naturalmente i test proiettivi realizzano le condizioni proprie delle tecniche proiettive in genere; essi nondimeno mantengono le caratteristiche comuni a tutti i test, quelle cioè di rappresentare una situazione standard e di usufruire di una valutazione dei propri risultati statisticamente valida e comparabile.
Fra i test proiettivi i due maggiormente entrati nell'uso sperimentale e nell'applicazione clinica sono il test di Rorschach e quello di Murray, il Thematic apperception test. Il test di Rorschach si attua sottoponendo al soggetto dieci tavole a contenuto non definito, cinque delle quali a colori e cinque in bianco e nero, e nel chiedergli di riferire che cosa ciascuna di esse potrebbe rappresentare. Vengono registrate tutte le risposte e le eventuali osservazioni. Ogni risposta è valutata in riferimento a una serie di criteri rigorosamente definiti. Dal complesso dei dati raccolti, e soprattutto dalla loro comparazione, dal valore offerto da alcuni rapporti e dalle caratteristiche di certe formule si può costruire un'immagine della personalità del soggetto, sia nei suoi aspetti fisiologici sia nelle sue caratteristiche patologiche. A questo proposito è ancora da rilevare che alcuni tipi di risposte hanno assunto ormai un significato che si può considerare patognomonico per certi quadri patologici.
Il Thematic apperception test comprende tre serie di dieci tavole ciascuna: la prima serie è applicata a tutti i soggetti, la seconda solo a quelli di sesso maschile, la terza esclusivamente agli individui di sesso femminile. Sulle tavole sono riprodotte scene con uno o più personaggi in atteggiamenti sufficientemente ambigui per permettere interpretazioni diverse. Si chiede al soggetto di raccontare che cosa è avvenuto antecedentemente alla situazione riprodotta nella tavola, che cosa si sta svolgendo nella situazione stessa e quale sarà la conclusione della storia. Le figure sono scelte in modo da evocare situazioni di conflitto, soggettivo o interindividuale, o situazioni scabrose. La valutazione dei dati raccolti tiene conto sia delle caratteristiche formali che si ritrovano nella struttura della storia, sia delle caratteristiche del contenuto. Vengono così esaminati, da una parte, l'adeguatezza della riposta alle istruzioni e la consistenza delle storia, dall'altra, quello che si può considerare il tono prevalente in esse, i personaggi, gli atteggiamenti. Dal complesso di tutti i racconti così analizzati e dall'integrazione dei dati desunti da ciascuno di essi è possibile ricavare un giudizio soddisfacente sulla dinamica della personalità del soggetto esaminato, sull'esistenza di eventuali alterazioni rispetto alla norma, sui motivi che tali alterazioni determinano o sostengono. Fra i test proiettivi, molti dei quali elaborati per l'esame della popolazione infantile, rientrano quelli fondati sul disegno di certi contenuti (albero, figura umana, famiglia ecc.) e quelli che utilizzano materiale da organizzare (villaggio, gioco delle bambole ecc.).
a. anastasi, I test psicologici, Milano, Angeli, 19957.
p. boncori, Teoria e tecniche dei test, Torino, Bollati Boringhieri, 1993.
r.b. cattel, A guide to mental testing, London, University of London Press, 1948.
m. cesa-bianchi, I tests mentali: il loro significato, le loro applicazioni, "La Settimana Medica", 1952, 16, pp. 425-31.
id., I tests di livello, "I Licei e i loro Problemi", 1968, 2-3, pp. 99-108.
l.j. cronbach, Essentials of psychological testing, New York, Harper, 1949 (trad. it. Firenze, Martello-Giunti, 1977).
j.p. guilford, Psychometric methods, New York, McGraw-Hill, 1936.
p. pichot, Les tests mentaux en psychiatrie, Paris, PUF, 1949.
d. rapaport, Diagnostic psychological testing (the theory, statistical evaluation and diagnostic application of a battery of tests), Chicago, Year Book, 1948.
d. wechsler, The measurement of adult intelligence, Baltimore, Williams and Wilkins, 1939.