Il problema mente-cervello
Le possibili soluzioni del problema mente-cervello devono oggi più che mai tener conto della crescente quantità di dati empirici forniti dalle neuroscienze, del recente sviluppo di alcuni potenti approcci teorici alla natura della conoscenza e dell'applicazione sempre più approfondita nella psicologia e nelle neuroscienze del processo scientifico noto come riduzione interteorica o spiegazione interstratificata. In questo saggio intendiamo esaminare questa problematica nel suo contesto storico, illustrare i principali approcci empirici attualmente adottati e le prove a loro favore, nonché tentare una valutazione dello stato attuale del dibattito. Cercheremo di controbattere le argomentazioni con cui numerosi studiosi hanno messo in discussione la realizzabilità di un approccio riduzionista e, infine, concluderemo dimostrando che il problema mente-cervello è divenuto un problema principalmente scientifico, e che, quindi, deve essere affrontato come tale.
Alla fine del 20° secolo, il problema mente-cervello non ha ancora ricevuto una soluzione universalmente accettata. Troppe alternative contrastanti, troppi pregiudizi di natura filosofica, e una ricerca scientifica ancora insufficiente impediscono di ordinare le conoscenze in un quadro conclusivo e privo di ambiguità.
Nonostante queste incertezze, tuttavia, il dibattito non è più ostacolato dall'improvvisazione. Le alternative teoriche a disposizione sono oggi più chiare e possono avvalersi di un apparato di conoscenze scientifiche senza precedenti. Inoltre, i sempre nuovi contributi empirici forniti dalle varie branche delle neuroscienze ci permettono di valutare con nuovi strumenti ogni soluzione alternativa per individuare quella più coerente con i fatti. Lo scopo di questo saggio è di illustrare in modo chiaro il contenuto e le premesse delle principali ipotesi di soluzione al problema mente-cervello, sottoponendo ad analisi gli argomenti pro e contro ognuna di esse. Ciò permetterà al lettore di venire a conoscenza del dibattito così come si configura attualmente senza perdere contatto con la sua prospettiva storica.
Tradotto in termini semplici, il problema mente-cervello può essere esposto come segue. Qual è l'autentica natura dei vari fenomeni mentali che caratterizzano la coscienza negli esseri umani, e in che modo essi sono correlati ai fenomeni fisici che si manifestano nel corpo umano e nel suo sistema nervoso centrale? Meno chiare, seppure di grande interesse, sono le numerose risposte con cui si è tentato di replicare a questa domanda apparentemente ingenua. Incominciamo ad analizzare le più importanti.
La prima antitesi: le soluzioni materialiste contro quelle dualiste
Nella storia delle idee, la prima divergenza sul tema che affrontiamo è quella tra materialismo e dualismo, divergenza che già la filosofia greca aveva reso evidente. Secondo Democrito, i fenomeni mentali che si producono all'interno della testa sono soltanto esempi della complessa attività che caratterizza gli atomi in movimento nello spazio. Secondo Platone, invece, il sé pensante è un'entità non fisica, ma sovrasensibile, con un' esistenza indipendente dalla sua incarnazione transeunte nella materia (fig. 1).
Duemila anni dopo, nell'Europa postrinascimentale questo stesso conflitto ha caratterizzato il dibattito tra il filosofo inglese Thomas Hobbes, sostenitore di una versione rivisitata della posizione democritea, e il filosofo e matematico francese René Descartes, difensore di una posizione molto simile a quella di Platone. Per Hobbes l'attività cognitiva non è che una forma complessa di computazione, cioè un'attività di cui è capace anche un sistema puramente fisico. In questo modo Hobbes anticipava la posizione dei funzionalisti moderni e degli studiosi dell'intelligenza artificiale, di cui si parlerà più avanti. Secondo Descartes, invece, la conoscenza è l'attività specifica di un'entità particolare (res cogitans), una sostanza totalmente distinta dalla materia (res extensa) il cui ambito specifico di attività è lo spazio nella sua estensione.
Tuttavia Descartes era anche un valente fisico e, rispetto a Platone, aveva una concezione molto più sofisticata della complessa realtà 'meccanica' del cervello e dell'organismo. Egli tentava di spiegare i processi sensoriali e motori in termini di attivitàmeccaniche all'interno del sistema nervoso, e arrivò a ipotizzare l'esistenza di una base fisica per la memoria. Tuttavia Descartes considerava l'autocoscienza e l'esercizio della ragione impossibili per la pura materia, e sosteneva che questi fenomeni mentali centrali possono manifestarsi soltanto nella sostanza senza spazio e senza materia, la res cogitans.
Questa visione del mondo, denominata dualismo cartesiano o dualismo della sostanza, è sufficientemente precisa da suggerire una domanda imbarazzante: se il sé mentale e quello fisico sono tanto diversi l'uno dall'altro, perchè i desideri e la ragione causano reazioni fisiologiche?
Il problema è semplice e chiaro. Secondo le leggi della fisica il movimento di ogni oggetto materiale nello spazio è sempre governato dalla conservazione dell'energia e della quantità di moto. Di conseguenza, un minimo cambiamento di energia o di quantità di moto che avvenisse in qualsiasi punto del cervello e che non fosse ancora pienamente spiegato dalla sua interazione con un altro agente fisico dotato di energia o di quantità di moto, rappresenterebbe una violazione del primo principio della termodinamica sulla conservazione dell' energia o di quello sulla conservazione della quantità di moto in un sistema isolato, oppure di entrambi (fig. 2). In apparenza, dunque, il mondo fisico è 'causalmente chiuso'. Il prezzo che si paga per separare, a livello ontologico, la mente cosciente dall 'universo fisico è quello di escluderla anche dal punto di vista della dinamica. Si può insistere sul ruolo causale di tale 'sostanza-mente' così svilito solo qualora si sia disposti a negare la validità di due dei più importanti principi della fisica.
Descartes non fu in grado di risolvere questo problema; né altri lo sono stati dopo di lui. Il nocciolo della questione, tuttavia, era e rimane quello di ricondurre i fenomeni mentali a una forma di interazione con i fenomeni fisici, coerente e accettabile dal punto di vista scientifico. A meno di non rinunciare all'approccio scientifico, la sola alternativa sarebbe quella di abbandonare l'assunto secondo cui le esperienze sensoriali e il ragionamento pratico provocano alcune nostre reazioni fisiche. Ma senza questo assunto di base, si nega alla mente alcun ruolo esplicativo, per lo meno per ciò che concerne il comportamento umano.
Alcuni pensatori contemporanei (per esempio il premio Nobel John Eccles) sperano ancora di fare nuovamente confluire la sostanza non fisica di Descartes nella sfera della dinamica, fornendole una collocazione adeguata nel mondo della fisica e dei processi energetici (Popper e Eccles, 1977). Ma questa speranza non è condivisa né dai dualisti né dai materialisti. In primo luogo, perchè una tale posizione di compromesso può sembrare una rinuncia a quanto il dualismo considera essenziale e una resa velata al materialismo. In secondo luogo, ammesso che qualcuno sia disposto a pagare questo prezzo, nessuno è stato ancora in grado di formulare una ipotesi non fisica di questo genere in modo da permettere di analizzarla o verificarla. In terzo luogo, la ricerca empirica contemporanea che ha analizzato nei minimi dettagli 'l'economia fisica' del cervello, non ha messo in luce alcun 'vuoto energetico' che debba essere riempito dalle attività della 'sostanza mentale'. Al contrario, il cervello appare come un elemento perfettamente funzionante e integrato di quell'universo fisico 'causalmente chiuso' da cui è scaturito il problema dell'interazione mentecervello. Secondo i risultati in nostro possesso, sembra che su questo argomento i sostenitori del dualismo tradizionale abbiano poche speranze.
Questo ordine di riflessioni ha spinto alcuni pensatori (di cui forse il primo fu Thomas Huxley, famoso collega di Charles DaIwin) a mettere da parte il dualismo cartesiano o della sostanza a favore di una visione denominata dualismo della proprietà o epifenomenalismo. Questa scuola di pensiero rinuncia a intendere la mente come una sostanza non fisica, ma rimane legata all'idea che esista una gamma di stati, eventi e proprietà non fisiche. Nel loro insieme questi elementi speciali (come, per esempio, il dolore, le emozioni, le credenze, le decisioni, le sensazioni) costituiscono una sorta di sfondo della vita mentale di ogni individuo e sono considerati stati e proprietà non fisiche del cervello che, pur essendo prodotte dai suoi processi materiali, tuttavia non producono a loro volta effetti causali sul cervello fisico che le ha generate (fig. 3). Gli effetti causali che dalla sfera fisica passano a quella mentale non comportano necessariamente una violazione delle leggi fisiche, cosa che avviene invece, come abbiamo visto, con gli effetti causali che dalla sfera mentale passano a quella fisica. Di conseguenza, secondo l'ipotesi del dualismo della proprietà, i fenomeni mentali sono del tutto reali ma ininfluenti dal punto di vista causale. Per questo non sono che epifenomeni, caratteristiche evanescenti la cui danza si limita solo a rispecchiare pigramente il flusso delle attività puramente fisiche del cervello. In questo modo, possiamo evitare di violare i principi di conservazione dell'energia e della quantità di moto. Le motivazioni di ciò sono molto chiare: ci si propone di rispettare l'autorevolezza esplicativa delle scienze fisiche rispettando al tempo stesso l'evidenza dell'introspezione (gli stati mentali sono reali!).
Purtroppo, come abbiamo già precedentemente ricordato, questa posizione teorica ha il limite di essere in contraddizione con ogni spiegazione che tenti di dare conto del comportamento umano in termini di stati mentali consapevoli. Le conseguenze dell'accettazione dell' epifenomenalismo (l'inefficacia causale ed esplicativa degli stati mentali) appaiono generalmente troppo gravi per essere accettate. Una posizione più accomodante è discussa nell' opera dei filosofi australiani F. Jackson (1982) e D. Chalmers (1996). Esiste una soluzione meno estrema che possa armonizzare le diverse esigenze? l materialisti moderni ne sono convinti.
La seconda antitesi: le soluzioni riduzioniste contro quelle antiriduzioniste
Secondo la più semplice delle numerose teorie materialiste, all'interno del cervello fisico gli stati e i processi mentali sono assolutamente identici ad alcuni stati e processi fisici. Questa teoria, denominata teoria dell 'identità o materialismo riduzionista, non subisce i vincoli dei problemi di natura dinamica che gravano sui dualisti. Poiché, secondo questa teoria, gli stati e i processi mentali non sono che un sottoinsieme degli stati e dei processi fisici in genere, la loro partecipazione all'economia causale del mondo non viola alcuna legge fisica. In questo modo viene ripristinato il ruolo causale degli stati mentali e riaffermata la loro realtà (fig. 4).
I materialisti che aderiscono a questa teoria sostengono che, per il caso in questione, la storia della scienza in vari momenti ha offerto il medesimo insegnamento. Si prenda per esempio il fenomeno del suono. La percezione cosciente iniziale del suono, attraverso l'orecchio umano e la sua coclea interna, non dà alcuna indicazione circa la vera natura di questo fenomeno oggettivo. Sono state necessarie una teorizzazione creativa e una sperimentazione meticolosa per rivelare ciò che esso realmente è. Il suono, abbiamo appreso, è una sequenza di onde di compressione dell'aria che viaggia nell'atmosfera, di cui percepiamo il grado di compressione in termini di altezza del suono e le diverse lunghezze d'onda in termini di toni differenti. Questi e altri aspetti del suono (la velocità, il carattere tonale, le ottave, l'eco, l'assorbimento) vengono spiegati in modo sistematico grazie alla conoscenza dei diversi aspetti della realtà fisica sotto stante e del suo comportamento dinamico. Si può dimostrare così che l'esistenza e il carattere del suono sono una conseguenza delle leggi naturali che governano una realtà più profonda di cui il suono non è che un riflesso parziale.
Lo stesso discorso vale per la temperatura. La nostra pelle possiede recettori termici che tuttavia, di per sé stessi, non spiegano la vera natura del calore. Sappiamo che la temperatura è associata all'energia cinetica delle molecole con cui sono formate le sostanze solide, liquide e gassose che ci circondano. Uno stato di agitazione più o meno intenso di tali molecole viene percepito in termini di temperatura più o meno alta. Anche in questo caso spieghiamo in modo sistematico i fenomeni termici in quanto interpretiamo fenomeni a noi familiari mediante la conoscenza di alcuni aspetti di una realtà teorica sotto stante che familiare non è.
Un terzo esempio è costituito dalla luce. La nostra retina possiede cellule sensibili alla luce, che di per sé stesse non ne spiegano la vera natura. La ricerca ci ha insegnato che la luce visibile è formata da onde elettromagnetiche la cui lunghezza d'onda è meno di un milionesimo di metro. Lunghezze d'onda differenti vengono percepite e concettualizzate come colori differenti. Ancora una volta tutti i fenomeni ottici che ci sono familiari vengono spiegati in modo sistematico mediante la conoscenza dei relativi fenomeni elettromagnetici. La luce visibile appare perciò un fatto sorprendente non soltanto per la sua natura (inizialmente, chi avrebbe potuto pensare che i campi elettrici e magnetici potessero avere a che fare con la luce?), ma anche perché essa costituisce solo una piccola parte di uno spettro vasto e invisibile di onde elettromagnetiche che va dai raggi X e γ con lunghezze d'onda molto brevi alle microonde e alle onde radio.
Tutti questi sono esempi appropriati di ciò che i filosofi della scienza definiscono riduzione interteorica. In questi tre casi il contenuto e l'andamento di alcuni fenomeni, che precedenti teorie o strutture concettuali avevano individuato, vengono spiegati in modo sistematico. Tale spiegazione proviene dall'identificazione degli elementi dell'insieme originario di fenomeni con gli elementi di un nuovo insieme, elaborato grazie a una teoria più avanzata e innovativa. Alla luce delle risorse esplicative della nuova teoria, all'improvviso fenomeni già noti acquistano un significato nuovo e più sistematico.
La lezione ottimistica del materialismo riduzioni sta è che potremo comprendere ulteriormente la sfera dei fenomeni mentali consci mano a mano che lo sviluppo delle neuroscienze ci consentirà di esaminarli secondo un approccio riduzionistico. Fino a oggi gli esseri umani hanno potuto avere accesso solo ad alcuni dei propri stati mentali grazie ai meccanismi innati della consapevolezza di sé e dell'autorappresentazione, ma non possediamo alcuna prova del fatto che tali meccanismi innati possano, di per sé stessi, rivelare la vera natura di quei fenomeni. Così come non abbiamo neppure buone ragioni per credere (ricordiamo l'esempio della luce) che tali meccanismi innati siano in grado di rivelare molto della realtà più profonda. I sostenitori del materialismo riduzioni sta ritengono che sarà possibile spiegare in modo adeguato e sistematico i fenomeni mentali mano a mano che verranno messi in relazione con fenomeni neurofisiologici a essi correlati. Quando ciò avverrà, avremo una conoscenza della mente altrettanto dettagliata di quella che abbiamo già raggiunto per i fenomeni del suono, della temperatura e della luce.
Questa è una prospettiva emozionante, ma per portare a compimento il proprio programma scientifico il materialismo riduzioni sta dovrà impegnarsi a fondo. Tuttavia, c'è chi dubita che ciò possa avvenire in tempi brevi. Non a caso molte obiezioni vengono avanzate da rappresentanti del dualismo i quali sostengono che se il loro paradigma è afflitto da problemi cronici di natura ontologica e di interazione, nemmeno il materialismo riduzioni sta ne è esente. Esso, infatti, non sembrerebbe in grado di spiegare in primo luogo il carattere qualitativo incomunicabile dell'esperienza sensoriale, né il contenuto semantico (il significato o intenzionalità) dei pensieri, e neppure l'esistenza di un modo di accesso conscio e intimo ai propri stati mentali. Poiché questi sono problemi che ogni teoria della mente da noi presa in considerazione è chiamata ad affrontare, li discuteremo globalmente più avanti. Di interesse più immediato sono due obiezioni di natura molto diversa mosse al materialismo riduzionista, che non sono state sollevate dai dualisti, bensì dai materialisti stessi.
La prima obiezione si ricollega alla nota teoria denominata funzionalismo (v. figura 4). I funzionalisti sostengono che la specificità della neurofisiologia umana non è probabilmente essenziale per produrre i fenomeni mentali. Creature con una struttura biologica diversa potrebbero giungere agli stessi risultati cognitivi con mezzi fisici diversi. E perfino un sistema non biologico fatto, per esempio, di rame, silicio e germanio potrebbe raggiungere lo stesso fine se possedesse un'organizzazione interna adeguatamente analoga.
I materialisti riduzionisti potrebbero trovare queste osservazioni degne di interesse. Ma i funzionalisti desiderano trarre da esse una conclusione nettamente antiriduzionista. Sarebbe errato, sostengono i funzionalisti, far coincidere l'essenza del dolore con qualcosa di specificamente umano, o con qualcosa di specificamente fisiologico, perchè questo ci impedirebbe di riconoscere che anche creature non umane o non biologiche possano provare dolore. Anziché cercare di ridurlo a qualcosa di più semplice, dovremmo riconoscere che l'essenza del dolore è qualcosa di più astratto, secondo il celebre argomento della realizzabilità multipla, considerato centrale nel funzionalismo.
In particolare, continuano i funzionalisti, dovremmo riconoscere che ciò che trasforma uno stato fisico in dolore è l'insieme caratteristico di rapporti causali astratti che esso intrattiene con input sensoriali esterni, con altri stati mentali e con output di comportamento. Per esempio, una caratteristica del dolore è quella di essere provocato da tensioni o lesioni che colpiscono l'organismo; a loro volta queste provocano altri stati mentali, come impazienza, sofferenza e desiderio di guarigione; provocano inoltre trasalimento, pianto e attenzione alla parte lesa. È questo profilo funzionaie che costituisce l'essenza del dolore (da cui il termine "funzionalismo"), e non i dettagli di un possibile substrato fisico, in questa o quella creatura, destinato a dare forma a quel profilo astratto.
Ciò che abbiamo detto per il dolore vale per tutti gli altri stati mentali, secondo questa argomentazione. L'essenza di ogni tipo di stato mentale risiede nel suo peculiare ruolo causale o funzionale nell'ambito generale dell'economia cognitiva di una data creatura. Inoltre, i profili funzionali rilevanti ci sono già noti, per lo meno nei loro tratti principali e risiedono nella conoscenza di senso comune che abbiamo dei numerosi termini abitualmente utilizzati per descrivere gli stati mentali. Secondo questa prospettiva, ciò che le neuroscienze umane scopriranno sarà soltanto il meccanismo grazie al quale tali profili funzionali si realizzano nello specifico substrato del cervello di Homo sapiens. A questo proposito si usa dire talvolta che le neuroscienze indagano soltanto i 'dettagli tecnici' della conoscenza nell'uomo e negli animali.
In verità, qualsiasi stato mentale (un mal di denti, per esempio) coinciderà con un appropriato stato fisico della creatura che lo sperimenta (per esempio, nel mal di denti, l'attività della fibra C si proietta verso l'area della bocca nella corteccia somatosensoriale). In questo modo il funzionalismo rimane risolutamente una teoria materialista, pur sostenendo che la coincidenza tra il mentale e il fisico (ammessa in un primo momento) è solo una coincidenza limitata, e non corrisponde alla coincidenza totale contemplata dal materialismo riduzionista. Sostengono i funzionalisti che coincidenze tra fisico e mentale di tipo altamente generale non si trovano.
Come si vedrà più avanti, grazie all'opera dei filosofi americani H. Putnam (1960), J.A. Fodor (1968) e D.C. Dennett (1978), il funzionalismo ha esercitato già al suo primo apparire una grande influenza, soprattutto sulla psicologia cognitiva e sull'intelligenza artificiale (lA). Ma sotto certi aspetti si è trattato di un'influenza negativa. Il funzionalismo ha incoraggiato a credere che conosciamo già la natura intima dei fenomeni cognitivi, per lo meno nei loro tratti più generali, e che sarebbe stato possibile ricreare artificialmente l'organizzazione funzionale caratteristica di un essere umano consapevole grazie a un so strato diverso da quello biologico umano ed indipendentemente da una plausibilità neurofisiologica, per esempio scrivendo programmi appropriati da impiegare con grandi e veloci calcolatori. Il risultato è stato quello di attribuire una completezza che forse non possiede, e un'autorevolezza che forse non merita, alla nostra capacità di comprendere i fenomeni cognitivi attraverso il senso comune. Un secondo risultato è stato quello di deviare l'attenzione dei ricercatori dall'unico campo di studi (quello della neurobiologia cognitiva) che avrebbe potuto opporre delle conoscenze sistematiche e autorevoli alla concezione compiacente o superficiale dettata dal senso comune. Inoltre, è ormai evidente che la critica operata originariamente dal funzionalismo nei confronti del materialismo riduzioni sta è stata superficiale e falsamente utile per le ragioni di seguito esposte.
Il suono può essere trasportato attraverso numerosi mezzi, diversi dall' atmosfera, ma questo non preclude una concezione riduttiva del suono in generale. Significa soltanto che qualora si voglia dimostrare una coincidenza riduttiva, è necessario scegliere livelli di generalizzazione appropriati: dobbiamo identificare il suono che si propaga nel mezzo M con le onde di compressione nel mezzo M. Il risultato è ancora un buon esempio di spiegazione riduzionistica, nonostante non si prenda in considerazione la natura dell'atmosfera terrestre.
Analogamente, calore e temperatura si possono manifestare in molte forme, in rapporto al mezzo usato. In un gas, per esempio, la temperatura è rappresentata dal valor medio dell' energia cinetica dei milioni di molecole in movimento che lo formano. In un plasma incandescente, per contro, non troviamo molecole o atomi perché essi sono stati distrutti dagli elevatissimi livelli di energia. Nel plasma, quindi, la temperatura è funzione dell'equilibrio dell'energia cinetica di milioni di particelle subatomiche con l'energia elettromagnetica di milioni di fotoni che si scontrano con violenza. Nel vuoto, infine, la temperatura si presenta secondo modalità ulteriormente diverse: è determinata dalla particolare distribuzione (la curva di emissione del corpo nero) dell' energia elettromagnetica che lo attraversa.
Ma questa varietà di condizioni non impedisce di dar conto del calore e della temperatura in termini riduzionisti. Significa soltanto che qualora si voglia operare un'analogia in questi termini, è necessario adottare livelli di generalizzazione idonei. In particolare è necessario, da un lato, far coincidere la temperatura di un qualsiasi mezzo con illivello di energia libera circostante presente nel mezzo, energia che può manifestarsi, come abbiamo visto, in forme molto diverse; dall'altro, dobbiamo far coincidere la quantità totale di calore di qualsiasi mezzo (escluso il calore latente) con la quantità totale di energia libera presente nel mezzo. Pur non tenendo in considerazione le peculiarità dei diversi mezzi, il risultato rappresenta un buon esempio di spiegazione riduzionistica. Lo scopo che il funzionalismo sembra prefiggersi è quello di mettere in discussione i possibili punti deboli del materialismo riduzionista. Ma in futuro, nell'applicazione dei propri metodi, i materialisti riduzionisti saranno liberi di scegliere i livelli di analisi più appropriati; nulla li obbliga a focalizzare l'attenzione esclusivamente sui dettagli della fisiologia umana. Infatti, e lo si vedrà più avanti, la migliore produzione teorica della ricerca neurobiologica cognitiva più recente propone modelli di organizzazione fisica e di attività neuronale collettiva che potrebbero essere realizzati in substrati fisici diversi dal tessuto cerebrale. Tuttavia, tali modelli costituiscono ancora interpretazioni potenzialmente riduzioniste dell'attività cognitiva e seguono lo stesso ragionamento adottato nei casi del suono, del calore e della luce.
I funzionalisti avevano ragione nell'insistere sulla possibilità di implementare i processi cognitivi su un mezzo diverso dal cervello, ma sono giunti a conclusioni azzardate affermando che ciò potesse precludere una spiegazione riduzionistica classica.
Come indicato in precedenza, il funzionalismo può anche essere in errore circa la forma essenziale del profilo funzionaIe astratto che costituisce un sistema cognitivo, anche appartenente al genere umano. Come si ricorderà, si pensa che questa essenza venga riflessa (per lo meno nelle sue linee generali) nella concezione che abbiamo di noi stessi dettata dal senso comune. Ma la comprensione che noi abbiamo comunemente delle forme basilari degli stati mentali, e della loro reciproca interazione, dipende essenzialmente dai caratteri logici e semantici che connotano il linguaggio. Noi pensiamo di credere che p, di desiderare che q, di temere che r, di sperare che s, di preoccuparci che t, di sospettare che p, di stupirci che q e così via, dove le minuscole in corsivo rappresentano frasi dichiarative mentre i rapporti funzionali tra questi diversi stati mentali (per esempio se temiamo che p, ovviamente speriamo che non-p) riflettono i rapporti logici e semantici tra le frasi dichiarative individuali usate per specificarne il contenuto. In sostanza, la concezione di noi stessi dettata dal senso comune è molto simile alla struttura combinatoriale, sintattica e semantica del linguaggio.
Almeno potenzialmente, ciò rappresenta un problema perché il regno animale è abitato da creature chiaramente cognitive, mentre soltanto gli esseri umani fanno uso dellinguaggio. Dobbiamo supporre che il sistema cognitivo di un topo, di un cane, di un rinoceronte o di qualsiasi altro animale produca il pensiero mediante la manipolazione di un sistema interno di rappresentazione analogo al linguaggio? O forse questa non è che un'ingenua proiezione su altre creature di un sistema caratteristico degli esseri umani? Poiché anche noi siamo animali e condividiamo con altre creature buona parte dell'organizzazione cerebrale e quindi buona parte delle capacità cognitive, assimilare la nostra attività cognitiva a un processo linguistico non potrebbe essere profondamente fuorviante e partigiano?
Questa è una domanda importante perché molte ricerche si basano sull'assunto che la conoscenza è ampiamente simile al linguaggio, e che essa consiste nell'elaborazione di stringhe di simboli fisici secondo un insieme idoneo di regole sensibili alla struttura. Tra i filosofi che hanno difeso dichiaratamente questa posizione ricordiamo lA. Fodor (1975) e, tra gli studiosi dell'intelligenza artificiale, A. Newell e H.A. Simon (1990). Di fatto questa ipotesi costituisce l'assunto che ha motivato quasi tutti gli studiosi di lA classica. Si è sostenuto infatti che poiché un calcolatore digitale può, in linea di principio, calcolare qualsiasi funzione computabile e poiché una creatura cognitiva può presumibilmente possedere una funzione adeguatamente sofisticata di input-ouput, di conseguenza, almeno in linea di principio, un computer digitale adeguatamente programmato dovrebbe essere in grado di ricreare tutte le attività funzionali essenziali di una creatura cognitiva consapevole. Naturalmente la funzione di un calcolatore programmato è proprio quella di elaborare delle stringhe di simboli secondo regole sensibili alla struttura. In questo modo la ricerca sull'intelligenza consapevole si è trasformata nella ricerca di un programma appropriato per calcolatori.
La ricerca classica sull'intelligenza artificiale, cosi come noi la conosciamo, ha ottenuto grandi successi e non vi è dubbio che ne mieterà altri nel futuro. Ma da qualche anno la sua fama è dovuta maggiormente alla curiosa natura di alcuni suoi insuccessi cronici che ai suoi successi (Dreyfus, 1992). Molti problemi cognitivi che vengono risolti facilmente dagli esseri umani si sono dimostrati sorprendentemente difficili per i calcolatori programmati. Il riconoscimento di un volto male illuminato e mostrato da un'angolatura inusuale, o il riconoscimento di una voce parzialmente coperta da rumore di fondo, il movimento di un sistema di muscoli e membra su un terreno diseguale, sono tutti compiti che un calcolatore digitale (anche se grande e veloce) potrebbe svolgere solo possedendo una memoria e un tempo di elaborazione incredibilmente elevati. Anche se i calcolatori, in linea di principio, sono in grado di elaborare tutto ciò che può essere elaborabile, essi sembrano incapaci di competere con un essere umano in termini di tempo. Un essere umano è in grado di espletare compiti come quelli sopra esposti in millesimi di secondo mentre il calcolatore, qualora sia abilitato a fado, impiega minuti o ore anche con i programmi più perfezionati. Tutto ciò è molto curioso, perché la velocità con cui viene trasmessa l'informazione all'interno di un calcolatore elettronico è superiore di circa un milione di volte a quella con cui si trasmettono gli impulsi nervosi nel cervello umano. Allo stesso modo, la frequenza di un moderno calcolatore digitale supera di circa un milione di volte le frequenze che si trovano nel cervello umano: 200 MHz contro 200 Hz. Ciononostante, nei compiti che abbiamo indicato, l'essere umano è molto più veloce. Come è possibile che la tartaruga superi la lepre?
Forse, come suggerito più sopra, ciò avviene perché la tartaruga compie il riconoscimento con mezzi diversi dalla manipolazione (guidata da programmi) di stringhe di simboli interni simili al linguaggio. Il problema è scoprire quali siano questi mezzi diversi.
La terza antitesi: le soluzioni revisioniste contro quelle conservatrici
È naturale che chi, come noi, comunica mediante una lingua sia portato a credere a un nesso tra questa e l'informazione, e che l'elaborazione dell'informazione comporti la manipolazione di rappresentazioni simili al linguaggio. Tuttavia la natura può rivelarci che queste supposizioni possono essere non soltanto superficiali, ma anche false. Infatti, la ricerca empirica sulle microstrutture del cervello e i sorprendenti recenti risultati delle simulazioni al calcolatore mediante le reti neurali, indicano che la strategia computazionale di base impiegata dal cervello biologico differisce in modo significativo dalla strategia impiegata dai calcolatori digitali programmabili. Qui di seguito discuteremo le principali differenze. Una tipica popolazione neuronale del cervello, per esempio la retina, il nucleo genicolato laterale (NGL) o la corteccia visiva primaria, è formata da molti milioni di neuroni diversi e a ogni rappresentazione specifica elaborata da ciascuna popolazione di cellule corrisponde un modo specifico di attivazione neuronale. Si potrà comprendere meglio questo concetto generale prendendo a esempio la retina, dove la rappresentazione di una scena esterna è paragonabile a quella di uno schermo televisivo: un insieme di livelli di luminosità generato da una vasta popolazione di minuscoli punti, o pixel. Nell'occhio, i coni e i bastoncelli costituiscono i pixel e i livelli di eccitazione o attivazione di ogni pixel rappresentano i livelli individuali di luminosità. Il punto importante in questo caso non è il carattere pittorico bidimensionale della rappresentazione, bensì il suo carattere vettoriale: cioè la sua struttura come insieme ordinato di valori di attivazione. Anche le cellule uditive della coclea, per esempio, rappresentano una realtà esterna (acustica) e, pur non formando di per sé un'immagine, rappresentano la struttura del suono in arrivo mediante una distribuzione di frequenze, e ciò per mezzo di un insieme ordinato di livelli di attivazione di cellule cocleari selettivamente sensibili a una data frequenza. Questo stesso meccanismo opera nella formazione della rappresentazione da parte delle popolazioni neuronali preposte alle altre modalità sensoriali, nonché in tutte le altre popolazioni neuronali del cervello. Anche la rappresentazione momentanea a livello dell'NGL costituisce un insieme di attivazioni dei suoi neuroni, parallelamente a quanto si verifica nella corteccia visiva primaria. Di conseguenza, la prima importante differenza con i calcolatori digitali seriali è il fatto che queste rappresentazioni vettoriali sono espressione di molti milioni (a volte miliardi) di elementi costitutivi, proprio perché le popolazioni neuronali coinvolte sono molto grandi. D'altra parte una rappresentazione momentanea di un calcolatore si caratterizza per il fatto di essere limitata a soli 16 o 32 o (in un elaboratore di grandi dimensioni) forse 64 elementi o bit di informazione ciascuno dei quali (nel codice binario) può assumere soltanto due valori, 0 o 1; al contrario, il livello di attivazione di ogni neurone può variare gradualmente secondo una considerevole gamma di valori. La capacità di rappresentazione istantanea del sistema neuronale, quindi, supera quella di un calcolatore di nove o dieci ordini di grandezza.
La seconda importante differenza riguarda il modo in cui questi due sistemi svolgono i loro calcoli sulla base delle rispettive modalità di rappresentazione. Nel cervello, ogni popolazione di neuroni invia alla successiva popolazione la propria rappresentazione collettiva per mezzo di milioni di assoni, ognuno dei quali è in contatto con numerose cellule differenti della popolazione ricevente per mezzo di centinaia, se non addirittura migliaia, di connessioni sinaptiche. Nel passaggio attraverso questi miliardi di sinapsi, ognuna delle quali possiede la propria 'importanza' o peso, il pattern originario si trasforma in un pattern nuovo e differente di attivazione, che ora è realizzato dai neuroni della popolazione ricevente (fig. 5).
Da un punto di vista matematico, questo processo è un esempio di moltiplicazione di un vettore a n dimensioni (cioè l'insieme di attivazioni provenienti da n assoni) per una matrice n x m, cioè il pattern di connessioni sinaptiche di vario peso, per fornire come output un vettore a m dimensioni, cioè il pattern di attivazioni risultante nella popolazione ricevente di m neuroni. Questa trasformazione globale da vettore a vettore ha luogo nell'arco di millisecondi e tutta in una volta, perchè tutte le sinapsi introducono contemporaneamente la propria minuscola modifica. Questa attività è denominata elaborazione distribuita e parallela. È distribuita in quanto la computazione è suddivisa tra circa un miliardo di elementi che partecipano a essa ed è parallela in quanto gli elementi che vi partecipano danno il proprio contributo in maniera indipendente e sincrona. Per un sottosistema neurale a due strati ciò si traduce nella realizzazione, in una minuscola frazione di secondo, di un miliardo di computazioni elementari. Per il cervello nel suo complesso, che contiene circa 100 milioni di miliardi di sinapsi, ciò significa un potenziale di 10¹⁴ computazioni elementari entro una frazione di secondo, un valore molto più elevato di quello delle 10⁹ computazioni elementari per secondo effettuate dai più recenti calcolatori. Il cervello non può sperare di eguagliare la velocità con cui i calcolatori elettronici ripetono un ciclo di calcolo, ma può compensare questa debolezza effettuando contemporaneamente molti passi computazionali distinti.
Di conseguenza, possediamo una presuntiva spiegazione del meccanismo grazie al quale il cervello biologico supera i calcolatori digitali guidati da un programma, per lo meno in una vasta gamma di compiti cognitivi quali il riconoscimento di un oggetto e la coordinazione sensomotoria. La spiegazione risiede nelle forme speciali di rappresentazione e computazione impiegate dall'architettura massicciamente parallela del cervello, perfettamente adattate ai bisogni cognitivi di base di un organismo mobile che deve essere in grado di affrontare i rischi di un mondo complesso.
È utile ribadire che queste forme di rappresentazione e di computazione sono molto diverse da quelle formalmente e semanticamente simili al linguaggio che gli studiosi di lA hanno elaborato per programmare i calcolatori digitali. Esse sono molto diverse, inoltre, dalle modalità, specificamente di tipo linguistico, di rappresentazione e computazione che noi esseri umani ci attribuiamo reciprocamente quando usiamo il vocabolario psicologico del senso comune. In poche parole, l'organizzazione funzionale fondamentale dell'attività cognitiva del cervello biologico (per lo meno quella dei cervelli semplici) non corrisponde minimamente alla concezione di noi stessi dettata dal senso comune.
Come armonizzare fra loro due immagini tanto diverse dell'attività cognitiva umana? Questo problema è particolarmente pressante per il materialismo riduzionista che spera di ricostruire l'immagine del senso comune mediante le risorse concettuali e matematiche che le recenti conoscenze neurobiologiche stanno prospettando. La ricostruzione almeno parziale delle nostre attività cognitive paralinguistiche dovrà basarsi per forza sugli apporti della neurobiologia cognitiva, poiché tutte le parti in causa di questo dibattito concordano sul fatto che gli esseri umani adulti usano il linguaggio e l'aritmetica, due sistemi che si presumono essere di tipo ricorsivo. Il successo di questo processo ricostruttivo sarà una misura dell'adeguatezza del genere di ricerca neurobiologica che si sta impiegando. I primi risultati ottenuti dallo studio di reti artificiali di modelli di competenza grammaticale (Elman, 1992; Christiansen e Chater, 1994) lasciano sperare che questa esigenza potrà essere soddisfatta. Le reti dotate di un'architettura riscorsiva si sono dimostrate capaci di apprendere semplici grammatiche generative, come si è visto dall' alta qualità dei compiti di discriminazione tra sequenze lessicali grammaticali e sequenze non grammaticali da esse eseguiti. Ma, se è stato possibile spiegare una delle nostre numerose capacità cognitive, cioè il linguaggio, non si è ancora in grado di confermare l'opinione comune secondo cui tutte le nostre rappresentazioni e le nostre attività cognitive sono di carattere paralinguistico. Al contrario, sorge il forte dubbio che pochissime di esse possiedano un tale carattere. Sorge anche il dubbio che la nostra concezione dell'attività cognitiva sia riduttiva e fuorviante, che debba essere sostanzialmente riveduta oppure drasticamente sostituita da un'ipotesi scientifica più accurata. Questo dubbio ha prodotto una teoria denominata alternativamente materialismo revisionista o materialismo eliminatorio (Feyerabend, 1981; Churchland, 1979; 1981), a seconda dell'entità dei cambiamenti concettuali che ci si attende per il futuro. Anche in questo caso la storia della scienza può fornire alcuni parallelismi istruttivi.
La teoria classica del calore è stata modificata in termini riduttivi mediante la più tarda teoria cinetico-corpuscolare. Tuttavia, non si deve dimenticare che nel corso di questo processo è stato necessario sottoporre la teoria originaria a correzioni o revisioni sostanziali. Per esempio, il ben noto secondo principio della termodinamica venne dichiarato falso e sostituito con una legge statistica molto più debole. Il calorico, ovvero l'evanescente sostanza che per lungo tempo la scienza ha considerato costituire il calore stesso, venne a un certo punto dichiarato totalmente inesistente. Il concetto di calore venne riformulato in termini di energia molecolare e l'espressione "calorico" venne eliminata completamente dal nostro vocabolario scientifico. Nel complesso questo evento si è prodotto all'insegna della moderazione in quanto si è salvato più di quanto non sia andato perduto. Ciò che della teoria è stato recuperato con successo è più importante di ciò che è stato riveduto o eliminato, e questo spiega perché, nonostante la modestia delle revisioni introdotte, essa venga comunemente adottata quale esempio di procedimento riduzionistico.
Ma la storia ha registrato capovolgimenti molto più drammatici. Un evento che si presenta nettamente con i connotati dell'eliminazione fu la sostituzione della teoria e del vocabolario propri della tradizione alchemica, con la nuova chimica degli elementi fondata da A.L. Lavoisier. In questo caso numerose espressioni alchemiche e della chimica prelavoisieriana vennero sostituite, prima gradualmente poi in modo totale, dalla terminologia scientifica più sistematica che designò gli elementi chimici e il loro combinarsi in composti chimici regolato da numeri interi. La teoria degli spiriti e delle essenze che aveva dato vita all'antico vocabolario alchemico venne sostituita dalla teoria dei pesi atomici, delle valenze chimiche e delle reazioni endo- ed esotermiche, e si formò così un nuovo vocabolario. L'alchimia aveva riunito sotto di sé una complessa miscela di pratiche riguardanti i metalli, la medicina e le attività produttive, di cui molte, seppure ridefrnite e riconcepite all'interno della struttura concettuale della chimica moderna, sopravvissero alla rivoluzione; tuttavia, molte altre scomparvero completamente per essere sostituite da pratiche più illuminate ed efficaci.
Questo esempio storico, più clamoroso del precedente, può rappresentare un caso di estremo revisionismo introdotto dal materialismo eliminatorio. Le aspettative dei suoi sostenitori sono che il vocabolario da noi impiegato per spiegare stati e attività cognitive, dettato dal senso comune e da un sistema esplicativo popolare, venga eliminato in futuro per fare posto a una terminologia descrittiva più accurata e a una struttura esplicativa più appropriata, che la neurobiologia cognitiva nel suo pieno sviluppo dovrebbe fornire. Senza dubbio la nostra vecchia struttura concettuale (paralinguistica) si basa su una complessa mescolanza di pratiche cognitive e sociali, molte delle quali potranno essere conservate senza consistenti modifiche anche dopo la rivoluzione che avverrà, ma saranno riformulate all'interno della nuova struttura. Molte altre di queste pratiche, tuttavia, verranno liquidate in quanto vuote e senza senso e sostituite, a nostro comune beneficio, da pratiche cognitive e sociali più illuminate ed efficaci (fig. 6).
In questo contesto, la concezione attuale della mente non è spiegata in termini fisici, così come pretenderebbe il materialismo riduzioni sta. Piuttosto, è la vecchia concezione 'popolare' che viene considerata priva di valore o non praticabile per una ricostruzione esplicativa sistematica in termini fisici, poiché essa travisa chiaramente la realtà dei processi cognitivi. Essa sarà quindi destinata a essere sostituita da una concezione più accurata delle nostre attività cognitive.
Il punto che divide il materialismo riduzionista dal materialismo più revisionista o più decisamente eliminatorio è così formulabile: quanto della struttura concettuale attuale, necessaria a comprendere la mente, sopravviverà ai chiarimenti forniti dal progresso delle neuroscienze? Questa, in ultima analisi, è una domanda empirica a cui è necessario rispondere con la ricerca scientifica in corso e non con analisi filosofiche o con argomentazioni aprioristiche. Il funzionalismo, una volta liberato si dal suo inutile conservatorismo, non apparirà più come una teoria distinta e contrapposta al materialismo, poiché la sua intuizione fondamentale (la possibilità che le attività cognitive siano frutto di molteplici eventi fisici) potrà essere tranquillamente accolta da tutte le altre tesi materialiste.
In verità la nostra rassegna di tutte le possibili soluzioni del problema mente-cervello potrebbe arrestarsi a questo punto, lasciando ogni ulteriore decisione alle scienze specificamene interessate. Tuttavia, la nostra riflessione non può ancora terminare perché esistono altri tre ordini di problemi che il materialismo non può eludere e che molti ritengono insormontabili per il materialismo stesso, sia riduzionista che eliminatorio. Molti sostengono che questi fenomeni problematici ed estremamente complessi non possono essere eliminati perché sono assolutamente reali. Si obietta inoltre che essi non possono essere affrontati con un metodo riduzionista perché possiedono caratteri che rimangono inesplicabili in termini fisici. In genere queste obiezioni vengono avanzate dai sostenitori delle teorie dualisti che, e questo ci porta a prendere nuovamente in esame la prima antitesi, quella che contrapponeva la soluzione materialista e quella dualista.
Il problema del significato o del contenuto semantico
Un assunto di base che guida quotidianamente i nostri rapporti sociali è quello secondo cui il comportamento di ogni essere umano esprime ciò che questi desidera e crede, nonché le riflessioni (pratiche e teoriche, talvolta complesse) indotte da questi stati interiori. Altrettanto fondamentale è l'assunto secondo cui il corso di tali riflessioni e il carattere del comportamento che ne consegue riflettono il contenuto semantico specifico di desideri e credenze individuali. Ciò è come dire che ogni nostro desiderio, credenza, sospetto, speranza e timore ha un carattere rappresentazionaIe unico e determinato, un carattere esprimibile con la clausola "che" come, per esempio, nella proposizione "il timore che si bruci la cena dentro il forno"; questo carattere o significato detta il corso specifico della riflessione e il comportamento individuali.
Come potrebbe una teoria materialista della mente sperare di spiegare questa dimensione fondamentale dell'attività cognitiva? Come possiamo spiegare il carattere significante, comprensivo o rappresentazionale degli stati mentali in termini puramente fisici? È molto frequente che a questo interrogativo si risponda con risposte negative. Il filosofo IR. Se arIe, per esempio, ha difeso strenuamente le posizioni antiriduzioniste in materia di contenuto semantico e le sue teorie sono divenute le fondamenta di una delle critiche più note al programma di ricerca classico sull'intelligenza artificiale (SearIe, 1980). Egli ha affermato che le attività puramente sintattiche dei calcolatori convenzionali, a qualsiasi livello di versatilità, non saranno mai in grado di rappresentare o produrre il fenomeno, totalmente differente, del significato, ovvero del contenuto semantico. Le risorse disponibili per un aspirante riduzioni sta, tuttavia, vanno ben oltre le attività sintattiche di un programma per computer a elaborazione seriale e codifica e consistono nelle proprietà strutturali e dinamiche del cervello biologico, un sistema di calcolo con uno stile operativo molto differente.
A partire dagli anni Ottanta si è assistito a un fiorire di ricerche sulle capacità cognitive e le strategie rappresentazionali delle reti neurali artificiali. Questi modelli si propongono di ricreare alcuni dei principali caratteri anatomici e fisiologici dei più importanti sotto sistemi cerebrali, per esempio le vie visive o uditive primarie (v. il saggio di I. Nelken, in questo volume e quello di P. Parodi e V. Torre, Visione artificiale). Queste ricerche hanno due obiettivi. Il primo è quello di addestrare la rete artificiale mediante una procedura di apprendimento che comporta la presentazione ripetuta di esempi sensoriali appropriati, in modo da ottenere un elevato livello esecutivo per alcune abilità classificatorie o per abilità cognitive a esse connesse. Il secondo obiettivo è quello di esplorare il profilo dell'abilità acquisita e individuare le proprietà strutturali e dinamiche acquisite della rete, che rendono possibile quell' abilità.
Alcuni risultati costituiscono un notevole incoraggiamento per coloro che sperano di comprendere la natura del significato, ovvero del contenuto rappresentazionale, in termini materialisti. Un esempio appropriato è costituito dalla rete per il riconoscimento dei volti sviluppata da G. Cottrell (1991) e illustrata in figura (fig. 7).
Questa rete contiene un ampio strato bidimensionale composto da unità simili a cellule. La funzione di questo strato consiste nel registrare l'immagine sotto forma di pattem globali di attivazione dell'intera popolazione di cellule. Ogni 'cellula' di input invia un 'assone' che si dirama verso le ottanta cellule del secondo strato, stabilendo contatti sinaptici con esse. Ciò dà luogo a un totale di 80 x 4096 = 327 .680 contatti sinaptici distinti con le cellule del secondo strato. Queste cellule, a loro volta, si connettono a uno strato fmale di output costituito soltanto da otto cellule. l livelli di attivazione di queste cellule di output dovrebbero indicare, una volta compiuto l'addestramento della rete, le caratteristiche generali dell'immagine presentata allo strato di input. La figura (fig. 8) riproduce alcune immagini del tipo utilizzato nell'addestramento della rete, che consistono in 7 differenti fotografie di undici individui, maschi e femmine, più un certo numero di immagini non riproducenti volti. Ad ognuno di questi undici individui è stato assegnato un codice digitale personale a cinque elementi che ne rappresenta il 'nome proprio'. Ognuna di esse è stata digitalizzata in un formato pixel 64 x 64, adatto a essere presentato al primo strato della rete. Lo scopo è stato quello di addestrare la rete a distinguere, mediante pattem di attivazione appropriati a livello dello strato di output, tre elementi: in primo luogo se l'immagine di input rappresenta o meno un volto; in secondo luogo se si tratta di un volto maschile o di uno femminile e, in terzo luogo, l'identità dell'individuo riprodotto a livello di input.
Rimandiamo ad altra occasione la discussione circa la procedura di addestramento (denominata retropropagazione). Basterà qui ricordare che sono state utilizzate circa 100 immagini per addestrare la rete a rispondere con un elevato livello di competenza. Dopo l'addestramento la rete è stata in grado di distinguere al 100% i volti dai non volti, i volti maschili da quelli femminili, nonché di distinguere e identificare correttamente lo stesso individuo tra le sette diverse fotografie dell'insieme di addestramento.
Ma è soprattutto interessante osservare che anche quando sono state presentate 65 nuove fotografie degli undici individui, cioè fotografie presentate alla rete per la prima volta, la rete ha risposto con un livello di precisione del 98%. E ancora più sorprendente è che anche con immagini di individui totalmente sconosciuti essa abbia risposto correttamente al 100%, distinguendo i volti dai non volti, e abbia conservato un livello di precisione dell'82% nel distinguere i volti maschili da quelli femminili. Evidentemente la rete non si è limitata semplicemente a memorizzare le risposte corrette per ognuna delle 100 immagini di addestramento, ma ha appreso nozioni generali relative ai volti, nonché i caratteri obiettivi che ne determinavano somiglianze e differenze. Ciò vale a dire che essa è stata in grado di applicare con successo a nuovi esempi le capacità di riconoscimento acquisite. Ovviamente la rete non è stata in grado di fornire il nome proprio corretto degli individui sconosciuti poiché, ovviamente, non ne aveva mai appreso i nomi. Ciononostante si è comportata in maniera sorprendente: man mano che il nome di un individuo sconosciuto veniva presentato allo strato di input, la rete rispondeva regolarmente fornendo allo strato di output il nome digitale della persona del set di addestramento che più somigliava a quello dell'individuo sconosciuto. Il comportamento cognitivo della rete ha rivelato così una tendenza naturale e automatica ad assimilare nuovi casi a quelli già conosciuti.
Come può una rete tanto semplice riuscire a eseguire compiti di livello così elevato? Cos'è che le permette di svolgere compiti la cui complessità comporta un'attività di discriminazione tanto sottile? È difficile dare una risposta a queste domande quando si tratta della rete neuronale di un essere vivente, ma è facile quando si parla di una rete artificiale. Poiché l'intera rete è implementata all'interno di un grande computer convenzionale, siamo in grado di seguire il livello di attivazione temporaneo di ogni cellula della rete a ogni stadio della sua attività. Possiamo leggere le dimensioni acquisite o il peso di ogni connessione sinaptica nell'intera rete e perfrno seguirne lo sviluppo durante la fase di apprendimento. A differenza di quanto avverrebbe per l'organismo vivente, tutti questi dettagli sono accessibili senza dover danneggiare il sistema o interferire con esso e così otteniamo un quadro affascinante dell' attività di base di una rete.
Quando inizia l'addestramento, lo strato cellulare intermedio è in grado di assumere una vasta gamma di pattern di attivazione globale in tutta la sua popolazione cellulare, pattern che hanno tutti la stessa probabilità di entrare in funzione. Ma con il procedere dell'addestramento, la forza di quei 327.680 collegamenti sinaptici del secondo strato lentamente si allontana dai valori iniziali casuali per avvicinarsi a valori o eccitatori oppure marcatamente inibitori. Questo processo modifica gradualmente, nel secondo strato, la distribuzione delle probabilità che aveva caratterizzato la gamma iniziale di possibili modelli di attivazione globale. La rete lentamente privilegia un insieme molto più piccolo di pattern di attivazione, che corrisponde a ognuno degli undici individui riprodotti nell'insieme delle immagini di addestramento.
Questi undici pattern sono organizzati l'uno rispetto all'altro, come è illustrato in figura (fig. 9). Questa figura cerca di riprodurre lo 'spazio' dei possibili pattern di attivazione dello strato intermedio. l suoi tre assi rappresentano ognuno il livello di attivazione delle prime tre cellule dello strato intermedio. Poiché, di fatto, nello strato intermedio della rete di Cottrell si trovano 80 cellule, dovremmo considerare uno spazio a 80 dimensioni, non riproducibile graficamente, quindi, a scopo illustrativo, fingeremo che lo strato mediano contenga solo tre cellule. Ogni punto di questo 'spazio di attivazione' rappresenta un pattern specifico di attivazione della corrispondente popolazione cellulare dello strato intermedio.
La sperimentazione condotta sulla rete ha rivelato che ogni volta che viene presentata allo strato di input un'immagine non corrispondente a un volto, si produce un tipo di attivazione situato presso il punto di origine del grafico mostrato in figura 9. Le immagini dei volti, per contro, producono sempre un tipo di attivazione nel volume complementare più grande, distante dall'origine. Questa 'regione dei volti' nello spazio di attivazione è stata suddivisa a sua volta in due sottovolumi, separati dal piano divisorio verticale (v. figura 9). l volti femminili presentati allo strato di input producono (quasi) sempre un tipo di attivazione di metà strato, al di qua del piano divisorio, mentre i volti maschili producono (quasi) sempre un tipo di attivazione al di là. l volti il cui genere risulta ambiguo si collocano esattamente sulla superficie del piano.
Inoltre, ognuno degli undici individui utilizzati per l'addestramento è indicato in questo spazio con un sottovolume piccolo e specifico che fa parte del volume relativo al genere, così che ognuna delle sette immagini specifiche produce, nello strato mediano, un tipo di attivazione all'interno di quel sottovolume approssimativamente sferico. Gli individui somiglianti producono punti tra loro vicini nello spazio di attivazione, mentre gli individui che non si somigliano producono punti distanti l'uno dall'altro. Nel suo complesso, durante l'addestramento, lo spazio di attivazione dello strato mediano della rete di riconoscimento dei volti si suddivide in un insieme gerarchico di categorie (volti e non volti), sottocategorie (maschi e femmine), e sotto-sottocategorie (Mary, Janet, Liz, e così via). Questo spazio di rappresentazione contiene, inoltre, una famiglia di punti prototipo (ovvero il 'centro di gravità' di ogni sottovolume) e, su tutta la sua estensione, un gradiente di somiglianza multidimensionale, in continuo cambiamento. Nel loro insieme questi caratteri ricreano, all'interno di un modello di ispirazione biologica, il profilo cognitivo a noi noto grazie alla nostra struttura concettuale. È difficile non provare la tentazione di riconoscere nella struttura concettuale acquisita dalla rete, un sistema di rappresentazione che, tutto sommato, non è poi così distante dal nostro.
Tale tentazione diventa ancora più forte quando si scopre che le reti neurali possiedono un'altra proprietà: spesso le rappresentazioni a livello dello strato intermedio contengono informazioni sull'individuo presentato allo strato di input che vanno oltre le informazioni contenute nell'immagine di input! Questo fenomeno, definito completamento del vettore, è comune a tutte le retifeedforward (a propagazione in avanti) debitamente addestrate, e può essere illustrato come segue. L'immagine (fig. 10) è una fotografia di Mary; si tratta di una delle fotografie dell'insieme originario utilizzato per addestrare la rete, modificata da una striscia di grigio che nasconde l'immagine per il 20%. La rete è ancora in grado di riconoscere Mary correttamente nonostante l'input sia stato parzialmente nascosto? In effetti, la rete è in grado di svolgere questo compito.
E forse non dovremmo stupircene, perchè il restante 80% dell'immagine è ancora sufficientemente chiaro da permettere alla rete di distinguere Mary dalle altre dieci persone che essa è stata addestrata a riconoscere. Tuttavia c'è qualcosa che può, in qualche modo, sorprenderci. Il tipo di attivazione prodotto nello strato intermedio dall'immagine parzialmente nascosta è identico a quello prodotto dall'immagine ricostruita mostrata nella figura 10b. Ciò significa che lo strato intermedio fornisce esattamente la stessa risposta alle due immagini; non distingue l'una dall'altra. Ma il punto importante è che il pattern di attivazione prodotto nello strato intermedio contiene informazioni che riguardano non soltanto il naso, la bocca e le altre parti visibili del volto di Mary, ma contiene informazioni anche sui suoi occhi. Il pattern non rappresenta degli occhi qualsiasi, ma proprio gli occhi di Mary. Rivediamo la fotografia originaria di Mary (v. figura 8, in alto a sinistra): la somiglianza di quegli occhi con quelli della figura originale non è perfetta, ma è comunque accettabile.
L'impressione è che in questa circostanza la rete abbia tratto le informazioni dal nulla, ma non bisogna dimenticare che essa ha visto il volto di Mary migliaia di volte durante l'addestramento. Questa rete contiene, nella configurazione appresa di circa 300.000 pesi sinaptici, numerose informazioni relative al volto di Mary e a tutti gli altri volti. Tali informazioni vengono automaticamente prodotte in risposta a una vasta classe di possibili immagini input, comprese quelle che sono state variamente alterate o nascoste. Appare dunque evidente che una rete neurale addestrata contiene una quantità di informazioni che supera l'informazione specificamente contenuta nell'input percettivo. Ciò concorda con quanto precedentemente affermato, e cioè che ogni organismo dotato di una struttura concettuale altamente sviluppata possiede implicitamente un numero elevato di informazioni sul mondo, indipendentemente da quante ne siano rappresentate esplicitamente nei suoi stati percettivi attuali.
Da quanto abbiamo esposto si può concludere che i fenomeni connessi alle nozioni di concetto, rappresentazione e contenuto semantico specifico non sono inaccessibili all' approccio della neurobiologia cognitiva. Al contrario, un'indagine teorica e sperimentale di grande interesse è già in corso e i successi ottenuti sono tutt'altro che insignificanti. Searle è a conoscenza di questo indirizzo di ricerca ma rifiuta di ammetterne le potenzialità riduzionistiche. Egli ritiene che il contenuto semantico reale sia una prerogativa delle creature dotate di coscienza, e che tale prerogativa non può essere compresa con il metodo riduzioni sta. Ma questo è un problema che affronteremo alla fine del saggio mentre ora ci limitiamo a ribadire che la natura della rappresentazione concettuale non è inaccessibile alle neuroscienze. Passiamo ora a un secondo problema, ancora più dibattuto del problema del significato.
Il problema dei qualia sensoriali
Il problema dei qualia consiste nello spiegare scientificamente i caratteri qualitativi inesprimibili del sentire individuale, a cui soltanto noi stessi possiamo accedere. Per usare una terminologia recente, il problema centrale per qualunque spiegazione che pretenda di essere di natura fisica nasce dall'innegabile esistenza di qualia sensoriali e dal fatto che essi possano essere conosciuti soltanto da un punto di vista personale e introspettivo. In alcune occasioni esso è stato definito il problema difficile, per distinguerlo da quelli presumibilmente più facili posti dalle spiegazioni riduzioniste della memoria, dell'apprendimento, dell'attenzione e così via.
Le argomentazioni contro il materialismo si basano su quanto segue. Il carattere qualitativo intrinseco (o quale), poniamo di una sensazione dolore, deve essere nettamente distinto dai numerosi aspetti causali, funzionali e relazionali che lo caratterizzano. Gli esempi in questo senso sono noti: il dolore è il risultato di uno stress o di un danno subiti dall'organismo; il dolore provoca nell'individuo uno stato di infelicità e lo induce a evitarlo. Questi sono i caratteri estrinseci del dolore che tutti conoscono: essi possono essere evidenziati sperimentalmente, sono noti a chiunque intrattenga normali rapporti sociali, e sono essenziali per spiegare e prevedere il comportamento nostro e dei nostri simili. Inoltre, queste proprietà causali e relazionali del dolore rappresentano un obiettivo legittimo delle aspirazioni riduzioniste ed esplicative di una neuroscienza in espansione. L'unica esigenza è quella di evidenziare gli stati del cervello che esprimono il medesimo profilo causale e relazionale precedentemente accettato da noi come caratteristico dello stato di dolore. Questo è ciò che costituirebbe nel nostro caso, e comunque nella ricerca scientifica, un'interpretazione esplicativa riduzioni sta. Se nel confronto tra questi stati del cervello che esprimono lo stesso profilo causale si rinvenissero caratteri sistematici, potremmo legittimamente sostenere di avere scoperto in cosa consiste il dolore: uno stato cerebrale.
Nel sostenere questa tesi dovremmo confrontarci con una difficoltà: il quale intrinseco del dolore dovrebbe essere ignorato dall'analisi, come lo sarebbe la conoscenza intima che ogni individuo ha dei qualia del proprio dolore. È evidente, sempre secondo questa argomentazione, che le nostre aspirazioni riduzioniste devono confrontarsi con un problema sconosciuto in altri ambiti scientifici. Infatti, il problema dell'autocoscienza non si esaurisce nella struttura di rapporti causali o di altra natura entro cui esso si colloca. In tutti gli altri ambiti della scienza il problema della natura essenziale dei fenomeni è affrontato in termini riduzionistici, ma nel caso unico dell' autocoscienza ci troviamo di fronte a un insieme di proprietà intrinseche (il colore legato a un ricordo, il profumo di una rosa e tutti gli altri qualia soggettivi che animano la nostra vita interiore) la cui essenza non può essere colta con argomenti di natura causale, funzionale, strutturale o relazionale. Per concludere le proprie argomentazioni gli antiriduzionisti continuerebbero come segue. Le scienze, o per lo meno le scienze fisiche, sono costrette per natura a interpretazioni che ricostruiscono la realtà causale e relazionale dei fenomeni presi in esame. Esse sono quindi destinate a fallire proprio nel caso in questione, poiché i qualia soggettivi delle sensazioni personali costituiscono un qualcosa di aggiuntivo e di diverso rispetto al ruolo causale e relazionale che tali sensazioni possono svolgere nell'economia biologica e cognitiva individuale. Tali qualia intrinseci, benché facilmente individuabili dal punto di vista personale, sono in sé e per sé degli elementi assolutamente semplici e quindi non analizzabili dalle scienze fisiche, e non rappresentano un tipo di fenomeno spiegabile con tale approccio. Essi sono semplici in termini metafisici ed esclusivamente soggettivi, mentre ogni loro ricostruzione fisica dovrebbe basarsi su strutture causali e relazionali ed essere totalmente obiettiva.
Queste considerazioni rappresentano il nucleo delle argomentazioni dei dualisti contro il materialismo riduttivo, ma in genere vengono esposte mediante esempi particolarmente pittoreschi. Un' indagine sull' elaborazione filosofica di questo argomento rivelerebbe molteplici 'esperimenti teorici' la cui funzione è quella di dimostrare o evidenziare in un modo o nell'altro la natura essenzialmente elusiva dei nostri qualia soggettivi, nel momento in cui vengono considerati dal punto di vista fisicalista di un altro individuo (Nagel, 1974; Jackson, 1982; Chalmers, 1996), come mostrato in figura (fig. 11). Tuttavia ognuno di questi esempi dipende, a modo suo, proprio dall'insieme delle convinzioni illustrate nei due precedenti paragrafi. Alla fine sono proprio queste convinzioni condivise che sono alla base della teoria antiriduzionista. Vediamo se resistono a un'analisi critica. Dobbiamo iniziare la nostra analisi riconoscendo che il quale di un dolore, o della sensazione del rosso, o del gusto del burro, sembrano indubbiamente delle sensazioni semplici prive di una struttura nascosta. Per quanto le nostre capacità introspettive innate ci consentano di valutare, tali sensazioni non rivelano in alcun modo elementi costitutivi o una struttura relazionale. Possiamo riconoscere e distinguere questi qualia in modo spontaneo, sicuro e inequivocabile, ma non siamo in grado di dire come o su quali basi siamo in grado di identificarli. Di conseguenza sembrano essere delle entità intrinsecamente semplici e la nostra conoscenza su di esse non sembra poter essere più diretta e fondata.
A questo punto, però, rischiamo di essere sedotti da uno dei temi privilegiati dai corsi di logica destinati alle matricole: l'argomentazione dell'ignoranza. Di fatto ignoriamo se esista una struttura nascosta nei qualia delle nostre sensazioni. E non sappiamo ancora in che modo la nostra autocoscienza riesca a operare una distinzione tra sensazioni differenti. Ma l'ammissione della nostra mancanza di conoscenza non comporta che questi qualia debbano essere necessariamente privi di una struttura sottostante, né che il nostro riconoscimento soggettivo di questi stessi qualia non dipenda da un meccanismo legato a caratteri relazionali interni di quella stessa struttura che finora ci è rimasta nascosta. In realtà, queste argomentazioni in chiave negativa non dovrebbero neppure suggerire una spiegazione in chiave positiva, poiché sappiamo da considerazioni puramente logiche che in ogni essere cognitivo, capace di operare una distinzione tra i vari aspetti della propria esperienza, deve esistere una capacità di discriminazione sensoriale di un livello così fondamentale che l'individuo non conosce e non può esplicitare la base causale - la quale può essere molto complessa - su cui si fondano le proprie discriminazioni. La negazione di questa inevitabile limitazione ci condannerebbe a una regressione infinita da un livello di capacità discriminatorie all'altro. Per ognuno di questi livelli, l'individuo potrebbe sempre descrivere il livello ancora più basso di proprietà da cui dipendono consciamente le sue capacità di discriminazione entro il livello dato. Bloccando questa regressione all'infinito ci garantiamo un livello apparentemente di base: in ogni creatura deve esistere un livello di discriminazione dove la sua capacità di esplicitazione semplicemente cessa.
Questo fatto puramente logico si manifesta in molte limitazioni a tutti note. Per esempio, sappiamo riconoscere la voce di nostro figlio, sappiamo individuarla all'istante tra quelle di centinaia di compagni di scuola ma non siamo in grado di specificare la base acustica di questo riconoscimento. Possiamo riconoscere all'istante un volto che ci ispira sospetto, ma avremo molte difficoltà a spiegare quel giudizio articolando lo sulla base delle sembianze facciali che ce lo hanno suggerito. È probabile che tali impressioni possiedano una base fisica, ma la nostra capacità di esprimerle non comporta che si debba essere consapevoli di tale base.
È quindi un fatto noto e inevitabile che a livello cosciente si ignorino le basi o l'eziologia di alcune delle nostre discriminazioni. Inoltre, queste proprietà non esplicitate possono presentarsi a noi come 'entità semplici', quale che sia la complessità della loro natura. E ciò accade per ragioni che non hanno nulla a che fare con gli argomenti che possono contrapporre i materialisti ai dualisti. Non dobbiamo quindi concludere che il riconoscimento dei qualia delle nostre sensazioni rappresenti un livello 'di base'. La semplicità attribuita ai nostri qualia sensoriali riflette soltanto la nostra prevedibile ignoranza del modo in cui riusciamo a riconoscerli. Questo non sta a indicare che gli antiriduzionisti siano in errore, ma dimostra che uno dei loro assunti più importanti, concernente la semplicità intrinseca, non relazionale, metafisica dei nostri qualia sensoriali, è infondato e non esauriente. Se i qualia sensoriali possiedano o meno tale carattere è un problema che sta alla ricerca risolvere e non una questione su cui le opposte fazioni possano sentenziare stando sedute in poltrona. Partendo dal presupposto della semplicità metafisica il dualista non fa altro che adottare proprio la conclusione antimaterialista che sta cercando di dimostrare.
Le conclusioni sono ovvie, ma vale la pena di riassumerle. Se in alcuni casi può essere plausibile insistere su una distinzione metafisica netta tra i caratteri 'intrinseci' e quelli puramente causali e relazionali di una determinata sfera di fenomeni, tale distinzione può anche essere dettata dall'ignoranza e dimostrarsi inappropriata e totalmente futile. E mentre può sembrare doppiamente plausibile insistere su tale distinzione quando si possieda anche un accesso epistemico innato alle proprietà intrinseche della sfera presa in considerazione, tale accesso innato non è sufficiente a sanare il contrasto problematico in questione. Esso delimita soltanto la nostra attuale comprensione discriminatoria.
In sostanza, nulla di quanto detto sui nostri qualia sensoriali interni ne garantisce una semplicità priva di struttura e neppure la suggerisce. È possibile che i qualia possiedano una ricca struttura interna, e quindi che una neuroscienza matura scopra un giorno quella struttura nascosta e la renda parte integrante di una ricostruzione complessiva dei fenomeni mentali in termini biologici. Di questo argomento parleremo più avanti.
Ma che dire del peculiare carattere esclusivo dell' accesso epistemico ai nostri qualia sensoriali? Che dire della loro inaccessibilità a qualsiasi forma di comprensione o di indagine strumentale basata sul punto di vista di un osservatore esterno? Tutto ciò non dovrebbe dimostrare che i qualia interni non possono essere sottoposti a un'analisi riduzionistica?
La risposta è negativa, perchè l'ipotesi basata sulla 'esclusività' non offre garanzie di concretezza o di certezza maggiori di quelle offerte dalla ipotesi basata sulla 'semplicità' che abbiamo liquidato più sopra. Se la struttura neurofisiologica nascosta dei qualia (supponendo per un momento che essa esista) dovesse essere messa in luce dalla ricerca in corso, ne risulterebbe automaticamente un nuovo accesso epistemico ai nostri qualia soggettivi, indipendentemente da una capacità esclusiva e innata di discriminazione interna presente in ogni persona. In quanto aspiranti riduzionisti, non ci è dato sostenere che questo è quanto il futuro ha in serbo per noi. Sarà la ricerca che dovrà stabilirlo. D'altra parte nemmeno gli antiriduzionisti possono sostenere che avverrà il contrario. Quindi anche il loro secondo assunto, cioè l'esclusività epistemica, rivela debolezze e punti oscuri come il primo.
Dobbiamo concludere osservando che sui qualia sensoriali non esistono attualmente argomenti convincenti in grado di mettere in discussione le aspirazioni e le spiegazioni riduzioniste delle neuroscienze. Le argomentazioni antiriduzioniste e antimaterialiste possono sembrare verosimili a causa della nostra attuale ignoranza, della nostra immaginazione limitata e di una colpevole tendenza a eludere il problema.
Le osservazioni che abbiamo riportato nei paragrafi precedenti sono tutte di carattere difensivo; tendono solo a evidenziare i difetti di argomentazioni antiriduzioniste prive di solide fondamenta. Ma prima di lasciare questo argomento è opportuno ricordare che le neuroscienze cognitive sono ormai in grado di partire all'offensiva su questi problemi. Nei manuali di neuroscienze si trovano teorie sulle basi strutturali e fisiologiche dei qualia del gusto e del colore, teorie che possono giustamente rivendicare un elevato livello di verità. Concludiamo questa sezione con un breve sguardo a un argomento di particolare interesse: la percezlOne VISIva.
Oltre alla neurobiologia, anche la psicofisica ha indagato sulla struttura dei nostri 'spazi qualitativi' per quanto riguarda la percezione. Senza che sia necessario inserire elettrodi nel cervello, è possibile esplorare in modo sistematico i rapporti di somiglianza relativa di centinaia di campioni di colore sottoponendoli alla valutazione di numerosi soggetti sperimentali. Per ciascun soggetto, tali valutazioni permettono allo sperimentatore di localizzare ogni campione di colore in una posizione unica in rapporto agli altri. Negli esseri umani normali la distribuzione dello spazio qualitativo dei colori è ben definita e uniforme in tutti soggetti e si presenta approssimativamente così come è indicato nella figura (fig. 12). Simili risultati si ricavano anche per le altre modalità sensoriali, ma abbiamo preferito indagare in profondità su un solo esempio.
Abbiamo, in questo caso, un tipo di struttura sistematica che riunisce l'insieme dei qualia visivi, una struttura che la neurobiologia della visione può sperare (e deve cercare) di ricostruire. In questo caso l'enigma dello 'spettro capovolto' si risolve rapidamente. È evidente che l'immagine speculare del doppio cono nella figura (v. figura 12) coglierebbe i rapporti interni della struttura spaziale dei colori altrettanto bene. Ci si potrebbe domandare se la struttura spaziale dei colori di un individuo sia causalmente collegata al mondo esterno così come avviene per gli altri individui. In questo caso i capovolgimenti lungo un solo asse non costituiscono l'unica possibilità: sono possibili anche delle rotazioni parziali dello spazio intorno ad assi arbitrari. Viene da chiedersi come sia possibile fornire un'interpretazione indipendente sulla struttura spaziale dei colori tale da risolvere questi problemi.
Una possibilità sarebbe quella di trovare una struttura determinata e accessibile, intrinseca o intra-qualia; una struttura intrinseca che fosse diversa per ogni qualia, e che rendesse indiscutibili i rapporti inter-qualia illustrati nella figura 12. Questa struttura ci fornirebbe uno strumento per identificare il quale interno di ogni individuo, uno strumento che non dipenderebbe né dai suoi rapporti con gli altri qualia interni né dai suoi rapporti causali con gli stimoli esterni. Naturalmente l'esistenza di una struttura intrinseca o intraqualitativa non può che essere considerata impossibile dagli antiriduzionisti, ma abbiamo imparato a non farci intimidire dalla loro ostinazione. Valutiamo ora questa stessa struttura intrinseca in rapporto a un essere vivente. La 'migliore' teoria finora enunciata nel campo della neuroanatomia e della neurofisiologia della visione dei colori negli esseri umani e nei primati è quella dei processi antagonisti. Secondo tale teoria il colore viene codificato come un vettore di livelli di attivazione a tre elementi, entro tre tipi specifici di cellule che formano sinapsi (forse nel NGL) partendo dai tre tipi familiari di coni retinici. Ognuno di questi tre tipi di cellule costituisce il luogo di un 'tiro alla fune' eccitatorio-inibitorio come indicato nella figura (fig. 13). Come risultato delle connessioni tra le cellule, avviene che la cellula situata all'estrema sinistra frnisce per codificare la dominanza relativa della luce gialla su quella blu; la cellula intermedia, codifica la dominanza relativa della luce rossa su quella verde; quella all'estrema destra codifica la dominanza relativa della luminosità sull'oscurità colta approssimativamente su tutte le lunghezze d'onda.
In questo modo possiamo determinare sperimentalmente quale specifica tripletta di attivazione si produce tra le cellule antagoniste attivate dal colore in risposta a un determinato campione esterno. Abbiamo, cioè, un accesso indipendente alla struttura intrinseca o interna della risposta neurofisiologica del soggetto e possiamo capire quali oggetti esterni inducono quella risposta. Chiediamoci ora come queste specifiche triplette di codifica siano organizzate, nel loro complesso, all'interno dello spazio vettoriale che contiene tutte le triplette possibili, secondo la vicinanza e distanza reciproche nello spazio euclideo (fig. 14). È importante notare che lo schema di codifica in questione mostra le stesse caratteristiche organizzative globali trovate nello spazio di qualità del colore descritto dalla psicofisica (v. figura 12). Questa organizzazione dimostra lo stesso insieme di collegamenti causali con il mondo esterno.
Questa coincidenza sistematica di strutture causali e relazionali suggerisce una spiegazione riduzionistica della struttura spaziale qualitativa originale e suggerisce anche l'ipotesi che i qualia del colore posseduti da ogni individuo siano identici alle triplette di codificazione dei tre tipi di cellule antagoniste. Se ciò rispondesse a verità avremmo una spiegazione sistematica dei contenuti specifici e della ricca struttura spaziale innata dell'uomo che permette di riconoscere i colori. Questa spiegazione, inoltre, renderebbe conto, grazie alla teoria elettromagnetica della luce, anche dei rapporti causali specifici di tale spazio con i colori reali del mondo esterno. La spiegazione descritta rende possibile l'ipotesi degli 'spettri capovolti' avanzata dal puzzle della tradizione filosofica? Pensiamo che la risposta sia affermativa e che la spiegazione addotta ci suggerisca anche come produrre tale effetto. Supponiamo che in un soggetto adulto normale, mantenendo costanti tutte le altre connessioni neuronali, venissero scambiati gli assoni che stabiliscono sinapsi con le cellule antagoniste del blu-giallo con gli assoni che stabiliscono sinapsi con le cellule antagoniste del rosso-verde. Svegliandosi da questa operazione ( decisamente fantasiosa), il nostro soggetto vedrà il mondo in maniera molto differente poiché il suo spazio qualitativo interno del colore sarà stato rimappato chirurgicamente rispetto al mondo esterno, cioè ruotato di novanta gradi intorno all'asse del bianconero, rispetto alle molteplici 'cause esterne' indicate nella figura 12.
Per contro, un'inversione speculare dello spazio originario lungo un asse potrebbe essere ottenuta con un intervento chirurgico (ancora più sofisticato) che invertisse la polarità di tutte le sinapsi esistenti rispetto a una delle tre popolazioni di cellule antagoniste. È ovvio che tali 'spettri capovolti' sono possibili concettualmente. È addirittura possibile che li si possa individuare sperimentalmente nei dettagli delle nostre connessioni neuronali, o manipolarli come abbiamo accennato. Ma nulla di tutto ciò costituisce un problema per il materialismo.
Bisogna osservare che quanto abbiamo esposto implica anche l'esistenza di una varietà di spazi subottimali del colore per la piccola percentuale di esseri umani privi di una delle tre normali popolazioni di coni retinici. In questo modo le cellule antagoniste vengono private di una buona parte delle informazioni. Potremmo addirittura simulare questo deficit in esseri umani normali ponendo dei filtri sugli occhi e bloccando la trasmissione alla lunghezza d'onda corrispondente a una delle tre popolazioni di coni. Se questo approccio ai qualia del colore, che implica la codifica del vettore e delle cellule antagoniste, si dimostrerà corretto, allora la mappatura psicofisica di tali spazi qualitativi, fenomenici, non standard, dovrà corrispondere agli spazi vettoriali non standard a livello cellulare. Per quanto è di nostra conoscenza, non è stato ancora svolto un lavoro sperimentale sulle varietà del daltonismo, per lo meno a livello cellulare, ma tali ricerche potrebbero costituire un buon test per questa teoria.
Se le ricerche che la neurofisiologia sta conducendo sullo spazio del colore negli esseri umani riusciranno a dimostrare la validità delle nostre ipotesi, anche a questo livello di dettaglio, ciò starebbe a indicare che i nostri qualia interni del colore sono effettivamente identici ai vettori di codifica presso le cellule antagoniste del nostro NGL. Non otterremmo certezze assolute, ma avremmo il tipo di evidenza sistematica che in altri ambiti della ricerca scientifica giustifica ogni teoria esplicativa riduzionistica. E a questa dovrebbe andare, entusiasmi dualistici a parte, il tipo di riconoscimento accordato le in altri ambiti dell'indagine scientifica. Nulla di più ma anche nulla di meno.
Tuttavia è necessaria una certa cautela. Non dobbiamo pensare che la verità della nostra spiegazione debba intendersi come una confutazione dello scetticismo antiriduzionista. A questo stadio iniziale della ricerca dobbiamo anche ammettere che i qualia sensoriali possano essere delle semplici entità metafisiche che le neuroscienze non riusciranno mai ad avvicinare. Tuttavia, le argomentazioni antiriduzioniste riportate all'inizio di questo saggio sostenevano la natura indiscutibile dei qualia come entità semplici prive di basi strutturali, e che nessuna teoria enunciata dalle scienze fisiche può sperare di affrontare questo tipo di fenomeni. In risposta a queste affermazioni replichiamo che non possediamo tale conoscenza e che una teoria degna di tutto rispetto, derivata dalle scienze fisiche, si sta già confrontando approfonditamente con i fenomeni in questione riportando successi tutt'altro che insignificanti.
La cautela è consigliabile anche per un'altra ragione. Mentre per il momento l'ipotesi delle cellule antagoniste sembra corretta, è possibile che si debba attendere prima di ritenere la collocazione spaziale qualitativa del colore a livello conscio identica allo spazio vettoriale specifico delle cellule antagoniste dell'NGL che si trovano in posizione relativamente periferica, in quanto esse potrebbero essere troppo periferiche.
Uno spazio vettoriale più verosimile, per collocare fisicamente lo spazio dei qualia del colore, potrebbe essere lo spazio di attivazione di popolazioni neuronali che si trovano due o tre livelli sinaptici più a valle delle cellule antagoniste presenti nell'NGL; per esempio, una sottopopolazione neuronale della corteccia visiva primaria, o forse le cellule dell' area V4. Questi spazi vettoriali di livello più elevato, che inviano informazioni più finemente elaborate, potrebbero consentire una ricostruzione più fedele delle sofisticate caratteristiche dello spazio dei nostri qualia per il colore negli esseri umani normali e non. Tali spazi vettoriali potrebbero contenere i vettori, rilevanti in un processo di elaborazione, plausibilmente implicati nel fenomeno dell'autocoscienza. A questo argomento rivolgeremo ora la nostra attenzione.
Il problema della coscienza
Qualia sensoriali a parte, perché e in che modo riusciamo a essere autocoscienti? La codifica vettoriale avviene a tutti i livelli del sistema nervoso, in migliaia di differenti popolazioni neuronali che elaborano la vasta gamma di informazioni concernenti le condizioni del nostro corpo e del mondo circostante. Tuttavia soltanto una piccola percentuale di queste informazioni è sempre presente a livello di coscienza. Cosa distingue questa classe preferenziale di rappresentazioni (coscienti) dalla più vasta classe di rappresentazioni che non affiorano mai alla coscienza? Questo interrogativo non possiede più il carattere misterioso di un tempo. Una sempre maggiore conoscenza dell'organizzazione neuronale del cervello e la possibilità di analizzare sempre meglio l'attività cerebrale di organismi in stato di veglia, hanno generato le condizioni per il decollo di indagini teoriche di cui, a nostro parere, gli aspetti più importanti sono quelli descritti qui di seguito.
A partire dalla metà degli anni Ottanta si è assistito a un crescente sviluppo nell'elaborazione di reti neurali artificiali e nell' analisi delle loro capacità di riconoscimento di insiemi di pattem. Un prototipo di rete feedforward è illustrato nella figura (fig. 15). Tuttavia i ricercatori hanno compreso molto rapidamente che per i numerosi insiemi di attività nervose dotati di dimensione temporale, come le tipiche sequenze motorie e i tipici processi causali, una semplice rete feedforward è inadeguata. È necessario elaborare reti che, oltre alle vie di connessione ascendenti, posseggano anche quelle discendenti o ricorrenti, come nella figura 15 (v. anche il saggio di F. van der Velde, Considerazioni metodologiche sullo studio delle funzioni cerebrali, e il saggio di G. Dreyfus, L. Personnaz e G. Toulouse, Perceptron: passato e presente).
Queste connessioni addizionali producono una rete la cui risposta vettoriale, nello strato intermedio, all'input dello strato sensoriale è in parte una funzione del concomitante stato di attivazione o cognitivo del terzo strato il quale, a sua volta, è la risultante di input ed elaborazione precedenti. Una risposta ricorrente della rete a un determinato stimolo, quindi, non viene fissata soltanto dai caratteri strutturali della rete stessa, come si verifica nella rete feedforward. La risposta varia come funzione del precedente contesto dinamico o cognitivo in cui si è manifestato lo stimolo. Tale risposta dello strato intermedio può anche svilupparsi di continuo nel tempo, a mano a mano che le cellule dello strato intermedio ricevono un insieme mutevole di influenze modulatorie dalla sotto stante attività cognitiva, mediante vie ricorrenti. Per un sistema ricorrente di questo tipo, la risposta dello strato intermedio si manifesta come una sequenza di vettori di attivazione. Ciò vale a dire che la risposta si manifesta più come una traiettoria nello spazio di attivazione che come un punto.
Ciò che rende affascinanti queste reti artificiali è il fatto che, regolando adeguatamente i pesi e le polarità delle connessioni sinaptiche, possiamo addestrarle a rispondere a vari stimoli con traiettorie di attivazione appropriate. Tali sequenze vettoriali sono in grado di rappresentare sequenze causali di particolare rilievo presenti nell'ambiente percettivo della rete, sequenze che la rete è stata addestrata a riconoscere. Per contro, esse possono fungere da generatori per sequenze motorie ben calibrate che la rete è stata addestrata a produrre. Tanto nella sfera percettiva quanto in quella motoria, quindi, le reti ricorrenti sono in grado di gestire insiemi di attività neurali sia temporali che spaziali, e perciò gestire il tempo oltre che lo spazio. In senso più generale, esse possiedono uno straordinario insieme di risorse teoriche che ci permettono di affrontare i fenomeni dell'apprendimento, della memoria, della percezione e del controllo motorio.
L'interesse per questi modelli è motivato anche dal fatto che il cervello possiede una certa quantità di vie assonali discendenti o ricorrenti. È noto che le numerose cortecce sensoriali primarie presenti nel cervello dei mammiferi proiettano cospicue fibre ricorrenti verso le numerose strutture talamiche (come, per esempio, l'NGL) da cui ricevono afferenze. Questo 'sistema specifico' è affiancato da un 'sistema non specifico' in cui tutte le cortecce sensoriali primarie sono connesse ai nuclei intralaminari del talamo, come illustrato nella figura (fig. 16).
Tali sistemi ricorrenti possono venirci in aiuto anche per affrontare il problema della coscienza. Se il nostro scopo è formulare un'ipotesi esplicativa riduzionistica della coscienza, allora anche in questo caso, come sempre nella scienza, dobbiamo cercare di ricostruire i caratteri noti dei fenomeni che intendiamo analizzare avvalendoci delle risorse che la scienza di base mette a nostra disposizione (Churchland e Churchland, 1990). Quali sono i caratteri della coscienza che emergono come elementi principali per questa ricostruzione? Seppure lontano dall'essere esauriente, l'elenco che segue può essere considerato sufficiente.
La coscienza comporta una memoria a breve termine, non ha bisogno di input sensoriali simultanei, implica un'attenzione indirizzabile, può interpretare in modi differenti lo stesso input sensoriale, scompare durante il sonno profondo, riappare, seppure in altra forma, durante il sogno e, infine, fa confluire differenti modalità sensoriali in un'esperienza singola, omogenea.
Le reti ricorrenti sono dotate di proprietà che, in futuro, potrebbero dimostrarsi utili nello studio di ognuno dei caratteri che abbiamo elencato. lnnanzitutto, ogni rete ricorrente rappresenta una forma di memoria a breve termine: le informazioni raccolte nel vettore di attivazione dello strato intermedio vengono elaborate nello strato successivo e quindi rinviate alla propria origine, forse in forma modificata. Tali informazioni possono muoversi più volte lungo questo anello ricorrente, attenuandosi gradualmente. Se alcune informazioni sono importanti, la rete può anche avere una configurazione capace di conservarle senza attenuazione attraverso molti cicli fino a che il contesto cognitivo non la ritiene più utile. Questo sistema fornisce automaticamente una forma di memoria a breve termine, sensibile al contenuto, con un tempo variabile di decadimento.
Una rete ricorrente è altresì in grado di impegnarsi in un'attività cognitiva anche in assenza di una stimolazione in arrivo allo strato di input, perché gli impulsi che viaggiano sulle vie ricorrenti possono essere sufficienti a mantenere il sistema in attività. Essa può modulare inoltre, per mezzo di quelle stesse vie, la modalità di reazione agli stimoli dello strato sensoriale, e la salienza di taluni aspetti di quell'input. Ciò rappresenta un modello grezzo sia per la plasticità della interpretazione concettuale che per la capacità di attivare l'attenzione percettiva dell'individuo.
Inoltre può accadere che per qualche tempo in una rete ricorrente vengano disattivate selettivamente le vie ricorrenti, e che essa tomi a essere temporaneamente una semplice rete feedforward, perdendo o sospendendo tutte le quattro capacità cognitive appena descritte. Il sonno profondo degli esseri umani è forse uno degli esempi caratteristici di questa forma altamente specializzata di 'pausa' cognitiva. È possibile, tuttavia, che il sogno consista nell'attività spontanea o auto guidata di una rete riccamente ricorrente che si muove tra le traiettorie apprese che dominano la sua attività di veglia, come se essa fosse temporaneamente priva di guida coerente da parte degli input sensoriali provenienti da un mondo esterno stabile, e disconnessa anche temporaneamente dagli effettori motori che essa controllerebbe in stato di veglia.
Infine, una rete ricorrente può integrare le informazioni provenienti da modalità sensoriali differenti riconsegnando tali informazioni, direttamente o indirettamente, a una popolazione cellulare comune e non specifica. l vettori di attivazione in una tale popolazione rappresenterebbero così le informazioni multimodali e potrebbero svolgere un ruolo nella 'unità' della coscienza sensoriale di cui abbiamo parlato in precedenza. A.R. Damasio (1994) ha denominato queste aree cerebrali 'zone di convergenza' (v. anche il saggio di A.R. Damasio, Emozione, processo decisionale ed etica).
Seppure rapidamente accennate, le riflessioni di natura ricostruttiva che abbiamo raccolto non vanno intese soltanto come semplici suggerimenti. Sappiamo che il cervello è decisamente un sistema neuronale ricorrente. Sappiamo che lesioni vaste e bilaterali ai nuclei intralaminari producono il coma profondo ed evidenze sperimentali stanno iniziando a mettere in luce le differenze dinamiche che intercorrono tra il sonno profondo, il sonno con sogni e lo stato di veglia (Llinas e Ribary 1993; Llinas et al., 1994). Grazie ai nuovi studi di neuroanatomia siamo in grado di intravedere la possibilità di affinare le ipotesi che abbiamo or ora avanzato, e grazie alla neurofisiologia siamo in grado di capire come potremo metterle alla prova.
Una possibile risposta alla domanda cruciale con cui abbiamo aperto quest'ultimo paragrafo è la seguente. Una rappresentazione è un elemento dell'autocoscienza, qualora il vettore di attivazione si trovi presso la popolazione focale di un adeguato sistema nervoso centrale ricorrente che unifichi le numerose modalità sensoriali e controlli il comportamento motorio. Ciò può rispondere o meno a verità. Ma quella che abbiamo formulato è un'ipotesi riduzionistica che cerca di fornire una spiegazione agli interrogativi sollevati dagli antiriduzionisti con cui abbiamo iniziato questo saggio. In primo luogo, siamo in grado di fornire una spiegazione fisica chiarificatrice circa la natura 'intrinseca' dei qualia sensoriali, che non sono altro che vettori di attivazione. Inoltre, possiamo ipotizzare il momento in cui tali vettori diventano parte dell'autocoscienza: riteniamo che essi si manifestino come parte dell'attività di rappresentazione di una rete adeguatamente ricorrente che si confronta con le limitazioni anatomiche ricordate precedentemente. Come abbiamo visto nel secondo paragrafo di questo saggio, lo scetticismo antiriduzionista non poggia su basi solide e non è suffragato da una struttura teorica che funga da sostegno a una vitale tradizione di ricerca. Sarà quindi meglio ignorare tale atteggiamento scettico per incamminarci lungo la strada indicata dai recenti risultati delle neuroscienze. Se le conclusioni di natura filosofica a cui ci ha permesso di giungere la nostra riflessione si dimostreranno fondate, il problema mente-cervello diventerà finalmente un problema scientifico e dovrà necessariamente essere affrontato come tale.
Ringraziamenti
Alcune parti di questo saggio sono tratte dal lavoro di P.M. Churchland e P.S. Churchland (1997). Si ringraziano i curatori di Seminars in Neurology per avere concesso la parziale utilizzazione del materiale.
Bibliografia citata
CHALMERS, D. (1996) The conscious mind: in search of a fundamental theory. Oxford-New York, Oxford University Press.
CHRISTIANSEN, M.H., CHATER, N. (1994) Generalization and connectionist language leaming. Mind and Language, 9, 273-287.
CHURCHLAND, P.M. (1979) Scientific realism and the plasticity of mind. Cambridge-New York, Cambridge University Press.
CHURCHLAND, P.M. (1981) Eliminative materialism and the propositional attitudes. Journal of Philosophy, 78, 67-90.
CHURCHLAND, P.M., CHURCHLAND, P.S. (1990) Intertheoretic reduction: a neuroscientist's field guide. Seminars in the Neurosciences, 2, 249-256.
CLARK, A. (1993) Sensory qualities. New Y ork, Oxford University Press e Oxford, Clarendon Press.
COTTRELL, G. (1991) Extracting features from faces using compression networks: face, identity, emotions, and gender recognition using holons. In Connectionist models: proceedings of the 1990 Summer School, a c. di Touretzky D., Elman J., Sejnowski T., Hinton G., San Mateo, Califomia, Morgan Kaufmann, pp. 328-337.
DAMASIO, A.R. (1994) Descartes' error: emotion, reason and the human brain. New York, G.P. Putnam. Trad. it. L'errore di Cartesio: emozione, ragione e cervello umano. Milano, Adelphi, 1995.
DENNETT, D.C. (1978) Brainstorms: philosophical essays in mind and psychology. Montgomery, VT, Bradford Books. Trad. it. Brainstorms: saggi filosofici sulla mente e la psicologia. Milano, Adelphi, 1991.
DREYFUS, H.L. (1992) What computers stilI can't do: a critique of artificial reason. Cambridge, Mass., MIT Press.
ELMAN, J. (1992) Grammatical structure and distributed representations. In Vancouver studies in cognitive science, a c. di Davis S., Oxford, Oxford University Press, voI. 3, pp. 138-194.
FEYERABEND, P.K. (1981) Realism, rationalism, and scientific method. Cambridge, Cambridge University Press.
FODOR, J.A. (1968) Psychological explanation: an introduction to the philosophy of psychology. New York, Random House.
FODOR, J.A. (1975) The language of thought. New York, Crowell.
HARDIN, C.L. (1988) Color for philosophers: unweaving the rainbow. Indianapolis, Hackett Pub. Co.
HURVICH, L.M. (1981) Colorvision. Sunderland, Sinauer Associates.
JACKSON, F. (1982) Epiphenomenal qualia. Philosophical Quarterly, 32, 127-136.
LLINAS, R., RIBARY, U. (1993) Coherent 40-Hz oscillation characterizes dream state in humans. Proc. NatI. Acad. Sci. USA, 90, 2078-2081.
LLINAS, R., RIBARY, U., JOLIOT, M., WANG, X.J. (1994) Content and context in temporal thalamocortical binding. In Temporal coding in the brain, a c. di Buzsaki G., Llinas R., Singer W., Berthoz A., Chrysten Y., Berlino-New York, Springer Verlag.
NAGEL, T. (1974) What is it like to be a bat? Philosophical Review, 83, 435-450.
NEWELL, A., SIMON, H.A. (1990) Computer science as empirical enquiry: symbols and search. In The philosophy of artificial intelligence, a c. di Boden M.A., Oxford-New York, Oxford University Press.
POPPER, K., ECCLES, J.C. (1977) The self and its brain, Part II. New York, Springer International. Trad. it. L'io e il suo cervello. Roma, Armando, 1981.
PUTNAM, H. (1960) Minds and machines. In Dimensions of mind, a c. di Hook S., New York, New York University Press.
SEARLE, J.R. (1980) Minds, brains, and programs. Behav. Brain Sci., 3, 417-457.
Bibliografia generale
CHURCHLAND, P.M., CHURCHLAND, P.S. (1990) Could a machine think? Scientific American, 262, 32-37.
CHURCHLAND, P.M., CHURCHLAND, P.S. (1997) Recent work on consciousness: philosophical, theoretical, and empirical. Seminars in Neurology, 17, 101-108.
SEARLE, J.R. (1980) Intrinsic intentionality: reply to criticisms of minds, brains, and programs. Behav. Brain Sci., 3, 450-457