Visione
Il termine visione (dal latino visio, derivato di videre, "vedere") indica il processo di percezione degli stimoli luminosi, la funzione e la capacità di vedere. Quella visiva è la modalità sensoriale più sviluppata dell'uomo: più del 50% della corteccia cerebrale risponde a stimoli visivi. La visione inizia con la formazione delle immagini sulla retina e prosegue con una catena di eventi che coinvolgono vari stadi delle vie nervose visive e gran parte del nostro cervello (v. occhio). Questo complesso sistema è soggetto a disfunzioni che possono coinvolgere i diversi stadi del processo visivo provocando varie patologie.
La catena degli eventi che portano alla visione ha inizio dall'energia luminosa che proviene dagli oggetti esterni e che forma immagini rimpicciolite e rovesciate sul fondo dell'occhio attraversandone le lenti. L'energia luminosa stimola i fotocettori (coni e bastoncelli) che codificano i segnali luminosi producendo segnali bioelettrici. Questi segnali ne generano altri nelle cellule nervose che si succedono nella retina e nelle vie che vanno dall'occhio al cervello, dando luogo a una catena di eventi che si conclude nella corteccia cerebrale generando l'immagine visiva. Occorre precisare che l'immagine visiva non è una rappresentazione fedele del mondo esterno, come può essere l'immagine fotografica o cinematografica, ma è il risultato di un processo di elaborazione cerebrale, e come tale ha caratteristiche che non sono identiche necessariamente a quelle geometriche e fisiche del mondo esterno che la genera. L'immagine cerebrale è costituita dall'attività di numerosissimi neuroni in varie aree del cervello, la quale è responsabile delle immagini che noi percepiamo e localizziamo al di fuori di noi stessi. Un esempio della mancanza di corrispondenza tra proprietà dell'oggetto e proprietà dell'immagine percepita sono le illusioni ottiche (v. illusione; percezione). Occorre inoltre tener presente che la visione non è un processo passivo, bensì risulta da principi cerebrali che organizzano l'informazione secondo regole in gran parte innate, già studiate nel secolo scorso e chiamate leggi della Gestalt. Esistono però dei limiti nelle proprietà del processo della visione, in quanto il sistema visivo agisce come un filtro capace di trasmettere solo entro certi livelli informazioni sulla realtà esterna; per es., vediamo solo le stelle che hanno un'intensità luminosa superiore a un certo valore minimo (detto di soglia); siamo sensibili solo a un ristretto intervallo dello spettro di onde elettromagnetiche (lunghezze d'onda tra 400 e 700 nm); abbiamo un limite nella capacità di vedere dettagli fini (acuità visiva). Altri animali hanno filtri visivi con proprietà diverse dalle nostre: le api e altri insetti sono sensibili alle radiazioni ultraviolette che noi non vediamo; gli uccelli rapaci e alcuni felini hanno un'acuità visiva rispettivamente molto superiore e molto inferiore a quella umana. Il nostro sistema visivo agisce da filtro anche nel dominio temporale: per es., luci che pulsano con una frequenza temporale superiore a un certo valore (50-60 Hz) sono percepite come continue, ed è ciò che accade per le lampade domestiche, alimentate con una tensione a 50 Hz. In questo modo è possibile ottenere immagini che appaiono in movimento continuo, come al cinema e alla televisione, ma che in realtà sono generate da una serie discontinua di immagini successive, poco diverse l'una dall'altra, con una cadenza temporale intorno a 50 Hz. Lo spazio che ci circonda è tridimensionale e la percezione della terza dimensione, la profondità, è possibile grazie a due diverse strategie. La prima è basata sull'esperienza, anche se è già presente nel bambino all'età di 6-7 mesi, e si fonda sui cosiddetti indizi monoculari, quelli cioè che sono percepibili anche con un solo occhio. Uno di questi è la parallasse monoculare, in base alla quale due oggetti posti a distanza diversa dall'osservatore sembrano spostarsi trasversalmente l'uno rispetto all'altro quando l'osservatore si muove; questo spostamento apparente viene interpretato come una diversa posizione dei due oggetti nel senso della profondità. Altri indizi vengono forniti dalle ombre, dalla grandezza apparente di oggetti di dimensioni note (prospettiva), dal fatto che un oggetto che ne copre parzialmente un altro è più vicino del secondo e così via. La seconda strategia è basata sulla parallasse binoculare, che risulta essere l'indizio più accurato per la visione della profondità. I due occhi vedono gli oggetti da punti di vista leggermente diversi e questo fa sì che le due immagini di uno stesso oggetto tridimensionale che si formano nei due occhi siano leggermente diverse tra loro (disparità binoculare). La disparità è analizzata nel cervello, e più precisamente nella corteccia visiva, nella quale esistono neuroni specializzati per elaborare questa informazione così come viene fornita dai due occhi. Il processo della visione non è statico ma dinamico e implica continui movimenti sia degli occhi sia della testa, che permettono l'esplorazione dello spazio circostante e l'osservazione dettagliata di ciò che attira la nostra attenzione.
L'insieme delle parti trasparenti dell'occhio (cornea, cristallino e umori) è assimilabile a un diottro sferico che di un punto luminoso a grande distanza dall'occhio forma un'immagine reale sulla retina. Dato un oggetto di dimensioni finite, cioè costituito da molti punti, il sistema ottico dell'occhio ne forma sulla retina un'immagine reale, rimpicciolita e capovolta (fig. 1). Avvicinando il punto luminoso all'occhio, l'immagine tenderebbe a sfocarsi sulla retina, se l'occhio non fosse dotato di un meccanismo capace di modificarne la messa a fuoco (accomodazione). Questo meccanismo funziona a patto che la distanza del punto non sia inferiore a un valore che nel bambino è pari a una decina di centimetri e che aumenta progressivamente con l'età, dando luogo intorno ai 50 anni alla presbiopia, cioè all'incapacità di vedere nitidamente a distanza ravvicinata. In alcuni individui l'immagine di un punto a grande distanza dall'occhio non si forma sulla retina, bensì davanti o dietro a essa a causa di un'eccessiva o di un'insufficiente lunghezza del bulbo oculare: questi due tipi di alterazione della rifrazione dell'occhio sono rispettivamente la miopia e l'ipermetropia (fig. 2). L'occhio miope vede sfocati gli oggetti a grande distanza e nitidi quelli a distanza ravvicinata, mentre l'occhio ipermetrope può arrivare a vedere nitidamente sia da lontano sia da vicino, purché possa compensare il suo difetto utilizzando l'accomodazione. Un'altra alterazione molto frequente è l'astigmatismo, che consiste nella mancanza di sfericità del diottro oculare e che provoca una diversità di messa a fuoco nei vari meridiani. L'occhio astigmatico può vedere nitidamente certe linee e contorni, ma sfocati quelli perpendicolari a essi: per es., di una E maiuscola è in grado di vedere nitido il tratto verticale e sfocati quelli orizzontali, o viceversa. Un'alterazione patologica, riscontrabile soprattutto in età avanzata, è la cataratta, un'opacità del cristallino che rende progressivamente offuscate le immagini retiniche e richiede l'asportazione del cristallino stesso e la sua sostituzione con una lente acrilica.
L'energia luminosa concentrata nell'immagine retinica viene assorbita dai fotocettori, dove si genera un segnale bioelettrico che, attraverso lo stadio intermedio delle cellule bipolari, dà luogo alla formazione di impulsi nervosi nelle cellule gangliari. Gli assoni di queste cellule costituiscono il nervo ottico che si dirige verso i centri visivi. I fotocettori sono di due tipi: i bastoncelli (circa 120 milioni), lunghi e sottili, responsabili della visione a bassi livelli di illuminazione (visione scotopica); i coni (circa 6 milioni), addensati particolarmente nella fovea, responsabili della visione ad alti livelli di illuminazione (visione fotopica) e della visione dei colori. I fotocettori contengono una sostanza fotosensibile (pigmento), che nel caso dei bastoncelli è la rodopsina. I coni, di tre tipi, si differenziano non per forma, ma per il pigmento contenuto; i tre pigmenti hanno massimo assorbimento per tre diverse lunghezze d'onda dello spettro: 435 nm per i coni S o coni 'blu'; 535 nm per i coni M o coni 'verdi'; 565 nm per i coni L o coni 'rossi' (fig. 3). Proprio la presenza di questi tre tipi di pigmento dei coni rende possibile la visione dei colori. La visione scotopica non consente la percezione dei colori, poiché i bastoncelli hanno un solo tipo di pigmento, il cui massimo di assorbimento è a 500 nm. Ogni cellula retinica risponde solo a stimoli visivi localizzati in una piccola porzione del campo visivo, detta campo recettivo della cellula. I campi recettivi delle cellule gangliari hanno dimensioni molto variabili; le dimensioni dei più piccoli sono dell'ordine di pochi minuti primi. La risposta a un piccolo stimolo luminoso sul campo recettivo può essere di due tipi: eccitatoria, od on, consistente in un aumento della scarica nervosa all'inizio della presentazione dello stimolo; oppure inibitoria, od off, consistente in una diminuzione della scarica nervosa. Il campo recettivo è costituito da due zone concentriche, che danno risposte di segno contrario, il centro e un anello circostante, detto periferia: vi sono campi recettivi di centro on e periferia off e viceversa. Il primo tipo di cellule risponde preferenzialmente a un disco luminoso su sfondo scuro, il secondo tipo a un disco scuro su sfondo chiaro. L'organizzazione dei campi recettivi è tale da rendere più efficace uno stimolo di contrasto chiaroscuro rispetto a uno di illuminazione uniforme. È noto infatti che valutiamo con relativa difficoltà il livello medio di illuminazione, mentre siamo molto sensibili a variazioni locali di contrasto. È per questa ragione che gli apparecchi fotografici sono forniti di uno strumento, l'esposimetro, che consente di adeguare l'esposizione della pellicola al livello di illuminazione della scena da fotografare. Gli oggetti presenti in una data scena ci appaiono largamente invarianti rispetto al livello di luce, anche quando questo varia di un fattore 1000 o 10.000, come avviene all'aperto nelle varie ore del giorno.
La gamma dei colori che l'uomo può percepire è molto grande, tanto che nello spettro visibile siamo in grado di distinguere più di duecento tinte diverse. Questa gamma così estesa risulta dall'eccitazione relativa dei tre tipi di coni, la cui attività elettrica si combina variamente a livello delle cellule gangliari. La combinazione di luci delle tre diverse lunghezze d'onda, opportunamente regolate in intensità, permette di riprodurre un'enorme gamma di colori. Le lunghezze d'onda devono essere scelte nelle regioni corte (blu), medie (verde) e lunghe (rosso) e si dicono primarie. Un esempio di combinazione additiva di tre luci primarie rosso, verde e blu è presentato in fig. 4; si noti che dalla combinazione delle tre primarie con opportuna intensità relativa risulta il bianco. Un corpo esposto alla radiazione del Sole (che contiene tutte le lunghezze d'onda dello spettro visibile all'incirca con uguale intensità; v. sole) può assorbire tutte le lunghezze d'onda nella stessa percentuale e ci apparirà bianco se assorbe poco, grigio, oppure nero se assorbe in percentuale maggiore. Il corpo invece appare colorato se assorbe prevalentemente una banda limitata di lunghezze d'onda dello spettro e riflette o trasmette le altre. Un corpo ci appare rosso se riflette o trasmette prevalentemente le lunghezze d'onda lunghe e assorbe quelle medie e corte, mentre un corpo che riflette tutte le radiazioni con solo una leggera prevalenza per una banda dello spettro appare quasi slavato di bianco (colore poco saturo): è questo il caso del rosa e del celeste, che corrispondono a una riflessione di tutte le radiazioni dello spettro, con una leggera prevalenza, rispettivamente, di lunghezze d'onda lunghe o corte. Sostanzialmente il colore è caratterizzato da tre variabili: la tinta, che risulta dalla lunghezza d'onda prevalente; la saturazione, che è la misura di quanto il colore si scosta da bianco, grigio o nero; l'intensità, che per i corpi illuminati si traduce nella scala dei grigi. Nella fig. 5 è rappresentato l'albero dei colori, costituito da un insieme di campioni di colore di tinte diverse, graduate in saturazione dal centro verso l'esterno e in intensità dall'alto verso il basso. Le patologie della visione dei colori a livello retinico sono di vario tipo. Vi sono difetti genetici che consistono nella mancanza di uno dei tre tipi di coni o, assai più raramente, nella totale mancanza dei coni. In quest'ultimo caso, la completa assenza di visione dei colori si accompagna ad altre severe limitazioni, quali la presenza di continui movimenti oscillatori degli occhi (nistagmo) e di effetti di abbagliamento, per cui queste persone preferiscono uscire soltanto all'imbrunire o di notte. Più comune è la mancanza di coni rossi o di coni verdi, che provoca il cosiddetto daltonismo (v.). Un'altra grave patologia dei fotocettori, di origine genetica e progressiva, è la retinite pigmentosa, dovuta a un processo di degenerazione dei recettori. Questa patologia porta inizialmente a una perdita della sensibilità nella visione notturna e a una riduzione ad anello del campo visivo, che preserva dapprima la visione centrale e poi invade progressivamente tutte le regioni del campo fino alla cecità completa. In tarda età, anche se non esclusivamente, si può verificare una disfunzione della parte centrale della retina (regione maculare), con progressiva perdita della visione distinta e della acuità visiva.
Gli assoni delle cellule gangliari della retina, circa un milione e mezzo di cellule, si riuniscono nella papilla ottica ed escono dalla retina formando il nervo ottico. I due nervi ottici si incontrano nel chiasma, dove si incrociano parzialmente: gli assoni provenienti dalla metà destra di ognuna delle due retine vanno a formare il tratto ottico sinistro, che si dirige verso l'emisfero sinistro del cervello, mentre gli assoni della metà sinistra delle retine formano il tratto ottico destro. Ne consegue che la metà sinistra del campo visivo è rappresentata nella parte destra del cervello e viceversa. I tratti ottici terminano nei nuclei (o corpi) genicolati laterali del talamo, dove le fibre si distribuiscono ordinatamente in sei strati di cellule, tre provenienti dall'occhio destro e tre, alternati, dall'occhio sinistro. Il corpo genicolato laterale è una stazione intermedia delle vie visive, dove le fibre dei tratti ottici entrano in contatto sinaptico con le cellule genicolate, i cui assoni si dirigono poi alla corteccia visiva del cervello dello stesso lato. I campi recettivi delle cellule del corpo genicolato sono molto simili a quelli della retina già descritti: campi a simmetria circolare, con risposte di tipo on e off (v. sopra). Nel corpo genicolato laterale, oltre a quelle del tratto ottico, convergono molte altre fibre, provenienti dalla sostanza reticolare e dalla corteccia visiva, che hanno il compito di modulare il flusso dell'informazione visiva in rapporto allo stato di veglia o di attenzione del soggetto o dell'animale. Quando la persona tende ad assopirsi o è comunque disattenta, le risposte visive sono molto attenuate, come se il cervello tendesse a ignorare le informazioni che in quel momento non ha interesse a elaborare.
La prima stazione della corteccia visiva, l'area primaria o V1, è situata nel polo occipitale del cervello. Le fibre provenienti dal corpo genicolato formano sinapsi con cellule della corteccia dando luogo a una rappresentazione ordinata della retina, che tuttavia non è in scala; infatti, alla parte centrale della retina, responsabile della visione dei dettagli e dei colori, è dedicata una porzione di corteccia molto più grande che alle porzioni più periferiche. Nella corteccia avviene un'importante rielaborazione dell'informazione visiva, in quanto vengono minimizzate alcune informazioni, come quelle riguardanti il livello medio di illuminazione, ed evidenziate altre, per es. i contorni e gli angoli delle figure. I campi recettivi delle cellule della corteccia, a differenza della retina e del corpo genicolato laterale, hanno perlopiù forma allungata e rispondono preferenzialmente a stimoli in movimento. La principale caratteristica è che ogni cellula risponde solo a stimoli visivi orientati in una certa direzione, cioè alcune cellule rispondono preferenzialmente a linee o contorni verticali, altre a quelli orizzontali e altre ancora a contorni obliqui. La struttura architettonica della corteccia visiva è determinata dalla funzione delle cellule da cui è costituita. Le cellule che rispondono a uno stimolo visivo di uguale orientamento, per es., sono raggruppate in colonne, cioè in piccoli blocchi di tessuto con una sezione di un centinaio di micron, che si estendono dalla superficie della corteccia fino alla sostanza bianca. Analogamente cellule che ricevono stimoli prevalentemente da uno dei due occhi sono raggruppate in colonne più grosse, dette colonne di dominanza oculare; le colonne di dominanza rispettivamente dell'occhio destro e dell'occhio sinistro si alternano regolarmente. In una stessa piccola regione della corteccia, su cui è rappresentata una piccola porzione del campo visivo, sono contenute colonne per tutti gli orientamenti e si ritiene che ciò renda possibile l'analisi dell'orientamento delle linee e dei contorni di un oggetto. Inoltre, le colonne di uguale orientamento in regioni distinte della corteccia, che rappresentano zone diverse dello spazio visivo, sono collegate tra loro anatomicamente, estendendo in tal modo l'analisi dei contorni a regioni più ampie dello spazio. Le efferenze della corteccia visiva primaria si dirigono verso centri sia sottocorticali (corpo genicolato laterale e collicolo superiore) sia corticali. Le aree corticali che ricevono dalla corteccia visiva primaria (aree extrastriate) contengono neuroni le cui proprietà di risposta sono progressivamente specializzate nell'elaborazione di diversi aspetti dell'informazione visiva. L'elaborazione dell'informazione visiva nelle aree extrastriate avviene lungo due vie privilegiate, che sono indicate come la via del 'che cosa' e la via del 'dove'. La prima è costituita da una successione di aree corticali, le cui uscite poi confluiscono nel lobo inferotemporale, ed è specializzata nelle funzioni che intervengono nella percezione degli oggetti, in particolare forma e colore. La seconda via, costituita da una successione di aree le cui uscite confluiscono nel lobo parietale, è specializzata nella percezione della posizione spaziale e del movimento degli oggetti. Nella via verso il lobo temporale, un'area di particolare rilievo è quella detta V4, i cui neuroni sono specializzati nell'elaborazione dell'informazione cromatica, cioè delle qualità spettrali dello stimolo luminoso. Si pensa che quest'area sia responsabile di alcuni aspetti inerenti la percezione cromatica, in particolare della costanza del colore, cioè del fatto che i colori degli oggetti ci appaiono sostanzialmente invariati al cambiare della sorgente di illuminazione, per es. passando dall'illuminazione solare a quella artificiale. Lesioni traumatiche, o dovute a cause circolatorie, localizzate nell'area V4 causano perdita della visione dei colori (acromatopsia corticale), che può rimanere limitata a un emicampo visivo se la lesione è solo in un emisfero. È da notare che lesioni dell'area V4, pur compromettendo la visione dei colori, non alterano quella delle forme. L'area inferotemporale riveste particolare interesse per la percezione visiva: i campi recettivi dei neuroni in essa presenti sono molto grandi e comprendono un'ampia porzione del campo visivo sia ipsilaterale sia controlaterale. Questi neuroni rispondono a stimoli con proprietà complesse, in particolare di forma, prescindendo largamente dalla posizione dello stimolo nello spazio. In una regione dell'area inferotemporale i neuroni rispondono particolarmente alle facce, sia di fronte sia di profilo e ai disegni schematici di volti, che rappresentano già nel neonato uno stimolo molto efficace. Lesioni di questa area nell'emisfero destro o anche bilaterali, ma non localizzate solo nell'emisfero sinistro, portano alla perdita della capacità di riconoscere le facce, anche quelle familiari (prosopoagnosia). Ciò avviene anche se le altre proprietà della visione, in particolare l'acuità visiva, rimangono invariate. Anche la percezione dell'espressione di un volto è regolata finemente dalle proprietà di strutture neurali: lesioni dell'amigdala, struttura sottocorticale che riceve proiezioni dall'area inferotemporale, causano una perdita della capacità di percepire l'espressione emotiva dei volti. Lesioni corticali nella regione parietale posteriore dell'emisfero destro possono invece alterare il riconoscimento di espressioni di paura o di tristezza. Inoltre, lesioni localizzate a sinistra nella regione occipitotemporale possono causare invece alessia, cioè incapacità di leggere. Nella via a proiezione parietale sono presenti aree specializzate per la percezione di oggetti in movimento, in particolare l'area V5. I neuroni di quest'area hanno campi recettivi grandi e sono specializzati nel rispondere alla direzione del movimento dello stimolo visivo. Esperimenti con le tecniche di visualizzazione dell'attività cerebrale indicano che l'area parietale è coinvolta nella percezione della posizione spaziale degli oggetti. Lesioni dell'area V5 causano perdita della visione del movimento, in particolare dei movimenti più veloci. Per lesioni di origine circolatoria o tumorali nell'area occipitale con estensione all'area parietale posteriore, si possono presentare nei pazienti gravi disturbi della capacità di orientarsi nello spazio, anche quando si tratta di uno spazio familiare; l'evenienza più comune e drammatica è che i pazienti non sanno più ritrovare la strada di casa. Lesioni dell'area parietale, particolarmente a destra, possono produrre una peculiare sintomatologia in cui il paziente ignora tutto ciò che si trova nello spazio controlaterale (eminegligenza spaziale); per es., il paziente invitato a scrivere riempie solo la metà destra del foglio e nel farsi la barba allo specchio rade solo metà del volto. Infine, occorre ricordare una sintomatologia particolarmente grave, conseguente a lesioni dell'area visiva primaria, che causa cecità completa. È stato tuttavia recentemente dimostrato che i pazienti colpiti da tale lesione, anche se percettivamente ciechi, mantengono alcune funzioni che si manifestano nella capacità di rispondere a stimoli visivi: per es., pur dichiarando di non vedere uno stimolo visivo, sanno indicare la posizione dello stimolo nel campo con buona probabilità di rispondere correttamente, oppure, quando viene loro mostrato un bastone inclinato rispetto alla verticale, sanno rispondere se è inclinato in una direzione o nell'altra. Questa visione inconscia è attribuibile alle informazioni visive analizzate nelle strutture sottocorticali.
bibl.: d.h. hubel, Eye, brain and vision, New York, Scientific American Library, 1988 (trad. it. Bologna, Zanichelli, 1989); l. maffei, a. fiorentini, Arte e cervello, Bologna, Zanichelli, 1995; s. zeki, A vision of the brain, Oxford, Blackwell, 1993.