Perché la matematica?
Lo scopo di questo saggio è presentare al lettore, invitandolo nel contempo a una personale riflessione, alcuni aspetti della matematica che permeano gran parte della nostra vita quotidiana. Il fatto che la matematica giochi un ruolo preminente, perlomeno nella società occidentale, può sembrare scontato se si considerano le sue applicazioni nella produzione o nella progettazione delle tecnologie che giorno dopo giorno semplificano la nostra vita, il modo di comunicare oppure di confrontarci nella società e così via. Si pensi, per es., ai servizi bancari offerti on-line o nei punti bancomat, al cellulare, alla risonanza magnetica quale esame di routine nella prassi ospedaliera e a numerosi altri esempi.
Tuttavia, quando si pensa all’interazione tra la matematica e la realtà quotidiana ci si riferisce a quel qualcosa di diverso e profondo, intimamente legato alla percezione del reale e al nostro modo, spesso inconscio, di realizzare conoscenza. Mentre il matematico di professione è in un continuo rapporto dialettico con la sua materia di studio che lo sensibilizza sul tema suddetto, in generale questo tipo di confronto non si verifica per chi matematico non è e, per vari motivi (primo tra i quali, spesso, una scarsa e approssimativa educazione scientifica), percepisce anzi la matematica come sostanzialmente estranea rispetto alla realtà, come uno studio specialistico le cui ricadute possono essere osservate e considerate esclusivamente nelle applicazioni tecnologiche e spesso solo a distanza di molto tempo (com’è accaduto, per es., per lo studio della cosiddetta funzione di Eulero intrapreso da Eulero stesso nel Settecento e utilizzato nell’attuale crittografia a chiave pubblica). Fortunatamente, ma forse ancora in modo limitato, gli inizi di questo nuovo secolo, accanto a una visione per molti versi prettamente ingegneristica della conoscenza, sono testimoni di un rinnovato interesse, persino al di fuori della cerchia degli addetti ai lavori, nei confronti della conoscenza prettamente matematica.
Poste tali premesse, quale risulta essere il grande vantaggio di questo nuovo punto di vista?
In questo saggio si cercherà di mostrare in quale maniera sorprendentemente naturale, la matematica ci insegna ad ampliare i nostri orizzonti di pensiero e, in secondo luogo, ci conduce a un’estesa concettualizzazione della conoscenza, punto di partenza indispensabile per ogni futura applicazione delle scienze. Lungo questo percorso si incontreranno e, a volte, saranno approfondite varie caratteristiche proprie della matematica e del fare matematica, tra le quali in particolar modo l’aspetto estetico, che però verrà sfiorato solo marginalmente, anche se meriterebbe un accurato esame. Si analizzeranno quindi situazioni concrete sufficientemente elementari che, tuttavia, permetteranno di cogliere, si spera in modo chiaro, le linee guida di questa indagine.
Conoscere
In prima istanza è opportuno porsi un semplice quesito e cercare una possibile risposta mettendo in luce, alla fine del processo, alcune delle caratteristiche matematiche di questa analisi e, in definitiva, del modo di produrre conoscenza. Si supponga che un certo numero di persone, per es. sei, si trovino all’interno della medesima stanza, una sala d’attesa di una stazione ferroviaria. È vero che almeno tre di queste persone si conoscono tra loro? Non vi è dubbio che in generale la risposta sarà negativa. Tutto cambia se si modifica la domanda nel modo seguente: è vero che almeno tre di esse si conoscono o che almeno tre di esse non si conoscono tra loro? Già a questo punto, vale a dire a livello della formulazione del quesito, si riscontra una difficoltà. Infatti, potrebbe accadere che delle sei persone tre si conoscano reciprocamente e le rimanenti tre no. In tale caso si presenterebbero contemporaneamente entrambe le possibilità espresse nella domanda: affinché quest’ultima abbia senso, è necessario interpretare la congiunzione ‘o’ non in senso disgiuntivo, ma nel senso del vel latino (disgiunzione inclusiva), come sempre accade, convenzionalmente, nel linguaggio matematico. Anche facendo questa precisazione, la risposta al quesito ora non appare più immediata: ciò suggerisce la ricerca di una ragionevole via per risolvere il problema mettendo in gioco la nostra euristica. Di primo acchito, trattandosi di sei persone in una sala d’attesa, si potrebbe pensare di osservare il loro comportamento. Se tra due di esse, per es., si instaura un’amichevole conversazione che procede speditamente per un lasso di tempo sufficientemente lungo, è probabile che queste due persone si conoscano da prima del loro ingresso nella stanza. Sebbene questa osservazione sembri ragionevolmente sensata, stiamo ‘producendo conoscenza’? O, più semplicemente, è percorribile questa via? Potrebbe accadere che alcune di queste persone abbiano mal di gola, e dunque poca voglia di conversare; ma al di là di considerazioni di questo tipo, si provi a sostituire la domanda iniziale con la seguente: è vero che almeno tre di esse hanno a due a due un amico in comune oppure per almeno tre di esse ciò non accade? Si noti che il nuovo quesito posto ha la stessa struttura del precedente, però mentre nel primo caso si era convinti fosse ragionevole considerare il loro reciproco comportamento per arrivare a un’eventuale soluzione del problema, in questo secondo caso ciò è assolutamente irrilevante. Il precedente ‘supplemento d’indagine’ dovrebbe chiarire efficacemente il fatto che nell’analisi iniziale, contestualizzando il problema nello specifico modello delle sei persone, si è in qualche modo cercato di introdurre nuove informazioni, in questo caso di tipo comportamentale, che nulla hanno a che fare con il problema stesso.
Questa osservazione suggerisce di riconsiderare il tutto in un contesto astratto. Più precisamente, e in accordo con Hans Reichenbach (The rise of scientific philosophy, 1951; trad. it. 1961), il nostro primo passo verso la conoscenza sarà astrarre e congetturare quali siano gli elementi essenziali che governano il problema. Si sostituisce allora la sala d’attesa con un foglio bianco e le nostre sei persone con sei punti distinti del foglio che indicheremo, per comodità, con le prime lettere maiuscole A,…, F dell’alfabeto, all’occorrenza confondendo, con abuso di notazione, il punto con la corrispondente lettera. Decidiamo di unire due lettere con un segmento continuo nel caso queste corrispondano a due persone che si conoscono e tratteggiato in caso contrario. È ora facile riconoscere che le informazioni contenute nel problema sono costituite esclusivamente dai sei punti individuati dalle lettere e dai segmenti tratteggiati o continui che li ammettono come estremi. Sembra utile soffermarsi a sottolineare l’essenzialità del passo appena compiuto con un esempio di natura matematica, che nello stesso tempo ci permetterà di fare un’ulteriore osservazione, non direttamente pertinente al problema, ma di grande importanza, che riguarda i limiti del processo stesso di astrazione.
La moderna teoria dei gruppi (H. Zassenhaus, Lehrbuch der Gruppentheorie, 1937) è nata nel momento in cui si è passati dai gruppi di trasformazioni su un prefissato insieme, detti anche gruppi di permutazioni, ai gruppi astratti caratterizzati da una legge di composizione soddisfacente certi assiomi che colgono l’essenzialità dell’esempio concreto costituito dai gruppi di trasformazioni stessi. In tal modo si sono eliminate le eventuali ‘sovrastrutture’ legate alla rappresentazione esplicita degli elementi del gruppo quali trasformazioni, riportando l’indagine ai principi essenziali. Con il passo successivo costituito dal teorema di rappresentazione di Cayley, che stabilisce che ogni gruppo è isomorfo a un sottogruppo, cioè ha la stessa struttura di un opportuno gruppo di trasformazioni, siamo sicuri di aver colto, con gli assiomi dei gruppi astratti, l’essenzialità dei gruppi di trasformazioni e, dunque, che in particolare la teoria dei gruppi astratti che così si sviluppa contiene al suo interno anche quella dei gruppi di trasformazione. Questa preoccupazione, che si potrebbe chiamare della giusta astrazione, è tipica del processo matematico.
Una volta isolato il problema dal contesto specifico del modello che lo rappresentava, si ritorna alla nostra euristica. La prima e più semplice strada che si potrebbe seguire è di enumerare tutte le possibili configurazioni del problema, per es. A conosce B, A conosce C, tutte le rimanenti persone non si conoscono tra loro e, analizzando una a una tutte le configurazioni ottenute, stabilire la veridicità o meno della domanda posta. Si osservi che, per come si è formalizzata l’indagine, la veridicità della domanda equivale alla possibilità di rinvenire in ciascuna configurazione almeno un triangolo i cui lati siano costituiti esclusivamente da segmenti continui o tratteggiati. Viceversa, una risposta negativa equivarrà all’esistenza di almeno una configurazione per la quale non si è in grado di trovare neppure uno di siffatti triangoli.
Questa maniera di procedere, che si può considerare meccanicista, benché in linea di principio permetta di arrivare a una conclusione (in positivo o in negativo che sia), rivela immediatamente un punto debole. Si invita il lettore con carta e penna a tracciare qualche configurazione possibile. Non è difficile, senza neppure doverne specificare il numero, rendersi conto che nel presente caso di soli sei punti la quantità di configurazioni possibili è grande. E allora se si considerassero sette, otto o più persone cosa succederebbe? E, a maggior ragione, se per qualche motivo si dovesse considerare un generico numero di persone, diciamo n, senza poter specificare l’intero naturale n? In quest’ultimo caso non si è in grado di procedere nel modo indicato. Si potrebbe però obiettare che nella sala d’attesa c’è sempre un certo numero di persone, in un determinato momento, per es. quando i nostri occhi fotografano la situazione. Tuttavia, l’astrazione stessa effettuata suggerisce l’ulteriore domanda: e se le persone fossero più di sei? Se originariamente in sala d’attesa fossero state presenti sette persone e non si fosse isolato il problema dal contesto specifico, probabilmente si sarebbe cercata una soluzione per quel preciso numero di persone senza chiedersi cosa sarebbe successo nel caso ce ne fossero state sei o otto. A questo punto, invece, appare evidente che poiché un insieme di n persone con n maggiore o uguale a sei contiene sempre un sottoinsieme di sei persone, se si risolve il problema nell’affermativo per sei persone si è risolto anche per sette, otto e così via. Si rivela quindi palese il vantaggio ottenuto con la concettualizzazione del problema. Per completezza e curiosità si noti che se ci si limitasse a sole cinque persone A, B, C, D, E (o meno) la risposta sarebbe negativa. Infatti, potrebbe accadere che A conosca B e C, B conosca A ed E, C conosca A e D, D conosca C ed E e le rimanenti non si conoscano tra loro. Eppure varianti poco più sofisticate alle quali si aggiunge un’euristica creativa del metodo descritto sono addirittura tuttora usate, per es., in molti laboratori (Gillies 1993).
Si procederà ora, con un tipico ragionamento matematico, a quella che tecnicamente viene chiamata dimostrazione. Sempre con carta e penna, disposti i punti A,…, F in ordine a formare i vertici di un poligono più o meno regolare (con il solo scopo di visualizzare in maniera semplice il problema) si congiunga il vertice A con i rimanenti vertici con linea piena o tratteggiata a seconda che A conosca o meno, come già detto, il secondo vertice a cui ci si riferisce. In questo modo si hanno cinque segmenti, tratteggiati o pieni, tre dei quali almeno sono dello stesso tipo. Per es., i segmenti AB e AD siano pieni e i rimanenti AC, AE, AF tratteggiati. Si considerino C ed E: se il segmento CE è tratteggiato non vi è più nulla da dimostrare, poiché il triangolo ACE ha tutti i lati tratteggiati. Se, invece, CE è pieno si considera CF. Se CF è tratteggiato il triangolo ACF risolve il problema. In caso contrario, si considera EF. Se quest’ultimo è tratteggiato AEF risolve il problema, altrimenti il triangolo CEF è a tratto pieno e risolve ugualmente il problema. È immediato realizzare, per es. partendo da una differente configurazione, che il precedente ragionamento ha carattere generale e dunque fornisce una dimostrazione dell’asserto.
Si noti il fatto seguente: si sono considerati i vertici C ed E e non, per es., B e D spinti dall’osservazione che i lati tratteggiati sono tre e dunque in numero maggiore di quelli a tratto pieno, il che inconsciamente suggerisce una possibilità di successo in tempi più brevi. Se ci si fosse aspettati una risposta negativa si sarebbe proceduto in modo differente. Per es., sempre nella situazione precedente, dopo aver congiunto A con i rimanenti punti, si sarebbero considerati i vertici B e D e ci si sarebbe posti nel peggiore dei casi, cioè BD tratteggiato; a questo punto che BC sia continuo o tratteggiato non è rilevante e in successione si sarebbero considerati BE, CD e DE. Nel passo successivo, volgendo l’attenzione su EC ci si trova di fronte all’alternativa di aver già risolto il problema in positivo, contrariamente alle aspettative, oppure di considerare EF necessariamente continuo e poi FC e così via fino alla risoluzione positiva del problema. Risulta evidente che la seconda dimostrazione è molto più contorta della prima, e moralmente ci si aspetta sia così poiché è stata suggerita dalla conclusione sbagliata.
È difficile giustificare razionalmente il perché si sia partiti con la fiduciosa convinzione che il problema avesse una soluzione in positivo. Certo si sarebbe potuto giocare con carta e penna su un numero specifico di casi per convincersene, ma questo sarebbe stato difficile già con nove o dieci persone. Formulato inoltre il problema in astratto per un generico numero n di individui ci si accorge che il numero sei è un caso speciale. Per valori inferiori non c’è soluzione positiva e sei è il primo e più facile caso trattabile per la nostra euristica.
Prima di riassumere brevemente alcune caratteristiche matematiche del percorso compiuto si pone una terza questione. Si sostituisca la precedente domanda con la seguente: è vero che tra le persone in esame almeno tre di esse hanno a due a due gli occhi dello stesso colore o per almeno tre di esse ciò non accade? Il quesito è del tipo finora considerato, però nel momento in cui si cerca la soluzione con il metodo descritto si nota che se il segmento a tratto pieno tra due lettere corrisponde al fatto che le due persone hanno gli occhi del medesimo colore, allora se due segmenti consecutivi, diciamo AB e BD sono pieni, lo sarà anche AD e dunque sarà risolto il problema. Questo fatto non accadeva necessariamente con il quesito iniziale; infatti, può benissimo capitare che A conosca B, B conosca D, ma che A e D non si conoscano. Tanto basta per accorgersi che si ha a disposizione un supplemento di informazione e forse vale la pena di cercare una dimostrazione alternativa. A tale scopo si suddividano le sei persone in gruppi a seconda del colore dei loro occhi. Si formerà un certo numero, da uno a sei, di gruppi con le seguenti caratteristiche: ogni persona sta in almeno uno di essi, due gruppi distinti non hanno persone in comune. Ora se un gruppo contiene almeno tre persone si è risolto il problema, altrimenti i gruppi contengono al più due persone ciascuno. Nell’ultimo caso ci sono almeno tre gruppi distinti; si sceglie in tre di essi una persona per ciascuno. Questa scelta risolve il problema. Per inciso, il supplemento d’informazione è costituito dal fatto che la relazione ‘avere gli occhi dello stesso colore’ è una relazione di equivalenza nell’insieme delle persone considerate. Cosa succederebbe se si sostituisse con la relazione ‘avere gli occhi azzurri’?
Si torni al quesito iniziale riassumendo le principali caratteristiche matematiche dell’indagine compiuta verso la soluzione: si è specificato il linguaggio; si è compiuto un processo di astrazione per precisare il problema e i dati pertinenti o gli elementi essenziali che lo governano; si è proposta una prima soluzione di tipo meccanicista evidenziandone i limiti e, nel contempo, formulato il problema più in generale riconoscendo la centralità del quesito originale; si è prodotta una dimostrazione con il convincimento di una risposta positiva; si è prodotta una seconda dimostrazione partendo dall’errata convinzione di una risposta negativa.
Sembra interessante osservare che le ultime due proposizioni mettono in luce il ruolo di quella che Karl R. Popper ha definito metafisica influente (Postscript to the logic of scientific discovery, 3 voll., 1982-83; trad. it. 1984). Secondo Popper, ogni fase dello sviluppo della scienza soggiace all’influenza di idee metafisiche, non controllabili; sono proprio queste idee a determinare quali problemi esplicativi affrontare e quali tipi di risposte poter considerare idonee, soddisfacenti o accettabili. L’analisi fin qui condotta ha infatti messo in evidenza che l’attesa di una risposta positiva al problema non è razionalmente giustificata e questo atteggiamento, queste convinzioni precostituite sono parte integrante tanto della ricerca scientifica quanto della vita in genere. È semmai più avanti nel corso dell’indagine che capita di formulare congetture che di volta in volta si ritengono più prossime alla verità. Rimane certamente comune all’indagine matematica e alle problematiche quotidiane quel tanto di ingiustificato da un punto di vista logico-razionale, che indirizza le scelte nella soluzione dei problemi. Non si è allora tanto distanti dalla posizione di Paul Feyerabend che, in uno scritto sul filosofo della matematica e della scienza, l’ungherese Imre Lakatos (Imre Lakatos, «The British journal for the philosophy of science», 1975, 26, 1, pp. 1-18), ha ribadito che le affermazioni e le procedure della scienza non si possono giustificare in quanto non ne hanno bisogno. È in fondo una visione della scienza come di una costruzione complessa che cerca convalide e giustificazioni non solo nella sua non contraddittorietà logica o empirica, ma anche in aspetti più propriamente metafisici, come detto, psicologici, pragmatici, sociali e così via.
Dimostrare
La parte più difficile nella dimostrazione di un teorema consiste nello stabilire quale teorema si vuole dimostrare. Lungi dall’essere un bisticcio di parole, il congetturare un enunciato di cui si voglia dimostrare la veridicità è nel contempo sia alla base di ogni dimostrazione sia influenzato dalla dimostrazione stessa. In modo chiaro Lakatos, in Proofs and refutations. The logic of mathematical discovery (1976; trad. it. 1979), ha scritto che le dimostrazioni anche se talvolta non dimostrano, di sicuro aiutano a migliorare la nostra congettura. Spesso in una seria attività decisionale si presenta un’esperienza analoga: per es., si supponga di voler migliorare la propria situazione economica con un investimento che si riveli redditizio nel tempo, e ci si rivolga a tale scopo al mondo dell’arte. Si può, per qualche motivo, avere in mente l’acquisto di una tela di un certo autore A, ma acquisendo notizie sulle sue quotazioni e sulla sua pittura si sarà quasi sicuramente esposti a nuove informazioni, per es., riguardanti un autore B le cui quotazioni negli ultimi anni sono state progressivamente più incisive. Un tale fatto provoca immediatamente un supplemento d’inchiesta e un confronto diretto tra A e B; l’ipotetico acquisto iniziale può, dunque, non sembrare più soddisfacente avendo conosciuto l’opera del pittore B. Ovviamente, non si sta dimostrando nulla, ma è pur vero che si è pronti a cambiare parere acquisendo nel percorso nuova conoscenza. Questo accade spesso per gli enunciati preliminari di un teorema. In altri termini, pur non avendo dato un senso matematicamente compiuto al verbo dimostrare, un punto iniziale (ed essenziale) del processo consiste non tanto nella correttezza logico-deduttiva della dimostrazione quanto nella comprensione di ciò che veramente si sta dimostrando. Nessun matematico riporta questa parte della sua ricerca in un articolo, ma è ovvio che il nucleo originario delle sue convinzioni, per es. relative al teorema principale dell’articolo che intende scrivere, si forma in uno stato di permanente ‘tensione’ che precede la stesura dell’articolo stesso, nel quale vengono sviluppati e confrontati processi, tecniche, idee, congetture ed enunciati. Si usa il termine tensione perché è confrontabile con la tensione essenziale dello storico e filosofo della scienza statunitense Thomas S. Kuhn, per es. quella realizzata dal contrapporsi di tradizione e innovazione.
L’esperienza e la prassi matematica guidano il ricercatore verso nuovi problemi posti dalla matematica stessa in contrapposizione a quelli provenienti dall’esterno, cioè da una visione empiristica e troppo spesso utilitaristica della materia, tipica, per es., di una concezione strumentale alla descrizione del mondo fisico. L’esperienza matematica è costituita da quel bagaglio di conoscenze e tecniche provenienti dallo studio e dalla ricerca che formano e influenzano la sensibilità del ricercatore: in questo senso è possibile distinguere, all’interno della comunità dei matematici, gli algebristi, gli analisti, i geometri e così via. Questa sensibilità condiziona, perlomeno inizialmente, la prassi dimostrativa, ma il matematico di qualità percepisce il continuo rapporto dialettico tra il problema e la sua esperienza, ritrovandosi costantemente pronto a ‘cambiare strada’. Siamo allora d’accordo con la posizione di Popper, per il quale la scienza e, in particolare, la matematica si sviluppano in un perenne stato di rivoluzione dovuto alla continua confutazione e alla correzione di sempre nuove congetture. È esattamente quel che accade nella pratica dimostrativa quando ipotesi, tesi e loro reciproci legami si sviluppano interagendo sotto gli occhi del ricercatore. Per Kuhn, invece, nell’ampliamento della conoscenza, in particolare di quella matematica, a periodi di scienza ‘normale’ si susseguono periodi di ‘rivoluzione’. Durante la scienza normale la comunità scientifica lavora su paradigmi, cioè su prescrizioni metafisiche, metodologiche, principi rilevanti, criteri ecc., al fine di perfezionarli ed estenderli; in sostanza, gli scienziati lavorano su un insieme di conoscenze collaudate nel tentativo di estenderne la precisione, la comprensione e il campo di applicabilità. Dunque per Kuhn la scienza normale è in un certo qual senso manualistica, con riferimenti ben precisi (quali, per es., per la fisica possono essere stati per centinaia di anni i Philosophiœ naturalis principia mathematica, 1687, di Isaac Newton), condotta quasi con la certezza che i problemi che via via si pongono al suo interno abbiano sempre soluzione. La scienza normale con il suo paradigma contingente serve a preparare il terreno alla rivoluzione, che si presenta inizialmente come una serie di anomalie nell’edificio scientifico organizzato nel paradigma. Inizia allora un nuovo periodo di ricerca, in cui accanto al vecchio paradigma può affermarsi una nuova organizzazione del sapere. È il momento della rivoluzione.
La dimostrazione in matematica, a eccezione ovviamente delle dimostrazioni elementari, non è mai manualistica: il matematico militante sa che se un problema è matematicamente nuovo troverà nei manuali, negli articoli in letteratura, nella sua esperienza solo una serie di idee e tecniche che potranno sì aiutarlo, ma non costituiscono certo una garanzia per la risoluzione del problema. La rivoluzione, che in fondo è creatività, si applica già a un livello più basso di quello prospettato da Kuhn; semmai è la portata della scoperta, cioè il suo valore in relazione alle scoperte future, che fa parlare di risultato o teoria rivoluzionaria in matematica, ma sempre e necessariamente a seguito di valutazioni a posteriori.
Un esempio significativo, che inoltre permette di introdurre e brevemente commentare una particolare prassi dimostrativa, è quello costituito dalla geometria euclidea. Nei suoi Elementi Euclide (attivo attorno al 300 a.C.) oltre a fornire contributi originali, distilla e riassume i risultati di molti pensatori precedenti. In tal modo le acquisizioni geometriche dell’età classica raggiungono una forma (quasi) definitiva: la geometria viene basata su un sistema di assiomi o postulati dai quali derivare tutti i teoremi. Questo fatto fornisce alla geometria un grado di certezza mai precedentemente raggiunto da nessun’altra scienza. I pochi assiomi che forniscono il fondamento del sistema erano così evidenti (per la matematica di quel tempo) che la loro validità veniva accettata senza riserve. L’intera costruzione geometrica era basata su essi e sulla validità delle inferenze logiche usate nel corso della dimostrazione vera e propria: un teorema, per quanto complesso ed eventualmente poco intuitivo si presentasse, poteva essere considerato vero tanto quanto gli assiomi di base che si erano assunti. Per meglio apprezzare l’importanza del metodo assiomatico mettiamo a confronto la geometria euclidea e quella iperbolica. Come ben noto, la geometria iperbolica deve la sua nascita al tentativo di determinare se la collezione degli assiomi della geometria euclidea, come espressi negli Elementi, sia minimale, nel senso che non possa essere sostituita da una collezione più piccola. In particolare, ci si chiedeva se qualche postulato fosse conseguenza dei rimanenti. Il quinto postulato, quello delle parallele, ben si presta a tale indagine essendo decisamente meno immediato e intuitivo degli altri. Euclide stesso, partendo dagli altri assiomi, era riuscito a provare che per un punto al di fuori di una retta data passa almeno una parallela a quest’ultima, riducendo in tal modo l’originario assioma all’assunzione dell’unicità della parallela. Bisogna sottolineare inoltre che l’assioma delle parallele, a differenza degli altri, non è neppure del tutto ‘sensibilmente’ soddisfacente, poiché contiene un’affermazione che riguarda l’infinito: l’asserzione che due rette non si intersecano a distanza finita trascende l’esperienza. Già nell’antichità i matematici (fra cui il filosofo greco Proclo, 412-485) si erano sforzati invano per cercare di risolvere il problema. Tutto cambiò quando nell’Ottocento il matematico e fisico tedesco Carl F. Gauss e, indipendentemente, l’ungherese János Bolyai e il russo Nikolaj I. Lobačevskij negarono il postulato ammettendo l’esistenza di più di una parallela per un punto esterno alla retta. Preceduti inconsapevolmente dal gesuita Giovanni Girolamo Saccheri (1667-1733), essi svilupparono i primi risultati di geometria iperbolica secondo cui, per esempio, la somma degli angoli interni di un triangolo è sempre inferiore a 180°, in aperto contrasto con il caso euclideo.
Restava ancora da capire perché fosse possibile una geometria non euclidea. La spiegazione sta nel fatto che, indipendentemente dalla nostra percezione sensoriale che sembrerebbe convalidare l’assioma delle parallele, la costruzione assiomatica fornisce la dimostrazione di un’asserzione in termini di derivazioni logiche dai soli assiomi. La visualizzazione adoperata attraverso una figura non è un fattore dimostrativo ma solo un mezzo che a volte suggerisce (soprattutto nel caso euclideo) come procedere nella concatenazione di inferenze logiche con le quali si arriva poi a dimostrare il teorema. Poiché la geometria iperbolica non è facilmente visualizzabile, a differenza della geometria euclidea dove inizialmente si formulavano i teoremi e poi si sviluppavano i fondamenti, la costruzione assiomatica è stata lo strumento di indagine nella nuova geometria secondo l’ordine ‘dal più semplice (gli assiomi) al più complesso (i teoremi)’.
Benché l’inglese Bertrand Russell (1872-1970) sembri privilegiare nella sua spiegazione del concetto di filosofia matematica la matematica che procede per analisi, cioè quella che cerca i concetti e i principi più generali nei cui termini quello che era il punto di partenza può essere dedotto o definito (come è stato per la geometria euclidea), la costruzione assiomatica gioca, in alcune occasioni, un ruolo insostituibile. Il discorso precedente conduce alla seguente considerazione: se la matematica è in grado di utilizzare un certo sistema di assiomi, in particolare l’assioma ‘a’, ed è altrettanto in grado di ripartire da un altro sistema di assiomi contenente ‘non a’ al posto di ‘a’, allora la matematica diviene esclusivamente la scienza delle implicazioni, cioè delle relazioni aventi la forma ‘se… allora’. Dunque, in questo senso, la veridicità o meno dell’assioma ‘a’ non appartiene alla matematica, ma a qualche altra scienza. Per es., se pensiamo allo spazio fisico in cui viviamo, ci sembra che il postulato delle parallele sia vero e che dunque sia corretto verificarne la veridicità nell’ambito della fisica (si veda, comunque, la critica di Reichenbach sulla possibile scelta di uno spazio fisico in Philosophie der Raum-Zeit-Lehre, 1928, trad. it. 1977).
Vi sono però alcune situazioni nella quali il problema epistemologico di dove collocare un postulato per verificarne se non la veridicità, perlomeno la ragionevolezza, diviene difficilmente superabile. Nell’esempio seguente si metterà in luce questo fatto e contemporaneamente, semmai ve ne fosse ancora bisogno, l’importanza del processo di assiomatizzazione. Spesso, infatti, quest’ultimo tipo di indagine permette di approfondire i problemi trattati chiarificandone al tempo stesso l’interesse matematico. A tale scopo si consideri una proposizione che dipenda da un intero naturale n. Gli esempi più semplici che si possono proporre sono di carattere matematico e dunque si consideri la proposizione P(n): la somma dei primi n interi naturali è data dalla metà del prodotto di n per l’intero successivo n+1. Verificare la veridicità di P(1) significa semplicemente osservare che 1 è la metà del prodotto di 1 con 2. Dunque P(1) è vera. Si può ora continuare ragionando nel modo seguente. Si supponga di avere una procedura, o una ricetta che dir si voglia, che dalla veridicità di P(1) permetta di passare a quella di P(2) e successivamente da P(2) a P(3) e così via; cioè, nel caso generale, di avere una prescrizione che dalla veridicità di P(n) permetta di passare a quella di P(n+1). Sembra allora assodato che, fissato comunque m, siamo in grado di provare la veridicità di P(m). Infatti P(1) è vera avendolo verificato direttamente, P(2) ne è conseguenza e così via in un numero finito di passi fino ad arrivare all’m-esimo passo, cioè a P(m). È possibile riassumere il precedente ragionamento nel seguente schema, chiamato principio di induzione. Sia P(n) una proposizione che dipende dall’intero n. Si verifichi la veridicità di P(n0) per un qualche n0; per n generico e non inferiore a n0 si sia in grado di provare che la veridicità di P(n) implica quella di P(n+1). Allora P(n) è vera per ogni n non inferiore a n0.
A questo punto sembrerebbe di avere semplicemente codificato un tipo di inferenza logica, propria delle leggi del pensiero, e di non avere alcun motivo particolare per elevarla al rango di assioma. Eppure qualcosa ci sfugge; precisamente il controllo di quel numero finito di passi, essendo quest’ultimo mai fissato. Un supplemento d’indagine mostra che il principio di induzione è equivalente al seguente enunciato: ogni sottoinsieme non vuoto dei numeri naturali ammette un minimo. Questo non è vero in generale per altri insiemi numerici ordinati. Per es., nel campo dei numeri razionali il sottoinsieme costituito dai razionali il cui quadrato è più grande di 2 non ha minimo (ciò corrisponde alla pitagorica incommensurabilità della misura della diagonale del quadrato rispetto al lato). La validità per gli interi naturali di ciò che in matematica si chiama assioma del buon ordinamento è dovuta alla loro stessa costruzione, introdotta per via assiomatica da Giuseppe Peano (1858-1932). Il principio di induzione dunque altro non è che un assioma. La successiva domanda è: in quale ambito è sensato considerare la veridicità del principio di induzione o, analogamente, dell’assioma del buon ordinamento?
I problemi nella discussione precedente sono nati dal fatto che si è preso in considerazione un processo infinito. Potrebbe capitare, invece, di dover esaminare un numero finito ben specifico di casi, ma troppo grande per le possibilità umane di calcolo. Questo è ciò che accade con il seguente problema di colorazione delle carte geopolitiche, noto come problema dei quattro colori. Si consideri una carta geopolitica con un certo numero di Stati ciascuno costituito da un solo pezzo (l’Italia non è quindi uno Stato utilizzabile). Il problema consiste nel colorare ciascuno Stato in modo che due Stati confinanti non abbiano mai il medesimo colore. Qual è il numero minimo di colori che si possono utilizzare affinché ciò avvenga? Conviene porre il problema in una forma astratta analoga a quella considerata all’inizio. Supponendo quindi che la carta rappresenti, per fissare le idee, sei Stati distinti, verrà rappresentato su un foglio ciascuno di essi con un punto e una corrispondente lettera, diciamo A,…, F, che lo individua. Si conviene poi di connettere due punti con un segmento se i corrispondenti Stati sono confinanti: il problema si traduce allora nel colorare i punti in modo tale che due punti estremi del medesimo segmento non abbiano mai lo stesso colore. Data sul piano del foglio una configurazione di punti e lati come quella ottenuta, cioè un grafo (semplice), qual è il numero minimo di colori che è possibile utilizzare? Non è poi così difficile provare che l’uso di cinque colori è sufficiente; se però si cerca di risolvere il problema utilizzando soltanto quattro colori, benché la risposta sia affermativa, la difficoltà è enorme. La dimostrazione di questa proprietà si articola riducendo la lista infinita di tutte le carte possibili a una lista finita di configurazioni standard inevitabili, precisamente 1936, sulle quali si dimostra l’asserto. Sebbene il processo di riduzione si possa attuare, in linea di principio, in via deduttiva mentale, il numero elevato di verifiche che esso richiede preclude a un essere umano la possibilità di poterlo eseguire. Quando nel 1976, Kenneth Appel e Wolfgang Haken (Solution of the four color map problem, «Scientific American», 1977, 237, 4, pp. 108-21), proposero questo tipo di dimostrazione, implementarono il processo su un calcolatore utilizzando circa 1000 ore macchina per poterlo espletare. Considerando che il funzionamento intrinseco di un calcolatore non è esente da errori, è lecito ritenere, pur completata nei dettagli tecnici, la precedente argomentazione ‘una dimostrazione’ del teorema dei quattro colori? Mentre nella matematica assiomatica la logica è uno strumento dimostrativo, si è ora di fronte a una situazione nella quale la matematica diviene quasi empirica e la logica deve assumere il ruolo di strumento di critica. Vi sarà forse la nascita di un nuovo empirismo nella matematica del 21° secolo? La storia della scienza ci insegna che la realizzazione del progresso scientifico richiede spesso molta immaginazione al di fuori del pensiero scientifico vero e proprio, quasi una nuova metafisica nel senso di Popper.
L’irragionevole efficacia della matematica
Negli esempi precedenti è stato utilizzato un approccio di tipo matematico che ha permesso di descrivere i problemi posti in un ambito astratto. Così facendo si è riusciti a determinare, come dice Reichenbach, i fattori rilevanti e irrilevanti del problema (in sostanza, specificare le ipotesi sotto le quali cercare una soluzione). Tutto ciò può far pensare di trovare nella matematica un linguaggio che è estensione e contemporaneamente precisazione di quello naturale, e che permette di descrivere, in modo univocamente interpretabile, i fatti della realtà complessa che ci circonda. Se nel nostro linguaggio comune si possedessero, per es., solo i termini chiaro e scuro la descrizione degli oggetti in un qualsiasi ambiente illuminato risulterebbe grossolana e poco significativa. È raffinando il linguaggio, per es. etichettando, seppur convenzionalmente, i colori, che si amplia la nostra conoscenza, essendo in grado di dare una migliore descrizione degli oggetti esistenti. Tuttavia, la matematica non è un semplice linguaggio e il suo uso non è uno strumento per la ricerca di un metodo risolutivo. Nelle applicazioni, ma non solo in esse come, per es., la fisica ci mostra, la matematica è soprattutto predittiva, ossia permette di anticipare l’accadere di nuovi fenomeni in modo così brillante che è d’obbligo domandarsi, parafrasando il titolo di un articolo di Eugene P. Wigner (The unreasonable effectiveness of mathematics in the natural sciences, «Communications in pure and applied mathematics»,1960, 13, 1, pp. 1-14), il perché dell’irragionevole efficacia della matematica. Se si pensa alle teorie scientifiche – nelle quali essa viene regolarmente utilizzata – come derivate dall’esperienza, assumendo in tal modo una posizione induttivista, non si riesce a formulare una risposta soddisfacente. Al più, per alcune branche di essa, per es. la geometria euclidea, è possibile osservare che i postulati sui quali si fonda sono stati suggeriti dal mondo sensibile. Sicuramente, tuttavia, questa giustificazione non è accettabile, poiché altre specialità della matematica, che in origine nulla hanno avuto a che fare con il mondo sensibile o fisico, sono in grado di determinare, attraverso considerazioni puramente speculative, ‘leggi fisiche’ come, per es., quella (peraltro molto semplice e ben nota) del decadimento radioattivo di una sostanza, che riscontrano un successo sperimentale. Come afferma Popper (Conjectures and refutations. The growth of scientific knowledge, 1962; trad. it. 1972), partendo da una simile posizione (induttivista) è naturalmente sorprendente riscontrare che una teoria, formulata da matematici in modo puramente speculativo risulti in seguito applicabile al mondo fisico; e, ancora, spesso è questa anticipazione speculativa a preparare la via alle teorie empiriche.
Si può azzardare a pensare che il successo della scienza moderna sia sostanzialmente dovuto alla combinazione di due fattori: il metodo matematico, usato per formulare le spiegazioni scientifiche e carico della capacità di predizione propria della matematica, e il metodo sperimentale, dove l’esperimento è una domanda rivolta alla natura. Mediante l’uso di opportune apparecchiature si dà origine a un fenomeno fisico, il cui risultato (almeno teoricamente) fornisce risposte positive o negative. Principio di indeterminazione e tesi di Quine a parte, una volta notato che i fenomeni osservati al di fuori dell’intervento umano dipendono da così tanti fattori che è impensabile poter determinare il contributo di ciascuno di essi al risultato finale, l’esperimento scientifico ha il compito di isolare questi fattori, nell’esperimento stesso o nelle sue conseguenze, rivelando così il meccanismo del fenomeno che ha luogo quando non vi è interferenza da parte dell’uomo. Nasce in questo modo nella scienza moderna il metodo ipotetico-deduttivo, cioè un metodo di spiegazione mediante ipotesi matematiche da cui sono dedotti i fatti osservati. L’esperimento diviene allora un criterio di verità dell’efficacia del metodo e delle sue previsioni. Citando ancora Reichenbach, «i dati d’osservazione sono il punto di partenza del metodo scientifico, ma non lo esauriscono. Essi vengono integrati con una spiegazione matematica che va molto al di là di ciò che è stato osservato; la stessa spiegazione è quindi sottoposta a delle inferenze matematiche che rendono esplicite le varie implicazioni contenute in essa, implicazioni controllate successivamente mediante ulteriori osservazioni. A decidere fra il sì e il no sono queste, e in tal senso il metodo è empirico. Ma quello che le osservazioni confermano come vero è molto di più di quanto esse provano direttamente; esse attestano una spiegazione matematica astratta, cioè una teoria da cui possono venire dedotti matematicamente i fatti osservabili» (The rise of scientific philosophy, 1951; trad. it. 1961, p. 109). Per contro, è lavorando all’interno della matematica stessa, per es. nella dimostrazione di un qualche teorema, che essa si pone nuovi obiettivi sia finalizzati alla risoluzione del problema considerato sia a volte assolutamente indipendenti. Quest’esperienza è propria del matematico, ma non è la sola a indicare nuove direzioni d’indagine. Spesso interessanti problemi nascono dalla semplice osservazione. La curiosità che a volte stimola a soffermarsi su alcuni particolari nella quotidianità è la medesima che spinge il matematico a indugiare, per es., su una certa struttura, risultato o teorema che sia, ritornando con domande ogni volta diverse.
A titolo esplicativo, la domanda che ci si è posta in precedenza sulle sei persone in sala d’attesa e sulla sua soluzione in positivo suggerisce al ricercatore attento uno slogan del tipo: il disordine completo è impossibile. La matematica ha sviluppato un’intera teoria, attualmente in rapida crescita in questa direzione e ciò rappresenta in sostanza la propaganda che caratterizza i teoremi di tipo Ramsey (per una introduzione all’argomento, F.P. Ramsey, On a problem of formal logic, «Proceedings of the London mathematical society», 1930, 30, 1, pp. 264-86, e B. Bollobás, Modern graph theory, 1998).
Un elementare e dettagliato esempio può fornire una spiegazione migliore. Si torni alla carta geopolitica e si supponga di avere a che fare con cinque Stati A, B, C, D, E che confinano tra loro in modo tale che, in base alla regola che si è data, A e B, B e C, C e D, D e A siano gli estremi di altrettanti segmenti e si ponga il punto E al di fuori del quadrangolo che ha per vertici i rimanenti punti. Si congiungano poi, per es., E con A. La figura che si è ottenuta dovrebbe assomigliare a un quadrangolo i cui vertici, in senso orario, si sono chiamati A, B, C, D, e da un quinto punto E fuori di esso con rispettivo segmento EA. Si ha dunque a che fare con cinque vertici, i punti, cinque lati, i segmenti, la faccia del quadrangolo e una regione esterna al quadrangolo in cui si insinua il lato AE che si ritiene ancora una faccia. Sia v1 il numero dei vertici, l1 quello dei lati e f1 quello delle facce. Si considerino somme e sottrazioni di questi tre interi: per es., risulta v1−l1+f1=2. Si supponga ora che, in seguito a una rivoluzione, lo Stato E si spezzi in due nuovi Stati, denominati E e F, dove E confina con F e con A e F anche con B. Nasce una nuova figura che vagamente assomiglia a due quadrangoli con un lato in comune. Ora però i vertici sono v2=6, i lati l2=7 e le facce, compresa quella esterna, f2=3. Si ha ancora v2−l2+f2=2. Ci si può adesso divertire ad aggiungere (o togliere) Stati più o meno confinanti chiamando facce quelle che la nostra intuizione ritiene tali. Con una certa sorpresa si constaterà che il precedente risultato non cambia, cioè sommando il numero dei vertici con quello delle facce e togliendo quello dei lati si ottiene il numero naturale 2.
L’istinto, eventualmente supportato da un sufficiente numero di tentativi, suggerisce che ciò non può essere casuale ed ecco nascere il nostro problema: dimostrare la veridicità universale di ciò che si è verificato direttamente in alcuni casi (per inciso, la precedente è una formula dimostrata da Eulero). Ma il matematico in generale non si ferma, non è appagato da questa generalità e magari sostituisce il foglio di carta da noi considerato con una superficie curva, per es. quella di una sfera, e poi con quella di una ciambella e così via. Senza entrare in particolari tecnici che coinvolgono la misura di quanto una superficie si discosti in un punto da un piano, nascono una nuova indagine e un nuovo risultato, il teorema di Gauss-Bonnet: l’integrale della curvatura di una superficie chiusa coincide con 2π volte la caratteristica di Eulero-Poincaré della superficie, un intero relativo, che sostanzialmente conta il numero di fori delle ciambelle a più anelli.
Quest’ultimo esempio suggerisce anche un commento, di natura diversa ma importante, che riguarda l’operato di un matematico e che spesso ne guida, più o meno consciamente, la ricerca. Come si è già avuto modo di accennare, la matematica si suddivide in varie discipline quali l’analisi, che studia la teoria delle funzioni, le loro proprietà di regolarità, di integrabilità, le soluzioni di equazioni differenziali ecc., oppure la topologia, il cui compito è lo studio delle proprietà invarianti degli oggetti per trasformazioni continue, come quelle che, per es., nascono disegnando figure su una superficie elastica che poi si deformano a piacere e così via. Ebbene, il teorema di Gauss-Bonnet è un ponte tra un concetto topologico, la caratteristica di Eulero-Poincaré, e un oggetto analitico, l’integrale della curvatura di una superficie. Il matematico è in un certo qual modo esteticamente appagato da un risultato di questo tipo forse psicologicamente spinto dal desiderio di operare una sempre più profonda unione all’interno dell’edificio matematico. Esistono molti altri esempi di questa natura e senza poter qui approfondire alcun aspetto, desideriamo citarne almeno alcuni classici come l’uso dell’analisi complessa in teoria dei numeri, o il modo in cui le sezioni coniche sono apparse nella teoria di Kepler e Newton delle orbite planetarie e per finire la recentissima comparsa degli invarianti polinomiali dei nodi nella teoria quantistica dei campi.
Mentre agli inizi del 20° sec., specie con il processo di assiomatizzazione iniziato già alla fine dell’Ottocento attraverso lo studio dei fondamenti, in particolare la teoria degli insiemi, la matematica aveva subito una sorta di frammentazione, conseguenza, in sostanza, di un riordino razionale dell’intero edificio, agli inizi del 21° sec. si è spettatori di una tendenza nell’ambito della ricerca verso la riunificazione di varie discipline in una sorta di progressivo cambiamento del paradigma kuhniano. Notevole, a questo riguardo, è la risoluzione della congettura di Poincaré dovuta al russo Grigorij J. Perelman che, portando a termine il programma analitico concepito e iniziato dallo statunitense Richard Hamilton, è riuscito a dimostrare un importante risultato topologico (Morgan, Tian 2007).
Ritornando all’aspetto estetico della matematica un’analogia con l’architettura può parzialmente far comprendere l’atteggiamento del matematico. Come possono apparire esteticamente appaganti un grattacielo o una cattedrale per le loro strutture, il gioco dei volumi, le corrispondenze su larga scala dei vari corpi di fabbrica, ma anche per i particolari nella ricerca stilistica degli ambienti, lo studio della luce naturale negli interni, le minuzie dei dettagli ecc., così nella matematica le teorie giocano il ruolo della progettazione architettonica nella sua interezza, mentre le ‘belle’ dimostrazioni di qualche specifico risultato quello dell’artigiano-artista nel concepimento e nella produzione dei particolari.
Com’è naturale, non sempre gli sforzi in una direzione, quale essa sia, vengono coronati da successo e certamente anche tra i matematici la qualità raggiunta non è sempre la stessa. Però a volte le intuizioni non razionali sono di un tipo particolare. Come ha già osservato Popper (2001), spesso un teorema può essere scoperto con tentativi inconsci, guidati da un’aspirazione di natura estetica, piuttosto che dal pensiero razionale. Definire quale o cosa sia l’estetica percepita quasi a livello inconscio da un matematico, è veramente difficile; eppure è una sensibilità per il bello che non ha a che fare con l’ordine, come si potrebbe pensare. Infatti, capita spesso al matematico di apprezzare in modo particolare una dimostrazione, un passo costruttivo, un’idea per la sua originalità, o fantasia, per essere al di là di certi schemi preposti sia dal gusto imperante sia dalla tradizione accademica. La comprensione di questo fenomeno dal di fuori non è né facile né immediata, ma spesso ciò è esattamente quel che accade quando si è esposti a un’opera, per es. una tela, che si colloca oltre le nostre forme e sensibilità culturali. Per poterla apprezzare si deve conoscere, e solo in questo modo si può diventare partecipi dell’emozione dell’opera d’arte. Come non tutte le opere sono arte, così non tutta la matematica è di qualità, intesa come quella qualità che la pone tra le conquiste del genere umano. Così accanto alla matematica ‘eccezionale’ vive quella ‘normale’, che ha comunque diritto al giusto riconoscimento, essendo il substrato comune da cui, a volte, si genera il capolavoro.
Bibliografia
D. Gillies, Philosophy of science in the twentieth century, Oxford-Cambridge (Mass.) 1993 (trad. it. Roma-Bari 1995).
K.R. Popper, La scienza e i suoi nemici, Roma 2001, pp. 21-56.
J. Morgan, G. Tian, Ricci flow and the Poincaré conjecture, Providence (R.I.)-Oxford 2007.