La nascita delle strutture
Per «struttura» s’intende l’impalcatura relazionale su cui si basa ogni discorso matematico, ossia lo scheletro costituito dalle relazioni che connettono i vari elementi di un insieme e dalle proprietà che tali relazioni soddisfano. Una simile presentazione mette subito in evidenza come l’accento non cada sulla specifica natura degli elementi su cui si opera, quanto piuttosto sulla griglia – la struttura, appunto – nella quale tali elementi sono inseriti e che assegna le modalità con cui gli elementi possono essere tra loro relazionati o, in altre parole, le operazioni che possono essere su di loro eseguite. Si parla in particolare di strutture algebriche, di strutture d’ordine, di strutture metriche.
Le prime a essere definite sono quelle algebriche, attorno alla metà dell’Ottocento, quando diverse ricerche convergono nell’assegnare un nuovo statuto all’algebra che da scienza delle quantità si trasforma progressivamente in scienza delle relazioni. In Gran Bretagna, a Cambridge, un gruppo di giovani matematici confluisce nella Analytical Society: polemizzano contro la sterile difesa a oltranza della tradizione newtoniana e auspicano lo svecchiamento di una matematica che, al pari di quella continentale, sappia procedere verso una maggior autonomia dei simboli usati (interessandosi non tanto al loro significato quanto allo studio delle regole formali cui sono sottoposti). Tra i giovani matematici dell’Analytical Society figura W.R. Hamilton, che cerca di generalizzare alle terne o addirittura alle n-uple di numeri reali i risultati ottenuti con i numeri complessi, definiti come coppie ordinate di numeri reali. Nascono così i quaternioni, numeri dalla forma a + bi + cj + dk con a, b, c, d ∈ R, in cui a è detta parte scalare del quaternione e il resto rappresenta la sua parte vettoriale (con coefficienti b, c, d). Si tratta di oggetti matematici strani, il cui calcolo oltretutto non verifica neppure la proprietà commutativa del prodotto. Gli elementi di cui ormai si occupa l’algebra non sono necessariamente numeri e le operazioni con cui questi elementi vengono composti, a due a due, non godono necessariamente delle classiche proprietà soddisfatte fino ad allora da tutti i numeri. Viene a cadere una sorta di principio di permanenza di queste proprietà: il prodotto tra due quaternioni, come detto, non verifica per esempio quella commutativa. Vale allora la pena di distinguere i calcoli che, a prescindere dalla natura degli elementi cui si applicano, confermano la proprietà commutativa del prodotto (per fermarsi all’esempio dei quaternioni) da quelli in cui invece questa proprietà non è soddisfatta; in altri termini, vale la pena – diremmo noi oggi – di distinguere le strutture commutative da quelle non commutative.
Altri oggetti “strani”, con un calcolo “strano,” che iniziano a circolare nella prima metà dell’Ottocento sono le matrici. Una matrice è una tabella rettangolare di numeri e sulle matrici – in precedenza strumento di indagine di altri problemi e ora oggetto di studio in sé – si è in grado di operare con un calcolo coerente (somma, prodotto, matrice inversa) scoprendo in particolare che ancora una volta, dopo il caso dei quaternioni, il prodotto tra matrici non soddisfa la proprietà commutativa. Quaternioni e matrici sono esempi di nuovi oggetti matematici che tolgono al calcolo ogni presunzione di “naturalezza” e di unicità. Ma il contributo più importante alla definizione di una specifica struttura algebrica, quella di gruppo, viene dal nuovo indirizzo che il francese E. Galois dà alla riduzione del problema della risolubilità di una generica equazione di grado maggiore di 4.
Vi erano già stati molti tentativi di ampliare i risultati ottenuti con le equazioni di terzo e quarto grado dagli algebristi italiani nel Cinquecento, ma a poco a poco si era diffuso il sospetto che l’obiettivo non fosse perseguibile. Il sospetto sembra diventare certezza con il medico e matematico P. Ruffini – il cui nome è legato alla cosiddetta “regola di Ruffini” – che prova l’impossibilità, in generale, di risolvere per radicali le equazioni di grado superiore al quarto. La sua dimostrazione non è però del tutto convincente: chi, a fatica, riesce a leggerla tutta pensa che non sia completa. La lacuna è colmata dal matematico norvegese N.H. Abel: dalla metà degli anni Venti del xix secolo sappiamo che in generale un’equazione di grado superiore al quarto non è risolubile per radicali, ossia con una formula simile a quella per le equazioni di secondo grado.
Le vicende personali di Galois sono sufficientemente note, divulgate anche da film e romanzi. A soli 18 anni vive la tragedia del suicidio del padre, vecchio anticlericale e antimonarchico, al centro di una diffamazione politica. Tenta per due volte di essere ammesso all’École polytechnique, ma viene respinto anche per una certa arroganza mostrata all’esame orale dove risponde troppo sinteticamente e in modo poco chiaro a domande che giudica ovvie. In seguito verrà espulso dall’École normale supérieure per motivi politici – si era legato agli studenti repubblicani e iscritto alla Società degli amici del popolo – nei giorni infuocati che erano seguiti alla fuga del re Carlo x. Nel frattempo, aveva cominciato a pubblicare alcuni lavori di matematica, ma le sue ricerche sulle equazioni algebriche vanno incontro a un destino beffardo: un primo articolo presentato all’Académie des sciences viene perso da A.-L. Cauchy che avrebbe dovuto esaminarlo, un secondo è affidato al giudizio di Ch. Fourier, che muore poco dopo, un terzo viene respinto da S.D. Poisson con la motivazione che gli argomenti trattati da Galois non sono abbastanza chiari e sviluppati per poterne giudicare la correttezza. Evariste muore in duello il 30 maggio 1832, né si sa con esattezza se a scatenare la contesa siano state questioni sentimentali o motivi politici. La notte prima del duello capisce che potrebbe non avere più tempo per continuare le sue ricerche e lascia un’appassionata lettera a un amico, compagno di studi e di militanza politica, in cui le riassume pregandolo di conservare in qualche modo i suoi appunti perché riescano utili a chi in futuro vorrà proseguire i suoi studi. La Mémoire sur les conditions de résolubilité des équations par radicaux (Memoria sulle condizioni di risolubilità delle equazioni per radicali) di Galois sarà stampata e conosciuta solo una quindicina di anni dopo la sua morte. Usando un linguaggio moderno, si può dare un’idea del procedimento contenuto in essa dicendo che Galois considera l’insieme Q dei numeri razionali cui appartengono i coefficienti dell’equazione e lo estende al più piccolo campo Q(a1, a2, …, an) che lo contiene assieme alle sue radici a1, a2, …, an, comprese quelle che non appartengono a Q. A questa estensione associa il gruppo – in suo onore poi chiamato gruppo di Galois – di tutte le possibili permutazioni delle radici o, in termini più tecnici, degli automorfismi di Q(a1, a2, …, an) che lasciano fisso ogni elemento di Q (e quindi si limitano ad agire sulle radici che non appartengono a Q). Le proprietà dell’equazione originaria vengono tradotte in condizioni relative a questo gruppo di automorfismi che ha un numero finito di elementi e pertanto può essere indagato per via combinatoria. In particolare, un’equazione algebrica a coefficienti in Q è risolubile per radicali se e solo se il gruppo di Galois a essa associato contiene una catena di sottogruppi tali che ognuno sia un sottogruppo normale di indice primo nel precedente.
Il gruppo di Galois è la prima struttura algebrica a comparire esplicitamente nel mondo matematico. La teoria elaborata dal matematico francese permette anche di risolvere una volta per tutte, sia pure negativamente, alcune antiche questioni geometriche legate alla costruzione con riga e compasso. Si dimostra infatti che è impossibile costruire in tal modo un cubo di volume doppio; analogamente è impossibile dividere un angolo in tre parti uguali e, dato un cerchio, costruire un quadrato che abbia la stessa area.
La struttura di gruppo – analogo discorso può comunque essere sviluppato per le altre strutture algebriche di ideale, corpo, campo, spazio vettoriale – è spesso arricchita dalla compresenza di una struttura d’ordine. Si è così in grado non solo di eseguire calcoli, grazie alla struttura algebrica, ma anche di confrontare tra loro due elementi di un dato insieme decidendo qual è il maggiore e quale il minore. È un confronto essenziale in molte nozioni matematiche, anche elementari. La definizione di massimo è per esempio basata sulla disuguaglianza ƒ(x) ≤ ƒ(x0) e quindi sulla possibilità di confrontare l’immagine del punto x0 con quella di tutti gli altri punti x del dominio della funzione (eventualmente ristretti a un intorno di x0). La risoluzione di una semplice disequazione di primo grado, quale per esempio x + 3 ≤ 4, è basata sulla compresenza di una struttura algebrica – ravvisabile nell’operazione di addizione – e di una struttura d’ordine che permette di confrontare i due membri della disequazione.
Le strutture metriche sono basate sul concetto di distanza ovvero su una nozione che sembra non nascondere particolari insidie. Si sa calcolare facilmente la distanza tra due punti dell’asse reale o anche tra due punti del piano. Nel piano, la distanza tra due punti P1 e P2, di coordinate rispettivamente (x1, y1) e (x2, y2), è data dalla lunghezza del segmento P1P2 ovvero, grazie al teorema di Pitagora, da
Si ragiona in modo analogo nello spazio; insomma sembra che non ci sia niente da discutere e da approfondire: la distanza tra due punti è un concetto naturale, intuitivo e molto “concreto”. Le cose invece non stanno così. La distanza sopra richiamata, con la formula della radice quadrata, che si chiama distanza euclidea, non è affatto così “concreta” come vorrebbe presentarsi e inoltre non è l’unica. È solo quella con cui si ha maggiore dimestichezza anche per via dell’esperienza scolastica. Ci sono altri modi di calcolare una distanza, anche nella vita di tutti i giorni e il risultato numerico può essere diverso. Si considerino per esempio, sempre nel piano, due punti di coordinate P1(1, 4) e P2(5, 2) e si supponga che siano due luoghi di una città il cui tessuto urbano è costruito su un reticolo di strade ortogonali. Usando come nell’esempio precedente la metrica euclidea, spostandoci da P1 a P2 in linea d’aria si avrebbe
Se invece ci si sposta da P1 a P2 seguendo effettivamente le strade della città (a pianta ortogonale), si ottiene
È, in altro contesto, il modo in cui nel gioco degli scacchi si sposta il pezzo della torre. C’è chi si sposta in linea d’aria e c’è chi, più terra terra, si sposta a piedi o in automobile, seguendo i possibili percorsi cittadini. È evidente che, a seconda del modo in cui ci si sposta, le distanze da percorrere risultano diverse. L’esempio è comunque sufficiente per trarre alcune conclusioni:
a) anche il concetto di distanza, apparentemente così innocuo, non è affatto esente da criticità e la sua formulazione euclidea non è comunque l’unica possibile;
b) la sua essenza non può essere affidata a una formula (quella della radice quadrata e della metrica euclidea);
c) non vale quindi la pena di affiancarle altre formule e di fare l’elenco di tutte le possibili distanze: ci sarebbe sempre la possibilità che ne vengano fuori altre e l’elenco andrebbe di continuo aggiornato (e con esso rivisto il concetto di distanza);
d) vale invece la pena di fissare la definizione di distanza concettualmente, a prescindere dalle possibili formule, isolando nel concetto di distanza quelle proprietà cha appaiono essenziali e irrinunciabili in qualunque definizione concreta successiva.
Non importa sapere con quali oggetti si stia lavorando – possono essere tra i più diversi – e neppure importa dichiarare precisamente, con delle formule, le operazioni che su di loro si eseguono. L’importante è fissare, attraverso alcuni assiomi, le proprietà minime che queste operazioni devono in ogni modo verificare; le formule verranno dopo, come semplici esempi delle molteplici applicazioni che la teoria astratta, costruita per via assiomatica, si può permettere. Nel caso della distanza, questa viene allora definita come un numero, dipendente dalla coppia di elementi x1 e x2 – non più necessariamente punti! – tra cui si vuole calcolare la distanza, appartenenti a un certo insieme X, sempre positivo e che è nullo se e solo se i due elementi coincidono; inoltre questo numero non cambia se cambia l’ordine in cui si considerano i due elementi (la distanza tra x1 e x2 è identica a quella tra x2 e x1) e soddisfa la cosiddetta disuguaglianza triangolare (in un triangolo, la misura di un lato è sempre minore della somma delle misure degli altri due; in altre parole: la distanza tra due elementi è minore quando è calcolata direttamente, senza nessuna deviazione per un terzo punto x3). Nascono così gli spazi metrici X, introdotti all’inizio del Novecento dal matematico francese M.R. Fréchet. Gli spazi metrici sono insiemi dotati di una distanza, vale a dire di una applicazione che a due qualsiasi elementi x1 e x2 di X, associa un numero d che soddisfa gli assiomi:
d(x1, x2) ≥ 0
d(x1, x2) = 0 se e solo se x1 = x2
d(x1, x2) = d(x2, x1)
d(x1, x2) ≤ d(x1, x3) + d(x3, x2)