Fermat, ultimo teorema di
di Massimo Bertolini
SOMMARIO: 1. Introduzione. ▭ 2. Storia: il lavoro di Kummer. ▭ 3. Estensioni abeliane di Q. ▭ 4. Estensioni esplicite di campi e funzioni modulari. ▭ 5. Curve ellittiche ed estensioni non abeliane di Q. ▭ 6. Rappresentazioni associate a forme modulari e la congettura di Shimura-Taniyama. ▭ 7. La dimostrazione di Wiles: a) dalla congettura di Shimura-Taniyama all'ultimo teorema di Fermat: il teorema di Ribet; b) il teorema di Mazur; c) il teorema di Langlands-Tunnell; d) la dimostrazione della congettura di Shimura-Taniyama. ▭ 8. Altri aspetti. ▭ Bibliografia.
1. Introduzione.
"Cubum autem in duos cubos, aut quadrato quadratum in duos quadrato quadratos, et generaliter nullam in infinitum ultra quadratum potestatem in duos ejusdem nominis fas est dividere: cujus rei demonstrationem mirabilem sane detexi. Hanc marginis exiguitas non caperet".
La dimostrazione di quest'affermazione di Pierre de Fermat, formulata intorno al 1630 in una famosa nota a margine e conosciuta come 'ultimo teorema di Fermat', ha eluso gli sforzi di matematici illustri (e meno illustri) sino agli ultimi anni del XX secolo, quando il matematico inglese Andrew Wiles, con la collaborazione di Richard Taylor, ha risolto finalmente il dilemma (v. Wiles, 1995; v. Taylor e Wiles, 1995).
In linguaggio più moderno, l'ultimo teorema di Fermat (UTF) afferma che l'equazione
xn + yn = zn
non ha soluzioni intere (x, y, z), con xyz ≠ = 0, per ogni esponente n ≥ 3. Si tratta di un'affermazione di disarmante semplicità, la cui dimostrazione sfrutta tuttavia sofisticate e profonde teorie matematiche sviluppate nel corso dei secoli (in particolare negli ultimi cinquant'anni) e combinate genialmente da Wiles. Queste teorie affondano le loro radici in due importanti filoni di sviluppo della matematica: la costruzione delle estensioni algebriche del campo razionale Q e la teoria delle forme modulari. Come quasi sempre accade per le scoperte matematiche importanti, la dimostrazione dell'UTF si inquadra nella continuità dello sviluppo delle idee in matematica, rappresentandone una delle massime sommità.
2. Storia: il lavoro di Kummer.
Nonostante Fermat avesse affermato di possedere una dimostrazione mirabile della sua nota a margine, egli ci lasciò una dimostrazione scritta soltanto del caso n = 4. Circa cent'anni più tardi, nel 1753, Leonard Euler fu in grado di dimostrare il caso n = 3 nel 1825 Gustav Peter Lejeune Dirichlet e Adrien Marie Legendre riuscirono a trattare il caso n = 5, mentre nel 1839 il caso n = 7 si arrese all'attacco di Gabriel Lamé. Da questi lavori emerge il metodo della 'discesa infinita', che resta a tutt'oggi fondamentale nello studio delle soluzioni intere di un'equazione algebrica (v. Edwards, 1977).
Grazie al lavoro di Fermat nel caso n = 4 e tenuto conto del fatto che ogni esponente n ≥ 4 è sempre divisibile per 4 oppure per un primo dispari p, l'UTF si riduce a dimostrare che l'equazione di esponente primo dispari
xp + yp = zp
non ha soluzioni non banali nell'anello degli interi Z.
Il contributo di Ernst Eduard Kummer allo studio dell'UTF rappresenta l'inizio di una nuova fase storica, in cui per la prima volta è ottenuto un risultato generale (cioè relativo a tutti gli esponenti) basato su tecniche profonde della teoria algebrica dei numeri (v. Washington, 1982; v. Marcus, 1977). Alla base del metodo vi è l'osservazione che l'equazione di Fermat per l'esponente p si fattorizza come
dove ζp indica la radice p-esima primitiva dell'unità e2πi/p. Supponendo che una soluzione intera esista, questa formula può essere interpretata come una relazione tra gli elementi dell'anello Z[ζp], composto da tutti i numeri complessi della forma a0 + a1ζp + … + ap-1ζpp-1 con gli ai interi. È naturale chiedersi sotto quali condizioni essa comporti che ciascun fattore x + ζpky sia essenzialmente uguale alla potenza p-esima di un elemento di Z[ζp].
Assumendo l'esistenza di una soluzione (x,y,z) con xyz ≠ = 0, Kummer cercò di ottenere una contraddizione. Si noti che non è una limitazione supporre che x, y e z non abbiano fattori comuni maggiori di 1. Si consideri dapprima il caso in cui p non divide xyz (questo è il cosiddetto 'primo caso' dell'UTF). Se nell'anello Z[ζp] vale la proprietà di fattorizzazione unica (come prodotto di fattori primi) ben nota per l'anello Z, si dimostra che x + ζpky è della forma uαp dove u è un'unità e α un elemento in Z[ζp]. Da questa relazione si può ricavare una contraddizione.
Questa dimostrazione introduce un importante interrogativo sulla struttura algebrica dell'anello Z[ζp], che ha stimolato la nascita della teoria dei numeri moderna. La fondamentale scoperta (descritta nel linguaggio dei giorni nostri) fu che la proprietà di fattorizzazione unica in Z[ζp] vale soltanto per un numero finito di esponenti p (quelli minori di 23) e che tuttavia una proprietà analoga è sempre valida per gli ideali non nulli di quest'anello (un ideale I di Z[ζp] è un sottoanello tale che se i appartiene a I anche a • i appartiene a I per ogni a in Z[ζp]). In base a questa proprietà ogni ideale non nullo di Z [ζp] può essere fattorizzato in modo essenzialmente unico come prodotto di ideali primi. Da questo segue che l'ideale principale (x + ζpky) è uguale alla potenza p-esima di un ideale I:
(x + ζπκψ) = Ip.
Si definisca una relazione di equivalenza I ~ J sull'insieme degli ideali non nulli di Z[ζp] dichiarando equivalenti I e J se esistono elementi non nulli α e β di Z[ζp] tali che αI = βJ. La moltiplicazione di ideali induce una struttura di gruppo abeliano sull'insieme quoziente Clp, detto 'gruppo delle classi di ideali'. Kummer dimostrò la finitezza di Clp e ottenne dei criteri per determinare se p divida o meno l'ordine hp di Clp. Il primo p è chiamato 'regolare' se non divide hp e 'irregolare' se invece divide hp. Se p è un primo regolare, l'uguaglianza (x + ζpky) = Ip implica che I è un ideale principale (α) e quindi vale la relazione x + ζpky = uαp, che si sarebbe ottenuta direttamente assumendo la proprietà di fattorizzazione unica per gli elementi di Z[ζπ]. Da questa relazione si può ricavare una contraddizione, dimostrando così il primo caso dell'UTF per esponenti primi regolari. Il secondo caso (in cui p divide uno tra x, y e z) può essere trattato con considerazioni analoghe.
Fu seguendo queste linee di ragionamento che Kummer ottenne la dimostrazione dell'UTF per tutti gli esponenti primi regolari. La sorte vuole che a tutt'oggi non si sappia dimostrare l'esistenza di infiniti primi regolari, nonostante questi sembrino presentarsi con maggiore frequenza di quelli irregolari, dei quali è dimostrata l'infinità. A dispetto di queste limitazioni del metodo di Kummer, le idee da lui introdotte nello studio degli anelli Z[ζπ] (e di certe loro generalizzazioni, chiamate 'anelli degli interi algebrici di campi di numeri') avranno un ruolo fondamentale nello sviluppo della teoria dei numeri e riappariranno in forme nuove e inaspettate nella dimostrazione di Wiles.
3. Estensioni abeliane di Q.
Le idee di Kummer (v. sopra, cap. 2) sono profondamente legate alla teoria delle estensioni abeliane del campo razionale Q.
Sia α un numero algebrico, cioè un numero complesso che soddisfi un'equazione algebrica p(x) = 0, dove p(x) è un polinomio irriducibile a coefficienti razionali non tutti nulli. Indichiamo con Q.(α) il campo generato da α: gli elementi di Q.(α) sono le espressioni polinomiali in α a coefficienti razionali. Il campo Q.(α) è chiamato 'estensione algebrica finita' di Q; questa estensione si dice 'di Galois' se Q.(α) contiene tutte le radici complesse di p(x) = 0. In questo caso, si definisce il gruppo di Galois Gal (Q(α)/Q) dell'estensione Q.(α) come il gruppo degli automorfismi di Q(α), rispetto alla composizione di applicazioni. (Un automorfismo di Q(α) è un'applicazione di Q(α) in sè che rispetta le operazioni di somma e prodotto). Per descrivere un automorfismo σ basta specificare l'immagine σ(α) di α, che è necessariamente un'altra radice di p(x) = 0 (coincidente con α se σ è l'applicazione identica). Un'estensione di Galois Q(α) si dice abeliana se il suo gruppo di Galois è un gruppo abeliano (ossia, commutativo).
Come esempio, si consideri l'm-esimo 'campo ciclotomico', definito come l'estensione Q (ζμ), dove ζμ indica la radice primitiva m-esima dell'unità e2πi/m, soddisfacente l'equazione xm - 1 = 0. Si verifica che Q(ζm) è un'estensione abeliana di Q; in effetti, vi è un isomorfismo
Gal(Q(ζμ)/Q) ≃ (Z/mZ)×,
dove (Z/mZ)× è il gruppo delle unità nell'anello Z/mZ delle classi di resti modulo m. Questo isomorfismo è definito inviando un elemento σ del gruppo di Galois di Q(ζμ) nell'unità k modulo m tale che σ (ζm) = ζμκ. Si noti che (Z/mZ) × può essere identificato con il gruppo GL1(Z/mZ) delle matrici invertibili di ordine uno a coefficienti in Z/mZ. Nel seguito, si utilizzerà la notazione GL1(Z/mZ) per indicare (Z/mZ)×, al fine di mettere in evidenza l'analogia con costruzioni che saranno introdotte nei prossimi capitoli.
Il teorema di Kronecker-Weber (v. Washington, 1982, cap. 14), dimostrato nella seconda metà dell'Ottocento, afferma che ogni estensione abeliana finita F di Q è contenuta in un campo ciclotomico Q(ζμ) per un certo m. Sia Q la chiusura algebrica di Q, cioè l'unione di tutte le estensioni algebriche finite del campo razionale (viste come sottocampi del campo complesso C), e sia Q(ζ∞) l'unione di tutti i campi ciclotomici. Grazie al teorema di Kronecker-Weber, Q(ζ∞) è l'estensione abeliana massimale di Q. Se GQ indica Gal(Q/Q), ne consegue che Gal(Q(ζ∞)/Q) si identifica con il quoziente abeliano massimale GQab di GQ. In particolare, dall'inclusione di Q(ζm) in Q(ζ∞) si ottiene per ogni m un omomorfismo suriettivo
ρm : GQ→GL1(Z/mZ).
Diremo che ρm è una rappresentazione galoisiana di GQ in GL1 e che Q(ζm) è un'estensione di Q di tipo GL1.
Si osservi che il metodo di Kummer è intimamente legato all'idea di associare a un'ipotetica soluzione dell'equazione di Fermat di esponente p l'estensione Q(ζp)/Q di tipo GL1, ossia l'estensione definita dall'equazione xp - 1 = 0 nell'incognita x. Vedremo più avanti (v. sotto, cap. 7) che un passo cruciale nella dimostrazione di Wiles consiste nell'associare a un'ipotetica soluzione dell'equazione di Fermat di esponente p un'estensione 'non abeliana' (cioè avente gruppo di Galois non commutativo) di tipo GL2. Quest'estensione è costruita aggiungendo a Q l'insieme finito delle soluzioni di un sistema di equazioni algebriche in due incognite x e y. Un'equazione del sistema è fornita dall'equazione di una curva piana E, detta 'curva ellittica', associata all'ipotetica soluzione; le altre equazioni descrivono i punti di m-torsione della curva E (v. sotto, cap. 5). Il metodo di Wiles consiste nell'ottenere una contraddizione: esso mostra che l'estensione costruita in questo modo ha proprietà incompatibili tra di loro e per ciò non può esistere.
4. Estensioni esplicite di campi e funzioni modulari.
Il teorema di Kronecker-Weber afferma che tutte le estensioni abeliane di Q si ottengono aggiungendo i valori della funzione esponenziale e2πix con esponenti x razionali. È naturale cercare di generalizzare questa affermazione sostituendo al campo razionale Q una sua qualsiasi estensione algebrica finita K, detta anche 'campo di numeri'. Il problema è cioè quello di generare le estensioni abeliane di un campo di numeri K per mezzo dei valori di certe funzioni esplicite. Si tratta di una forma del famoso XII problema di Hilbert, formulato all'inizio del XX secolo e ancora del tutto aperto nella sua forma generale. Il caso particolare del problema in cui K sia un campo quadratico immaginario Q(√D), con D intero negativo - il cosiddetto Kronecker Jugendtraum - è tuttavia ben compreso: il problema è risolto dalla teoria della moltiplicazione complessa, che rappresenta uno dei culmini della matematica del XIX secolo (v. Weber, 19082; v. Serre, 1967). Le funzioni esplicite utilizzate in questo caso particolare sono chiamate 'funzioni modulari'.
Vediamone per sommi capi la definizione (v. Shimura, 1971; v. Serre, 1973, cap. VII). Sia ℋ il semipiano superiore complesso, formato dai numeri complessi aventi parte immaginaria strettamente positiva, e sia Γ0(N) il gruppo moltiplicativo delle matrici quadrate di ordine 2 a coefficienti in Z, il cui determinante è uguale a 1 e la cui riduzione modulo N è triangolare superiore. Il gruppo Γ0(N) agisce su ℋ mediante la regola
Una funzione modulare di peso k ∈ Z è una funzione meromorfa f definita su ℋ a valori in C, che gode della proprietà (di simmetria rispetto all'azione di Γ0(N))
f(γ z) = (cz + d)kf(z) per ogni γ ∈ Γ0(N)
e che soddisfa una condizione di meromorfia nell'insieme delle 'cuspidi' P1(Q) = Q ⋃{∞}. Una funzione modulare è chiamata 'forma modulare' se è olomorfa ovunque (cuspidi incluse). (Una funzione g(z) definita su un disco D di centro z0 del piano complesso, salvo al più in z0, si dice olomorfa in D se è differenziabile in senso complesso in tutti i punti di D, e si dice meromorfa in D se è nella forma h(z)/(z-z0)n, con n intero, h(z) olomorfa in D e h(z0) ≠ 0. Se n 〉 0, z0 è chiamato polo di ordine n. Per maggiori dettagli sui concetti dell'analisi complessa, v. Ahlfors, 1979).
Le funzioni modulari di peso 0 (e quindi invarianti per l'azione di Γ0(N)) formano un campo rispetto alle operazioni naturali di somma e prodotto. Se N = 1, cioè si considerano funzioni invarianti rispetto al gruppo SL2(Z), questo campo è generato da un'unica funzione j(z), caratterizzata dalle proprietà seguenti: ha un polo semplice con residuo 1 nella cuspide ∞, è olomorfa su ℋ e si annulla nel punto e2πi/3 di ℋ. La forma modulare j ha uno sviluppo in serie di Fourier, detto 'q-espansione',
dove q = e2πiz e i coefficienti an sono interi; in particolare a1 = 196884 e a2 = 21493760.
Un caso particolare della teoria della moltiplicazione complessa prende in considerazione le estensioni di K = Q (√ D) ottenute aggiungendo a K certi valori di j(z). Più precisamente, visto K come sottocampo di C, si consideri una base {1,ω} su Z dell'anello ℴK degli interi algebrici di K, con ω appartenente a ℋ (per definizione, ℴK è il sottoanello di K contenente gli elementi che soddisfano un'equazione algebrica a coefficienti interi, con coefficiente del monomio di grado più alto uguale a 1). Sia poi K∞ il sottocampo di C ottenuto aggiungendo a K tutti i valori j(cω), al variare di c tra gli interi positivi. Il risultato fondamentale della teoria della moltiplicazione complessa afferma che K∞ è un'estensione (infinita) abeliana di K; inoltre, se K∞(ζ∞) indica il minimo campo contenente K∞ e il campo ciclotomico Q(ζ∞) (v. sopra, cap. 3), si ha che K∞(ζ∞) è essenzialmente uguale all'estensione abeliana massimale di K.
5. Curve ellittiche ed estensioni non abeliane di Q.
Le forme modulari sono legate intimamente alla classificazione delle curve ellittiche sul campo complesso (v. Silverman, 1986).
Una curva ellittica definita su un campo F (di caratteristica diversa da 2 e 3) è una curva proiettiva non singolare rappresentata da un'equazione affine della forma
y2 = 4x3 - g2x - g3,
con g2 e g3 appartenenti a F; la condizione di non singolarità equivale alla condizione g23 -27g32 ≠ = 0.
Sia Λ un reticolo in C, cioè un sottogruppo del gruppo additivo di C della forma Zω 1 + Zω2, con ω1/ω2 appartenente a ℋ. Il gruppo quoziente C/Λ è chiamato 'toro complesso di dimensione uno'. I punti complessi di una curva ellittica definita su C si identificano con un toro complesso. Infatti, se Λτ indica il reticolo Zτ + Z (con τ ∈ ℋ), vi è un isomorfismo (definito dalla funzione ??? di Weierstrass e dalla sua derivata) tra C/Λτ e i punti complessi Eτ (C) della curva ellittica di equazione Eτ: y2 = 4x3 -g2(τ)x - g3(τ), dove
con c2 = 60 e c3 = 140. Questo isomorfismo invia l'origine del toro nel punto all'infinito O = (0,1,0) di Eτ. Inoltre, si dimostra che ogni curva ellittica definita su C è isomorfa a Eτ per qualche τ in ℋ. La funzione gi(τ) è una forma modulare di peso 2i per il gruppo SL2(Z).
Sostituendo a un reticolo Λ = Zω1 + Zω2 un reticolo omotetico αΛ, α ∈ C -{0}, si ottiene un toro complesso C/αΛ isomorfo a C/Λ; l'isomorfismo è indotto dalla moltiplicazione per α. Segue che la classe di isomorfismo del toro C/Λ è anche rappresentata dal toro C/Λτ, dove τ = ω1/ω2. Otteniamo che i punti di ℋ descrivono le classi di isomorfismo dei tori complessi di dimensione uno. Due punti τ e τ′ di ℋ corrispondono alla stessa classe di isomorfismo se e solo se sono coniugati rispetto all'azione di SL2(Z), cioè τ′ = γτ per un elemento γ di SL2(Z). Di conseguenza, vi è una biiezione
ℋSL2(Z) ↔ {classi di isomorfismo di tori complessi di dimensione uno}.
Il quoziente ℋ/SL2(Z) possiede una struttura naturale di superficie di Riemann (v. Ahlfors, 1979), usualmente indicata con Y0(1). La superficie Y0(1) è isomorfa alla retta affine complessa e può essere compattificata con l'aggiunta dell'insieme quoziente di cuspidi P1(Q)/SL2(Z), contenente in effetti un solo elemento (rappresentato per esempio da ∞). Questa compattificazione, indicata con X0(1) e chiamata 'curva modulare di livello uno', è quindi uguale al quoziente ℋ*/SL2(Z), dove ℋ* indica il semipiano superiore esteso ℋ⋃P1(Q). Si tratta di una curva proiettiva, isomorfa a P1(C).
L'isomorfismo da X0(1) a P1(C) è definito esplicitamente per mezzo della forma modulare di peso zero j(τ) (v. sopra, cap. 4): infatti, j(τ) è invariante per l'azione di SL2(Z) e quindi può essere vista come una funzione su X0(1) a valori in P1(C); questa funzione è biiettiva, poiché j(τ) ha un unico polo semplice nella cuspide di X0(1). In conclusione, le classi di isomorfismo dei tori complessi di dimensione uno sono parametrizzate dai valori della funzione j(τ).
Il gruppo C/Λτ è dotato di una struttura naturale di gruppo, in cui l'operazione di somma è indotta dalla somma in C. Questa struttura può essere trasportata su Eτ(C), grazie alla biiezione tra questo insieme e C/Λτ, così che diviene possibile sommare i punti complessi della curva ellittica Eτ. Quest'operazione di somma può equivalentemente essere definita in modo geometrico, per mezzo della proprietà seguente: la somma di tre punti P, Q ed R (non necessariamente distinti) è uguale al punto all'infinito O (l'origine della legge di gruppo) se e solo se P, Q ed R sono allineati.
Fissiamo ora una curva ellittica E definita su Q (e quindi anche su C); la struttura di gruppo su E permette di costruire estensioni algebriche di Q. Dato un intero m ≥ 2, si indichi con [m] la moltiplicazione per m sui punti complessi di E e sia E[m] = {P ∈ E(C):[m] P = O} il nucleo di [m]. Poiché E(C) è isomorfo a un toro C/Λ, il gruppo E[m] è isomorfo a (Z/mZ)2; fissata una base (P1,P2) per E[m] come Z/mZ-modulo, si ottiene un'identificazione del gruppo Aut(E[m]) di automorfismi di E[m] con il gruppo GL2(Z/mZ) delle matrici invertibili di ordine 2 a coefficienti in Z/mZ. Poiché E è definita su Q, la mappa [m] è descritta da funzioni razionali a coefficienti in Q; segue che le coordinate affini dei punti non nulli in E[m] definiscono un'estensione di Galois Q(E[m]) di Q: in altre parole GQ agisce su E[m] per mezzo di automorfismi. Combinando queste osservazioni, grazie alla teoria di Galois si ottiene un omomorfismo
ρE,m:GQ → GL2(Z/mZ),
detto 'rappresentazione galoisiana associata ai punti di m-torsione di E '. Il nucleo di ρE,m è Gal(Q/Q(E[m])) e quindi Gal(Q(E[m])/Q) si inietta in GL2(Z/mZ). L'estensione Q(E[m])/Q sarà detta di tipo GL2.
È noto che Q(E[m])/Q può essere ramificata solo nei divisori primi di m e del conduttore N di E. Il conduttore N è un intero positivo che misura la cattiva riduzione di E; in particolare, se un primo p non divide N, la riduzione modulo p di un'equazione per E a coefficienti interi definisce una curva ellittica Ẽ(p) sul campo finito con p elementi Fp = Z/pZ. Sia ℴm l'anello degli interi algebrici in Q(E[m]). L'estensione Q(E[m])/Q è non ramificata in p se l'ideale pℴm di ℴm si fattorizza come prodotto di ideali primi distinti di ℴm. Se ℘ è uno qualunque di questi fattori primi, l'elemento di Frobenius Frob℘ è definito come l'elemento del gruppo di Galois di Q(E[m])/Q tale che Frob℘(x) - xp appartiene a ℘ per ogni x in ℴm. Segue che è possibile definire la matrice ρE,m(Frob℘) corrispondente a Frob℘ mediante ρE,m. Se np indica la cardinalità dell'insieme finito Ẽ(p)(Fp), e se p non divide Nm si dimostra che valgono le relazioni
tr (ρE(Frob℘)) ≡ 1 + p - np mod m,
det (ρE,m(Frob℘)) ≡ p mod m.
La costruzione descritta sopra di un'estensione di tipo GL2, ottenuta grazie ai punti su una curva ellittica soddisfacenti l'equazione [m]P = 0, è analoga alla costruzione dell'estensione Q(ζm)/Q di tipo GL1 (v. sopra, cap. 3) per mezzo delle soluzioni dell'equazione xm - 1 = 0. Come già osservato (v. sopra, cap. 4), questa seconda costruzione è ottenuta aggiungendo a Q i valori della funzione esponenziale negli argomenti razionali; viene da chiedersi se anche la prima costruzione possa essere effettuata in un'opportuna maniera esplicita. Le considerazioni svolte nel cap. 4 suggeriscono che la teoria delle funzioni modulari può essere di aiuto; vedremo che la questione è legata alla costruzione di rappresentazioni galoisiane associate a forme modulari. La fondamentale congettura di Shimura-Taniyama afferma che la curva ellittica E è associata a una forma modulare f per il gruppo Γ0(N), nel senso che 1 + p - np è uguale al p-esimo coefficiente ap nella q-espansione di f per tutti i primi p che non dividono N. In particolare, per le relazioni messe in evidenza sopra, si ha che se p non divide Nm, ap(mod m) è uguale alla traccia di ρE,m(Frob℘); diremo in questo caso che ρE,m è associata a f (per una formulazione più precisa, v. sotto, cap. 6.). La dimostrazione della congettura di Shimura-Taniyama da parte di Wiles e Taylor rappresenta l'ultimo atto nella dimostrazione dell'UTF.
6. Rappresentazioni associate a forme modulari e la congettura di Shimura-Taniyama.
In questo capitolo l'attenzione sarà concentrata sulle forme modulari di peso 2 per il gruppo Γ0(N), soggette alla condizione di annullamento nelle cuspidi; l'insieme S2(N) di tali forme possiede la struttura di spazio vettoriale complesso. Data f(z) in S2(N), il differenziale f(z)dz è invariante per l'azione di Γ0(N) ed è olomorfo sul semipiano esteso ℋ*. Generalizzando la costruzione della curva modulare di livello uno, definiamo il quoziente
X0(N) = ℋ*/Γ0(N),
detto 'curva modulare di livello N'. Esso è dotato della struttura di superficie di Riemann compatta e quindi può essere visto come l'insieme dei punti complessi di una curva proiettiva. Ne consegue che S2(N) si identifica con lo spazio dei differenziali olomorfi su X0(N); in particolare, per il teorema di Riemann-Roch, ha dimensione finita uguale al genere di X0(N). Ogni forma f in S2(N) gode della proprietà di invarianza f(z + 1) = f(z) e quindi ammette uno sviluppo in serie di Fourier (la q- espansione)
La variabile q può essere interpretata come un parametro locale nella cuspide ∞. Lo spazio S2(N) è provvisto di una struttura aggiuntiva: un anello commutativo TN di endomorfismi definiti esplicitamente in termini delle q-espansioni delle forme modulari, chiamato 'algebra di Hecke'. L'algebra TN è generata su Z da operatori Tn, n ≥ 1, detti 'operatori di Hecke' (v. Shimura, 1971). Stante l'interpretazione degli elementi di S2(N) come differenziali olomorfi su X0(N), TN può essere identificata con un anello di corrispondenze della curva modulare X0(N) o, equivalentemente, con un anello di endomorfismi della varietà jacobiana J0(N) di X0(N).
Fissata una forma f in S2(N), si supponga che f abbia coefficienti in Z, sia una forma nuova (cioè non provenga da forme per gruppi Γ0(M) con M divisore proprio di N), sia normalizzata così che a1 = 1 e sia un'autofunzione per tutti gli operatori in TN. Sotto queste ipotesi, valgono le relazioni Tnf = anf, dove an è l'n-esimo coefficiente nella q-espansione di f. L'assegnazione Tn → an definisce un omomorfismo suriettivo di algebre ῳf: TN → Z. Indicato con If il nucleo di ῳf, la varietà quoziente Ef = J0(N)/IfJ0(N) è una curva ellittica definita su Q avente conduttore N. La rappresentazione galoisiana
ρf,m : GQ → GL2(Z/mZ)
associata a f e a un intero m ≥ 2 è per definizione la rappresentazione galoisiana associata ai punti di m-torsione di Ef. Inoltre, se p è un primo che non divide Nm, la traccia di ρf,m(Frobp) è uguale (modulo m) al p-esimo coefficiente ap nella p-espansione di f. Questo implica che valgono le relazioni (v. sopra, cap. 5)
ap = 1 + p - np
(dove np è la cardinalità di Ẽf(p) (Fp)). Nel caso in cui la forma f in S2(N) non abbia coefficienti razionali ma goda delle altre precedenti proprietà, una costruzione analoga a quella spiegata sopra permette di associare a f delle rappresentazioni galoisiane. La congettura di Shimura-Taniyama (diventata poi un teorema di Taylor e Wiles) afferma la validità di un converso della costruzione delle rappresentazioni ρf,m. Data una curva ellittica E definita su Q, diciamo che ρE,m è 'irriducibile' se per ogni divisore primo p di m non esiste alcun sottospazio di dimensione uno di Fp2 invariante per l'azione di GQ su Fp2 definita da ρE,p. La congettura di Shimura-Taniyama è la seguente: se E è una curva ellittica definita su Q avente conduttore N, esiste una forma f in S2(N) definita come sopra tale che ρE,m è isomorfa a ρf,m per ogni m per cui ρE,m è irriducibile. Il significato di questa congettura è che le estensioni di tipo GL2 ammettono una costruzione esplicita, per mezzo della teoria delle forme modulari. Anche la costruzione esplicita di estensioni abeliane di un campo quadratico immaginario descritta nel cap. 4 può essere interpretata in termini di rappresentazioni galoisiane associate a una classe di curve ellittiche di tipo speciale, chiamate 'curve ellittiche con moltiplicazione complessa'.
7. La dimostrazione di Wiles.
Conviene schematizzare la strategia dimostrativa in più tappe.
a) Dalla congettura di Shimura-Taniyama all'ultimo teorema di Fermat: il teorema di Ribet.
Come nell'approccio concepito da Kummer, il punto di partenza nella dimostrazione di Wiles consiste nel supporre, per assurdo, che l'equazione di Fermat di esponente p ammetta una soluzione intera (a, b, c) con abc diverso da 0:
ap + bp = cp.
Si può supporre che l'esponente p sia maggiore di 7 (l'UTF è noto dall'Ottocento nei casi p = 3,5,7, v. cap. 2), che a, b, c non abbiano fattori primi comuni e che a ≡ - 1 mod 4 e b ≡ 0 mod 2. Associamo alla soluzione ipotetica (a, b, c) la curva ellittica definita da
E = Ea,b,c : y2 = x(x - ap)(x + bp).
La curva E è 'semistabile', cioè la singolarità sulla curva ottenuta per riduzione di E modulo ciascun divisore primo del conduttore N è un nodo. La rappresentazione ρE,p associata ai punti di p-torsione di E (v. sopra, cap. 5) è irriducibile (v. sopra, cap. 6): questo è affermato dal teorema di Barry Mazur, che sarà enunciato nel prossimo paragrafo. Inoltre, l'estensione Q(E[p])/Q definita da ρEp è non ramificata nei primi diversi da 2 e da p (ciò segue dai fatti generali enunciati nel cap. 5 per i primi che non dividono N).
Assumiamo per il momento la validità della congettura di Shimura-Taniyama: esiste cioè una forma modulare f appartenente a S2(N), soddisfacente le proprietà elencate nel cap. 6, tale che ρE,p è associata a f (cioè ρEp = ρf,p). Considerate le proprietà di ρE,p, un teorema di Kenneth Ribet, detto di 'abbassamento del livello' (v. Ribet, 1990), afferma l'esistenza di una forma modulare g in S2(2), con proprietà simili a quelle di f (ma senza necessariamente avere q-espansione a coefficienti razionali), tale che ρE,p è associata a g (cioè ρf,p = ρg,p). In altre parole, la rappresentazione galoisiana associata a E e p può anche essere costruita utilizzando una forma per Γ0(2). Sappiamo (v. sopra, cap. 6) che la dimensione dello spazio S2(2) è uguale al genere della curva modulare X0(2). Analogamente al caso di X0(1), l'insieme dei punti complessi di X0(2) è isomorfo a P1(C); in altre parole, la curva X0(2) ha genere zero. Segue che S2(2) è lo spazio nullo e quindi la forma g non può esistere: si ottiene così una contraddizione. In conclusione, la dimostrazione dell'UTF è ridotta dai ragionamenti delineati sopra alla dimostrazione della congettura di Shimura-Taniyama; il risultato di Wiles e Taylor consiste nella dimostrazione di questa congettura.
L'idea di associare a un'ipotetica soluzione dell'equazione di Fermat una curva ellittica apparve nei lavori di Yves Hellegouarch; più tardi Gerhard Frey comprese che l'esistenza di tale curva poteva essere incompatibile con la congettura di Shimura-Taniyama. Ribet infine, con il suo fondamentale teorema di abbassamento del livello, ha reso queste idee rigorose (v. Serre, 1987).
b) Il teorema di Mazur.
Un profondo teorema di Mazur (v., 1977 e 1978) afferma che se un primo p è maggiore di 7, la rappresentazione ρE,p associata ai punti di p-torsione di una curva ellittica E semistabile definita su Q è irriducibile, anzi, più precisamente, è suriettiva. Questo teorema si applica in particolare alla curva E = Ea,b,c, come abbiamo visto nel paragrafo precedente, poiché E è semistabile. In altre parole, il gruppo di Galois dell'estensione Q(E[p])/Q è il più grande possibile, essendo isomorfo a GL2(Fp). D'altro canto, la contraddizione ottenuta nel paragrafo precedente si basa sul fatto che l'estensione Q(E[p])/Q è poco ramificata, essendo la ramificazione concentrata nei soli primi 2 e p.
La dimostrazione di Mazur si fonda sullo studio della curva modulare X0(p). Una generalizzazione di quanto spiegato nel caso di X0(1) (v. sopra, cap. 5) mostra che i punti di X0(p) diversi dalle cuspidi classificano le classi di isomorfismo di coppie (E, C), dove E è una curva ellittica e C un sottogruppo di ordine p di E. Il teorema di Mazur può dunque essere visto come una proposizione diofantea relativa ai punti razionali di X0(p), analoga all'UTF: esso afferma in particolare che se p è sufficientemente grande, gli unici punti di X0(p) definiti su Q sono le cuspidi.
c) Il teorema di Langlands-Tunnell.
Sia E una curva ellittica su Q e si supponga che la rappresentazione ρE,3 associata ai punti di 3-torsione di E sia irriducibile. Sofisticate tecniche analitiche (v. Langlands, 1980; v. Tunnell, 1981) permettono di dimostrare che ρE,3 è sempre associata a una forma modulare f di peso 2, cioè ρE,3 = ρf,3. La validità di questo risultato dipende dal fatto che il gruppo GL2(F3) è risolubile e può essere immerso in GL2(C). Si badi che esso non permette di concludere direttamente la validità della congettura di Shimura-Taniyama per E.
d) La dimostrazione della congettura di Shimura-Taniyama.
Cominciamo con una riformulazione della congettura di Shimura-Taniyama. Se E è una curva ellittica definita su Q, il modulo di Tate p-adico Tp(E) di E è definito come il limite inverso dei gruppi E[pn], n ≥ 1, rispetto alle proiezioni naturali. Segue che Tp(E) è isomorfo a Zp2, dove Zp indica il gruppo additivo degli interi p-adici. Fissata una base per lo Zp-modulo Tp(E), l'azione di GQ su Tp(E) definisce una rappresentazione
Analogamente, data una forma f in S2(N) a coefficienti razionali soddisfacente le ipotesi elencate nel cap. 6, si associa a f una rappresentazione ρ^f,p mediante la relazione ρ^f,p = ρ^Ef,p, dove Ef è la curva ellittica introdotta nel cap. 6. La congettura di Shimura-Taniyama è equivalente all'affermazione seguente: se E è una curva ellittica definita su Q di conduttore N, esiste un primo p per cui ρE,p è irriducibile e una forma modulare f ∈ S2(N) come sopra tale che ρ^E,p è isomorfa a ρ^f,p. Se ν indica la mappa tra gruppi GL2 indotta dalla proiezione naturale Zp → Z/pZ, si ha l'uguaglianza
Diciamo che ρ^E,p è una 'deformazione' di ρE,p. Supponiamo che ρE,p sia irriducibile. L'approccio di Wiles alla dimostrazione della congettura di Shimura-Taniyama consiste nello studio di tutte le deformazioni di ρE,p della forma
dove R è una Zp-algebra locale, noetheriana e completa, di campo residuo Fp, soddisfacenti opportune ipotesi di ramificazione. Grazie a una teoria sviluppata da Mazur (v., 1989), tali deformazioni sono classificate da una 'deformazione universale' corrispondente a un'algebra Runiv. Se la rappresentazione ρE,p è associata a una forma modulare f, è possibile classificare le sue deformazioni associate a forme modulari per mezzo di un anello T, identificato con una certa algebra di Hecke. L'universalità di Runiv implica l'esistenza di un'applicazione
Mediante l'uso di ingegnosi criteri di algebra commutativa, Wiles e Taylor dimostrano che π è un isomorfismo. Questo significa che tutte le deformazioni di ρE,p sono associate a forme modulari; in particolare lo deve essere ρ^E,p e quindi E soddisfa la congettura di Shimura-Taniyama. Il lettore avrà notato che, per poter essere messa in atto, questa strategia richiede di sapere che ρE,p sia irriducibile e sia associata a una forma modulare, per una scelta del primo p. Scegliendo p = 3, Wiles invoca a questo punto il teorema di Langlands-Tunnell: se ρE,3 è irriducibile, ciò mette fine al tour de force. Se invece ρE,3 è riducibile, Wiles dapprima osserva che ρE,5 è irriducibile; poi mostra l'esistenza di una nuova curva ellittica E′ tale che ρE',5 è isomorfa a ρE,5 e ρE',3 è irriducibile; applicando la strategia precedente, ottiene che E′ soddisfa la congettura di Shimura-Taniyama e in particolare che ρE',5 (e per ciò anche ρE,5) è associata a una forma modulare; infine, applicando di nuovo la strategia precedente, questa volta per p = 5, dimostra che anche E soddisfa la congettura di Shimura-Taniyama.
Due osservazioni per concludere. Il lavoro originale di Wiles e Taylor dimostra la congettura di Shimura-Taniyama per la classe delle curve ellittiche semistabili. Generalizzando le tecniche qui esposte, Christophe Breuil, Brian Conrad, Fred Diamond e Richard Taylor (v. Breuil e altri, 2001) hanno recentemente dimostrato la congettura per tutte le curve ellittiche definite su Q. Infine, il criterio di isomorfismo per l'applicazione π che è alla base del metodo dimostrativo corrisponde alla verifica di una formula analitica per il numero di classi di ideali relativa alla rappresentazione aggiunta della curva ellittica: questa formula può essere interpretata come una generalizzazione del criterio di Kummer per la regolarità di un primo p (v. sopra, cap. 2).
8. Altri aspetti.
Sebbene il lavoro di Wiles e Taylor metta la parola fine all'annoso problema posto dalla congettura di Fermat, si può dire che esso rappresenti solo l'inizio del lavoro sulla risoluzione di fondamentali questioni in teoria dei numeri. Una di queste è la congettura di Birch e Swinnerton-Dyer, la più importante questione aperta nello studio dell'aritmetica delle curve ellittiche. Data una curva ellittica E definita su Q, sia ap il coefficiente (considerato nel cap. 5) 1 + p - np, dove np è la cardinalità di Ẽ(p)(Fp). I coefficienti ap sono definiti per tutti i primi p di buona riduzione, cioè che non dividono il conduttore N; una definizione analoga permette di determinare ap anche per i divisori primi di N (in questo caso ap è sempre uguale a 0, 1 o - 1). La 'funzione L archimedea' di E è definita come il prodotto infinito
dove s è una variabile complessa. Una stima degli ap mostra che L(E, s) converge a una funzione olomorfa se la parte reale di s è maggiore di 3/2. La serie L di E codifica informazioni 'locali' relative alla riduzione di E modulo i primi razionali; la congettura di Birch e Swinnerton-Dyer (v., 1963 e 1965) afferma che L(E, s) esprime proprietà 'globali' di E, concernenti il gruppo E(Q) dei punti di E definiti su Q. Più precisamente, essa afferma che L(E, s) ammette un prolungamento analitico a tutto il piano complesso; inoltre, l'ordine di annullamento in s = 1 di L(E, s) è uguale al rango di E(Q) (grazie a un teorema di Mordell, il gruppo E(Q) è finitamente generato). Come l'UTF determina le soluzioni intere dell'equazione di Fermat, così la congettura di Birch e Swinnerton-Dyer determina il numero delle soluzioni razionali indipendenti dell'equazione cubica E. La dimostrazione della congettura di Shimura-Taniyama implica la prima parte della congettura di Birch e Swinnerton-Dyer e dunque ammette, oltre all'UTF, una nuova applicazione diofantea. Indicata con f la forma modulare associata a E, si definisca la serie L di f mediante un prodotto infinito L( f, s) analogo a L(E, s), in cui il coefficiente ap è sostituito dal p-esimo coefficiente nella q-espansione di f. La congettura di Shimura-Taniyama si può riformulare come l'uguaglianza L(E, s) = L( f, s). Le proprietà analitiche di f implicano la continuazione analitica di L( f, s) e quindi di L(E, s). La seconda parte della congettura di Birch e Swinnerton-Dyer è nota, grazie ai teoremi di Benedict Gross e Don Zagier (v., 1986) e Victor Kolyvagin (v., 1990), solamente se l'ordine di annullamento di L(E, s) in s = 1 è minore o uguale a uno. Negli altri casi, il problema è del tutto aperto. La dimostrazione di questi teoremi è basata in modo essenziale sulla teoria della moltiplicazione complessa (v. sopra, cap. 4).
È interessante osservare che la situazione è migliore nel caso delle congetture p-adiche di Birch e Swinnerton-Dyer, nelle quali la funzione L archimedea L(E, s) è sostituita da certi analoghi non archimedei, detti 'funzioni L p-adiche'. Risultati ottenuti negli ultimi dieci anni da diversi autori dimostrano che l'ordine di annullamento di tali funzioni è sempre almeno uguale al rango di E(Q). Il problema di comprendere i legami profondi tra le teorie archimedee e quelle p-adiche è una delle più importanti sfide poste dalla teoria dei numeri nel XXI secolo.
Bibliografia.
Ahlfors, L., Complex analysis, New York: McGraw-Hill, 1979.
Birch, B., Swinnerton-Dyer, H. P. F., Notes on elliptic curves (I), in "Journal für die Reine und angewandte Mathematik", 1963, CCXII, pp. 7-25.
Birch, B., Swinnerton-Dyer, H. P. F., Notes on elliptic curves (II), in "Journal für die Reine und angewandte Mathematik", 1965, CCXVIII, pp. 79-108.
Breuil, C., Conrad, B., Diamond, F., Taylor, R., On the modularity of elliptic curves over Q: wild 3-adic exercises, in "Journal of the American Mathematical Society", 2001, XIV, 4, pp. 843-939.
Darmon, H., Diamond, F., Taylor, R., Fermat's last theorem, in Current developments in mathematics. Proceedings of the Harvard/MIT joint conference held at the American Academy of Arts and Sciences, Cambridge, Mass.: International Press, 1995, pp. 1-154.
Edwards, H. M., Fermat's last theorem: a genetic introduction to algebraic number theory, New York: Springer, 1977.
Gross, B. H., Zagier, D., Heegner points and derivates of L-series, in "Inventiones mathematicae", 1986, LXXXIV, pp. 225-320.
Kolyvagin, V. A., Euler systems, in The Grothendieck Festschrift. A collection of articles written in honor of the 60th birthday of Alexander Grothendieck (di P. Cartier e altri), Boston: Birkhäuser, 1990, vol. II, pp. 435-483.
Langlands, R. P., Base change for GL(2), Princeton, N. J.: Princeton University Press, 1980.
Marcus, D. A., Number fields, New York: Springer, 1977.
Mazur, B., Modular curves and the Eisenstein ideal, in "Publications mathématiques de l'Institut des Hautes Études Scientifiques", 1977, XLVII, pp. 33-186.
Mazur, B., Rational isogenies of prime degree, in "Inventiones mathematicae", 1978, XLIV, pp. 129-162.
Mazur, B., Deforming Galois representations, in Galois groups over Q (a cura di Y. Ihara e altri), New York: Springer, 1989, pp. 385-437.
Ribet, K. A., On modular representations of Gal(Q/Q) arising from modular forms, in "Inventiones mathematicae", 1990, C, pp. 431-476.
Serre, J.-P., Complex multiplication, in Algebraic number theory (a cura di J. W. S. Cassels e A. Frölich), London: Academic Press, 1967, pp. 292-296.
Serre, J.-P., A course in arithmetic, New York: Springer, 1973.
Serre, J.-P., Sur les répresentations modulaires de degré 2 de Gal(Q/Q), in "Duke mathematical journal", 1987, LIV, pp. 179-230.
Shimura, G., Introduction to the arithmetic theory of automorphic functions, Princeton, N. J.: Princeton University Press, 1971.
Silverman, J., The arithmetic of elliptic curves, New York: Springer, 1986.
Taylor, R., Wiles, A., Ring theoretic properties of certain Hecke algebras, in "Annals of mathematics", 1995, CXLI, 2, pp. 553-572.
Tunnell, J., Artin's conjecture for representations of octahedral type, in "Bulletin of the American Mathematical Society", 1981, V, pp. 173-175.
Washington, L., Introduction to cyclotomic fields, New York: Springer, 1982.
Weber, H., Lehrbuch der Algebra, vol. III, Braunschweig: Vieweg, 19082.
Wiles, A., Modular elliptic curves and Fermat's last theorem, in "Annals of mathematics", 1995, CXLI, 2, pp. 443-551.