ALGEBRA (fr. algèbre; sp. algebra; ted. Algebra; ingl. algebra)
Introduzione Storica. -1. Il vocabolo algebra è una derivazione della parola araba al-giabr, che si trova per la prima volta nel libro Kitāb al-giabr wa 'l-muqābalah dell'astronomo e geografo Muhammad ibn Mūsà al-Khuwārizmī, fiorito a Baghdād nella prima metà del sec. IX, a significare l'operazione per la quale, allorché in uno dei due membri di un'eguaglianza compaia un termine da sottrarsi, esso possa invece venire aggiunto all'altro membro.
L'importanza che a codesta operazione si annetteva dagli antichi Greci e Arabi - ai quali mancava il concetto delle quantità negative - rispondeva alla loro preoccupazione di avere nei due membri di un'eguaglianza soltanto termini positivi.
Del pari, il nome algoritmo, attualmente usato per ogni sistema di notazioni e convenzioni che permetta di eseguire determinate operazioni secondo certe regole, non è che il soprannome dello stesso autore arabo, derivato dal nome della provincia (Khuwārizm), di cui questi era originario.
L'altro vocabolo al-murlābalah, che figura nel titolo del libro citato, denota l'operazione secondo la quale, avendo preventivamente trasformato un'equazione così da avere tutti i termini positivi, si riducono nei due membri di essa i termini aventi lo stesso grado rispetto all'incognita. Dice Luca Pacioli (1494): Algebra id est restauratio; Almucabala id est oppositio".
Nel sec. XVI il vocabolo al-muqābalah era quasi caduto in disuso, e si parlava soltanto di algebra, comprendendo con questo nome così la teoria delle equazioni come il calcolo che ne consegue.
Poiché l'incognita veniva chiamata res, ed anche causa o cosa (ted.: die Coss), e il suo quadrato census (v. i nn. 17 e 18), dal Pacioli e da altri l'algebra fu anche detta arte, o regula della cosa (regula cosae), ars rei et census, ars cossica o cossa. E come un'arte, o una tecnica, anzi come l'arte o il metodo per eccellenza, l'avevano considerata gl'Indiani e gli Arabi del Medioevo, e così pure l'intesero gli algebristi del nostro Rinascimento, che la chiamarono arte maggiore, ars magna, artiunt ars. Ars certis legibus et praeceptis contenta la disse ancora Erasmo Bartolini nella 2ª ed. della versione latina della Géométrie di Renato Descartes, pubblicata nel 1659 da Francesco van Schooten.
Da qualcuno l'algebra è tuttora concepita come una tecnica avente per oggetto il calcolo, ossia come l'insieme delle regole, con le quali si effettuano certe trasformazioni o combinazioni (dette algebriche) aventi la loro origine nelle operazioni fondamentali dell'aritmetica. Ma generalmente col nome di algebra si suole oggi comprendere lo studio delle funzioni razionali intere (polinomî) di una o più variabili, o, sotto altra forma, lo studio delle equazioni algebriche e l'insieme delle teorie che con esso si connettono (matrici, determinanti, gruppi di operazioni, ecc.).
2. Le origini dell'algebra sono da ricercarsi nella teoria delle equazioni, e risalgono ad epoca assai remota. Già nel cosiddetto papiro Rhind del British Museum, manuale di calcolo (o, forse, quaderno scolastico), attribuito all'egiziano Ahmose e composto tra il 2000 e il 1700 a. C., sono risolti problemi che si traducono in equazioni di primo grado con un'incognita. E un particolare sistema di equazioni di primo grado con più incognite, che in simboli moderni si scrive come segue:
fu risolto da uno scolaro di Pitagora, Timarida di Paros (IV secolo a. C.), mediante una proposizione equivalente alla Formula
alla quale Giamblico di Calcide (tra il III e il IV sec. d. L.) diede il nome di epantema (ἐπάνϑημα).
Anche la risoluzione delle equazioni di 2° grado era nota, sotto forma geometrica, nella scuola di Pitagora (sec. V a. C.). Queste equazioni, distinte nei tre tipi
con b e c positivi, erano concepite in forma di problemi, nei quali si chiedeva di determinare due quantità (segmenti), conoscendone il prodotto (rettangolo) e la somma oppure la differenza.
Siffatte soluzini trovansi riportate negli Elementi (Στοιχεῖα) di Euclide (circa 300 anni a. C.). specialmente nei libri II, Vl, X e XIII, e nell'altra opera dello stesso autore intitolata Dati (Δεδομένα), nella quale è trattato anche il caso in cui il coefficiente del termine quadratico è diverso dall'unità, e trovansi pure soluzioni geometriche di equazioni di grado superiore riducibili al 2° grado.
La rappresentazione nelle grandezze continue per mezzo di segmenti rettilinei, e dei loro prodotti per mezzo di rettangoli, permetteva ai Greci di superare le difficoltà provenienti dall'intervento degl'irrazionali (ἄλογοι), che essi non considerarono mai come numeri. D'altra parte, la risoluzione delle equazioni mediante costruzioni geometriche rispecchiava l'ufficio di prova esistenziale da essi attribuito ai problemi costruttivi, e in virtù del quale si doveva ogni volta dimostrare l'effettiva esistenza della grandezza da determinarsi.
Le relazioni che intercedono tra quei prodotti di segmenti, e che permettono di giungere alla soluzione delle equazioni quadratiche, costituivano un algoritmo geometrico - da H. G. Zeuthen (1839-1920) chiamato ulgebra geometrica, ma studiato con questo stesso nome già alla fine del sec. XVI da Paolo Bonasoni, lettore nellti studio di Bologna - alla cui esposizione è appunto dedicato il libro ll degli Elementi. Le prime dieci proposizitmi di questo libri equivalgono alle seguenti identità algebriche:
3. Più estesi sviluppi ehbe l'algebra geometrica presso i geometri greci posteriori ad Euclide (Archimede, Apollonio, Pappo, ecc.), e venne da essi usata anche per la risoluzione di problemi di terzo e quarto grado (problemi solidi, προβλήματα στερεά). Basterà accennare alle soluzioni, ottenute per mezzi di coniche, dei classici problemi della trisezione di un angolo e della duplicazione di un cubo, inoltre dei due problemi di dividere una sfera con un piano in due parti, i cui volumi abbiano un rapporto dato, e di condurre per un dato punto le normali ad una conica. Il primo di questi due fu trattato da Archimede di Siracusa (287-212 a. C.) nel 2° libro dell'opera sulla sfera e il cilindro (περὶ σϕαίρας καὶ κυλίνδρου), e la sua soluzione e discussione trtivansi in un antico manoscritto (dovuto forse allo stesso Archimede) scopertti da un commentatore di Archimede e Apollonio, Eutocio d'Ascalona (nato nel 480 d. C.), il quale riporta pure altre soluzioni del problema mediante coniche, dovute a Diocle e Dionisodoro (rispettivamente del II e del I secolo circa a. C.). Il secondo fu risolto e completamente discusso da Apollonio di Perga (tra il III e il II sec. a. C.) nel 5° libro del trattato sulle coniche (κωνικά), nel quale le proprietà di tali curve sono ottenute con l'algebra geometrica, seguendo una via che è del tutto equivalente a quella che attualmente si tiene quando le curve stesse si pensano rappresentate da particolari eqluazioni cartesiane.
4. Ma gli antichi Greci, ai quali era ben noto come ad ogni relazione tra segmenti corrisponda una relazitme tra numeri, non mancarono di mettere in luce anche il significato aritmetico delle costruzioni geometriche da essi immaginate; conobbero la possibilità di una duplice soluzione (con numeri positivi di un'equazione di 2° grado, e seppero discernere i casi in cui una tale equazione non ammette soluzioni (positive). Se per lo più tennero conto di una sola delle due soluzioni, è perchè ciò era loro suggerito o dal fine che si proponevano col particolare problema esaminato, o dal modo con il quale questo era da essi concepito e formulato.
La considerazione di equazioni numeriche di 2° grado (di cui si ha già qualche esempio in papiri dell'antico Egitto) risale verosimilmente, presso i Greci, al tempio di Platone (429-348 a. C.), e sembra sia stata oggetto di uno scritto Ipparco di Nicea (intorno al 150 a. C.), che andò perduto. S'incontra per la prima volta (anche per equazioni a tre termini) presso Erone di Alessandria (sec. II d. C.), in una raccolta (μετρικα) di problemi numerici, redatta in una forma non molto dissimile da quella del papiro Rhind, e in un'altra raccolta di problemi numerici di geometria, dove è particolarmente degno di nota un problema, nel quale, abbandonata la preoccupazione dell'omogeneità geometrica, si sommano linee con superficie.
Anche il problema, connesso col precedente, dell'estrazione approssimata della radice quadrata, occupò gli Egizi fin dai tempi più remoti, e più tardi anche i geometri greci. Se ne hanno esempî in Archimede, in Claudio Toltimeo (sec. II d. C.), soprattutto in Erone, e più tardi in Teone di Alessandria (sec. IV d. C.), il quale diede un procedimento che è identico a quello oggi usato.
Non si conosce invece che un esempio di estrazione di radice cubica da parte dei Greci, ed è quello della radice di 100, per la quale Erone indico il valore approssimato 4 +
5. Con Euclide, Archimede e Apollonio, la matematica greca raggiugeva il suo massim0 splendore; ma nelle ragioni medesimc che l'avevano sollevata a tanta altezza si annidavano i germi del suo inevitabile decadimento. La persistente aspirazione verso un'armoniosa perfezione artistica e un rigore logico impeccabile, la forma geometrica data perciò alle operazioni algebriche, la quale ne rendeva malagevole la comprensione e lo sviluppo, il poco conto attribuito alle applicazioni pratiche, e con esse ai calcoli numerici, concorsero a irrigidire il pensiero ellenico in una concezione troppo ristretta della scienza, determinando in questa un lungo periodo di arresto.
Si dava il nome di aritmetica allo studio teorico delle proprietà astratte dei numeri, mentre chiamavasi logistica l'insieme delle regole pratiche occorrenti alla soluzione di problemi su numeri concreti, e veniva esposta in forma di racconti tratti dalla mitologia o da casi della vita quotidiana. Al tempo dei grandi maestri, sotto l'influsso delle dottrine pitagoriche, la logistica fu generalmente negletta, come scienza alla quale si annetteva una minore dignità. Ma verso il principio dell'era volgare, soprattutto per i bisogni che scaturivano dalle indagini astronomiche e geodetiche, l'attitudine ai calcoli pratici venne affinandosi, e la logistica, abbandonando a poco a poco il suo carattere concreto, si confuse con l'aritmetica.
6. Codesto nuovo orientamento, che gia si avverte in Erone, appare compiuto in Diofanto di Alessandria (seconda metà del sec. III d. C.).
Nella sua raccolta di problemi intitolata 'Αριϑμητικῶν βιβλία ιγ′ (dei 13 libri, sei soltanto sono a noi pervenuti), dove con abili artifizî si risolvono molte equazioni di 1° e 2° grado con una o più incognite, e molti sistemi di tali equazioni, i problemi numerici sono per la prima volta enunciati sotto forma astratta e studiati senza fare appello ad alcuna rappresentazione geometrica. Pur operando su numeri particolari, nell'esecitazione dei calcoli Diofanto si preoccupa non tanto del risultato numerico finale, quanto della via seguita e da seguirsi, anche partendo da dati differenti. Nel che gli soccorre non solo la sua grande perizia di calcolatore, ma pure l'impiego di un simbolismo già adoperato da altri, in ispecie da Sant'Ippolito (sec. II d. C.), e consistente nell'abbreviazione di vocaboli, particolarmente per la rappresentazione di una sola incognita, delle prime sei potenze di essa e delle loro inverse, ed anche dell'unità.
D'altro lato, mentre gli scrittori greci del periodo classico avevano generalmente ripugnato dal calcolo delle grandezze geometriche, come contrastante con la purezza del loro ideale scientifico, in Diofanto, come già in Erone, le questioni vengono ricondotte allo studio di relazioni tra soli numeri, e cade l'obbligo dell'omogeneità geometrica: ciò che, molti secoli più tardi, col Descartes (preceduto dal Bombelli: v. sotto, nn. 20 e 23), segnò il passo decisivo verso l'invenzione della geometria analitica.
Propopendosi, al pari dei suoi predecessori, di evitare la presenza di quantità irrazionali, Diofanto riesce a dare svariati esempi così di problemi che conducono ad equazioni quadratiche (distinte in tre tipi, come in Euclide) aventi soluzioni (positive) razionali, come di problemi indeterminati (di 2°, 3° e 4° grado) dei quali si debbono trovare soluzioni razionali: limitandosi del resto ad assegnare, sì degli uni che degli altri, una sola soluzione particolare.
Conosce pure le operazioni più elementari che è permesso eseguire sulle equazioni, ad esempio il trasporto di un termine dall'uno all'altro membro; ricorre spesso all'introduzione di un'incognita ausiliaria, e si vale del metodo di eliminazione per sostituzione. Pur non avendo il concetto di numero negativo considerato in sé stesso, conosce le regole per l'addizione e la sottrazione di quantità positive o negative (sempre con la limitazione che il risultato sia positivo), e la regola di moltiplicazione di due polinomî, i cui termini, da aggiungersi o da sottrarsi, siano prodotti di coefficienti numerici per potenze dell'incognita; in particolare conosce la regola dei segni.
7. La medesima trattazione dei problemi numerici mediante il linguaggio ordinario, o qualche sua abbreviazione, con alcune estensioni specialmente alla simultanea rappresentazione di più incognite, si riscontra nel Medioevo presso gl'Indiani, ai quali i Greci, venuti con essi a contatto per ragioni di commercio, avevano trasmesso molte delle loro cognizioni matematiche.
Anche gl'Indiani, al pari di Diofanto, non ricorsero a rappresentazioni geometriche, ma, calcolatori abilissimi e spiriti pratici, alieni dagli scrupoli dei Greci intorno al rigore teorico, si spinsero molto più innanzi di questi sulla via che, ripresa assai più tardi, doveva condurre alla costituzione dell'algebra. Così estesero senz'altro ai numeri irrazionali le regole di calcolo dei numeri razionali, e operarono altresì con numeri negativi, interpretandoli come debiti o come misure di lunghezze da contarsi in senso opposto al prestabilito; conobbero il doppio valore di un radicale quadratico, e seppero applicare la geometria all'algebra e questa a quella.
In Aryabhata (nato nel 476) trovansi le regole per l'estrazione delle radici quadrate e cubiche, quali noi siamo usi dedurle dagli sviluppi di (a + b)2 e (a + b)3. Presso lo stesso autore, e più esplicitamente in Brahmagupta (nato nel 598) e in Bhāskara Acārya (nato nel 1114), è data la regola generale per la risoluzione delle equazioni quadratiche. Ammessa la possibilità che i coefficienti siano negativi, scompare in Brahmagupta la distinzione delle tre forme nelle quali, dal punto di vista dei Greci, quelle equazioni potevano presentarsi (n. 2). Bhāskara riconosce come una tale equazione possa avere due soluzioni o non ammetterne alcuna (reale), e riesce pure ad assegnare soluzioni di particolari equazioni numeriche di 3° e 4° grado.
8. Dopo un lungo periodo di generale decadimento degli studî scientifici, eredi, nel Medioevo, della matematica greca, pur con derivazioni dalla matematica indiana, furono gli Arabi, i quali contribuirono al risveglio e al progresso di quegli studî, dapprima (nel IX e, in parte, anche nel X secolo), con la traduzione delle principali opere della geometria e dell'astronomia greca (Euclide, Archimede, Apollonio, Ipparco, Erone, Tolomeo, Diofanto, ecc.) e di quelle astronomiche degli Indiani, in seguito anche con nuove ricerche.
Per quanto spetta all'algebra, le caratteristiche più salienti di codesto duplice influsso greco-indiano si trovano già nel più antico libro arabo su quella scienza che a noi sia pervenuto, il Kitāb al-giabr wa 'l-muqābalah di cui si disse al n.1, composto verso l'820 da Muḥammad ibn Mūsà al-Khuwārizmī, probabilmente ispirandosi ad una tradizione conservatasi attraverso due popoli soggiogati dagli Arabi, cioè i Siriaci ed i Persiani. Il libro, ch'ebbe larga fama in tutto il Medioevo, e di cui si fecero molte traduzioni in latino, è in gran parte una raccolta di regole e problemi relativi ad eredità, esecuzioni testamentarie, questioni bancarie e commerciali. L'esposizione è sempre fatta con le parole del linguaggio comune, da un lato con la costante esclusione delle quantità negative, dall'altro con la considerazione delle quantità irrazionali. Delle equazioni di 2° grado, distinte in tre tipi (n. 2), sono date soluzioni mediante l'algebra geometrica (n. 2), accompagnate da esempî numerici, e sono indicate le due soluzioni (positive, razionali o no) dell'equazione x2 + c = b x quando sia
Abū Bekr Muḥammad ibn al-Husain al-Karkhī (intorno al 1000), benché spiccatamente orientato verso le antiche fonti elleniche, in un'opera sull'algebra, intitolata al-Fakhrī, trasse l'ispirazione da Diofanto ma in suo confronto attuò notevoli progressi, dando maggiore estensione al linguaggio simbolico di esso e regole più complete per il calcolo algebrico, e risolvendo un gran numero di nuovi problemi tanto determinati che indeterminati. Sviluppò inoltre il calcolo dei radicali irrazionali, e insegnò a risolvere equazioni delle forme
con a, b, c positivi, ma per l'equazione a x2 + c = b x non tenne generalmente conto delle due soluzioni.
Lo studio dei radicali irrazionali fu coltivato ulteriormente, soprattutto con riferimento alle vedute dei Greci intorno alle grandezze irrazionali, dal matematico e poeta persiano ‛Omar ibn Ibrāhīm al-Khayyām (‛Omar Khayyām) astronomo in Baghdād (morto nel 1123), al quale si debbono pure regole per l'estrazione di radici d'indici arbitrarî: ciò che rende assai verosimile aver egli conosciuto lo sviluppo di (a + b)n per n intero positivo.
Tra gli Arabi dell'Occidente è da ricordare Ibn al-Bannā', nato al Marocco intorno al 1255, il quale sembra esser stato il primo a far uso di simboli, come risulta dal commentario ad un suo libro di aritmetica e algebra, scritto dall'andaluso Abū 'l-Hasan ‛Alī ibn Muḥammad al-Qalasādī (morto intorno al 1480).
9. In connessione con le menzionate ricerche sugl'irrazionali (n. 8), l'attenzione degli Arabi doveva necessariamente essere richiamata sopra un argomento, che acquistò in appresso importanza capitale per lo sviluppo dell'algebra, cioè la risoluzione delle equazioni di 3° grado.
Soluzioni numeriche di equazioni cubiche si erano assegnate in tempi anteriori soltanto in alcuni casi particolari assai semplici. Il primo esempio si ha nell'equazione
che trovasi in Diofanto, ed anzi è l'unico che si abbia nell'opera di questo autore. La sua affermazione che l'equazione ha la soluzione x = 4, si può giustificare scrivendo l'equazione nella forma
Similmente, l'equazione
che s'incontra presso l'indiano Bhāskara, scritta nella forma
pone in evidenza la soluzione x = 5 da lui indicata.
Nell'aspetto geometrico, già i Greci avevano attuato l'idea di risolvere i problemi del 3° grado (ed anche quelli del 4°) mediante coniche; ma per ogni singolo problema avevano, in generale, escogitato opportuni artifizî, traendo profitto di particolari proprietà geometriche di quelle curve.
In Archimede invece, e probabilmente in qualche geometra anteriore, la risoluzione aveva luogo secondo un concetto sistematico: il problema era anzitutto tradotto in equazione, e l'incognita era costruita come ascissa di un punto d'incontro di due coniche, la considerazione delle quali veniva suggerita dalle condizioni del problema esaminato, e implicava in sostanza un procedimento di eliminazione. Di questa natura erano le soluzioni del problema della duplicazione del cubo (o dell'equivalente problema dell'inserzione di due medie proporzionali tra due dati segmenti), che, secondo Eutocio, si debbono a Menecmo (circa 350 ann a. C.), discepolo di Platone: problema che dipende da un'equazione cubica binomia. Archimede, trattando il problema della divisione della sfera, del quale si fece cenno al n. 3, lo aveva tradotto in una proporzione, che equivale ad un'equazione di 3° grado della forma
e questa equazione (a cui può ridursi qualsiasi equazione cubica), probabilmente da lui stesso era stata risolta per mezzo di coniche.
ll medesimo concetto fu ripreso verso la fine del sec. IX dall'astronomo Muḥammad ibn Isà Abū Abdallāh al-hāhānī, di Baghdād, il quale studiò per via algebrica il problema di Archimede, ma non riuscì a risolvere l'equazione cubica a cui esso conduce. Mediante coniche, la soluzione ne fu assegnata, circa un secolo dopo, da Abū Gia‛far al-Khāzin.
Con metodo analogo, un'intera serie di questioni di egual natura furono trattate nella seconda metà del sec. X e nella prima metà del secolo successivo, cioè nel periodo in cui, resasi indipendente dall'astronomia, la matematica araba attinse la sua massima altezza. Però, contrariamente a quanto avevano fatto i Greci, in particolare Archimede e Apollonio, gli Arabi si astennero, in generale, dal determinare il cosiddetto diorisma (διορισμός) del problema, ossia le condizioni della sua risolubilità.
Specialmente del problema della trisezione dell'angolo furono date molte nuove soluzioni, che trovansi raccolte in un lavoro di as-Siǵzī (detto anche as-Singiārī).
Abū Sahl al-Kūhī risolse, tra altri, il problema di trovare una calotta sferica di dato volume e data superficie, aggiungendone un completo diorisma.
Abū'l-Ciūd Muḥammad ibn al-Layth risolse, per mezzo di coniche, l'equazione
a cui conduce la ricerca del lato del poligono regolare di nove lati; inoltre le due equazioni, contenenti pure il termine quadratico,
che avevano resistito agli sforzi di autori precedenti, e delle quali la prima fornisce il lato del poligono regolare di sette lati.
La classificazione delle equazioni cubiche secondo i segni dei coefficienti, e la loro sistematica risoluzione mediante coniche, iniziata dallo stesso autore, fu recata a compimento da Omar al-Khayyām (già citato al n. 8), senza tuttavia l'indicazione del corrispondente diorisma.
Nell'opera di questo autore trovasi pure risalto, per mezzo di un cerchio e di un'iperbole, un problema che dipende da un'equazione di 4° grado della forma
Le accennate soluzioni geometriche degli Arabi rimasero sconosciute in Occidente sino alla metà del secolo scorso, e furono in modo indipendente ritrovate (anche per equazioni di 4° grado) da Pietro de Fermat (verso il 1637), Renato Descartes (1637), Francesco van Schooten (1659), poi ancora dal belga Renato Francesco de Sluse (1659 e 1668), dagli inglesi Tommaso Baker (1684), Edmondo Hallei (1687), Isacco Newton (1707), e da altri.
Al riconoscimento del legame tra le equazioni cubiche e il problema della trisezione dell'angolo fu di nuovo condotto Giovanni Müller, detto Regiomontanus (1436-1476), nel 1471; e dell'equazione cubica, da cui dipende la ricerca del lato del poligono regolare di nove lati, si occupò ancora Raffaele Bombelli, di Bologna, in un'aggiunta alla sua Algebra (scritta intorno al 1550, e pubblicata nel 1572), che fu rintracciata soltanto nel 1923, per merito di Ettore Bortolotti.
10. Rispetto alle equazioni di 3° grado, al punto in cui erano giunti i Greci, in ispecie Archimede e Diofanto, e più tardi, seguendo la via da essi tracciata, gli Arabi, per ottenerne la risoluzione mediante radicali non occorreva che un passo. Ma questo passo non fu compiuto se non nel sec. XVI, dagli algebristi italiani (nn. 19 e 20).
Gli Arabi, che, sulle orme degl'Indiani, avevano riconosciuto la possibilità di fare operazioni aritmetiche anche su linee e superficie, e quindi la possibilità di stabilire un collegamento tra l'algebra e la geometria, non si resero conto sufficiente del progresso che codesta veduta attuava rispetto alla tradizione greca; anzi tornarono alla rigorosa distinzione tra numero e quantità, e contrapposero le soluzioni geometriche delle equazioni quadratiche date da Euclide a quelle aritmetiche di Diofanto.
Il progresso dell'algebra doveva invece scaturire, non dalla ripresa della pura concezione ellenica, ma dallo sviluppo della logistica.
11. Un accenno a un risveglio degli studî scientifici nel mondo occidentale, dopo un oscuramento durato più di sei secoli, comincia a manifestarsi al principio del sec. XII con traduzioni latine di opere arabe: impresa durata pure nel secolo successivo, e alla quale contribuirono Adelardo di Bath, Roberto di Chester (Robertus Castrensis), Platone di Tivoli (Plato Tiburtinus), Gherardo di Cremona, Giovanni Campano di Novara, Giovanni di Siviglia (Johannes Hispalensis), e altri.
Non mancarono neppure, e furono poi continuate sino alla metà del sec. XVI, traduzioni latine fatte direttamente dal greco. Si deve per esempio al monaco fiammingo dell'ordine dei domenicani Guglielmo von Moerbek la versione, nel 1269, di una raccolta di opere di Archimede.
D'altra parte, ebbero sempre maggior diffusione i metodi di calcolo indiani, che furono esposti in numerosi scritti del XII e del XIII secolo. Molto studiati, anche nei secoli successivi, furono il Tractatus de arte numerandi (stampato nel 1488) dell'inglese Giovanni di Sacrobosco (cioè John of Holywood), morto verso il 1256, e lo scritto De numeris datis (stampato soltanto nel 1879) di Giordano Nemorario, il quale verosimilmente è una sola persona col monaco tedesco Giordano di Sassonia (morto nel 1237), generale dell'ordine dei domenicani.
Un'opera scritta in lingua ebraica da Abrāhām bar Chijja ha Nasi, di Barcellona, noto col nome di Abramo Savasorda (intorno al 1100), e tradotta in latino nel 1145 da Platone di Tivoli col titolo Liber embadorum, è quella che fece anzitutto conoscere in occidente le nozioni arabe intorno alle equazioni (soprattutto di 2° grado, con una o due incognite), in particolare l'esistenza di una doppia soluzione nelle equazioni quadratiche del tipo x2 + c = b x, quando sia b2 > 4 c.
12. Ma all'aprirsi del sec. XIII un uomo sopra tutti fa presentire per la matematica, particolarmente per l'algebra, l'inizio di una nuova èra: Leonardo di Pisa, detto anche Leonardo Fibonacci (ossia figlio di Bonaccio), il quale fu il più grande matematico del Medioevo.
L'esteso trattato Liber abbaci, scritto da Leonardo nel 1202 (poi di nuovo, con aggiunte, nel 1228) in seguito ai suoi viaggi in Oriente - dal ricordo del quale non può disgiungersi quello degli scritti Practica geometriae (1220) e Flos - presenta un quadro completo delle più importanti cognizioni sull'aritmetica e sull'algebra acquisite dagli Arabi e dai Bizantini, ed è il frutto di un'elaborazione limpida e originale di quanto si riferisce ad ogni sorta di calcoli commerciali con numeri interi e fratti, a progressioni aritmetiche e geometriche, all'estrazione di radici quadrate e cubiche, e alla risoluzione di problemi che dipendono da equazioni determinate e indeterminate di 1° e 2° grado, con una o più incognite. Per le equazioni quadratiche, distinte nei soliti tre tipi, è talvolta tenuto conto anche delle due soluzioni positive. Tutta la vasta materia è dominata con superiore maestria, e l'esposizione è accompagnata da una ricchissima serie di esempî, le cui difficoltà sono superate con abilità sorprendente, e corredata da dimostrazioni in forma geometrica.
Quest'opera fu diffusamente studiata su esemplari manoscritti (vide la luce per le stampe, in modo completo, soltanto nel 1857, per opera di B. Boncompagni) massime in Italia, e costituì per lungo tempo la fonte da cui gli algebristi attinsero l'ispirazione ai loro studî. Tuttavia, pure in Italia, dovevano ancora trascorrere tre secoli prima che il suo influsso determinasse un reale progresso.
13. Veniva intanto a poco a poco maturando negli spiriti la tendenza ad allargare il tradizionale contenuto del sapere matematico; di che, rispetto all'algebra, porgono chiari indizî due autori francesi: Nicola Oresme, vescovo di Lisieux (nato circa nel 1323, morto nel 1382) e nTicola Chuquet (morto intorno al 1500), i quali sono anche da riguardarsi, benché da punti di vista differenti, come precursori della teoria dei logaritmi.
Il primo, nell'Algorismus proportionum, introdusse le potenze con esponente frazionario e indicò le regole più semplici per il loro calcolo. Il secondo, nel libro Le triparty en la science des nombres, scritto nel 1484 e riprodotto in parte da Estienne de la Roche, detto Villefranche, nell'opera Larismethique, stampata nel 1520, introdusse altresì l'esponente zero e gli esponenti negativi, e tenne conto anche di soluzioni negative delle equazioni; inoltre dalla considerazione simultanea di due progressioni, delle quali una aritmetica e l'altra geometrica, pervenne ad una delle proprietà fondamentali del calcolo logaritmico. Questa considerazione, contenuta in germe nell'Arenario (ψαμμίτης) di Archimede, si rinviene anche nel Pacioli (1494), nel Grammateus (1518) (n. 16) e in altri, e in modo più completo nello Stifel (1544; cfr. il n. 18).
Ma, benché ricche di vedute originali, le opere dell'Oresme e del Chuquet, rimaste a lungo accessibili soltanto a pochi (non furono stampate che nel 1868 e nel 1880 rispettivamente) non poterono che scarsamente influire sui progressi dell'algebra.
Tra i molti libri invece che, pubblicati per le stampe, giovarono a mantenere e divulgare l'interesse per lo studio dell'aritmetica e dell'algebra, sono da ricordare, per la Germania (dove il più antico manuale di calcolo, stampato, è il cosiddetto Bamberger Rechenbuch, del 1483), quello di Giovanni Widmann di Eger, intitolato Behende und hübsche Rechnung auff allen Kauffmanschafft, di cui la prima edizione, di Lipsia, è del 1489; per l'Italia (dove un manuale di calcolo era comparso a Treviso, senza nome d'autore, già nel 1478, e un altro ne aveva pubblicato Piero Borgi a Venezia nel 1484), la Summa de Arithmetica Geometria Proportioni et Proportionalita, del monaco francescano Luca Pacioli, detto anche Fra Luca, di Borgo San Sepolcro (nato verso il 1445, morto nel 1514). La quale, edita a Venezia nel 1494, ma composta già verso il 1470, ebbe molta diffusione, e, riassumendo tutte le cognizioni del tempo in aritmetica, algebra e geometria, fornì il precipuo materiale, donde nel secolo successivo gli studiosi trassero le loro scoperte.
La Summa, in gran parte ispirata al Liber abbaci di Leonardo (n. 12), contiene, con numerosi esempi e svariate applicazioni, molti calcoli su numeri razionali e irrazionali, positivi e negativi, e molti problemi così numerici come geometrici, trattati con abili artifizî, e conducenti ad equazioni di 1° e 2° grado con una o più incognite. Nell'intento di evitare le quantità negative, da lui, come da Leonardo, interpretate come debiti, è ancora mantenuta, per le equazioni quadratiche ad un'incognita, la distinzione in tre tipi; ma per l'equazione b x = x2 + c è rilevata, come già avevano fatto, dietro l'esempio degli Arabi, il Savasorda e Leonardo, l'esistenza di due radici (positive) quando sia soddisfatta la condizione b2 > 4 c.
Tuttavia, ancora al principio del sec. XVI, stentava a farsi strada l'idea che un'equazione potesse avere più di una radice, e nei problemi conducenti ad un'equazione di 2° grado quasi sempre si riteneva una sola delle due soluzioni.
14. Nel rinato fervore di studî che nel Cinquecento si determinò in Italia in ogni ramo del sapere, e, favorito dalla contemporanea invenzione della stampa, ben presto si propagò in altre regioni d'Europa, l'algebra fece essenziali progressi in due direzioni: da un lato, rendendo l'apparato formale più adeguato alla rappresentazione delle sue operazioni, dall'altro, venendo a capo di un problema, intorno al quale invano si erano affaticati i ricercatori dei secoli precedenti, e che il Pacioli, nella Summa (n. 13), aveva ritenuto ancora superiore alle risorse della scienza del suo tempo: la risoluzione algebrica delle equazioni di 3° e 4° grado. Invero all'attuazione di tali progressi non poteva darsi terreno più propizio che presso una generazione vibrante di confidenza nelle proprie forze, e nella quale alla tendenza pratica e utilitaria andava congiunta un'estesa conoscenza dell'antico sapere ellenico.
Aveva fatto difetto, così nell'antichità come nel Medioevo, un simbolismo che fosse adatto alla chiara esposizione di metodi gt: nerali, e consentisse agli scrittori di basare le loro ricerche direttamenti su quei metodi anziché sopra esempî particolari. Anche più tardi, nei secoli XVI e XVII, il progressivo avviamento verso un siffatto simbolismo fu reso assai lento dall'educazione essenzialmente geometrica, ispirata allo studio pressoché esclusivo dei grandi modelli greci. Così per lungo tempo l'algebra non poté svolgersi secondo una via propria, indipendentemente da ogni ricorso alla rappresentazione geometrica, e per tutto il Medioevo e al principio del Rinascimento si conservò la tradizione, che era stata interrotta da Diofanto (n. 6), di trattare separatamente problemi sostanzialmente equivalenti, rivestendone gli enunciati sotto forme svariate, spesso pittoresche, ispirate a casi della vita pratica.
Né all'accennata manchevolezza poteva supplire il particolare simbolismo grafico costituito dall'algebra geometrica dei Greci (n. 2), poiché, non avendosi il concetto delle quantità negative, la trattazione di una questione appena dotata di qualche generalità non era possibile se non con la distinzione di molti casi.
15. Segni particolari, atti a rendere il linguaggio più spedito, furono usati fin dai tempi più antichi, e già se ne trovano nel papiro Rhind (n. 1) per l'eguaglianza, l'addizione e la sottrazione. Aristotele (384-322 a. C.) designò con lettere dell'alfabeto oggetti qualunque del pensiero, e lo stesso fecero i geometri greci (Euclide, Apollonio, ecc., e con maggiore ampiezza Pappo di Alessandria [verso la fine del sec. III dell'êra volgare] nel 2° libro della Collezione [συναγωγή]) per rappresentare elementi geometrici, come punti, linee, ecc., oppure grandezze numeriche; lo stesso ancora si fece per tutto il Medioevo, specie dagl'Indiani, poi ancora, per es., da Leonardo pisano (n. 12), da Giordano Nemorario (n. 11) e, nel 1460, dal Regiomontano (n. 9), ma senza che mai si desse luogo ad un vero calcolo algebrico.
Così presso i Greci e gl'Indiani, come presso gli Arabi e gli altri scrittori medievali, l'esposizione si mantenne sempre puramente verbale, con o senza abbreviazioni, ed anche le formule algebriche si enunciarono con parole oppure per mezzo di esempî numerici. Codesto carattere dell'esposizione andò a poco a poco attenuandosi soltanto nella seconda metà del '500, con l'introduzione di notazioni convenzionali, l'impiego delle quali acquistò in seguito sempre maggiore uniformità.
16. Per l'addizione e la sottrazione, Leonardo usava le parole et e minus; Chuquet e Pacioli (n. 13) adoperarono i segni p??? e m???, abbreviazioni delle parole plus e minus venute in uso dopo Leonardo, specialmente in opere di origine italiana. I segni + e − compaiono per le stampe dapprima nel libro del Widmann (1489) citato al n. 13; ma il primo libro di calcolo uscito per le stampe, che li contenga in modo sistematico come segni di addizione e sottrazione, è un trattato di Enrico Schreiber di Erlurt (morto nel 1525), detto Grammateus, composto nel 1518 e puuhlicato, sembra, nel 1521, col titolo Ayn new künstlich behend vnd gewiss Rechenbüchlin vff alle Kauffmanschafft, il quale è altresì il primo libro tedesco stampato, contenente una sezione dedicata all'algebra.
Il doppio segno ± trovasi nella Clavis mathematicae (1631) di Guglielmo Oughtred (1574-1660), parroco inglese; il segno = presso l'inglese Roberto Recorde (1510-1558), in un'opera dal titolo The Whetstone of witte (1557); i segni > e 〈 in Tommaso Harriot di Oxford (1560-1621), in un'opera pubblicata dieci anni dopo la sua morte, col titolo Artis analyticae praxis.
L'uso di una notazione esponenziale per le potenze dell'incognita si riscontra nell'Ahebra del Bombelli (n. 9), e fu seguito, con piccole modificazioni, da Simone Stevin, di Bruges (1548-1620), nel libro L'Arithmétique (1585). La notazione degli esponenti frazionari e degli esponenti negativi trovasi nella Mathesis universalis (1657) di John Wallis (n. 24), al quale è pure dovuta l'introduzione del segno ∞ per infinito, nell'opera Tractatus de sectionibus conicis nova methodo expositis (1655).
Il segno radicale √ si deve a Cristoforo Rudolff di Jauer, vissuto verso la prima metà del sec. XVI, che l'adottò in un'opera Behend und hubsch Rechnung durch die kunstreichen Regeln Algebre (1525). L'uso degli indici nei radicali si trova pure nell'Algebra del Bombelli.
Parentesi rotonde si hanno nell'Arithmetica integra (1544) del monaco agostiniano Michele Stifel (lat. Stiffelius), di Esslingen (1486-1567); in modo sistematico nell'Algebra del Bombelli, ed anche nel 2° volume del General trattato di numeri et misure (1556) di Nicolò Tartaglia. L'uso di lettere con indici, iniziatosi con lo Stevin (1634), fu continuato da Francesco van Schooten (1649) e da Goffredo Guglielmo Leibniz (1676).
Il simbolo sommatorio Σ è di Leonardo Euler (1755).
17. Già prima di Euclide l'incognita era designata con la parola ἀριϑμός, il suo quadrato con δύναμις, il cubo con κύβος. Erone aggiunse il vocabolo δυναμοδύναμις per indicare la quarta potenza; Diofanto i vocaboli δυναμόκυβος e κυβόκυβος per la quinta e la sesta potenza, inoltre ἀριϑμοστόν, δυναμοστόν,..., κυβοκυβοστόν per indicare le inverse delle sei prime potenze.
Dagli Arabi, l'incognita era chiamata cosa (shay') ed anche radice (gidhr), mentre le quantità note erano dette numeri.
Nelle versioni latine del secolo XII furono usati particolari vocaboli a denotare l'incognita e le sue potenze: radix, res, causa per l'incognita, census per il suo quadrato, ecc.; per le costanti si disse numerus, ed anche dragma o denarius.
Le parole radix, res, causa si ritrovano tutt'e tre in Leonardo pisano, il quale designò le potenze 3ª, 4ª, 6ª e 8ª dell'incognita con le parole cubus, census census, census census census ed anche cubus cubi, census census census census, mentre chiamò census tanto l'incognita quanto il suo quadrato. Con i vocaboli numerus, denarius, dragma egli denotò per lo più l'unità.
Con gli stessi nomi (aggiunto cubus de censu per la 5ª potenza) si designavano in Germania nei sec. XV le prime sei potenze dell'incognita. Grammateus (n. 16) denotava le successive potenze con pri, se, ter....
In Luca Pacioli le costanti si dicono numeri, l'incognita chiamasi cosa e le sue successive potenze prendono i nomi di censo, cubo, censo censo, primo relato, censo de cubo, secundo relato, ecc. Quando intervenga una seconda incognita, dal Pacioli essa è detta quantità.
Le potenze con esponente intero positivo furono dal Tartaglia (General trattato, ecc., 1556, v. il n. 16) chiamate dignità. Il Bombelli, ispirandosi a Diofanto, chiamò tanto l'incognita, potenza il suo quadrato, potenza di potenza e potenza cuba la 4ª e la 6ª potenza, e usò in generale per le potenze successive alla 2ª il vocabolo tartaleano dignità. Lo Stevin seguì il Bombelli nel chiamar potenza il quadrato dell'incognita e disse potence cubique e potence de quarte quantité la 3ª e la 4ª potenza, e adottò inoltre segni particolari anche per potenze di più incognite. Del resto, il Regiomontano (n. 9 e 15) fin dal 1471 aveva usato la parola potentia nel significato generale.
La 5ª potenza fu detta sursolidum da Adamo Riese di Staffelstein (1492-1559) e dal Rudolff (n. 16), poi ancora dal Descartes (1637) e da Edmondo Halley (1694).
La parola aequatio, che è usata, per es., già da Leonardo, è l'equivalente del vocabolo ἴσωσις, con il quale Diofanto designava i due membri di una equazione. Invece di equazione, gli algebristi italiani del principio del Rinascimento dicevano capitolo.
Un termine dell'equazione, che da Diofanto era detto εἶδος, fu chiamato species dal Vieta (1591): donde il nome di arithmetica speciosa dato per lungo tempo al calcolo letterale (cfr. il n. 21).
18. Nella prima metà del '500, i segni che servivano a denotar l'incognita, e, più generalmente, un numero qualunque, e le sue potenze, consistevano per lo più nelle lettere iniziali dei rispettivi vocaboli.
In Germania, dove l'algebra era stata importata dall'Italia nella seconda metà del secolo precedente (il più antico documento sull'algebra è un volume di manoscritti di Monaco, redatti parte in latino e parte in tedesco, la cui compilazione può assegnarsi tra il 1455 e il 1464), la parola cosa passò col significato che riportammo al n. 17, l'incognita si chiamò numerus cossicus, ed anche die Coss, e i segni rappresentativi dei numeri, noti o incogniti, e delle loro potenze, si dissero segni cossici. Il calcolo con essi, e, più generalmente, l'algebra, si disse anche ars cossica, o brevemente la cossa; i cultori di essa, cossisti. Merito precipuo di questi fu aver promosso il calcolo letterale, preparando così la via all'odierno simbolismo algebrico, e aver coltivato il calcolo con potenze, separandolo dalla teoria delle equazioni.
Tra i cossisti saliti in maggior rinomanza, ricordiamo il Grammateus e il suo discepolo Rudolff (n. 16), il Riese, e, sopra tutti, Michele Stifel (n. 16). Il quale nell'Arithmetica integra (1544), ed anche nella nuova edizione, da lui curata (1553), del libro del Rudolff che citammo al n. 16 e che dallo Stifel fu intitolato Die Coss, introdusse la denominazione di esponente, estese i simboli cossici delle potenze e delle radici a gradi comunque elevati, e per primo adottò simboli per più numeri generali e loro potenze.
Sciogliendosi poi dall'eccessivo formalismo de' suoi predecessori, lo Stifel mostrò come i numerosi casi a cui si solevano ridurre i problemi dipendenti da un'equazione quadratica (nell'opera Die Coss, composta nel 1524, pubblicata nel 1892, la soluzione delle equazioni di 1° e 2° grado era stata data da Adamo Riese in 24 "regole") potessero tutti risolversi con una regola unica, da applicarsi ai tre tipi
riconobbe la possibilità di una duplice soluzione nell'ultimo caso, e, pur respingendo, al pari di tutti i cossisti, le soluzioni negative, contribuì a chiarire il concetto di tali numeri (da lui detti numeri absurdi), considerandoli come minori dello zero.
Così, in ispecie con l'ammettere numeri negativi come coefficienti di un'equazione, dopo circa un millennio si tornava alle vedute degl'Indiani!
Nello Stifel si trova altresì il primo esempio di un'equazione avente come secondo membro lo zero; inoltre un avviamento al calcolo logaritmico, fondato, come già in Chuquet (n. 13), sul confronto tra due progressioni, l'una aritmetica e l'altra geometrica, e ancora un perfezionamento del calcolo delle potenze, ed una generale trattazione delle radici d'indici arbitrarî, da estrarsi così da numeri assegnati, come da espressioni algebriche contenenti quantità indeterminate.
La riduzione di tutte le equazioni quadratiche ad un unico tipo si trova la prima volta nell'Arithmétique (1585) dello Stevin (n. 16), il quale riconobbe altresì la duplicità della soluzione in tutti i casi, e tenne conto anche di soluzioni negative. Ma in questo era stato preceduto dal Cardano (1539). Soltanto il caso x2+ p x + q = 0, con p e q positivi, restava al di fuori delle considerazioni del tempo, perché richiedeva l'intervento degli immaginari.
Frattanto erasi scoperta in Italia la risoluzione algebrica delle equazioni di 3° grado.
19. Rifuggendosi generalmente dalla considerazione di quantità negative, le equazioni cubiche prive del termine di 2° grado venivano a quel tempo distinte nei tre tipi
con p e q positni.
Per primo, verso il 1515, il bolognese Scipione Dal Ferro (1465-1526) risolse l'equazione (1), assegnando una regola che può estendersi anche alle (2) e (3). Del procedimento da lui seguito non si ha notizia sicura; ma gli svolgimenti dati dal Bombelli nella sua Algebra (n. 9 e 16) fanno presumere che il Dal Ferro giungesse al suo risultato cercando come si potessero estendere ad irrazionali cubici le proprietà degli irrazionali quadratici contenute nel libro X degli Elementi di Euclide.
La formula del Dal Ferro, da lui comunicata soltanto a pochi familiari, fu ritrovata da Nicolò Tartaglia, di Brescia (1500-1557), nel 1535, e da lui confidata nel 1539, senza dimostrazione, a Gerolamo Cardano, di Pavia (1501-1576), il quale la divulgò, corredandola di dimostrazioni e ampiamente riconoscendo al Dal Ferro e al Tartaglia il merito della scoperta, nel suo Artis magnae sive de regulis algebraicis liber unus, stampato a Norimberga nel 1545. A questa pubblicazione il Tartaglia rispose col libro Quesiti et inventioni diverse (1546), nel quale sono pure narrate le polemiche cui avevano dato luogo le scoperte sue e del Dal Ferro.
Nelle equazioni (2) e (3), quando sia
la formula risolutiva involge estrazioni di radici quadrate da numeri negativi. Questo, che fu detto il casus irreducibilis dell'equazione cubica, diede luogo a molte discussioni tra i matematici del tempo, e particolarmente se ne occupò, cercando di evitar l'immaginario, il Cardano nel libro citato, e più a lungo nel De regula Aliza libellus (1570), come pure nell'altro libro Ars magna arithmeticae, stampato dopo la sua morte, nell'edizione completa delle opere, pubblicata nel 1663.
Spetta al Bombelli il merito di avere per primo introdotto nell'algebra il calcolo dei numeri immaginarî, e di aver riconosciuto, per mezzo di esso, la generale validità della formula di Dal Ferro e Tartaglia, e l'esistenza di radici reali nel caso irriducibile. Che il problema della risoluzione dell'equazione cubica in quel caso si identifichi con quello della trisezione dell'angolo, fu pure accennato dal Bombelli, e più tardi posto in luce da Francesco Viète (1593), e dal lorenese Alberto Girard (morto nel 1632) nell'Invention nouvelle en l'algèbre (1629) e dal Descartes nella Geométrie (1637).
La soluzione delle equazioni di 4° grado prive del termine contenente il cubo dell'incognita, si deve a Lodovico Ferrari di Bologna (1522-1565), discepolo del Cardano, ed è esposta nel libro già citato Artis magnae del 1545.
In questo libro, il Cardano indica pure il modo di ridurre un'equazione cubica, con una trasformazione lineare, a mancare del termine di 2° grado, tien conto anche di radici irrazionali e di radici negative (i numeri negativi sono da lui detti numeri ficti), e per la prima volta riconosce che un'equazione cubica può ammettere tre radici, distinte o no (e quattro una di 4° grado); osserva inoltre in qual modo la somma e il prodotto delle radici si esprimano mediante i coefficienti, e come, conoscendo una radice a dell'equazione, questa si possa abbassare di grado con la divisione per x − a. L'opera contiene pure la riduzione di ogni equazione cubica ai due tipi (1) e (2) mediante una trasformazione a radici aumentate (del tipo y = x + k) o a radici reciproche (del tipo y =
l'ultima delle quali è dal Cardano attribuita al Ferrari.
20. Alla diffusa esposizione di quanto si riferisce alla soluzione delle equazioni di 3° e 4° grado, in tutti i numerosi casi che possono presentare, è dedicata gran parte dell'Algebra del Bombelli (nn. 9, 16 e 19). La quale segna un importante progresso anche per altri riguardi: anzitutto per l'introduzione del segmento unitario nell'algebra geometrica (n. 2), e la conseguente rappresentazione, mediante segmenti, di aree, volumi, quozienti, potenze e radici di segmenti (rispettivamente con esponenti e indici qualunque, interi positivi). Questa considerazione, di cui si avevano tracce in geometri greci (Erone, Diofanto) e indiani (nn. 4, 6, e 7), si presentò quasi un secolo dopo anche al Descartes (n. 23), e, come si disse al n. 6, costituì la base fondamentale per la costruzione della geometria analitica.
Devesi pure al Bombelli il merito di aver per primo fatto conoscere in Occidente l'opera di Diofanto. La sua Algebra contiene infatti soluzioni ingegnose di molti dei problemi trattati dall'autore greco, mentre la versione latina di Diofanto per opera dell'umanista Guglielmo Holtzmann, detto Xylander (1532-1576), è del 1575.
In una certa dipendenza dagli algebristi italiani, massime dal Cardano, lo Stifel (nn. 16 e 18) nell'Arithmetica integra (1544) e nelle aggiunte alla nuova edizione (1553) del libro Die Coss del Rudolff, trattò abilmente molti problemi conducenti ad equazioni di 2°, 3° e 4° grado.
Siffatte equazioni furono diffusamente studiate anche nell'Aritmétique (1585) dello Stevin (nn. 16 e 18), il quale per le equazioni di ciascun grado assegnò forme normali, e, al pari del Cardano, tenne conto delle soluzioni negative (ma non delle immaginarie).
Varî modi di soluzione di equazioni di 3° e 4° grado furono in appresso immaginati, tra altri, da Francesco Viète (1591), Renato Descartes (1637), Cristiano Huygens (1655), Giovanni Hudde (1657), Ehrenfried Walter von Tschirnhaus (1683), Leonardo Euler (1733 e 1764), Étienne Bézout (1765), Giuseppe Luigi Lagrange (1770).
Merita menzione una nuova soluzione dell'equazione di 4° grado, alla quale il Descartes pervenne decomponendo il primo membro dell'equazione in due fattori quadratici, mediante il metodo dei coefficienti indeterminati, da lui stesso escogitato.
Soluzioni trigonometriche delle equazioni di 2°, 3° e 4° grado furono date da Viète (1591) e Girard (1629), inoltre da Bonaventura Cavalieri (1639), Alessio Llaudio Clairaut (1746), Tommaso Simpson (1748). Antonio Cagnoli (1786) ed altri.
21. L'interesse per gli studî di algebra, suscitato dalle scoperte dei matematici italiani, contribuì pure al perfezionamento del relativo simbolismo. Inversamente, la maggiore generalità e scioltezza conseguite dall'algebra nell'aspetto formale furono di potente ausilio al progredire del suo contenuto.
Un passo essenziale alla fondazione del calcolo algebrico letterale fu compiuto da Francesco Viète de la Bigotière (1540-1603), comunemente noto col nome latinizzato Vieta. Nello scritto In artem analyticam isagoge (1591), seguendo l'uso già da tempo invaalso, egli rappresentò sistematicamente con lettere dell'alfabeto così le quantità incognite come le quantità note, alle quali in ogni singola questione è lecito attribuire un valore qualsiasi; ma a codesti simboli letterali, denotanti grandezze geometriche, applicò i segni delle operazioni aritmetiche (somma, sottrazione, moltiplicazione, divisione, estrazione di radice), per rappresentare le corrispondenti costruzioni geometriche. Al pari dei Greci, fece uso di lettere maiuscole, le vocali per le incognite, le consonanti per le quantità note.
Specialmente importante fu l'innovazione di designare con lettere, anziché con numeri particolari, i coefficienti delle equazioni. Anzitutto, essa permise di concepire sotto forma generale gli scambievoli rapporti tra l'algebra e la geometria, la considerazione dei quali, già esistente presso gl'Indiani e gli Arabi, era si di nuovo presentata in Leonardo pisano e in Luca Pacioli, e poi presso molti autori del sec. XVI (Adamo Riese, Cristoforo Rudolff, Michele Stifel, ecc.), ma sempre con riferimento a dati di natura particolare. Rese inoltre possibile far uso di formule per rappresentare le soluzioni delle equazioni, e aperse la via alla considerazione del legame funzionale stabilito, mediante un'equazione, tra le radici di questa e i suoi coefficienti pensati come parametri variabili.
Il calcolo così risultante fu dal Vieta chiamato logistica speciosa (cioè calcolo con species, utpote alphabetica elementa), in opposizione alla logistica numerosa, calcolo con numeri. Si tornava con ciò all'antica veduta greca, che portava a distinguere tra numeri e grandezze, e che era stata superata da Erone e Diofanto (nn. 4 e 6), più tardi dagl'Indiani e dagli Arabi, poi ancora dal Bombelli, mentre di nuovo sussisteva nel General trattato di numeri et misure (1556) del Tartaglia (nn. 16, 17 e 19), ed ancora fu mantenuta da Pietro de Fermat (1601-1665) nell'opera Ad locos planos et solidos isagoge, pubblicata nel 1679, ma composta verosimilmente prima della comparsa (1637) della Géoéetrie di Descartes.
Coerentemente a quella veduta, le equazioni considerate dal Vieta sono sempre omogenee complessivamente rispetto alla quantità note e alle incognite. Del resto per il Vieta, fedele seguace della tradizione greca, i numeri da sottoporsi al calcolo sono soltanto razionali e positivi, e tali, in particolare, sono supposti i coefficienti delle equazioni numeriche da lui consideate e per le quali si serve dei simboli cossici. Quanto alle soluzioni, che per particolari valori dei coefficienti possono risultare irrazionali oppure negative, nel primo caso il Vieta ricorre a rappresentazioni geometriche e alla teoria euclidea delle proporzioni, nel secondo, come già si usava prima di lui, le soluzioni negative di un'equazione sono pensate come soluzioni positive dell'equazione che si ottiene cambiando x in − x.
22. Ma l'impiego del calcolo letterale consentì al Vieta di pervenire, nella teoria delle equazioni algebriche, a risultati nuovi e di notevole importanza, e altresì di conferire alla trattazione di questioni gia risolute da altri (per esempio, quelle relative alle equazioni dei quattro primi gradi) una molto maggiore generalità e compiutezza che non si fosse mai fatto. Già accennammo (n. alla risoluzione trigonometrica dell'equazione cubica nel caso irriducibile. In alcuni scritti che risalgono al 1591 circa, e furono pubblicati dopo la sua morte, studiò alcune classi particolari di equazioni, specialmente trinomie, estese ad equazioni di grado qualunque la regola data dal Cardano (n. 19) per far scomparire il secondo termine mediante una sostituzione della forma y = x + k, e, generalizzando un altro risultato del Cardano sulle equazioni cubiche, diede le formule che per le equazioni dei gradi 2, 3, 4 e 5 esprimono la somma delle radici, le somme dei loro prodotti a due a due, a tre a tre...., e il loro prodotto, per mezzo dei coefficienti.
Tali relazioni tra i coefficienti e le radici si trovano assegnate in modo completo, per un'equazione di qualsiasi grado, nel breve scritto Invention nouvelle en l'Algèbre (1629) del Girard (n. 19). Nel quale, tenendo conto di tutte le radici reali (razionali e no, positive e negative) e immaginarie, sono altresì calcolate per mezzo dei coefficienti le somme delle quattro prime potenze delle radici, e viene enunciato il teorema fondamentale che ogni equazione algebrica ha tante radici quante sono le unità del suo grado: mentre Pietro Rothe nella sua Arithmética philosophica (1608) già aveva affermato che il numero delle radici non può superare il grado dell'equazione. Il caso particolare, secondo il quale la nma radice di un numero ha sempre n valori, non fu dato esplicitamente che nel 1690, da Michele Rolle (1652-1719) nel suo Traité d'algèbre.
Alle dette relazioni era giunto alquanto prima anche il Harriot nell'opera che citammo al n. 16, la quale, con l'opera contemporanea dell'Oughtred citata nello stesso n. 16, contribuì notevolmente alla diffusione della conoscenza del calcolo algebrico.
Seguendo il Vieta, il Harriot respinse le soluzioni negative, ma conobbe lo spezzamento di un polinomio in fattori lineari (reali), e contribuì alla semplificazione del simbolismo algebrico, sia esprimendo le equazioni totalmente in simboli anziché con parole, sia sostituendo alle lettere maiuscole, usate dal Vieta, le lettere minuscole, che già erano state di uso comune presso gli scrittori medievali, e poi erano state ancora adoperate da John Napier (1550-1617) nella sua Ars logistica, composta prima del 1594 (pubblicata soltanto nel 1839).
23. Il completo e definitivo abbandono di ogni distinzione tra numero e quantità, è il fondamento della Géometrie (1637) di Renato Descartes du Perron, lat. Cartesius (1596-1650). Fissato un segmento unitario, si rende possibile rappresentare mediante segmenti i risultati delle operazioni algebriche elementari (addizione, sottrazione, moltiplicazione, divisione, elevazione a potenza, estrazione di radice) eseguite sulle misure di dati segmenti. Le relazioni tra grandezze geometriche (segmenti, aree, volumi...) vengono così espresse per mezzo di equazioni, e cade per queste l'obbligo dell'omogeneità.
Questi essenziali progressi erano già contenuti, come si disse al n. 20, nell'Algebra del Bombelli, e, almeno in embrione, in taluni passi delle opere di Erone e Diofanto, poi presso gl'Indiani e qualche scrittore arabo, ma erano ogni volta rimasti senza continuazione. L'opera del Descartes fu invece subito largamente divugata, e arricchita di commenti e illustrazioni, e segnò stabilmente l'organica fusione di due discipline, che per lo innanzi, pure prestandosi vicendevoli aiuti, erano state considerate come nettamente distinte: l'algebra e la geometria.
L'ulteriore sviluppo della scienza portò ad invertire le posizioni delle discipline stesse: poiché, mentre dapprima il fondamento della ricerca era costituito dalla geometria, ed a questa si riconducevano i problemi algebrici, a partire dal Descartes l'algebra fu concepita come scienza autonoma, avente la propria base nel calcolo aritmetico, e i problemi geometrici si pensarono ad essa subordinati. Tuttavia l'accoglimento delle nuove vedute non avvenne senza difficoltà, e la supremazia dell'algebra in tutti i rami della matematica non può ritenersi stabilita in modo definitivo che alla fine del '700, dopo i lavori di Leonardo Euler (1707-1783).
Dal lato formale, le notazioni del Descartes, che rapidamente presero il posto di quelle, troppo complicate, del Vieta, poco differiscono da quelle attualmente in uso. Egli denota con le ultime lettere dell'alfabeto (dapprima z, poi y, da ultimo x) le incognite, con a, b, c... le quantità note; rappresenta le successne potenze di a con a3, a4..., ma per il quadrato scrive aa, mentre lo Stifel (nn. 16 e 18) aveva scritto (1553) 1 A, 1 AA, 1 AAA..., e nel Cursus mathematicus (1634) di Pietro Hérigone le potenze di a erano indicate con a 2, a 3...
Al pari del Vieta, il Descartes usa le lettere soltanto per significare quantità positive, cosicché, per esempio, il primo membro di un'equazione del 4° grado priva del termine cubico (il secondo membro essendo lo zero) è da lui scritto così:
dove p, q, r sono numeri positivi e i puntini stanno a denotore + ovvero −
Descartes è il primo che abbia assunto sistematicamente lo zero come secondo membro delle equazioni: una volta, come si disse al n. 18, ciò era stato fatto dallo Stifel; più spesso trovasi nel libro del Napier ricordato alla fine del n. precedente.
L'uso di una lettera per rappresentare indifferentemente un coefficiente positivo o negatiio di un'equazione, si riscontra dapprima in una lettera scritta nel 1657 da Giovanni Hudde, di Amsterdam (1628-1704), e riprodotta nella 2ª edizione della versione latina della Géométrie di Descartes, pubblicata nel 1659 da Francesco van Schooten (1615-1660), poi fu seguito sistematicamente da Isacco Newton (lettera del 24 ottobre 1676 ad Enrico Oldenburg).
Al Hudde è pure dovuta una regola generale per decidere se una data equazione abbia due o più radici eguali.
24. Un segno della preponderanza acquistata, dopo il Descartes, dall'algebra in tutta la matematica traspare già da uno scritto (n. 16) di John Wallis (1616-1703) di Oxford, dal titolo espressivo Mathesis universalis sive arithmeticum opus integrum (1657). In esso le operazioni di calcolo su numeri interi sono arditamente estese ad ogni specie di grandezze, e, in particolare, viene esposto in veste aritmetica il contenuto dei libri II e V degli Elementi di Euclide, che costituiscono rispettivamente il fondamento dell'algebra geometrica (n. 2) e della teoria delle proporzioni.
La stessa trattazione aritmetica delle proporzioni si ritrova nel Treatise of algebra dello stesso autore (del 1685, ma scritto fin dal 1676, poi tradotto in latino nel 1693), nel quale sono raccolte tutte le cognizioni algebriche di quel tempo.
Nello scritto citato Mathesis universalis, il Wallis faceva uso di potenze con esponente negativo o fratto, come già avevano fatto l'Oresme e il Chuquet (n. 13). Ma il vero significato di siffatta estensione del concetto di potenza fu anzitutto riconosciuto da Isacco Newton (1642-1727), il quale poté così pervenire alla formula generale che dà lo sviluppo della potenza d'un binomio (cfr. il n. 8) anche quando l'esponente sia negativo o frazionario. Questo fondamentale risultato, comunicato dal Newton ad Enrico Oldenburg con lettera del 13 giugno 1676 (ma, a quanto sembra, a lui noto fin dal 1669), fu pubblicato la prima volta nell'Algebra del Wallis.
Newton per primo ebbe il concetto di funzione algebrica, definita come radice di un'equazione algebrica, i cui coefficienti siano funzioni razionali di una variabile (aequatio speciosa). Egli mostrò infatti come una radice di tale equazione possa svilupparsi in una serie di potenze (ascendenti o discendenti) della variabile (Analysis per aequationes numero terminorum infinitas, 1711, ma scritta prima del 1669; inoltre lettera ad Oldenburg del 24 ottobre 1676): la quale scoperta fu il punto di partenza di tutte le ricerche posteriori intorno ai punti singolari delle funzioni (e curve) algebriche.
Altri contributi all'algebra diede Newton in lezioni tenute a Cambridge nel 1673-1683 e poi raccolte e pubblicate da W. Whiston nel 1707 in un volume dal titolo Arithmetica universalis. È esso soprattutto una ricca raccolta di notevolissimi problemi di varia natura, che sono risolti e discussi con metodi eleganti, e molti dei quali oggi ancora sono riprodotti nei nostri trattati; ma contiene altresì, in forma esplicita e limpida, il concetto dei numeri negativi (minori dello zero), e l'interpretazione che deve darsi al loro apparire nelle soluzioni dei problemi; inoltre la scomposizione del primo membro di un'equazione in fattori lineari, la risoluzione delle equazioni cubiche mediante una concoide, formule ricorrenti per le somme delle potenze simili delle radici di un'equazione, e un metodo di eliminazione tra due equazioni algebriche.
25. L'adozione sistematica del calcolo letterale, permettendo una grande economia di pensiero e porgendo all'algebra un linguaggio atto allo studio generale dei problemi, diede un forte impulso allo sviluppo di tutta la matematica, e insieme con l'avvenuta fusione dell'algebra con la geometria preparò la strada al calcolo infinitesimale.
Nella seconda metà del sec. XVII e nel secolo successivo, l'attenzione dei matematici fu prevalentemente assorbita dall'esame dei numerosi problemi suscitati dall'invenzione del nuovo calcolo; ma anche le teorie puramente algebriche attuarono progressi, che in seguito si fecero sempre più notevoli.
Il maggior impulso alle nuove ricerche nell'algebra si riconnette con le scoperte degli algebristi italiani della Rinascenza. Il successo riportato con la risoluzione algebrica delle equazioni del 3° e del 4° grado aveva ben presto fatto sorgere la speranza di poter conseguire un analogo risultato rispetto alle equazioni di grado più elevato. È bensì vero che i ripetuti sforzi, con i quali molti matematici dei secoli XVII e XVIII si affaticarono intorno a questo problema, dovevano necessariamente fallire, essendosi più tardi riconosciuto che per le equazioni generali di grado superiore al 4° una risoluzione per radicali non esiste. Ma si deve appunto a quei tentativi l'introduzione e l'impiego dei concetti principali che hanno permesso di edificare la teoria delle equazioni algebriche sopra le sue vere basi.
Il problema fu studiato dal Leibniz (verso il 1676) e dal suo amico von Tschirnhaus (1683), poi da Euler (1732 e 1762) e da Bézout (1762 e 1765); in seguito, verso il 1770 e ispirandosi a nuove vedute, da Giuseppe Luigi Lagrange (1736-1813), da Edoardo Waring (1734-1798) e da Alessandro Teofilo Vandermonde (1735-1769), dopo i quali la sua trattazione subì una sosta di più di un quarto di secolo.
L'impossibilità della risoluzione algebrica delle equazioni generali di grado superiore al 4°, esplicitamente affermata da Carlo Federico Gauss (1777-1855) nella sua Dissertazione del 1799, fu dimostrata, muovendosi nello stesso ordine di idee di Lagrange e con argomentazioni pertinenti alla teoria dei gruppi di sostituzioni, da Paolo Ruffini (1765-1822), il quale la espose dapprima nella sua Teoria generale delle equazioni (1799), poi con modificazioni e semplificazioni in cinque lavori dal 1801 al 1813. Una dimostrazione in forma più limpida, e senza fare esplicito ricorso alla teoria dei gruppi, fu data nel 1826 dal norvegese Niels Enrico Abel (1802-1829). Una modificazione della dimostrazione di Abel, dovuta a Pietro Lorenzo Wantzel (1845), non differisce nei punti principali dall'ultima dimostrazione del Ruffini.
Ma per questo e per qualche altro argomento sembra ormai opportuno collegare con la loro sommaria esposizione i cenni storici relativi. Rimandiamo ad altri articoli per quanto riguarda l'analisi combinatoria, i determinanti, le equazioni lineari, la teoria dei gruppi, la teoria dei numeri, le equazioni indeterminate, la risoluzione numerica delle equazioni, e, in generale, i metodi di approssimazione.
Bibl.: Tra le molte opere, alle quali si può utilmente ricorrere per la storia dell'algebra, citiamo le seguenti: P. Cossali, Origine, trasporto in Italia, primi progressi in essa dell'algebra, Parma 1797, voll. 2; H. Hankel, Zur Geschichte der Mathematik im Alterthum und Mittelalter, Lipsia 1874; H. G. Zeuthen, Geschichte dser Mathematik im Altertum und Mittelalter, Copenaghen 1896; H. G. Zeuthen, Geschichte der Mathematik im XVI und XVII Jahrhundert, Lipsia 1874; S. Günther, Geschichte der Mathematik, I, Lipsia 1908; II, 1ª parte redatta da H. Wieleitner, Lipsia 1911; M. Cantor, Vorlesungen über Geschichte der Mathematik, I, 3ª ed., Lipsia 1907; II e III, 2ª ed., Lipsia 1899, 1901; M. Simon, Geschichte der Mathematik im Altertum in Verbindung l'antica Grecia, 2ª ed., Milano 1914; H. Wieleitner, Geschichte der Mathematik, voll. 2, Berlino e Lipsia 1922 e 1923; J. Tropfke, Geschichte der Elementar-Mathematik, 2ª ed., 6 voll., Berlino e Lipsia 1921-24 (per l'algebra, specialmente i primi tre volumi); E. Bortolotti, Studi e ricerche sulla storia della matematica in Italia nei secoli XVI e XVII, Bologna 1928.
Si vedano inoltre le osservazioni critiche all'opera del Cantor, pubblicate soprattutto da G. Ernström, nella 3ª serie (1900-1914) della Bibliotheca mathematica da lui diretta. Un notevole interesse ha pure il libro di D. E. Smith, Rara arithmetica, Boston e Londra 1908, nel quale sono riprodotti, con molte note bibliografiche e molti facsimili, brani di numerose opere di aritmetica e algebra, stampate (1472-1600) e manoscritte (1260-1600). Notizie e svolgimenti utili si trovano anche in U. Cassina, Calcolo numerico, Bologna 1928.
Monomî e polinomî.
26. Se x, y, z,... denotano numeri indeterminati (variabili), ai quali sia lecito attribuire valori arbitrarî, reali o complessi, si suol chiamare espressione o formula algebrica relativa a tali numeri, l'indicazione di un numero finito di operazioni di addizione, sottrazione, moltiplicazione, divisione, elevazione a potenza (con esponente intero, positivo, negativo o nullo) ed estrazione di radice (d'indice intero positivo), applicate ai numeri rappresentati da quelle lettere.
L'espressione è razionale se non interviene l'estrazione di radice, irrazionale nel caso contrario.
Un'espressione algebrica dicesi un monomio quando in essa non figurano le operazioni di addizione e sottrazione. Per esempio, 2 x3 y z2
è un monomio.
Un monomio si dice intero quando sia il prodotto di numeri particolari per potenze di variabili aventi esponenti interi, positivi o nulli. Il fattore puramente numerico, col suo segno, chiamasi coefficiente del monomio. Così nei monomî interi
e − 3 x4 y3 i coefficienti sono rispettivamente
Segno di un monomio è il segno del suo coefficiente.
Sotto forma più generale, se in un monomio come
si pensa di attribuire alle lettere a e b valori fissi (costanti) e alle x, y, z valori indeterminati (variabili), il monomio si dice ancora intero, e il suo coefficiente è
Due monomî interi sono sintili quando contengono le stesse variabili, elevate rispettivamente agli stessi esponenti.
Di un monomio intero si considerano i gradi rispetto alle singole variabili e il grado complessivo. I primi sono gli esponemi delle rispettive variabili, mentre il grado del monomio è la somma degli esponenti di tutte le variabili che lo compongono.
27. Si chiama polinomio la somma di due o più monomi, e questi monomî sono i termini del polinomio. Si dice anche spesso che il polinomio è la somma algebrica dei dati monomî, volendo significare che nel far la somma ciascuno dei monomî si considera con il suo segno.
Un polinomio di due, tre, quattro.... termini si dice rispettivamente binomio, trinomio, quadrinomio.... E spesso conviene anche considerare un monomio come un polinomio d'un solo termine.
Un polinomio si dice intero rispetto a certe lettere (simboli di numeri variabili) in esso contenute, quando tutti i suoi termini sono interi rispetto a quelle lettere. Un tal polinomio si chiama anche funzione razionale intera dei numeri variabili rappresentati dalle dette lettere.
Funzione razionale fratta di una o più variabili è una frazione, i cui termini sono funzioni razionali intere di quelle variabili.
Ridurre alcuni termini simili in un polinomio intero, quando esistano, significa sostituirli con un solo termine, che sia simile ad essi ed abbia per coefficiente la somma dei loro coefficienti.
Solitamente, dato un polinomio intero, si suppone di avere in esso eseguita la riduzione dei termini simili. In tal caso il polinomio si dice ridotto, e i coefficienti de' suoi termini si dicono coefficienti del polinomio.
Un polinomio intero si dice omogeneo di grado n rispetto ad una variabile, o rispetto a due o più variabili insieme, se tutti i suoi termini sono di grado n rispetto a quella variabile, o complessivamente rispetto a tutte quelle variabili.
Se un polinomio intero non è omogeneo rispetto ad una variabile, o rispetto a due o più variabili insieme, chiamasi grado di esso rispetto a quella variabile, o complessivamente rispetto a quelle variabili, il maggiore tra i gradi dei singoli suoi termini rispetto alla variabile stessa o alle variabili stesse.
Dato un polinomio ridotto, non omogeneo rispetto ad una variabile x, ordinarlo secondo le potenze decrescenti (o crescenti) di x significa disporne i termini in tale ordine che i loro gradi rispetto ad x vadano decrescendo (o crescendo) da ogni termine al successivo.
Un polinomio ridotto di grado n rispetto ad una variabile x, ordinato secondo le potenze decrescenti di x, ha la forma
dove i coefficienti a0, a1, ..., aa - 1, an sono numeri (reali o complessi) indipendenti da x (ossia costanti rispetto ad x), dei quali qualcuno può avere il valore zero, all'infuori di a0. Quando tutti i coefficienti siano diversi da zero, il loro numero è n + 1.
Dato un polinomio intero ridotto di grado n in m variabili x1 x2, ..., xm, ogni suo termine è del tipo a x1a1 x2a2 ... xmam dove a è una costante (reale o complessa) ed α1, α2, ... αm sono numeri interi, positivi o nulli, la cui somma è al più eguale ad n, e almeno in un termine raggiunge il valore n. Se il polinomio è omogeneo nelle m variabili, la somma degli esponenti α1, α2, ..., αm è in tutti i termini eguale ad n.
Se un polinomio ridotto di grado n in m variabili non ha alcun coefficiente nullo, il numero de' suoi termini è
secondo che è non omogeneo oppure omogeneo.
28. Un polinomio intero nella variabile x, e di grado n, il quale si annulli per più di n valori distinti di x, ha tutti i coefficienti nulli, quindi è identicamente nullo, cioè assume il valore zero per qualsiasi valore attribuito ad x.
Affinché un polinomio intero ridotto di una o più variabili sia identicamente nullo, cioè assuma il valore zero qualunque siano i particolari valori dati alle variabili, è necessario e sufficiente che tutti suoi coefficienti siano nulli.
Ne segue che, affinché due polinomî interi delle stesse variabili siano identicamente eguali, ossia prendano gli stessi valori per valori arbitrarî dati alle variabili, occorre e basta che, scritti in forma ridotta, abbiano eguali i coefficienti dei loro termini rispettivamente simili.
Questo teorema suol chiamarsi il principio d'identità dei polinomi interi (o delle funzioni razionali intere).
Il vocabolo binomio ha origine da Euclide, il quale nel libro X degli Elementi chiama ἐκ δύο ὀνομάτων (ex binis nominibus) espressioni della forma a + √b, √a + √b, con a e b razionali. In questo senso la parola binomium fu usata fino alla metà del sec. XVI. Nel significato attuale, la parola binomio si trova anzitutto in Stevin (1585).
La parola monomio compare dapprima nel Dictionnaire mathématique di J. Ozanam (1691), ma non fu usata sistematicamente che al principio del sec. XIX. Nei due secoli precedenti si diceva quantità semplice, oppure grandezza incomplessa.
Nel senso attuale, la parola polinomio fu usata dal Vieta (1591); qualche anno prima (1585) lo Stevin aveva detto miltinomio; ma ancora alla fine del sec. XVIII e nei primi anni del XIX si usava dire quantità composta, oppure grandezza complessa, anziché polinomio.
Il vocabolo coefficiente (πλῆϑος in Diofanto) si trova in uno scritto del Vieta del 1591, ma fu poco usato sino alla fine del sec. XVII. Anche il vocabolo gradus, nel senso attuale, trovasi in Vieta. Descartes usava la parola dimensione.
Il nome funzione omogenea si deve a Giovanni Bernoulli (1726).
Operazioni tra monomi e polinomi.
29. Per fare la somma di due o più polinomî, si scrivono tutti i loro termini l'uno di seguito all'altro.
Per sottrarre da un polinomio un altro polinomio, si scrivono di seguito al primo i termini del secondo, presi con i segni cambiati.
Il grado della somma algebrica di due o più polinomi non supera il maggiore dei gradi degli addendi.
Il prodotto di due o più monomi interi è un altro monomio intero, il quale ha per coefficiente il prodotto dei coefficienti, e per fattori variabili gli stessi fattori variabili dei dati monomî, ciascuno con esponente eguale alla somma degli esponenti che il fattore considerato ha nei singoli monomî.
Il prodotto di un polinomio per un monomio (o di un monomio per un polinomio) è il polinomio i cui termini si ottengono moltiplicando i termini del polinomio per il monomio.
Il prodotto di due polinomî è un polinomio, i cui termini si hanno moltiplicando ciascun termine del moltiplicando per ciascun termine del moltiplicatore.
Dal prodotto di due polinomî si passa a quello di tre, quattro ... polinomî.
Il prodotto di due o più monomî o polinomî ha per grado la somma dei gradi di essi.
S'intende che negli enunciati precedenti la parola grado si riferisce tanto ad una determinata variabile, quanto a più variabili insieme.
30. Dati due monomî o polinomî A e B, dipendenti da un numero qualunque di variabili, e supposto B non identicamente nullo, quando esista un nuovo monomio o polinomio C, che moltiplicato per B dia per prodotto A, si dice che A è divisibile per B, che B è un divisore, o fattore, di A, e anche che B divide A. Si dice che A è il dividendo, B il divisore, e C il quoziente della divisione di A per B, e si scrive A: B = C, od anche
Queste scritture equivalgono all'altra: A = B C.
Un polinomio è divisibile per una costante qualunque, e per sé stesso.
Affinché un monomio A sia divisibile per un monomio B, è necessario e sufficiente che tutti i fattori variabili di B siano pure fattori di A, ed abbiano in A un esponente non minore che in B.
Quando il monomio A è divisibile per il monomio B, il quoziente della loro divisione è il monomio che ha per coefficiente il quoziente dei coefficienti di A e B, e gli stessi fattori variabili di A, ciascuno con esponente eguale alla differenza degli esponenti che sono in A e in B. Perciò il grado del quoziente è la differenza tra il grado di A e quello di B.
Affinché un polinomio A sia divisibile per un monomio B, occorre e basta che ogni termine di A sia divisibile per B. Il quoziente è allora il polinomio i cui termini sono i quozienti dei termini di A per B, ed ha quindi per grado la differenza tra il grado di A e quello di B.
Un polinomio A sia divisibile per un monomio B, e si denoti con C il quoziente della divisione. Se allora in luogo di A si scrive B C, si dice spesso che nel polinomio A si è raccolto a fattor comune, o anche si è posto in evidenza, il fattore B.
31. Siano A e B due polinomî interi della variabile x, e rispettivamente di gradi n ed m, essendo n non minore di m, e si supponga B non identicamente nullo. Allora col principio d'identità dei polinomi interi (n. 28) si dimostra che esistono due, e due soli, polinomî interi Q ed R, il secondo dei quali al più di grado m − 1, tali che abbia luogo l'identità
I polinomî A e B si dicono dividendo e divisore, Q dicesi quoziente ed R resto della divisione di A per B. Quando, in particolare, R sia identicamente nullo, si dice che A è divisibile per B, che B è un divisore, o un fattore, di A, ed anche che B divide A.
Per calcolare Q ed R, conviene nella pratica procedere come segue. Ordinati A e B secondo le potenze decrescenti di x, si pensino così ordinati anche Q ed R. Allora il primo termine q1 di Q si ottiene dividendo il primo termine di A per il primo termine di B. Dopo ciò, si moltiplichi B per q1, il prodotto si sottragga da A e la differenza si ordini secondo le potenze decrescenti di x. Risulta così un primo dividendo parziale, e dividendo il suo primo termine per il primo termine di B. si avrà il secondo termine q2, di Q. Si continui così finché si ottenga un dividendo parziale R di grado inferiore ad m, il quoziente Q sarà q1 + q2 + ..., e il resto sarà R.
Importa segnalare il caso particolare in cui il divisore B sia di 1° grado in x, e, come è sempre permesso supporre, della forma x − k, essendo k una costante. In tal caso il quoziente Q è un polinomio di grado n − 1 e il resto R è una costante, e si ottengono con la regola detta di Ruffini (1799),-la quale, posto
è espressa dalle formule:
da cui:
Perciò il resto della divisione di un polinomio in x per un binomiop della forma x − k è il numero che risulta sostituendo nel polinomio, al posto di x, il numero k.
Ne segue il teorema già dato dal Descartes (1637), che affinché un polinomio in x sia divisibile per x − k, è necessario e sufficiente che esso si annulli quando si attribuisca ad x il valore k.
In particolare xn − kn è sempre divisibile, e xn − kn non è mai divisibile per x − k; xn − kn è divisibile per x + k solo quando n sia pari, e xn + kn solo quando n sia dispari.
Quanto ai quozienti, si ha per esempio:
Le operazioni algebriche fondamentali hanno avuto origine dalla considerazione delle equazioni, e tracce di un calcolo algebrico si trovanno già in Euclide (n. 2). L'addizione, la sottrazione e la moltiplicazione di polinomî s'incontrano in Diofanto (n. 6). La divisione di un polinomio per un monomio, pure accennata da Diofanto, si ritrova in Luca Pacioli e nei cossisti tedeschi del sec. XVI (n. 12). Della divisione di due polinomî si ha pure qualche semplice esempio in Diofanto, ma si può dire che tale operazione veramente non s'incontri che nel sec. XVI, al fine di abbassare il grado di un'equazione sopprimendo un fattore comune ai due membri. Anzitutto si trova in Stifel (n. 18).
La convenienza di ordinare dividendo e divisore secondo le potenze di una stessa variabile fu indicata dal Newton nell'Arithmetica universale (n. 24). La proprietà che xn − kn è divisibile per x − k trovasi già nel libro IX degli Elementi di Euclide. La divisione di xn ± kn per x ± k compare nel sec. XVI, tra altri in Cardano (1539) e Tartaglia (1556), più tardi in Wallis (1685).
32. Tornando a considerare un polinomio intero A di una o più variabili, esso si dice riducibile quando è identicamente eguale al prodotto di due polinomî interi delle stesse variabili, nessuno dei quali si riduca ad una costante. Nel caso contrario, A si dice assolutamente irriducibile (cfr. il n. 49).
La decomposizione di un polinomio intero riducibile in un prodotto di polinomî interi assolutamente irriducibili è possibile in un solo modo (facendo astrazione da fattori costanti).
Dal teorema fondamentale dell'algebra, di cui si dirà al n. 35, risulta che i polinomì irriducibili di una sola variabile sono soltanto quelli di 10 grado. Esistono invece polinomî assolutamente irriducibili di più variabili e di grado superiore all'unità. Tali ad esempio x2 + y2 + 1, x3 − y2.
Massimo comune divisore e minimo comune multiplo di due o più polinomi in una variabile.
33. Siano A e B due polinomî interi della variabile x, rispettivamente di gradi n ed m, e sia n non minore di m > 0. Tra i divisori comuni di A e B, uno ne esiste, e uno solo (fatta astrazione da un fattore costante), il quale ha il grado più alto possibile, e gode della proprietà che i suoi divisori sono tutti e soli i divisori comuni di A e B. Un tal polinomio chiamasi massimo comun divisore di A e B.
La ricerca del massimo comun divisore di A e B si fonda sulla proprietà - immediata conseguenza della formula (1) del n. 31 - che se un polinomio divide A e B, esso divide anche il resto della divisione di A per B, e, inversamente, se un polinomio divide B e questo resto, divide anche A.
Il calcolo del massimo comun divisore si fa allora applicando ad A e B l'algoritmo di Euclide (Elementi, libro VII), che serve a determinare il massimo comun divisore di due numeri interi. Con successive divisioni si ottengono le identità:
dove i successivi resti R1 e R2, ... sono polinomî interi in x, i cui gradi vanno diminuendo. Proseguendo l'operazione, si giungerà dunque ad un resto, che sarà una costante, e sia Rk. Se Rk non è nullo, A e B non ammettono divisori comuni (che non siano costanti), e si dicono primi tra loro. Se invece Rk = 0, il resto precedente R-1 è il massimo comune divisore di A e B.
Se ciascuno dei polinomî A, B, ... è primo con ciascuno dei polinomî L, M, ..., il prodotto A B ... e il prodotto L M ... sono primi tra loro.
Un polinomio intero in x, che sia divisibile per altri polinomi primi tra loro a due a due, è pure divisibile per il loro prodotto.
Dividendo due polinomî per il loro massimo comun divisore, i quozienti sono primi tra loro.
Se un polinomio divide il prodotto di due polinomî ed è primo con uno di questi, esso divide l'altro.
La ricerca del massimo comun divisore può farsi anche per più di due polinomî. Per esempio, il massimo comun divisore di tre polinomî A, B, C si ha determinando il massimo comun divisore H di A e B, poi quello di H e C.
Minimo comune multiplo di due o più polinomî interi è il polinomio di minimo grado, che è divisibile per ciascuno dei dati. Se si tratta, per esempio, di due polinomî A e B, esso si ottiene dividendo il prodotto A B per il massimo comun divisore di A e B.
ll minimo comune multiplo è unico, salvo un fattore costante arbitrario. I polinomî multipli del minimo comune multiplo sono tutti e soli i polinomî multipli comuni dei dati.
La ricerca del massimo comun divisore di due polinomi interi in una variabile, col metodo delle divisioni successive, fu fatta anzitutto da Stevin (1585), poi ancora da van Schooten (1659), Rolle (1690) e altri; con un processo di eliminazione, da Hudde nella lettera citata al n. 23.
Le precedenti nozioni di divisibilità, massimo comun divisore, ecc. si estendono facilmente a polinomî interi di più variabili, come può vedersi, ad es., in A. Capelli, Istituzioni di analisi algebrica, 4ª ed., Napoli 1909, p. 346 seg.
Derivate delle funzioni intere. Formule di Taylor e di Maclaurin. Teorema di Euler sulle funzioni omogenee.
34. Dal concetto di derivata di una funzione qualunque f(x) (v. differenziale, calcolo) segue che, quando si tratti di una funzione razionale intera
la derivata f′ (x) è la funzione razionale intera di grado n − i espressa da:
Se ne deduce allo stesso modo la derivata seconda f″ (x), cioè la derivata della derivata, e così la derivata terza f‴ (x),..., la derivata nma, o di ordine n, f(n) (x), la quale è la costante n! a0 mentre le derivate successive alla nma sono tutte nulle.
Dando ad x un incremento arbitrario h, e sviluppando le potenze di x + h, si ottiene
la quale costituisce la formula di Taylor (1717).
Per x = 0 e scrivendo x al posto di h, se ne deduce la formula di Maclaurin:
Per una funzione intera f(x, y, z, ...) di più variabili x, y, z, ... si hanno le derivate parziali, calcolate nell'ipotesi che alcune delle x, y, z, .... siano pensate come costanti. La fmzione intera che si ottiene eseguendo sopra f un numero qualunque di successive derivazioni parziali è sempre la stessa, comunque si cambî l'ordine di tali derivazioni. Ad es., la derivata terza rispetto ad x due volte e rispetto ad y una sola volta, s'indicherà con f‴xxy.
Limitiamoci a scrivere la formula di Taylor per una funzione f di tre variabili x, y, c, di grado n:
dove la f e le derivate s'intendono formate con x, y, z.
Se una funzione intera di più variabili x, y, z, ... è omogenea di grado n, sussiste l'identità
la quale costituisce il teorema di Euler per le funzioni omogenee, da lui dato nel 1° volume delle Institutiones calculi differentialis (1755), benché già gli fosse noto fin dal 1736.
Il teorema fondamentale dell'algebra. Radici semplici e multiple di un'equazione.
35. Dato un polinomio intero in una variabile x, o, come diremo d'ora innanzi, data una funzione razionale intera f(x) (n. 27), coefficienti reali o complessi, ogni numero reale o complesso, che, sostituito nella funzione al posto di x, fa acquistare ad essa il valore zero, si dice una soluzione, o una radice, dell'equazione algebrica
Il grado n di f (x) si dice anche grado dell'equazione.
Un teorema del Descartes, riportato al n. 31, può ora enunciarsi dicendo: affinché un numero k sia radice della (1), è necessario e sufficiente che il primo membro f(x) sia divisibile per x − k.
Il teorema fondamentale dell'algebra afferma che ogni equazione algebrica possiede almeno una radice.
Ne segue che, se si pone
con a0 non nullo), la funzione f(x) si può rappresentare in forma di prodotto così:
ed i numeri, reali o complessi, α1, α2, ..., αn sono tutte e sole le radici dell'equazione (1). Si dice che la funzione f(x) è scomposta nei suoi fattori lineari: una tale scomposizione può farsi in un solo modo.
I numeri α1, α2, ..., αn possono essere tutti tra loro diversi, oppur no. Se α di essi sono eguali ad α, altri β eguali a b, ..., altri λ eguali ad l, essendo a, b, ..., l tutti tra loro differenti, ed essendo α, β, ..., λ numeri interi positivi tali che α + β + ... + λ = n, l'identità (3) si può scrivere anche come segue:
e si dice che a, b, ..., l sono radici dell'equazione (1), rispettivamente di molteplicità α, β, ... λ. Se α = 1, la radice a si dice semplice.
Pertanto una radice α della (1) si dice aver la molteplicità r, od anche essere una radice r-pla della (1), quando il primo membro f(x) è divisibile per (x − a)r e non per (x − α)r+1.
Si può così asserire che un'equazione algebrica di grado n ammette sempre n radici, purché ciascuna delle radici si conti tante volte quant'è il suo grado di molteplicità.
La possibilità di enunciare il teorema in forma così precisa è essenzialmente dovuta all'estensione data al concetto di numero con l'introduzione dei numeri complessi.
Quando la (1) abbia tutti i coefficienti reali, le sue radici complesse, se esistono, sono a due a due coniugate. Più precisamente se essa ha per radice un numero complesso p + q i (con i =
ha pure per radice il numero complesso coniugato p − q i, e le due radici hanno la medesima molteplicità.
Questo teorema è di Colin Maclaurin (1729).
Moltiplicando tra loro le coppie di fattori lineari di f(x) provenienti da due radici complesse coniugate, segue che una funzione razionale intera a coefficienti reali può scomporsi, in un solo modo, in fattori di primo e secondo grado, a coefficienti reali.
Supposto di nuovo che nella (1) i coefficienti possano essere reali o complessi, un teorema di Hudde (1659), a cui si è alluso nel n. 23, dice: affinché un numero k sia radice r-pla di un'equazione, è necessario e sufficiente che k annulli il primo membro dell'equazione e tutte le sue prime r - 1 derivate, ma non la derivata rma.
Ne segue che se k è radice r-pla della (1), essa è radice (r -1)-pla dell'equazione deriz'ata, cioè di quella che risulta eguagliando a zero la derivata
della funzione f(x).
Segue altresì che affinché le radici della (1) siano tutte semplici, occorre e basta che f(x) e f′ (x) siano prime tra loro.
ln virtù di questi teoremi, data ad arbitrio la (1), con sole operazioni di divisione e di derivazione si può ricondurre la risoluzione di essa alla risoluzione di altre equazioni aventi radici soltanto semplici, le quali sono rispettivamente le radici semplici, le radici doppie, ecc. della (1).
Si può anche ottenere similmente un'equazione avente soltanto radici semplici, le quali siano tutte e sole le radici distinte della (1): basta eguagliare a zero il quoziente della divisione di f(x) per il massimo comun divisore di f(x) e f′ (x).
Quando dalla (1) si passa a questa nuova equazione, si suol dire che si è liberata la (1) dalle sue radici multiple.
Già si disse nell'introduzione storica che alcuni scrittori indiani e arabi medievali avevano considerato le due radici di un'equazione di 2° grado; che Cardano (1545) aveva avvertito la possibilità di tre radici in un'equazione di 3° grado e di quattro in una del 4°; e che Vieta (1591) sapeva costruire equazioni di gradi 2, 3, 4, 5, .... dotate di 2, 3, 4, 5 radici.
Il teorema che un'equazione di grado n ammette n radici fu enunciato dal Girard nel 1629; e il Rolle nel 1690 osservò che la
possiede n valori distinti, il che val quanto dire che l'equazione xn − a = 0 ha n radici (n. 22).
Descartes (1637) e Newton (1707) si limitarono all'osservazione, fatta dal Rothe fino dal 1608 (n. 22), che un'equazione di grado n possiede n radici al più.
Dopo tentativi incerti e inesatte asserzioni di varî autori, Euler per il primo (1743) affermò la possibilità di dimostrare il teorema che ogni funzione razionale intera di una variabile, a coefficienti reali, può scomporsi in fattori lineari e quadratici a coefficienti reali; e Jean le Rond d'Alembert (1717-1783) ne diede nel 1746 una dimostrazione, la quale, pure non essendo priva di mende, ha in sé tali pregi da far ritenere non ingiustificato il nome di teorema di d'Alembert dato da molti al teorema fondamentale. Ma una dimostrazione, benché pur essa incompleta, era già stata data tre anni prima da Nicola Bernoulli (1687-1759), cercando di ottenere, per ogni equazione algebrica, una risolvente di grado dispari. È questo il concetto cui ancora s'ispirano molte delle dimostrazioni che furono proposte in seguito, e in particolare la prima delle due, entrambe non rigorose, date da Euler nel 1749.
Altre dimostrazioni, pure inesatte, si debbono a F. Daviet de Foncenex (1759), a Lagrange (1772 e 1792), ed a Pietro Simone Laplace (1795).
La prima dimostrazione rigorosa del teorema fondamentale si trova nella dissertazione di Gauss, del 1799 (da lui riprodotta, con modificazioni, nel 1849), la quale contiene altresì una critica delle dimostrazioni date dagli autori precedenti. Posto x = u + i v, f(x) = ϕ (u, v) + i ψ (u, v), Gauss prova che le due curve ϕ = 0, ψ = 0 hanno almeno un punto reale comune.
Altre due dimostrazioni, pure rigorose, furono date ancora da Gauss nel 1815 e nel 1816, nell'una ponendosi da un punto di vista puramente aritmetico, nell'altra basandosi sopra considerazioni di calcolo integrale.
Tra le numerose dimostrazioni dovute ad altri autori, limitiamoci a citare quella di Agostino Luigi Cauchy (1789-1857), del 1820, fondata - secondo un concetto che già trovasi in Giovanni Roberto Argand (1806) e in Adriano Maria Legendre (1808) - sull'esistenza di un minimo per il modulo di f(x). La dimostrazione presentava alcune lacune, che furono rilevate da Ossian Bonnet: tra l'altro, l'esistenza del detto minimo era ammessa, ma non dimostrata. Ma Gastone Darboux (1872), Rodolfo Lipschitz (1877) e altri l'hanno posta al riparo da ogni obiezione, ed essa, per la semplicità dei mezzi di cui fa uso, ha avuto la maggiore diffusione anche nei trattati.
Per un'esposizione storico-critica della varie dimostrazioni, vedasi G. Loria, Rivista di matematica, I (1891), p. 185; id., Bibl. math., s. 2ª, V (1891), p. 99 e s. 2ª, VII (1893), p. 47; A. Agostini, Period. di mat., s. 4ª, IV (1924), p. 307.
Proprietà analitiche delle funzioni razionali intere.
36. Una funzione razionale intera f(x) della variabile complessa x gode, tra altre, delle seguenti proprietà.
a) Dato ad arbitrio un numero reale ε > 0, si può assegnare un numero reale η > 0, per modo che per tutti i valori di x il cui modulo è minore di ε, il modulo di f(x) sia minore di η .
Ricorrendo alla rappresentazione geometrica dei numeri complessi dovuta ad Argand e Gauss, il teorema può enunciarsi dicendo che la funzione f(x) è finita in un campo qualunque limitato da una linea chiusa.
b) Dato ad arbitrio un numero reale R non negativo, si può assegnare un numero reale A > 0 tale che, per tutti i valori di x il cui modulo supera A, il modulo di f(x) sia maggiore di R.
In altre parole, quando il modulo di x diventa infinito, anche la funzione f(x) (cioè il suo modulo) diventa infinita.
Assumendo R = 0, risulta che esiste un numero reale k > 0, tale che gli eventuali valori di x che annullano f(x) hanno un modulo minore di k (Gauss, 1849).
c) La funzione f(x) è continua per ogni valore di x.
Il preciso significato di questafiermazione è il seguente. Si supponga che x varii in modo che il suo modulo si mantenga costantemente inferiore ad un numero dato R > 0, e sia xa un valore di x avente questa proprietà. Fissato allora ad arbitrio un numero ε > 0, si può assegnare un numero η > 0 per modo che, per tutti i valori di h il cui modulo è minore di η, il modulo della differenza f(x0 + h) − f(x0) risulti minore di ε: dove il numero η dipende unicameme dalla scelta di ε, ma non da quella di x0, purché, beninteso, il modulo di x0 sia inferiore ad R.
d) Se x0 è un valore di x tale che il modulo di f(x0) sia diverso da zero, si può dare ad x0 un tale incremento h che il modulo di f (x0 + h) risulti inferiore al modulo di f (x0).
I teoremi precedenti intervengono in molte delle dimostrazioni che furono proposte per il teorema fondamentale. Il teorema d) è dovuto a Legendre (1808), che appunto ne fece uso nella sua dimostrazione di quel teorema.
e) Le radici di un'equazione algebrica f(x) = 0 sono funzioni continue dei coefficenti.
Ecco qual'è il significato del teorema. Si scriva l'equazione nella forma:
e ponendo in evidenza le radici distinte, si abbia
con α + β + ... + λ = n. Facendo variare i coefficienti a1, a2, ..., an, potranno variare così le radici a, b, ..., l come i loro gradi di molteplicità α, β, ..., λ. Dicansi ε1, ε2, ... εn le variazioni subìte dai coefficienti, e si ponga
Se allora, nella rappresentazione geometrica di Argand e Gauss, si descrivono dei cerchi di centri a, b,..., l e di dati raggi (non nulli), tali che i cerchi stessi siano a due a due l'uno esterno all'altro, si può assegnare un numero η > 0 cosiffatto che, quando i moduli di ε1, ε2, ... εn sono tutti minori di η, l'equazione ϕ (x) = 0 possieda esattamente α radici nell'interno del primo cerchio, β nell'interno del secondo, ..., λ nell'interno dell'ultimo.
Equazioni di secondo, terzo e quarto grado.
37. Le due radici dell'equazione quadratica
son date dalla formula
Il discriminante (n. 45) dell'equazione è D = a12 − 4 a0 a2. Secondo che D è diverso da zero oppur no, le radici sono distinte o coincidono. Quando a0, a1, a2 siano reali, le radici sono reali se D non è negativo, complesse coniugate in caso contrario.
38. Un'equazione di terzo grado si può, con la trasformazione lineare (a radici aumentate, n. 47) y = x
ridurre alla forma
e questa si risolve con la cosiddetta formula di Cardano (n. 19):
dove
è il discriminante (n. 45)
Per ottenere dalla (2) le tre radici della (1), si fissi ad arbitrio uno dei tre valori di cui è suscettibile il primo dei due radicali cubici che compaiono in (2), e lo si denoti con u; si ponga
e si chiami ε una (scelta a piacere) delle due radici cubiche primitive dell'unità, cioè uno dei due valori
Allora le radici della (1) sono:
Se D = 0, le radici della (1) sono:
Quando p e q sono reali, possono presentarsi tre casi.
a) Se D > 0, delle radici della (1) una è reale e le altre due sono complesse coniugate. Scegliendo per u il valore reale del primo radicale cubico di (2), anche v risulta reale, e la radice reale è α1.
b) Se D = 0, sono reali tanto la radice semplice della (1) quanto la radice doppia.
c) Se D 〈 0, le radici della (1) sono tutte e tre reali. La (2) dà però queste radici in forma immaginaria. Questo caso fu dagli algebristi del sec. XVI chiamato casus irreducibilis (n. 19) perché non riuscì loro di rappresentare algebricamente le radici in forma reale. In tempi recenti si è dimostrato che effettivamente una tale rappresentazione è impossibile. La dimostrazione fu data da Vincenzo Mollame, e completata da Alfredo Capelli (1890); un'altra dimostrazione ne diede contemporaneamente Otto Hölder (1890); altre poco appresso Adolfo Kneser (1891) e Leopoldo Gegenbauer (1893), ai quali si deve anche un risultato più generale (n. 58).
Già si disse (n. 19) avere il Vieta mostrato come nel caso c) la realtà delle tre radici possa mettersi in evidenza per via trascendente, facendo intervenire le funzioni circolari. Invero in tal caso le due espressioni, dalle quali nella (2) si debbono estrarre le radici cubiche, sono numeri complessi coniugati, e si possono rappresentare con
cosicché, denotando con
la radice cubica aritmetica di ρ, e ponendo
la realtà delle tre radici risulta evidente dalle (3).
Il nesso, notato dal Bombelli e dal Vieta, tra il caso presente e il problema della trisezione dell'angolo, emerge dalla relazione goniometrica
39. Con la trasformazione (a radici aumentate) y = x -
(n. 47), l'equazione di quarto grado si riduce alla forma
La sua risoluzione si fonda sulla considerazione della risolvente cubica:
Se le radici di questa si chiamano u1, u2, u3, le radici della (1) sono:
per es., rappresentano uno dei due valori della rispettiva radice, fissato ad arbitrio, dopo di che il valore di
deve determinarsi per mezzo della relazione:
Il discriminante della (1) è e,
salvo un fattor numerico, non differisce dal discriminante della (2).
Quando i coefficienti della (1) sono reali, segue dalla (3) che il prodotto u1 u2 u3
è nullo o positivo.
Se q = 0, una delle u1, u2, u3 è nulla, quindi due delle radici della (1) sono eguali e contrarie alle altre due.
Se invece q è diverso da zero, sono da distinguere tre casi.
a) Se u1 è reale ed u2, u3 sono complesse coniugate, la (1) ha due radici reali α1, α2 e due radici complesse coniugate α3, α4.
b) Se u1, u2, u3 sono reali positive, le radici della (1) sono tutte reali e tra loro diverse.
c) Se u1 è positiva ed u2, u3 negative, le radici della (1) sono tutte complesse, essendo coniugate così α1 e α2 come α3 e α4.
Se D 〈 0, la (1) ha due radici reali e due complesse coniugate; se D 〈 0, le radici sono tutte reali o tutte complesse. Perché le quattro radici siano tutte reali (potendo due, ma non più, coincidere), è necessario e sufficiente che D non sia negativo e si abbia inoltre p 〈 0, q2 − 4 r > 0.
Un'esposizione diffusa di molti metodi di risoluzione delle equazioni dei primi quattro gradi, con numerose notizie storiche e bibliografiche, si trova nel libro di L. Matthiessen, Grundzüge der antiken und modernen Algebra der litteralen Gleichungen, 2ª ed., Lipsia 1896. Particolarmente notevoli sono il metodo di Lagrange (1770), fondato su considerazioni pertinenti alla teoria delle sostituzioni, e quello di Cavley (1858), che fa capo alla teoria degl'invarianti delle forme binarie (n. 66).
Per metodi di risoluzione delle equazioni di 4° grado v. anche F. Enriques, Questioni riguardanti le matematiche elementari, 3ª ed., II, Bologna 1926 (art. XX, di V. Notari), p. 417.
Equazioni reciproche.
40. Un'equazione algebrica si dice reciproca quando, avendo per radice un numero α non nullo, ammette pure per radice il numero
Affinché l'equazione
(con a0 non nullo) sia reciproca, è necessario e sufficiente che i coefficienti a0 e an, a1 e an-1, ... dei termini equidistanti dagli estremi siano eguali, oppure eguali e di segni contrarî. Dividendo, eventualmente, il primo membro per x − 1, ovvero per x + 1, oppure per il prodotto (x − 1) (x + 1), ogni equazione reciproca può ridursi ad un'altra (detta di tipo normale) di grado pari 2 m, nella quale i coefficienti dei termini equidistanti dagli estremi sono eguali, cioè del tipo:
e si può altresì supporre che questa non abbia più le radici + 1 e − 1.
Dividendo per x‴, e ponendo
si ha la formula ricorrente:
e la (1) si trasforma in un'altra di grado m in y. Da ciascuna delle m radici della nuova equazione si ottengono, mediante la prima della (2), due radici della (1).
Le equazioni reciproche furono considerate anzitutto nel 1730 da Abramo de Moivre (1667-1754), che ne stabilì le proprietà precedenti. Queste furono ritrovate da Euler (1733), cui si deve il nome di equazioni reciproche, e da Lagrange (1770).
Formule d'interpolazione. Spezzamento delle frazioni razionali in frazioni semplici.
41. Poiché una funzione razionale intera
contiene n + 1 coefficienti (reali o complessi), essa risulta determinata in modo unico quando siano noti i valori u0, u1, ..., un che assume per n + 1 valori x0, x1, ..., xn della variabile, assegnati arbitrariamente, ma tra loro differenti. Le formule che esprimono f(x) per mezzo dei dati, diconsi formule d'interpolazione. Le più notevoli sono quelle che portano i nomi di Newton e di Lagrange.
Sotto veste geometrica, il problema equivale a quello di far passare una curva parabolica, di equazione y = f(x), per un certo numero di punti assegnati nel piano. Questa veduta, che trovasi già in Giacomo Gregory (1668), ha condotto Newton alla formula intitolata dal suo nome, la quale è indicata nell'opera Philosophiae naturalis principia mathematica (1687), ma trovasi già accennata nella lettera ad Oldenburg del 24 ottobre 1676. La formula è:
dove in generale
La formula d'interpolazione detta di Lagrange fu pubblicata da lui nel 1795, ma trovasi già in un lavoro del Waring del 1779, ed è riprodotta nella 2ª ed. delle Meditationes analyticae (1783) di questo autore, che del resto la conosceva fin dal 1776.
Posto
e detta g′ (x) la derivata di g (x), la formula è:
o, sotto altra forma,
42. Con l'argomento precedente si collega il problema dello spezzamento di una frazione razionale in frazioni semplici.
Data una frazione razionale irriducibile
cioè una frazione avente per termini due funzioni razionali intere F(x) e f(x) di x, prive di fattori comuni e rispettivamente di gradi m ed n, supponiamo m 〈 n, al qual caso possiamo sempre ridurci con la divisione. Siano a, b, ..., l le radici (reali o no) distinte dell'equazione f(x) = 0, e α, β, ..., λ i rispettivi loro ordini di molteplicità, cosicché, denotando con a0 il coefficiente di xn in f (x), si avrà
e sarà α + β + ... + λ = n. Allora si può, in un sol modo, porre la frazione sotto la forma:
dove le A, B,..., L sono costanti determinate. Per calcolare i valori di queste costanti, si conoscono formule ricorrenti, ma praticamente conviene ridurre il secondo membro della formula ad una unica frazione di denominatore f (x), ed eguagliare i coefficienti delle stesse potenze di x nei numeratori dei due membri, il che porta ad un sistema di tante equazioni lineari nei coefficienti A, B,..., L quanti sono questi coefficienti.
La formula precedente fu data dal Leibniz nel 1703. Allorché α = β = .... = λ = 1, era stata indicata l'anno innanzi simultaneamente dal Leibniz e da Giovanni Bernoulli. In tal caso le costanti A, B,..., L si esprimono così:
e la formula coincide con la (1) del n. precedente.
Nel caso, particolarmente importante nel calcolo integrale, in cui i coefficienti di F(x) e f(x) siano reali, Euler (1781) ha mostrato come si possa evitare la comparsa dell'immaginario, decomponendo la data frazione in una somma di frazioni semplici aventi per denominatori potenze di espressioni lineari o quadratiche.
Funzioni simmetriche di più variabili.
43. Premettiamo una definizione, che tornerà utile anche più avanti.
Una funzione razionale intera delle n variabili x1, x2, ..., xn è una somma di termini del tipo
dove A è un coefficiente costante, che può variare da termine a termine, e k1, k2, ..., kn sono numeri interi, positivi o nulli. Secondo Gabriele Cramer (1750), dicesi peso del termine scritto la somma k1 + 2 k2 + ... + nkn.
Se tutti i termini hanno lo stesso peso P, la funzione dicesi isobarica, di peso P. Perché ciò abbia luogo, è necessario e sufficiente che, indicando con ρ un fattore arbitrario (non nullo), e sostituendo nella funzione, al posto di x1, x2, ..., xn, i loro prodotti rispettivamente per ρ, ρ2, ..., ρn, la funzione si riproduca moltiplicata per ρP; cioè che si abbia identicamente:
Analoghe sono le definizioni per funzioni razionali intere di più sistemi di variabili.
Ciò posto, una funzione delle variabili x1, x2, ...., xn si dice simmetrica, o ad un valore, se resta immutata quando le variabili si permutano tra loro in un modo qualunque. Basta per ciò che la funzione resti immutata per lo scambio di due qualunque delle n variabili.
Lo studio delle funzioni razionali simmetriche di più variabili si riconduce a quello delle funzioni intere simmetriche delle stesse variabili, poiché ognuna delle prime è il quoziente di due di queste ultime.
Tra le funzioni intere simmetriche di x1, x2, ..., xn hanno speciale importanza le funzioni simmetriche elementari (o fondamentali), cioè la loro somma, la somma dei loro prodotti a due a due, a tre a tre, ..., il loro prodotto.
Se le x1, x2, ..., xn si pensano come radici di un'equazione di grado n
Vieta, e più completameme Girard (n. 22), hanno trovato che le funzioni simmetriche elementari si esprimono mediante i coefficienti p1, p2, ..., pn con le formole:
dove ad es. Σ xi, xh, xk denota la somma degli
prodotti delle x1, x2, ..., xn a tre a tre.
Il teorema fondamentale della teoria è il seguente: ogni funzione intera simmetrica di x1, x, ..., xn si può, in un solo modo, esprimere come funzione intera delle funzioni simmetriche elementari, o, ciò che è lo stesso, dei coefficienti p1, p2, ..., pn della (1).
Se la data funzione delle x1, x2, ..., xn è omogenea di grado m, la sua espressione per mezzo delle pi è isobarica e di peso m; in ogni caso questa espressione ha, rispetto alle pi, il medesimo grado che la funzione primitiva ha rispetto ad una qualunque delle x1, x2, ..., xn. Se i coefficienti della data funzione sono numeri interi, anche i coefficienti della sua espressione per mezzo delle pi sono numeri interi.
Le più semplici funzioni simmetriche intere di x1, x2, ..., xn sono quelle del tipo
dove k è un numero intero, positivo o nullo. Esse diconsi le somme delle potenze simili di x1, x2, ..., xn, ed anche le funzioni simmetriche semplici, o le somme semplici.
Le loro espressioni per mezzo delle pi, sono date dalle formule ricorrenti, dette formule di Newton (n. 24):
Queste formule, da Newton nell'Arithmetica universalis (1707) soltanto enunciate, furono poi dimostrate da Colin Maclaurin (1698-1746) nel suo postumo Treatise of algebra del 1748 (in parte composto fin dal 1729), da Euler nel 1750, e da altri.
La somma sk è pertanto una funzione razionale intera, a coefficienti numerici interi, di grado k e peso k, delle p1, p2, ..., pn.
Al teorema fondamentale sulle funzioni simmetriche sono giunti simultaneamente Gabriele Cramer (1704-1752) nell'Introduction à l'analyse des lignes courbes algébriques (1750) e L. Euler (1748), il quale l'anno precedente lo aveva dimostrato per il caso delle somme delle potenze simili. Un metodo per il calcolo di una qualsiasi funzione simmetrica intera per mezzo delle funzioni elementari fu dato dal Waring (1762), e fu ritrovato dal Gauss (1815), cui si deve pure una rigorosa dimostrazione del teorema fondamentale.
Le funzioni simmetriche soddisfanno certe equazioni alle derivate parziali, che furono stabilite da Francesco Brioschi (1854).
Tabelle per funzioni simmetriche si debbono a Vandermonde (1771), Francesco Faà di Bruno (1873), P. A. Mac Mahon (1884). Cayley (1885) e altri.
Una nuova teoria delle funzioni simmetriche fu elaborata dal Mac Mahon in molti lavori, a cominciare dal 1887.
Furono pure studiate, anche con applicazioni geometriche, funzioni simmetriche di più serie di variabili, e funzioni simmetriche delle radici comuni a più equazioni: Waring, S. D. Poisson, L. Schläfli, G. von Escherich, F. Mertens, F. Junker, A. Brill, ecc.
Risultante di due equazioni.
44. Date due equazioni
delle quali l'una di 1° grado e l'altra di grado qualunque n, affinché la radice della prima soddisfi anche la seconda occorre e basta che sia nulla l'espressione
la quale è formata in modo razionale intero con i coefficienti delle date equazioni.
La questione può generalizzarsi, considerando due equazioni
di gradi arbitrarî, a coefficienti reali o complessi, ma con a0 e b0 diversi da zero, e proponendosi di assegnare una funzione razionale intera dei coefficienti a0, a1, ..., an, b0, b1, ..., bm, la quale con il suo annullarsi esprima la condizione necessaria e sufficiente perché le (1) abbiano almeno una radice comune, ossia perché le funzioni razionali intere f(x) e ϕ (x) abbiano un divisore comune almeno del 1° grado.
Una tale funzione R dei coefficienti dicesi risultante delle due equazioni.
Allorquando, con un procedimento qualunque, dalle (1) siasi dedotta la relazione R = 0, si dice che si è eseguita l'eliminazione di x dalle (1). Questo vocabolo fu usato da Euler, mentre Newton nell'Arithm. universalis aveva detto exterminatio.
Uno di tali procedimenti è offerto dall'algoritmo del n. 33, che conduce al massimo comun divisore di f(x) e ϕ (x). Se le operazioni là indicate si proseguono sino a che non siasi ottenuto un resto di grado r − 1, eguagliando questo resto identicamente a zero, si hanno condizioni necessarie e sufficienti affinché le (1) posseggano r radici comuni, ossia affinché f(x) e ϕ (x) abbiano in comune un divisore di grado r.
Questo metodo, per r = 1, fu usato, in casi particolari, dallo Stevin (1585) e dal Leibniz (1683).
Un altro metodo per ottenere il risultante fu indicato simultaneamente da Euler (1748) e da Cramer (1750), e dicesi delle funzioni simmetriche, perché consiste nell'esprimere il risultante dapprima come funzione intera simmetrica delle radici così della prima come della seconda delle (1), dopo di che la sua espressione per mezzo dei coefficienti di quelle equazioni si effettua come si disse al n. precedente.
Dette α1, α2, ..., αn le radici di f(x) = 0, e β1, β2, ..., βm quelle di ϕ (x) = 0, il risultante R può esprimersi, per mezzo di tali radici, nelle forme seguenti:
Un'espressione esplicita ed assai notevole del risultante per mezzo dei coefficienti delle (1) è la seguente:
dove sono m le orizzontali contenenti i coefficienti a0, a1, ..., an ed n quelle contenenti i coefficienti b0, b1, ..., bm.
Alla forma precedente si può giungere scrivendo la condizione di coesistenza di m + n equazioni lineari omogenee con altrettante incognite, per valori non tutti nulli di queste incognite. Tali equazioni si stabiliscono secondo due metodi principali. Il primo si dice metodo di Euler, perché da lui esposto nel vol. II dell'Introductio in analysin infinitorum, del 1748, ma era già stato usato dal Leibniz in un lavoro manoscritto di data incerta, compresa tra il 1678 e il 1693. Esso si fonda sulla proprietà che, affinché le funzioni f(x) e ϕ (x) abbiano un divisore comune almeno del grado r, occorre e basta che esistano due funzioni intere F(x) e Φ(x), non entrambe identicamente nulle, e al più di grado m − r e rispettivamente n − r, così fatte che sia identicamente f F + ϕ Φ = 0.
Il secondo modo è il metodo dialitico di Sylvester, così chiamato da questo autore (1840), perché dissocia le potenze dell'incognita. Consiste nel formare le n + m equazioni
e nel considerarle come lineari omogenee rispetto a 1, x, x2, ..., xn+m-1.
Un metodo equivalente in sostanza a questo era però già noto a P. de Fermat fin dal 1638, e fu da lui esposto in un lavoro pubblicato nel 1679, ma probabilmente scritto nel 1650. Un metodo analogo fu dato poi da Hudde (1659).
Supposto p. es. n non minore di m, É. Bézout (1764) ha posto il risultante sotto forma di un determinante di ordine n, che da J. J. Sylvester (1853) fu chiamato il bézoutiante di f(x) e ϕ (x).
Il risultante è una funzione razionale intera così dei coefficienti a0, a1, ..., an come dei coefficienti b0, b1, ..., bm, di grado m nei primi, di grado n nei secondi. Considerato come funzione di tutti i coefficienti a0, a1, ..., an, b0, b1, ..., bm, esso è isobarico e di peso mn. Se inoltre questi coefficienti si riguardano come parametri del tutto indeterminati, esso è una funzione intera irriducibile (n. 32) dei medesimi, cioè non può essere scomposta nel prodotto di due funzioni razionali intere di quei coefficienti.
Espresso R, come si disse sopra, in forma di determinante di ordine m + n, affinché le (1) abbiano precisamente k radici comuni, occorre e basta che sia
avendo denotato con Ri il determinante che si deduce da R sopprimendone le ultime i orizzontali contenenti i coefficienti a, le ultime i orizzontali contenenti i coefficienti b, e le ultime 2 i verticali.
La stessa condizione fu posta da A. Capelli, nel 1907, sotto altra forma, dicendo che il determinante R deve avere la caratteristica (o rango) m + n − k.
Espressioni esplicite del risultante per i primi valori di m ed n furono date da Newton, Bézout, Cayley, Gordan e altri.
Discriminante di un'equazione algebrica.
45. Sia data una funzione razionale intera di grado n
e se ne formi la prima derivata
Il risultante R di f(x) e f′ (x), scritto ad esempio in forma di determinante, come si è veduto al n. precedente, contiene il fattore a0. Posto
l'espressione D risulta una funzione razionale intera dei coefficienti a0, a1, ..., an, il cui annullarsi è condizione necessaria e sufficiente perché l'equazione f (x) = 0 abbia una radice almeno doppia. Con denominazione introdotta dal Sylvester (1851), essa chiamasi discriminante dell'equazione, ed anche della funzione f(x), mentre Gauss (1801) l'aveva chiamata determinante di f(x).
Se le radici dell'equazione f (x) = 0 sono α1, α2, ..., αn si hanno pure queste altre espressioni di D:
dove V è il determinante di Vandermonde formato con le radici, ed si, è la somma delle ime potenze di α1, α2, ..., αn (n. 43).
Il discriminante D è una funzione razionale intera omogenea e irriducibile dei coefficienti a0, a1, ..., an, di grado 2 n − 2, isobarica e di peso n (n − 1). Posto
affinché l'equazione f(x) = o abbia esattamente ρ radici tra loro diverse, è necessario e sufficiente che Dρ non sia nullo e si abbia
Questo teorema si deve a C. W. Borchardt (1847).
Se la f(x) = 0 ha tutti i coefficienti reali ed è priva di radici multiple, Alessandro Brill (1877) ha dimostrato che il discriminante D è positivo o negativo secondo che l'equazione possiede un numero pari o dispari di coppie di radici complesse coniugate.
Le espressioni esplicite del discriminante per i primi valori di n furono calcolate da Cayley, Salmon, Brioschi, Gordan e altri.
Il risultante e il discriminante soddisfanno certe equazioni caratteristiche alle derivate parziali, che furono stabilite da Francesco Brioschi (1857), e ulteriormente studiate da Max Noether (1881).
Cenno sulla teoria generale dell'eliminazione.
46. L'estensione delle proprietà indicate nei due nn. precedenti, al caso di un numero qualunque di equazioni algebriche tra un numero qualunque di variabili, ha dato luogo in tempi recenti a molte e svariate ricerche, che sono d'importanza fondamentale sia per l'algebra in sé, sia per le sue interpretazioni nel campo della cosiddetta Geometria algebrica. Queste ricerche sono dovute principalmente a Leopoldo Kronecker (1823-1891), che le espose nel suo Festschrift in onore del Kummer (1891), e furono proseguite da molti autori (König, Lasker, ecc.). Esposizioni dell'argomento furono date da J. Molk nel tomo 6° degli Acta mathem. (1885) e da J. König nel libro Einleitung in die allgemeine Theorie der algebraischen Grössen (Lipsia 1903). Un'esposizione algebrico-geometrica può trovarsi nel libro di Eugenio Bertini, Introduzione alla geometria proiettiva degli iperspazi, 2ª ed., Messina 1923.
Qui ci limitiamo a riportare alcuni pochi teoremi fondamentali.
Date r equazioni algebriche tra m variabili
dicesi soluzione del sistema (1) un sistema di valori di x1, x2, ..., xm soddisfacenti le (1). La ricerca di condizioni necessarie e sufficienti perché tali soluzioni esistano, e, in questo caso, la determinazione delle soluzioni stesse, sono problemi che possono ridursi, mediante operazioni puramente razionali, all'analogo problema per il caso di una sola variabile.
Ciò posto, un teorema del Kronecker afferma che la totalità delle soluzioni del sistema (1) può sempre ottenersi come totalità delle soluzioni di un altro sistema di equazioni algebriche tra le variabili x1, x2, ..., xm, ma composto di m + 1 equazioni al più.
K. Th. Vahlen (1891) ha mostrato con un esempio che effettivamente il numero delle equazioni necessarie a sostituire completamente il sistema (1) può non essere inferiore ad m + i
Se si considerano m + 1 equazioni algebriche
tra m variabili x1, x2, ..., xm, rispettivamente dei gradi n1, n2, ..., nm+1, e con coefficienti del tutto indeterminati, esiste una funzione razionale intera irriducibile R di questi coefficienti, la quale si annulla quando e soltanto quando le (2) hanno una soluzione comune. Questa funzione R dicesi risultante delle (2), ed è omogenea rispetto ai coefficienti di ciascuna delle (2), e di grado eguale al prodotto dei gradi delle equazioni rimanenti. Inoltre è isobarica, di peso n1 n2 ... nm+1, nei coefficienti di tutte le (2).
Dall'ultima proprietà discende che, date m equazioni algebriche con altrettante incognite, rispettivamente dei gradi n1, n2, ..., nm, aventi coefficienti del tutto indeterminati, il numero delle loro soluzioni comuni è il prodotto n1 n2 ... nm dei gradi
A questo teorema si dà il nome di teorema di Bézout, perché Étienne Bézout (1730-1783), di Nemours, per il primo lo stabilì in modo generale nella sua Théorie genérale des équations algébriques (Parigi 1779).
Per m = 2, il teorema, interpretato geometricamente, dice che due curve piane algebriche di ordini m, n, poste in un medesimo piano e prive di parti comuni, hanno m n punti comuni (reali o immaginarî, al finito o all'infinito, tutti distinti o no): teorema enunciato già dal Maclaurin nel 1720, dimostrato, ma incompletamente, da Euler (1748) e da Cramer (1780), completamente da Bézout nel 1766.
Trasformazione delle equazioni algebriche.
47. Ad un tentativo del Leibniz (verso il 1674) di risolvere per via algebrica (mediante un numero finito di estrazioni di radici) le equazioni di grado superiore al 4°, si collegano gli studî del suo amico Ehrenfried Walter von Tschirnhaus (1651-1708) sulla trasformazione delle equazioni, che oggi ancora porta il suo nome. Nelle intenzioni dell'autore (1683), si trattava di eseguire sull'incognita una trasformazione razionale, in guisa che l'equazione trasformata avesse la forma binomia xn + k = 0. Ma, sebbene ciò non possa effettivamente ottenersi che per le equazioni cubiche, la trasformazione di Tschirnhaus in tempi più recenti ha condotto a risultati importanti.
Che quel metodo possa dare la soluzione dell'equazione cubica generale, mostrò il Rolle nel suo Traité d'algèbre (1690). Uno studio della trasformazione nel caso generale si deve al Lagrange (1770 e 1771).
Consideriamo dapprima il caso più semplice, in cui la trasformazione è lineare. Data l'equazione
si eseguisca la trasformazione lineare
dove a, b, c, d sono costanti reali o complesse. Affinché la corrispondenza stabilita dalla (2) tra le variabili x e y sia biunivoca senza eccezione, occorre e basta che il modulo ad-bc della trasformazione sia diverso da zero, e tale sarà supposto. L'equazione trasformata della (1) si ottiene eliminando x tra le (1) e (2), ed è pure di grado n; ad una radice s-pla di (1) corrisponde una radice s-pla della trasformata.
Ogni trasformazione lineare (2) equivale al prodotto di più trasformazioni lineari più semplici, dei tipi:
dove k è una costante diversa da zero. Queste particolari trasformazioni si dicono spesso a radici aumentate, a radici multiple, a radici reciproche.
Per il teorema di Taylor (n. 34), la trasformata a radici aumentate della (1) è
La trasformata a radici multiple è
Per k = − 1, segue che l'equazione avente per radici le radici della (1) mutate di segno si ottiene dalla stessa (1) cambiando di segno i coefficienti dei termini di posto pari.
La trasformata a radici reciproche (supposto che an non sia nullo, cioè che la (1) non abbia per radice lo zero) è
La trasformazione a radici aumentate può servire ad ottenere una nuova equazione, che sia priva di un termine di grado assegnato ρ, bastando per ciò ricavare k dall'equazione di grado n − ρ
Ha particolare importanza il caso più semplice ρ = n − 1: per dedurre dalla (1), con una trasformazione a radici aumentate, un'equazione mancante del termine di grado n − 1 (cfr. i nn. 19, 22, 38, 39), basta far la trasformazione
La più generale trasformazione di Tschirnhaus dell'equazione (1) è espressa dalla relazione y
dove ψ(x) e χ(x) sono funzioni razionali intere di x. Ma non si perde nulla in generalità considerando, in luogo della precedente, quest'altra y = ϕ (x), dove ϕ (x) è una funzione razionale intera di x, di grado n − 1 al più, e però
Il problema della trasformazione consiste allora in ciò: dette α1, α2, ..., αn le radici della (1), e posto
costruire, senza conoscere le α1, α2, ..., αn, l'equazione, di grado n in y,
che ha per radici y1, y2, ..., yn. Questa equazione, detta risolvente di Tschirnhaus della (1), risulta eliminando x tra le (1) e (3), e può calcolarsi in varî modi, tra cui è notevole uno dovuto a Ch. Hermite (1858), il quale ha collegato il problema con la teoria degli invarianti delle forme binarie.
Con una scelta opportuna dei coefficienti indeterminati b0, b1, ..., bn-1, può avvenire che l'equazione trasformata (4) sia più semplice della (1).
Per n = 3, se si prendono b0, b1 b2, in guisa che siano soddisfatte le equazioni t1 = 0, t2 = 0, rispettivamente di 1° e 2° grado, come risolvente di Tschirnhaus si ottiene l'equazione binomia y3 + t3 = 0.
Per n = 4, determinando b0 b1, b2, b3 in modo da soddisfare le equazioni t1 = 0, t3 = 0, rispettivamente di 1° e 3° grado, come risolvente di Tschirnhaus si ottiene
la cui risoluzione richiede soltanto estrazioni di radici quadrate.
Quando n > 4, la trasformazione di Tschirnhaus non dà, in generale, un metodo di risoluzione, ma permette di assegnare per l'equazione certe forme normali o canoniche, aventi qualche carattere di semplicità.
Ad es., con l'aggiunta della sola irrazionalità consistente nell'estrazione di una radice quadrata, la (1) può essere trasformata in un'equazione di grado n priva dei termini di gradi n − 1 ed n − 2. Si ottiene una trasformata priva anche del termine di grado n − 3, mediante l'estrazione di radici quadrate e la risoluzione di un'equazione cubica.
Quest'ultimo risultato è dovuto all'inglese G. B. Jerrard (1834), ma per n = 5 trovasi già in uno scritto dello svedese Erland Samuel Bring (1786). La forma
cui può ridursi ogni equazione di 5° grado, suol chiamarsi perciò forma normale di Bring-Ferrard. Con l'ulteriore trasformazione y =
si ottiene la forma normale
la quale è particolarmente importante perché contiene un solo parametro.
La (5) è la forma da cui è partito l'Hermite nel 1858 nelle sue celebri ricerche, che lo condussero, contemporaneamente al Kronecker, alla risoluzione dell'equazione di 5° grado mediante le funzioni ellittiche.
Speciale interesse ha la equazione ai quadrati delle differenze della (1), ossia l'equazione di grado
che ha per radici i 2 quadrati delle differenze delle radici della (1) a due a due. Di essa si occuparono il Waring (1762) e il Lagrange (1798), l'ultimo dei quali ha pur dato un metodo per calcolarla.
Su tutto quanto si è esposto nei nn. 26-47 si possono consultare, ad es., le Istituzioni del Capelli, citate al n. 33, inoltre E. Cesàro, Corso di analisi algebrica, Torino 1894; G. Ricci, Lezioni di algebra complementare, Padova 1900; S. Pincherle, Lezioni di algebra complementare, 2ª ed., Bologna 1920-1921, voll. 2; M. Cipolla, Analisi algebrica e introduzione al calcolo infinitesimale, 2ªed., Palermo 1921.
Collegamento della teoria delle equazioni algebriche con la teoria dei gruppi di sostituzioni. Cenni storici.
48. Nel ricercare le ragioni, per le quali i metodi conducenti alla risoluzione algebrica (cioè mediante radicali) delle equazioni dei quattro primi gradi, falliscono allo scopo per le equazioni di grado più elevato, Lagrange (1770) fu condotto a studiare equazioni, le cui radici fossero legate da particolari relazioni, inoltre le funzioni razionali delle radici di un'equazione algebrica e i valori che esse assumono quando su tali radici si eseguiscono delle permutazioni.
Della prima questione, in alcuni casi semplici, già si era occupato il Hudde (1657) nella lettera citata al n. 23, nella quale egli iniziò pure l'esame del problema di costruire l'equazione che ha per radici m radici di una data equazione di grado n (m 〈 n).
Lagrange partì dall'osservazione che i metodi proposti per la soluzione di un'equazione del 3° o del 4° grado consistono tutti sostanzialmente nel ricondurre tale soluzione a quella di un'equazione ausiliaria (risolvente, secondo una denominazione già usata da Euler nel 1733: aequatio resolvens), risp-ttivamente di 2° o di 3° grado, le radici della quale si esprimono mediante le radici α1, α2, ... della data equazione con funzioni, che per effetto di tutte le permutazioni delle α1, α2, ..., assumono soltanto due o rispettivamente tre valori diversi.
Per le equazioni cubiche basta, ad es., prendere un'espressione della forma (α1 + ε α2 + ε2 α3)3, essendo
una radice cubica complessa dell'unità; e per l'equazione di 4° grado basta, p. es., prendere una delle espressioni α1 α2 + α3 α4, (α1 + α2 − α3 − α4)2.
Ma questo metodo, applicato all'equazione generale di grado n > 4, conduce a risolventi di grado superiore ad n.
Malgrado ciò, la nuova via aperta da Lagrange doveva, per opera dei suoi continuatori, rivelarsi come la più appropriata a penetrare nell'essenza della questione, e intanto realizzava un progresso notevole rispetto ai metodi precedenti già per questo, che, ad es., per l'equazione di 5° grado forniva una risolvente di 6° grado, mentre Tschirnhaus, Euler, e Bézout ne avevano trovata una del 24° grado. Ad una risolvente del 6° grado perveniva nel 1771 anche Gianfrancesco Malfatti (1731-1807), ma con l'uso dei procedimenti di eliminazione di Euler e Bézout.
Con le ricerche del Lagrange, e con quelle contemporanee del Waring e del Vandermonde, i quali, indipendentemente da lui, giungevano alla maggior parte de' suoi risultati, si può dire che veramente s'inizî l'algebra moderna, avente le sue basi nella teoria delle funzioni simmetriche e in quella dei gruppi di permutazioni. Codeste ricerche hanno anzi fornito i germi dei due concetti di gruppo e di invariante, che dominano tutta l'odierna matematica.
La teoria generale delle equazioni algebriche non venne però ripresa che circa trent'anni più tardi: da una parte, con la rigorosa dimostrazione del teorema fondamentale dell'algebra (Gauss, 1799) e con la dimostrazione dell'impossibilità di una risoluzione algebrica delle equazioni generali di grado superiore al 4° (Ruffini 1799, Abel 1826), dall'altra, con lo studio di particolari classi di equazioni algebricamente risolubili.
Già nel 1771 il Vandermonde aveva dimostrato la risolubilità algebrica dell'equazione x11 = 1. Nel 1801, Gauss dimostrò in generale che la medesima proprietà spetta, per qualsiasi valore dell'intero n, all'equazione xn = 1, dalla quale dipende la divisione della circonferenza in n parti eguali; e fece uno studio profondo ed esauriente della serie di equazioni, a cui può successivamente ridursi la soluzione di quell'equazione.
Abel (1829), generalizzando l'analisi di Gauss, fu condotto a quella classe importante di equazioni algebricamente risolubili, che, su proposta del Kronecker, si chiamano appunto abeliane, e godono della proprietà che tutte le loro radici si possono esprimere come funzioni razionali di una di esse.
Ma il massimo progresso nella teoria generale delle equazioni algebriche fu attuato da Evaristo Galois (1811-1832), il quale, con la considerazione del gruppo che porta il suo nome, pose per primo in luce l'elemento essenziale da cui dipendono tutte le proprietà dell'equazione, e per mezzo di esso poté assegnare un criterio per decidere se una data equazione algebrica sia, oppur no, risolubile per radicali.
I risultati più importanti dovuti al Galois, pubblicati in piccola parte nel 1830, trovansi in un lavoro che vide la luce soltanto nel 1846, e sommariamente anche nella lettera al suo amico Augusto Chevalier, scritta il 29 maggio 1832, alla vigilia del duello in cui egli doveva incontrare la morte. Essi furono poi esposti sistematicamente, e notevolmente ampliati, con numerose e svariate applicazioni, da Camillo Jordan (1838-1922) nel suo grande Traité des substitutions et des équations algebriques (Parigi 1870). Un'esposizione si trova, ad esempio, in Luigi Bianchi, Lezioni sulla teoria dei gruppi di sostituzioni e delle equazioni algebriche secondo Galois, Pisa 1899.
Poiché la teoria di Galois si fonda sul concetto di irriducibilità, converrà dapprima precisare il significato di questo concetto.
Campi di razionalità. Funzioni intere riducibili o irriducibili in un dato campo.
49. Un aggregato di numeri si dice costituire un corpo di numeri, od anche un campo di razionalità, quando, essendo a e b due suoi numeri qualunque, distinti o no, anche i numeri a + b, a − b, a b, e, ove b sia diverso dallo zero,
appartengono all'aggregato.
Sono altrettanti campi di razionalità l'insieme di tutti i numeri razionali, quello di tutti i numeri reali, quello di tutti i numeri complessi. Il primo si suol chiamare campo assoluto, o campo naturale di razionalità, perché contenuto in ogni altro campo di razionalità.
Se R è un campo di razionalità, ed ω un numero non appartenente ad esso, si ottiene un nuovo campo di razionalità R′ quando, insieme con i numeri di R, si considerino tutti quelli che risultano combinando ω, mediante le quattro operazioni, con i numeri di R. Si dice che il campo R′, più ampio di R, è stato ottenuto da R mediante l'aggiunzione di ω, ed anche che R è stato ampliato con l'aggiunzione di ω, e il numero ω si dice aggiunto. Così il campo di razionalità formato dai numeri complessi si ottiene da quello formato dai numeri reali, aggiungendo il numero
Il concetto fondamentale di corpo di numeri, ossia campo di razionalità, si deve ad Abel (1829) ed a Galois (1831); la prima denominazione è di Riccardo Dedekind (1871), la seconda di Kronecker (1882).
Ciò posto, una funzione razionale intera di quante si vogliano variabili, i cui coefficienti appartengano ad un certo campo di razionalità R, si dice riducibile in questo campo se è identicamente eguale al prodotto di due funzioni intere, i cui coefficienti appartengono pure ad R, e delle quali nessuna si riduce ad una costante. La funzione si dice irriducibile nel campo R quando quella decomposizione in fattori non è possibile.
La riducibilità o irriducibilità di una funzione intera dipende dunque essenzialmente dal campo di razionalità; ed una funzione intera, la quale sia irriducibile in un dato campo, può diventar riducibile quando il campo venga ampliato.
Per es., la funzione x2 + 4 è riducibile nel campo complesso, perché è eguale al prodotto (x + 2 i) (x − 2 i), ma è irriducibile tanto nel campo assoluto quanto nel campo reale di razionalità. Invece la funzione x2 − 3 è irriducibile nel campo assoluto, ma riducibile in quello che se ne deduce con l'aggiunzione di √3; e la funzione x2 − 4 è già riducibile nel campo assoluto.
L'irriducibilità assoluta, di cui si disse al n. 32, si riferisce al caso in cui il campo di razionalità è costituito da tutti i numeri.
Una funzione intera di un numero qualunque di variabili, la quale sia riducibile in un dato campo R, può in un solo modo esprimersi come prodotto di funzioni intere irriducibili in R (purché non si considerino come diverse due tali funzioni, che differiscono soltanto per un fattore costante).
Si presenta qui il problema: data una funzione intera di un numero qualunque di variabili, riconoscere se essa è o no riducibile in un dato campo, e, in caso affermativo, determinare i suoi fattori irriducibili. Kronecker (1882) ed altri hanno dimostrato che la sua soluzione può sempre ottenersi con un numero finito di operazioni, ed hanno dato diversi metodi per eseguire effettivamente la scomposizione di una funzione riducibile proposta.
Nel caso più semplice di una funzione intera di una sola variabile, quando si tratti del campo assoluto di razionalità, si ha in proposito il seguente notevole teorema, comunemente noto col nome di lemma di Gauss (1801):
Se una funzione intera
della quale il primo coefficiente è l'unità e gli altri coefficienti a1, a2, ...., an sono numeri interi, è riducibile nel campo assoluto di razionalità, essa non può scomporsi nel prodotto di altre due funzioni intere, in ciascuna delle quali il primo coefficiente sia l'unità e gli altri coefficienti siano numeri razionali, a meno che tutti questi coefficienti non siano essi pure interi.
50. Un'equazione algebrica f(x) = 0 si dice irriducibile, oppure riducibile, in un dato campo di razionalità, secondo che tale è la funzione intera f(x).
Si deve ad Abel (1828) il teorema:
Se due equazioni F(x) = 0, f(x) = 0 hanno i coefficienti appartenenti ad uno stesso campo di razionalità, e se la seconda è irriducibile in questo campo, esse non possono avere in comune una radice, senza che ogni radice della seconda equazione sia pure radice della prima, o, in altre parole, senza che F(x) sia divisibile per f(x).
Un esempio assai notevole della possibilità di concludere l'irriducibilità di un'equazione in base alla natura de' suoi coefficienti, è fornito dal teorema seguente, che può dedursi dal lemma di Gauss (n. 49), e al quale pervennero, indipendentemente l'uno dall'altro, Teodoro Schönemann (1812-1868) nel 1846 e Ferdinando G. Eisenstein (1823-1852) nel 1850:
Se un'equazione
ha per coefficienti numeri interi, e se esiste un numero primo p, per il quale sono divisibili tutti i coefficienti a1, a2, ..., an, ma non a0, mentre an non è divisibile per p2, l'equazione è irriducibile nel campo assoluto di razionalità.
Di qui si può facilmente dedurre il teorema di Gauss (1801), che se p è un numero primo, l'equazione
è irriducibile nel campo assoluto di razionalità.
L'equazione ora scritta, che ha per radici le p − 1 radici pme primitive dell'unità, è quella da cui dipende il problema della divisione della circonferenza in p parti eguali.
Quando n non sia primo, l'equazione che ha per radici tutte e sole le radici nme primitive dell'unità, e alla quale, nell'aspetto algebrico, si riduce la divisione del cerchio in n parti eguali, ha pure per coefficienti numeri interi e il primo coefficiente eguale all'unità. E, come per primo dimostrò in generale il Kronecker (1854), è essa pure irriducibile nel campo assoluto di razionalità.
Funzioni razionali appartenenti ad un gruppo.
51. Se ϕ (x1, x2, ..., xn) è una funzione razionale delle n variabili x1, x2, ..., xn tra le n! sostituzioni che si possono eseguire su queste variabili, una almeno lascia inalterata la funzione, ed è la sostituzione identica. L'insieme di tutte le sostituzioni che godono di tale proprietà costituisce un gruppo (Ruffini, 1799), in quanto che, effettuando successivamente un numero qualunque di queste sostituzioni, la funzione rimane inalterata, epperò il prodotto di un numero qualunque di sostituzioni dell'insieme è ancora una sostituzione dell'insieme.
Il gruppo così determinato si dice il gruppo della funzione ϕ.
Inversamente, dato un gruppo G di sostituzioni tra le n variabili x1, x2, ..., xn, si possono sempre costruire infinite funzioni razionali di quelle variabili, ciascuna delle quali resti immutata per tutte e sole le sostituzioni di G. Si dice che tali funzioni appartengono al gruppo G.
Esse non sono tra loro indipendenti, poiché, per un teorema di Lagrange (1770), ciascuna può esprimersi razionalmente per mezzo di una qualunque delle altre.
Una funzione razionale delle x1, x2, ..., xn che per effetto di tutte le possibili n! sostituzioni di queste variabili assuma r valori diversi, si dice una funzione ad r valori. Per r = 1, essa è una funzione simmetrica delle x1, x2, ..., xn (n. 43).
Gli r valori di una funzione razionale ad r valori sono le radici di un'equazione di grado r, i cui coefficienti sono funzioni simmetriche di x1, x2, ..., xn (Lagrange).
Se r 〈 n, il numero r non può avere che i valori 1 oppure 2, eccezion fatta per n = 4, nel qual caso esistono anche funzioni a tre valori. Questo teorema è di Giuseppe Bertrand (1845), e comprende come casi particolari teoremi già dati da P. Ruffini (1799), P. Abbati (1803) e A. L. Cauchy (1815).
Ogni funzione a due valori è della forma A + B Δ, dove A e B sono funzioni simmetriche (e B non è identicamente nulla) e d è il determinante di Vandermonde formato con le x1, x2, ..., xn, ossia la radice quadrata del discriminante (n. 45) dell'equazione che ha per radici x1, x2, ..., xn.
Una funzione delle x1, x2, ..., xn a due valori si dice (Cauchy, 1812) alternante, se i due valori che essa assume per tutte le possisibili sostituzioni eseguite sulle variabili sono eguali e di segni contrarî. Ogni funzione siffatta è il prodotto di una funzione simmetrica per il determinante Δ.
Risolvente di Galois di un'equazione algebrica.
52. Sia
un'equazione di grado n, che supporremo (n. 35) ridotta a non avere radici multiple, ma che del resto può essere riducibile o irriducibile in un dato campo di razionalità R. È allora possibile, in infiniti modi, costruire una funzione razionale intera ϕ delle sue n radici x1, x2, ..., xn, la quale per tutte le nl sostituzioni di queste radici assuma valori, non soltanto algebricamente, ma pure numericamente distinti in R. Basta ad es. assumere ϕ ϕ = m1 x1 + m2 x2 + ... + mn xn, scegliendo i coefficienti m1, m2, ..., mn in modo opportuno.
Se si considera l'equazione
di grado n!, che ha per radici i n! valori di cui ϕ è suscettibile quando in essa si eseguiscono le n! sostituzioni delle x1, x2, ..., xn, i coefficienti della (2) potranno esprimersi razionalmente mediante i coefficienti della (1), quindi saranno razionalmente noti nel campo R.
La (2) si dice una risolvente di Galois della (1). Essa è priva di radici multiple, ma può essere riducibile o no in R; quando sia riducibile, il suo primo membro si decompone in fattori irriducibili, tutti d'uno stesso grado.
Due qualunque risolventi di Galois della (1) si ottengono l'una dall'altra con una trasformazione di Tschirnhaus, perciò vengono riguardate come non essenzialmente diverse, ed è lecito parlare de la risolvente di Galois.
Questa risolvente gode della proprietà fondamentale seguente, dovuta allo stesso Galois.
Una qualsiasi funzione razionale delle radici x1, x2, ..., xn, della (1) si può esprimere razionalmente per mezzo di una radice, arbitrariamente fissata, della risolvente di Galois; e l'espressione così determinata non muta se sulle x1, x2, ..., xn si effettua una sostituzione qualunque.
Ne segue che ogni radice della (1) si può esprimere razionalmente per mezzo di una radice, comunque fissata, della risolvente di Galois.
Per ottenere la completa risoluzione della (1), basterà dunque conoscere una radice della risolvente di Galois.
Gruppo di Galois di un'equazione algebrica.
53 Sia Γ (y) un fattore irriducibile del primo membro V(y) della (2) considerata al n. precedente, e sia r il suo grado, cosicché l'equazione Γ(y) = 0 avrà r radici distinte. Si passerà da una di queste a tutte le altre, eseguendo sulle radici della (1) certe r sostituzioni. Orbene, queste sostituzioni formano un gruppo, il quale non muta se, in luogo di partire da Γ (y), si parte da un qualsiasi fattore irriducibile di V (y). Il gruppo così determinato è il gruppo di Galois della (1).
Le proprietà caratteristiche di tale gruppo sono espresse dai teoremi seguenti:
a) Se una funzione razionale delle n radici della (1), i coefficienti della quale appartengano al campo di razionalità R, rimane numericamente invariata per qualsiasi sostituzione del gruppo di Galois, il suo valore è un numero appartenente ad R (ossia essa è razionalmente nota).
b) Inversamente, se una funzione razionale delle radici della (1), con coefficienti appartenenti ad R, è razionalmente nota in questo campo, ossia ha per valore un numero del campo stesso, essa rimane numericamente immutata quando sulle radici della (1) si effettui una sostituzione qualunque del gruppo di Galois.
c) Nessuna sostituzione, non appartenente al gruppo di Galois, può lasciar immutate tutte le funzioni razionali, razionalmente note, delle radici della (1).
Il gruppo di Galois dell'equazione (1) risulta così caratterizzato come l'insieme di tutte quelle sostituzioni tra le radici della (1), che lasciano numericamente invariate tutte le funzioni razionali di queste radici, con coefficienti appartenenti al campo considerato di razionalità.
Se perciò un certo gruppo di sostituzioni tra le radici della (1) ha la proprietà che ogni sua sostituzione lascia invariato il valor numerico di qualsiasi funzione razionale di quelle radici, avente i coefficienti nel dato campo di razionalità, quel gruppo o sarà il gruppo di Galois della (1), o ne sarà un sottogruppo.
La considerazione del gruppo di Galois è fondamentale nella teoria delle equazioni algebriche: tutte le particolari proprietà, di cui il gruppo può esser dotato, si rispecchiano in altrettante proprietà dell'equazione.
Così un'equazione (a radici tutte distinte) è irriducibile o riducibile, secondo che il suo gruppo di Galois è transitivo oppure intransitivo.
Il gruppo di Galois di un'equazione algebrica in relazione col problema della risoluzione algebrica di questa.
54. Il gruppo di Galois di una data equazione algebrica
risulta completamente determinato quando sia pur dato il campo R di razionalità che s'intende considerare. Se questo campo viene ampliato, il nuovo gruppo di Galois o coinciderà col primitivo o ne sarà un sottogruppo.
Si supponga, in particolare, di aggiungere ad R una funzione razionale y delle radici x1, x2, ..., xn della (1). Il nuovo gruppo di Galois sarà un sottogruppo G′ del gruppo primitivo G, e sarà costituito da tutte e sole le sostituzioni di G che lasciano y numericamente invariata. Se q è l'indice di G′ in G (ossia il quoziente degli ordini di G e G′), la funzione y, per le sostituzioni di G, assume q valori distinti y1, y2, ..., yn, sicché la funzione razionale intera
è razionalmente nota. L'equazione ϕ (x) = 0 si dice una risolvente razionale della (1). Due tali risolventi della (1), costruite con due funzioni razionali delle x1, x2, ..., xn e per le quali il gruppo G′ sia lo stesso, sono trasformate di Tschirnhaus l'una dell'altra, e sono quindi da ritenersi identiche. Inversamente, partendo da un qualsiasi sottogruppo G′ di G, si può costruire una classe di risolventi razionali, che sono trasformate di Tschirnhaus l'una dell'altra.
Ora, quando la (1) sia risolta, le sue radici x1, x2, ..., xn saranno razionalmente note in un campo R0 convenientemente ampliato da R, e il suo gruppo di Galois in R0 sarà l'identità. Pertanto qualsiasi procedimento che conduca alla risoluzione della (1) consiste nell'abbassarne successivamente il gruppo di Galois, sino a che questo si riduca ad essere l'identità.
Per quanto precede, una riduzione del gruppo di Galois può ottenersi ampliando il campo primitivo R con l'aggiunta di funzioni razionali delle radici x1, x2, ..., xn; l'aggiungere invece ad R le radici di equazioni ausiliarie, che non siano risolventi razionali della (1), non porta nessun contributo essenzialmente nuovo al problema della risoluzione algebrica della (1).
In ordine a questo problema, risultati importanti si ottengono con la considerazione della cosiddetta composizione del gruppo di Galois, come hanno mostrato il Jordan (1870) e O. Hölder (1888).
Qui basterà accennare, come conseguenza di tali ricerche, che una riduzione del gruppo di Galois è possibile quando, e solo quando, il gruppo stesso ammetta un sottogruppo invariante, designandosi con questo nome un sottogruppo G′ di un gruppo G di sostituzioni, allorché ogni sostituzione di G′ viene trasformata da qualsiasi sostituzione di G in una sostituzione ancora appartenente a G′.
Equazioni risolubili per radicali. Equazioni abeliane. Equazioni per la divisione della circonferenza in parti eguali.
55. Un'equazione algebrica, della quale i coefficienti appartengano a un dato campo R di razionalità, si dice risolubile per radicali, o anche algebricamente risolubile, nel campo R, quando tutte le sue radici si possono ottenere con un numero finito di operazioni razionali e di estrazioni di radici, a partire da numeri di R. Questi radicali possono del resto avere indici qualunque (interi), e sotto ogni segno radicale possono comparire altri radicali.
Una classe importante di equazioni risolubili per radicali è quella delle equazioni che si chiamano abeliane, perché per la prima volta considerate da Abel (1829).
Un'equazione a radici tutte diverse, i cui coefficienti appartengano a un dato campo R di razionalità, si dice abeliana, quando il suo gruppo di Galois è costituito da sostituzioni a due a due permutabili.
Un'equazione abeliana riducibile si spezza nel prodotto di più equazioni abeliane irriducibili.
Se un'equazione abeliana è irriducibile, tutte le sue radici si esprimono razionalmente mediante una qualunque di esse, e tali operazioni razionali eseguite sulle radici sono a due a due permutabili. Inversamente, se un'equazione irriducibile è tale che tutte le sue radici sono razionalmente esprimibili mediante una di esse, e se le operazioni razionali a ciò occorrenti sono a due a due permutabili, l'equazione è abeliana.
Se, scomposto il grado n di un'equazione abeliana irriducibile in fattori primi, è n = p1r1 p2r2 ..., la risoluzione dell'equazione si riduce a quella di r1 equazioni abeliane di grado p1, di altre r2 di grado p2, ... .
Se un'equazione abeliana irriducibile di grado n è ciclica, se cioè il suo gruppo di Galois consta delle n successive potenze di una sostituzione ciclica delle n radici, la risoluzione dell'equazione si ottiene aggiungendo al campo R una radice nma primitiva dell'unità ed estraendo una radice nma da un'unica quantità.
Se l'equazione abeliana non è ciclica, la sua risoluzione può ricondursi a quella di un certo numero r di equazioni cicliche di gradi n1, ..., nr (i così detti invarianti del gruppo di Galois), e si ottiene aggiungendo al campo R le radici primitive dell'unità degli ordini n1, ..., nr ed estraendo r radicali separati di indici n1, ... nr.
56. Ad una categoria assai notevole di equazioni abeliane conduce il classico problema della determinazione delle radici nma dell'unità, o, che è lo stesso, della divisione della circonferenza in n parti eguali.
La risolubilità per radicali dell'equazione xn − 1 = 0, stabilita dal Vandermonde (1771) per n = 11, fu dimostrata per qualsiasi valore di n dal Gauss (1801), le cui ricerche apersero la via a quelle più generali di Abel e Galois (cfr. il n. 48).
Se, scomposto n in fattori primi, si ha n = p1r1 p2r2, ..., qualsiasi radice nma dell'unità si ottiene moltiplicando tra loro altrettante radici dell'unità, di indici p1r1 p2r2, ... Si può quindi limitarsi a considerare il caso in cui n = pr, essendo p un numero primo. Le radici nme non primitive dell'unità sono in tal caso tutte e sole le radici dell'equazione xppr-1 − 1 = 0, sicché, dividendo xpr − 1 per xppr-1 − 1, si è condotti in definitiva ad una equazione di grado xppr-1 (p − 1). Se, scomponendo p − 1 in fattori primi, si ottiene
l'equazione si risolve aggiungendo al campo R le radici primitive dell'unità degli ordini p1, p2, ..., pk ed estraendo r − 1 radici d'indice p, poi α radicali quadratici, α1 radicali d'indice p1, ..., xppr-1 − 1 α1 radicali d'indice pk.
Risolubilità di un'equazione algebrica per radicali.
57. La teoria di Galois permette di trattare in modo esauriente la questione della risolubilità di un'equazione algebrica per mezzo di radicali.
Anzitutto, il dubbio che possano esistere equazioni irriducibili, di cui una o più radici, ma non tutte, siano esprimibili per radicali, vien tolto dalla proprietà, indicata da Abel, che un'equazione irriducibile, della quale una o più radici possano esprimersi per radicali, è totalmente risolubile per radicali.
Il decidere se una data equazione algebrica sia o no risolubile, richiede in ogni caso un numero finito di operazioni.
Quando l'equazione sia irriducibile ed abbia per grado un numero primo, Galois ha trovato che affinchè essa sia risolubile per radicali occorre e basta che tutte le sue radici si possano esprimere razionalmente mediante due di esse.
Hanno particolare interesse per le applicazioni alla geometria le equazioni, la cui risoluzione richiede soltanto estrazioni di radici quadrate. Perché ciò sia possibile, occorre e basta che l'ordine del gruppo di Galois sia una potenza di 2. Quando l'equazione sia irriducibile, una condizione necessaria, ma non sufficiente, è che il grado dell'equazione sia una potenza di 2: teorema dovuto a Giulio Petersen (1871).
Suppongasi ora invece che si tratti dell'equazione generale del grado n, cioè di un'equazione, i cui coefficienti a0, a1, ..., an si possano pensare come altrettante variabili indipendenti. Il suo gruppo di Galois è allora il gruppo totale delle n! sostituzioni sulle radici, ed un abbassamento di esso può ottenersi solo aggiungendo al campo R la radice quadrata del discriminante. Divengono così razionalmente note le funzioni alternanti delle radici della data equazione, e il gruppo di Galois si riduce al gruppo alterno, d'ordine
formato dalle sostituzioni pari di quelle radici. Ma per 2 n > 4 il gruppo alterno è semplice, ossia non possiede sottogruppi invarianti (n. 54) all'infuori di sé stesso e della sostituzione identica, cosicché non è possibile alcun altro abbassamento del gruppo di Galois, né per estrazione di radici né per aggiunta di radici di equazioni ausiliarie.
Si conclude così il teorema di Ruffini-Abel: l'equazione generale di grado superiore al quarto non è risolubile per radicali.
Davide Hilbert (1892) ha anzi dimostrato che si possono pure costruire infinite particolari equazioni, di grado n arbitrariamente dato, e con coefficienti interi, le quali nel campo assoluto di razionalità hanno per gruppo di Galois il gruppo totale, e non sono quindi risolubili per radicali.
L'equazione generale di grado n non ha risolventi di grado inferiore ad n, all'infuori della risolvente di 2° grado x2 = D, dove D è il discriminante. Fa eccezione soltanto il caso n = 4, nel quale esiste una risolvente cubica.
Se n è diverso da 6, le risolventi di grado n dell'equazione generale di grado n sono tutte trasformate di Tschirnhaus di questa.
58. La teoria di Galois dà anche modo di risolvere il problema della risolubilità per radicali reali, di un'equazione algebrica a radici tutte reali. Si ha infatti il teorema: se di un'equazione algebrica a coefficienti reali tutte le radici sono reali, e se G è il suo gruppo di Galois in un campo reale R di razionalità, aggiungendo a questo campo un numero qualsiasi di radicali reali, il gruppo non subisce mai un abbassamento, a meno che ciò non avvenga per estrazione di radici quadrate da quantità positive.
Ancora nell'ipotesi di un campo reale di razionalità, un'equazione a coefficienti reali, la quale abbia più di una radice reale, senza aver tutte le radici reali, non è risolubile per radicali.
Ciò che precede fornisce, in particolare, la ragione dell'impossibilità di esprimere in forma algebrica reale le radici di un'equazione cubica nel caso irriducibile (nn. 19 e 38).
Più generalmente, Adolfo Kneser (1891) e Leopoldo Gegenbauer (1893) hanno dimostrato che un'equazione algebrica avente tutte le radici reali, la quale sia irriducibile in un dato campo reale di razionalità e di cui il grado non sia una potenza di 2, non può essere algebricamente risoluta con l'uso esclusivo di radicali reali.
59. Le proprietà fin qui esposte hanno notevole applicazione a taluni problemi classici della geometria.
Un problema determinato di geometria piana suol dirsi elementare, o risolubile elementarmente, allorquando può risolversi con il solo uso degli strumenti elementari riga e compasso, ossia per mezzo di un numero finito di rette e di circoli.
Quando, con i metodi della geometria analitica, un problema venga tradotto in equazioni, condizione necessaria e sufficiente perché esso sia risolubile elementarmente è che ognuna di quelle equazioni sia algebrica, con coefficienti appartenenti al campo di razionalità determinato dagli enti dati, e sia risolubile per radicali quadratici: osservazione questa già contenuta nella Geométrie di Descartes.
Non sono quindi risolubili elementarmente né il problema della duplicazione del cubo né quello della trisezione di un angolo arbitrario: infatti sì l'uno che l'altro conducono ad un'equazione di 3° grado, la quale è irriducibile nel campo di razionalità determinato dai coefficienti, e non è quindi (per il teorema del Petersen, n. 57) risolubile per radicali quadratici.
Sono invece costruibili elementarmente i poligoni regolari di n lati, quando e soltanto quando n sia della forma
essendo p1, p2, ..., pk numeri primi tra loro diversi e aventi la forma 22μ + 1. Questo teorema, che costituisce un'importante aggiunta all'antica geometria, è dovuto a Gauss (1801).
Conviene però avvertire che non tutti i numeri della forma 22μ + 1 sono primi: sono tali per μ = 0, 1, 2, 3, 4, ma per μ = 5 si ha il numero 225 + 1 = 4 294 967 297 = 641 • 6 700 417, come rilevò Euler (1732-3). È tuttora dubbio se all'infuori dei cinque indicati valori di μ, l'espressione 22μ +1 dia altri numeri primi.
Su questo argomento v. F. Enriques, Questioni riguardanti le matematiche elementari, 3ª ed., II, Bologna 1926, p. 231 (articolo di G. Castelnuovo) e p. 263 (articolo di F. Enriques).
Teoria delle forme algebriche. Variabili omogenee sostituzioni lineari.
60. Sia
un'equazione algebrica di grado n, nella quale i coefficienti, reali o complessi, a0, a1, ..., an siano pensati come parametri variabili tra loro indipendenti. Se, variando i coefficienti, il primo di essi, a0, tende allo zero, una delle n radici della (1) ha un modulo che cresce indefinitamente, sicché si conviene di dire che se nella (1) è a0 = 0, l'equazione ha una radice infinita.
Più generalmente, se si ha 0 = a1 = ... = ar-1 = 0, cosicché la (1) si riduce ad un'equazione di grado n - r, si conviene di riguardare la stessa (1) ancora come equazione di grado n, ma della quale r radici sono infinite, ossia come un'equazione di grado n avente una radice r-pla (o di molteplicità r) infinita.
Il modo più semplice di ovviare alla considerazione convenzionale di radici infinite deriva dall'introduzione di variabili omogenee. xi Posto x
dove x1 e x2 sono numeri reali o complessi, determinati soltanto a meno d'un arbitrario fattore comune e soggetti all'unica condizione di non essere entrambi nulli, l'equazione (1), moltiplicata per x2n si trasforma in quest'altra:
della quale il primo membro è omogeneo in x1 e x2.
Se ora si suppone a0 = a1 = ... = ar-1 = 0, essa diventa:
la quale ammette la radice x2 = 0, con la molteplicità r.
In modo analogo, da un'equazione, il cui primo membro sia un polinomio razionale intero di grado n in due variabili x, y, ponendo x =
e moltiplicando per x3n, si passa ad un'equazione avente per primo membro un polinomio omogeneo, di grado n, in x1, x2, x3. E lo stesso accade per un numero qualunque di variabili.
Una funzione razionale intera omogenea di due, tre, quattro, ... variabili, e di grado n in queste variabili, si dice una forma, rispettivamente binaria, ternaria, quaternaria,..., di ordine n.
L'introduzione delle variabili omogenee non produce complicazioni nei calcoli, ma permette di evitare la considerazione di quantità infinite. In virtù di essa, le equazioni algebriche si mutano in altre equazioni algebriche omogenee, cosicché si raggiunge pure il vantaggio di poter applicare ai primi membri le proprietà dei polinomî omogenei, e innanzi tutto il teorema di Euler (n. 34).
61. Una trasformazione lineare sulla x, espressa dalla relazione
posto
risulta rappresentata dalle formole:
dove ρ è un fattore di proporzionalità, di valore arbitrario, purché diverso da zero. Essa equivale perciò ad una trasformazione, o sostituzione, lineare omogenea delle antiche variabili x1, x2 nelle nuove variabili x′1, x′2. Il determinante d =
dicesi il modulo della trasformazione, ed è da supporsi non nullo, se si esige che dalla (3) si possa, per ogni valore di x, ricavare un unico valore di x′ (cfr. il n. 47).
Queste osservazioni si possono estendere ad un numero qualunque di variabili omogenee, scrivendo che, salvo un arbitrario fattore di proporzionalità, esse sono eguali a funzioni lineari omogenee di altrettante nuove variabili, in cui il determinante formato con i coefficienti (modulo della trasformazione) non sia nullo.
Si ottiene così una trasformazione, o sostituzione, lineare omogenea delle antiche variabili nelle nuove e di queste in quelle.
Invarianti e covarianti.
62. Sia
una forma binaria di ordine n. Eseguendo sulle x1, x2 la trasformazione lineare, di modulo non nullo d, rappresentata dalle (4) del n. precedente, si otterrà un'altra forma binaria di ordine n, che rappresenteremo con
Ora sia ϕ (ao, a1, ..., an) una funzione razionale dei coefficienti di f, e si costruisca la stessa funzione ϕ (a′0, a′1, ..., a′n) con i coefficienti di f′. Si dice che ϕ è un invariante della forma f se le funzioni ϕ (a0, a1, ..., an) e ϕ (a′0, a′1 ..., a′n) differiscono soltanto per un fattore che sia una potenza intera di Δ, se cioè si ha identicamente
essendo p un numero intero. Questo numero p dicesi il peso dell'invariante.
Si può restringersi a considerare invarianti interi, poiché si dimostra che ogni invariante razionale può rappresentarsi come quoziente di due invarianti interi. Un invariante intero è omogeneo in a0, a1, ..., an, e il suo peso non può essere nullo né negativo.
Più generalmente, data la forma binaria f(x1, x2), si possono considerare funzioni razionali composte, oltre che con i coefficienti di f, anche con le variabifi x1, x2. Se ψ (x1, x2; a0, a1, ..., an) è una tale funzione, e si costruisce la medesima funzione ψ (x′1, x′2; a′0, a′1, ..., a′n) delle nuove variabili x′1, x′2 e dei coefficienti della funzione f′ trasformata di f, si dice che ψ è un covariante di f se si ha identicamente
essendo p un numero intero, detto peso del covariante.
Qui pure si può limitarsi a considerare covarianti interi, i quali saranno allora omogenei così rispetto alle x1, x2 come rispetto ad a0, a1, ..., a′n; e in tal caso il peso p non sarà nullo né negativo.
Se il covariante intero ψ contiene le variabili al grado m e i coefficienti al grado g, si dice che esso è di ordine m e grado g, e sussiste la relazione n g - m = 2 p.
Gli invarianti e covarianti ricevono il nome comune di forme invariantive della data forma f. Gli invarianti sono covarianti di ordine nullo.
È ovvio come tutto quanto precede possa estendersi al caso in cui, anziché da un'unica forma binaria, si parta da un sistema di un numero qualunque (finito) di forme binarie fondamentali, ed anche al caso in cui le forme fondamentali, invece che binarie, siano ternarie, quaternarie,....
Un invariante razionale, il cui peso sia lo zero, si dice invariante assoluto: esso ha la proprietà di restare invariato quando sulle date forme si eseguisce una qualsiasi trasformazione lineare (a modulo non nullo). Un siffatto invariante non dipende propriamente dai coefficienti delle date forme, ma dai loro rapporti.
Quando di una o più forme binarie si abbiano due invarianti ϕ1 e ϕ2, di pesi p1 e p2, che non siano potenze d'uno stesso invariante, si può subito formare un invariante assoluto delle date forme, ed è il quoziente
Rappresentazioni geometriche.
63. La considerazione di forme invariantive si presenta in molte questioni, che si possono esprimere con il linguaggio così dell'algebra come della geometria. Nel campo binario, il legame tra la rappresentazione algebrica e quella geometrica si ottiene nel modo più semplice interpretando la variabile x come coordinata di un punto P mobile sopra una data retta: ad es., come ascissa di P, ossia distanza di P da un punto fisso (origine) della retta. Quando si faccia uso di variabili omogenee x1, x2, esse saranno le coordinate omogenee di P.
Allora un'equazione omogenea f (x1, x2) = 0 di grado n definirà un gruppo di n punti (tutti distinti, oppur no) della retta.
Analogamente, se nel campo ternario o quaternario s'interpretano le variabili omogenee x1, x2, x3, oppure x1, x2, x3, x4, come coordinate (ad es., cartesiane) omogenee di un punto del piano o dello spazio, un'equazione omogenea di grado n rispetto ad esse definirà una curva piana, oppure una superficie, pure algebrica, d'ordine n.
Se il numero delle variabili omogenee è superiore a 4, per averne un'immagine geometrica converrà ricorrere al linguaggio della geometria iperspaziale.
Ciò posto, se è data una forma binaria f (x1, x2), l'annullarsi di un suo invariante esprime una particolare proprietà proiettiva del gruppo degli n punti rappresentato dall'equazione f = 0, cioè una proprietà, della quale è dotato non soltanto questo gruppo di punti, ma ogni altro che da esso si deduca con una proiettività non degenere.
L'annullarsi di un covariante di f, che sia d'ordine m in x1, x2, rappresenta un gruppo di m punti che sta in una particolare relazione proiettiva col gruppo definito da f = 0, cioè in una tal relazione con questo gruppo, che sussiste anche per i due gruppi di n e di m punti dedotti dai due dati con un'arbitraria proiettività non degenere.
Se invece si esige che un covariante di f. risulti nullo identicamente, cioè qualunque siano i valori attribuiti alle variabili x1, x2, si ottiene (come nel caso dell'annullamento di un invariante) una particolare proprietà proiettiva del gruppo degli n punti f = 0.
Analoghe proposizioni si hanno per un sistema di due o più forme fondamentali f1 (x1, x2), f2 (x1, x2), ... .
Invarianti e covarianti di forme binarie espressi con le radici di queste forme.
64. Finora si è parlato d'invarianti e covarianti di una o più forme binarie, come funzioni dei coefficienti di queste forme. Ma, se si fa capo alle relazioni che intercedono tra i coefficienti di una equazione algebrica e le radici di essa (n. 43), si giunge ad una nuova e importante rappresentazione delle forme invariantive per mezzo delle radici delle equazioni che risultano eguagliando a zero le forme date (Brioschi, 1854).
Limitiamoci, per semplicità, a considerare una sola forma binaria f(x1, x2), dell'ordine n. Ogni suo invariante intero di peso p si otterrà costruendo una funzione intera simmetrica delle radici a1, a2, ..., an dell'equazione f = 0, tale che ciascun termine di essa sia il prodotto di p differenze ai − ak, dove ognuno degli indici 1, 2, ..., n compaia nel prodotto uno stesso numero di 2 volte, eguale a
I covarianti di f si ottengono in modo analogo, facendo intervenire anche le differenze x − a.
Alcuni casi particolari.
65. Tra gli invarianti simultanei di due forme binarie f1, f2 di ordini n1, n2, uno dei più notevoli è il loro risultante, il cui annullarsi è condizione necessaria e sufficiente perché i due gruppi di punti determinati da f1 = 0, f2 = 0 abbiano un punto comune. Posto x1 = x, x2 = 1, esso coincide col risultante delle equazioni f1(x) = 0, f2 (x) = 0 quale fu definito al n. 44. È un invariante di grado n1 n2 e di peso n1 n2.
Se f (x1, x2) è una forma d'ordine n, il risultante delle due derivate parziali
è il discriminante di f e coincide col discriminante dell'equazione f (x) = 0 definito al n. 45. Esso è un invariante della forma f, di grado 2 (n − 1) e peso n (n − 1), e con il suo annullarsi dà la condizione perché nel gruppo di punti f(x) = 0 non tutti gli n punti siano distinti.
Un covariante simultaneo, di peso 1, di due forme binarie f1, f2 di ordini n1, n2, è il loro determinante funzionale, o jacobiano
Allorché f1 ed f2 sono le derivate parziali di 1° ordine di una medesima forma f di ordine n, il jacobiano diviene il determinante
che dicesi hessiano di f. È un covariante di f, di peso 2 e ordine 2 (n − 2).
In generale, il determinante d'ordine n formato con le derivate seconde di una forma di n variabili, è un covariante di queste forme, che dicesi hessiano, perché studiato da L. O. Hesse nel 1844.
Forme binarie di 2°, 3°, 4° ordine.
66. Una forma binaria quadratica
non possiede covarianti, ed ha un solo invariante
che ne è il discriminante.
Due forme quadratiche
determinano un fascio di tali forme
essendo λ un parametro arbitrario. Il discriminante della (1) può scriversi come segue:
dove D11 e D22 sono i discriminanti di f e ϕ, e
L'espressione D12 è un invariante simultaneo di f e ϕ, il cui annullarsi è condizione necessaria e sufficiente perché le coppie di punti definite dalle equazioni f = 0, ϕ = 0 si separino armonicamente.
Un covariante simultaneo di f e ϕ è il loro iacobiano (n. 65) dato da
Eguagliato a zero, esso rappresenta i due punti che dividono armonicamente l'una e l'altra delle coppie f = 0, ϕ = 0, ossia i punti doppî dell'involuzione determinata da queste coppie.
Le forme invariantive considerate verificano l'identità
Un altro invariante simultaneo di f e ϕ è il discriminante di J, il quale coincide col risultante di f e ϕ, ed è eguale a D11 D22 − D122.
I significati geometrici di D11, D12, D22 si possono anche dedurre come casi particolari dall'equazione quadratica
la quale ha per radici i valori a ed
di cui è suscettibile il rapporto anarmonico del gruppo formato con le due coppie di punti f = 0, ϕ = 0.
La forma binaria cubica
possiede il covariante quadratico
che ne è l'hessiano, e il covariante cubico
che è il iacobiano di f e H. La f possiede inoltre un invariante R, dato da
ed è il discriminante così di f come di H.
I due covarianti e l'invariante sono legati ad f mediante l'identità (Cayley, 1854):
Una forma biquadratica
ha i due invarianti
con i quali si forma il discriminante i3 − 6j2.
Un primo covariante di f è l'hessiano
ed un altro è il iacobiano
di f e H. Tra le forme precedenti sussiste l'identità (Cayley, 1855)
Non riportiamo le interpretazioni geometriche relative alle forme cubiche e biquadratiche, le quali possono trovarsi, p. es., in R. F. A. Clehsch, Theorie der binären algebraischen Formen, Lipsia 1872, p. 114; R. F. A. Clebsch, Vorlesungen iiber Geometrie, a cura di F. Lindemann, 2ª ed., I, 1, Lipsia 1906, p. 428; F. Enriques e O. Chisini, Lezioni sulla teoria geometrica delle equazioni e delle funzioni algebriche, I, Bologna 1915, p. 22 segg.
In questi trattati si vedrà altresì come con l'intervento delle forme invariantive, quale fu attuato dal Cayley (1858), la risoluzione algebrica delle equazioni di 3° e 4° grado acquisti perspicuità ed eleganza.
Rappresentazione simbolica delle forme binarie.
67. Quando una forma binaria sia di ordine superiore al 4°, oppure si tratti di un sistema di più forme binarie, le espressioni delle forme invariantive divengono sempre più complicate, e dànno luogo a calcoli assai laboriosi. Le difficoltà provenienti da codesta circostanza vengono attenuate se si ricorre alla rappresentazione simbolica delle forme, che fu immaginata dal Cayley (1845) e, indipendentemente da lui, da S. Aronhold (1857), poi approfondita dal Clebsch (1860) e largamente usata dallo stesso Clebsch, da P. Gordan e da altri molti. Su tale rappresentazione è sistematicamente fondata la trattazione della teoria delle forme binarie, come trovasi esposta nei libri di Clebsch che citammo al n. precedente, e in quello di Gordan, Vorlesungen über Invariantentheorie, II, Lipsia 1887.
Sia f una forma binaria di ordine n, e s'intenda scritta nel modo seguente, dove sono messi in evidenza i coefficienti binomiali:
Posto poi
consideriamo la potenza axn. La forma f sarà identica a questa potenza allorché, qualunque siano i e k, sussistano le relazioni
Ma anche quando f non sia la nma potenza di una forma lineare, si potrà riguardare la potenza axn come una rappresentazione simbolica di j, e si scriverà f = ar., purché, eseguito lo sviluppo della potenza, ogni prodotto a1i a2k si pensi sostituito dal coefficiente effettivo aik.
Ove occorra moltiplicare tra loro due o più coefficienti di f, s'introdurranno altrettante rappresentazioni simboliche axn, bxn, ... di f, cosicché uno stesso coefficiente aik di f sarà simbolicamente rappresentato da ciascuno dei prodotti a1i, a2k, b1ib2k, ..., e i simboli a, b,... si diranno equivalenti.
I determinanti simbolici a1b2 − a2b1, a1c2 − a2c1, ... si denoteranno brevemente con (a b), (a c),....
Come l'accennata rappresentazione fornisca immediatamente un modo di costruzione delle forme invariantive di f, risulta dal teorema seguente, dovuto al Clebsch:
Ogni invariante di grado g (con g 〈 1, poiché non esistono invarianti di primo grado) di una forma f si può rappresentare simbolicamente introducendo g rappresentazioni simboliche equivalenti axn, bxn, ... di f, e costruendo una somma di prodotti di determinanti simbolici (a b), (a c), (b c),..., in modo che ciascun termine della somma contenga ne' suoi fattori n volte ognuno dei simboli a,b,c, ...
Nella rappresentazione simbolica dei covarianti intervengono, insieme con determinanti simbolici (a b), (a c), ..., anche forme lineari simboliche ax, bx, ... .
Inversamente, qualunque formazione simbolica dei due tipi descritti rappresenta rispettivamente un invariante o un covariante della forma f.
Come esempio indichiamo le rappresentazioni simboliche degli invarianti e covarianti delle forme binarie di 2°, 3° e 4° ordine considerati al n. 66. Riterremo tutte le notazioni usate in quel n. 66.
Per una forma quadratica f = ax2 = bx2 = ..., si ha D = (ab)2.
Per due forme quadratiche f = ax2 = bx2 = ..., ϕ = ax2 = βx2 = ..., si ha
Nel caso di una forma cubica f = ax3 = bx3 = ... abbiamo
Per una forma biquadratica f = ax4 = bx4 = ... si ha
In generale, se una forma d'ordine n è simbolicamente rappresentata da axn, bxn, ..., il suo hessiano è (ab)2 axrn-2 bxn-2. E se αxm, βxm, ... sono le rappresentazioni simboliche di un'altra forma d'ordine m, il jacobiano delle due forme è (a α) axn-1 αxm-1.
Estensioni a forme di più di due variabili.
68. Già più volte (nn. 61, 62, 63) fu accennato come le definizioni e proposizioni principali sulle forme invariantive di una o più forme binarie si estendono alle forme ternarie, quaternarie,.... Nel caso, per es., di una o più forme ternarie, insieme con gl'invarianti e covarianti si presentano pure altre forme invariantive, dette controvarianti e forme miste. La loro considerazione si offre spontanea quando si faccia capo alla rappresentazione geometrica, ossia quando le variabili omogenee x1, x2, x3 si pensino come coordinate omogenee di un punto in un piano. Sia
una trasformazione lineare delle x nelle y, il cui modulo A non sia nullo. Se un punto percorre una retta di equazione
in virtù delle (1), le variabili controgredienti u1, u2, u3 subiscono la trasformazione lineare
dove Aik denota il complemento algebrico di aik, in A.
Ciò posto, controvariante del dato sistema di forme ternarie è una forma invariantiva contenente i coefficienti di quelle forme e le variabili u1, u2, u3; forma mista è una forma invariantiva contenente i coefficienti e insieme le variabili x1, x2, x3 e le variabili u1, u2, u3.
Se le forme date sono f, ϕ, ..., l'annullarsi di un loro invariante esprime una proprietà proiettiva delle curve f = 0, ϕ = 0,...; e l'annullarsi di un loro covariante rappresenta una curva che ha con tali curve una determinata relazione proiettiva. L'annullarsi di un controvariante rappresenta un inviluppo algebrico, avente con quelle curve un legame proiettivo, e l'annullarsi di una forma mista può interpretarsi, ad esempio, come esprimente una corrispondenza tra i punti del piano e certi inviluppi, la quale sia legata alle curve f.= 0, ϕ = 0,... da relazioni di natura proiettiva.
Anche la rappresentazione simbolica può venire estesa alle forme con quante si vogliano variabili. Nel campo ternario, ad es., una forma d'ordine n
può rappresentarsi simbolicamente con
dove si ritenga che, eseguito lo sviluppo della potenza, abbiano luogo le relazioni
Se allora si pone
sussiste il teorema che ogni invariante della forma f = axn = bxn = ... si può rappresentare simbolicamente come somma di prodotti di fattori del tipo (a b c). Quando si tratti di covarianti, entrano ancora fattori del tipo ax, e quando si tratti di controvarianti o di forme miste, entrano ancora fattori del tipo (a b u) e del tipo ux.
Per es., l'hessiano di f, ossia il determinante di 3° ordine formato con le derivate seconde di f, è rappresentato simbolicamente da
I problemi dell'equivalenza e della base.
69. Tra i varî problemi che si presentano nello studio generale delle forme algebriche dal punto di vista delle trasformazioni lineari, due particolarmente furono oggetto di numerose ricerche: quello dell'equivalenza e quello della base.
Rispetto al primo, si chiedono le condizioni affinché due dati sistemi di forme si possano trasformare linearmente l'uno nell'altro.
Per le forme bilineari e quadratiche, e per i sistemi di tali forme, la questione fu risolta in modo completo da Carlo Weierstrass nel 1868, e corredata di ulteriori sviluppi da Leopoldo Kronecker e da altri.
Per le forme di ordine superiore al 2°, ed a coefficienti affatto generali, il problema fu studiato a fondo dall'Aronhold (1863), il quale ne fece il punto di partenza di una trattazione diretta delle proprietà di tutte le varie forme aventi carattere invariantivo, unicamente basata sulla teoria delle trasformazioni lineari. Come condizione necessaria per la trasformabilità lineare di due forme l'una nell'altra, risultò l'eguaglianza dei loro invarianti assoluti.
La ricerca di condizioni necessarie e sufficienti, proposta dal Clebsch (1869), e da lui eseguita con la riduzione a certe forme tipiche, fu quattro anni appresso ripresa da J. P. Gram, e condotta a termine per la via diretta che era stata segnata dall'Aronhold. Il criterio di equivalenza stabilito dal Gram consiste in ciò, che affinché due sistemi di forme algebriche con quante si vogliano variabili siano linearmente trasformabili l'uno nell'altro, occorre e basta che per essi siano eguali gl'invarianti assoluti e si annullino identicamente i medesimi covarianti.
La questione, che di qui nasce, di determinare le forme equivalenti ad una data, fu studiata da E. B. Christoffel nel 1881.
Il problema della base consiste nel ricercare se le forme invariantive di un dato sistema di forme algebriche si possano tutte esprimere razionalmente per mezzo di un numero finito di esse.
Alla questione fu risposto affermativamente dal Cayley e dal Sylvester (1853-1855) per le forme binarie dei primi quattro ordini; ma per quelle di ordine superiore al 4°, il Cayley nel 1856 giunse erroneamente a dare una risposta negativa.
Che tutti gli invarianti e covarianti di una forma binaria si possano esprimere razionalmente mediante un numero finito di essi, fu per la prima volta dimostrato da Paolo Gordan (1868), fondandosi sulla rappresentazione simbolica; nel 1870 il teorema fu da lui esteso ai sistemi di più forme binarie. Una dimostrazione basata invece sulle espressioni degli invarianti e covarianti per mezzo delle radici delle forme date (n. 64), fu assegnata da F. Mertens nel 1886, e in modo più semplice da Davide Hilbert due anni dopo.
Un analogo teorema sussiste per un numero qualunque (finito) di forme fondamentali di quante si vogliano variabili, soggette alla medesima trasformazione lineare od a trasformazioni lineari diverse, ed è stato stabilito da Hilbert (1890) come rientrante in risultati di indole ancora più generale.
Si suol dire che un sistema di forme invariantive, con le quali ogni altra può esprimersi razionalmente, costituisce un sistema completo, od anche una base.
Per una forma binaria quadratica la base è data dalla forma stessa e dal suo discriminante. Ogni invariante della forma non è dunque che una potenza del discriminante.
Per una forma binaria cubica f. (n. 66 e 67) la base consta di f, H, Q ed R. Qui pure i soli invarianti sono le potenze del discriminante.
Per una forma binaria biquadratica (n. 66 e 67) la base è costituita da f, H, T, i, j.
Cenni storici.
70. I primi germi della teoria delle forme invariantive si possono ravvisare sia nella proprietà d'invarianza del discriminante di una forma quadratica binaria o ternaria, segnalata in ricerche aritmetiche da Lagrange (1773) e da Gauss (1801), sia negli studî di Lagrange (1759), Euler (1770), Gauss (1801), Cauchy (1829), Jacobi (1834) e altri sulla trasformazione di una forma quadratica in una somma di quadrati.
Anche il teorema di A.L. Cauchy e J. Binet (1815) sulla moltiplicazione dei determinanti può riferirsi a questa teoria, in quanto esprime che se gli elementi di una orizzontale (o di una verticale) qualunque d'un determinante vengono sottoposti ad una medesima trasformazione lineare, il determinante si riproduce moltiplicato per il modulo della trasformazione.
G. Boole (1841-42) stabilì la proprietà invariantiva del discriminante di una forma binaria qualunque, e costruì molti altri invarianti e covarianti di una o più forme binarie. G. Eisenstein (1844) considerò i principali invarianti e covarianti di una binaria di 3° o 4° ordine, in particolare i due invarianti i e j di quest'ultima; e Boole espresse come funzione intera di essi il discriminante della forma. Contemporaneamente Otto Hesse (1844) riconobbe l'invarianza del determinante che ora porta il suo nome.
D'altra parte, allo sviluppo di quella che fu chiamata la nuova algebra diedero notevole impulso i progressi compiuti dalla nuova geometria, o geometria proiettiva, a partire dal 1822, anno di pubblicazione del Traité des propriétéś projectives des figures di J. V. Poncelet; poiché per opera dello stesso Poncelet, e di Gergonne, Chasles, Möbius, Pücker, Steiner e altri furono poste in luce espressioni algebriche e proprietà delle figure geometriche, che hanno carattere proiettivo, ossia rimangono invariate per trasformazioni delle coordinate. Basti qui ricordare i teoremi che si collegano alla nozione di rapporto anarmonico e quelli relativi alla reciprocità polare.
Ma come fondatore della teoria generale dev'essere considerato Arturo Cayley (1821-1895), il quale in una lunga serie di lavori, a partire dal 1845, la sviluppò negli aspetti più varî, così puramente algebrici come geometrici, e l'arricchì di procedimenti e di risultati essenzialmente nuovi. Le forme furono da lui chiamate quantiche, e gl'invarianti iperdeterminanti.
Intimamente connesse con le ricerche del Cayley sono quelle iniziate nel 1851 da J.J. Sylvester (1814-1897), nel 1852 da Ch. Hermite (1822-1901), nel 1854 da F. Brioschi (1824-1897): con i quali si può ritenere compiuta la prima fase dello sviluppo storico della teoria. Si deve, in particolare, al Sylvester l'introduzione dei vocaboli invariante, covariante, controvariante, modulo, e altri molti pertinenti alla teoria delle forme algebriche.
La teoria di Cayley e Sylvester, della quale Giorgio Salmon (1819-1904) fin dal 1859 aveva dato un'esposizione nelle Lessons introductory to the modern higher algebra (Dublino), fu ulteriormente elaborata in lavori più recenti dello stesso Sylvester e di molti autori, soprattutto inglesi e americani. Di questi nuovi sviluppi si può aver cognizione nei libri di E. B. Elliott, An introduction to the algebra of quantics, Oxford 1895, e di J. H. Grace e A. Young, The algebra of invariants, Cambridge 1903.
Per i più antichi lavori di Cayley, Sylvester, Hermite e Brioschi vedasi F. Faà di Bruno, Théorie des formes binaires, Torino 1876, e la traduzione tedesca, con aggiunte di M. Noether, fattane da Th. Walter col titolo Einleitung in die Theorie der binären Formen, Lipsia 1881.
Un secondo periodo è caratterizzato dai lavori di Clebsch (1833-1872) e Gordan (1837-1912), che ebbero principio rispettivamente nel 1860 e nel 1867, e sono basati sull'uso sistematico della rappresentazione simbolica. Esso si riattacca più propriamente ad Aronhold, il quale fin dal 1849 aveva trovato gl'invarianti della forma cubica ternaria e la loro relazione col discriminante, e nel 1857 aveva fatto uno studio approfondito delle forme invariantive di quella forma e introdotto il concetto di invariante assoluto.
Ma mentre per il Cayley e per gli algebristi inglesi il metodo simbolico serviva soltanto a generare forme invariantive in numero arbitrario, e per l'Aronhold non era che un mezzo per dimostrare i suoi teoremi, il Clebsch lo assunse come unico fondamento dell'intiera teoria, riducendo tutte le formazioni invariantive di un dato sistema di forme (limitatamente almeno ad una sola serie di variabili) a quelle di un sistema di forme lineari.
A questo simbolismo si riporta, in Clebsch, la stessa definizione degl'invarianti e covarianti, laddove il Cayley li aveva definiti come le soluzioni razionali intere di certe equazioni alle derivate parziali, nelle quali i coefficienti delle date forme figurano come variabili indipendenti; e l'Aronhold ne aveva desunto la definizione dalle relazioni di trasformabilità lineare di una forma in un'altra.
Il momento culminante di questo periodo può riferirsi al 1868, allorché dal Gordan fu stabilito il teorema dell'esistenza di un sistema completo d'invarianti e covarianti per una forma binaria.
Ma il metodo simbolico, con il quale più tardi il Gordan estese il suo teorema a più forme binarie simultanee e ad alcuni pochi casi di forme ternarie e quaternarie, si dimostrò ben presto inadeguato a risolvere il problema generale della base. L'introduzione di nuovi concetti e di nuovi metodi, mediante i quali è riuscito a D. Hilbert (1890) di dare al teorema di Gordan la massima generalità, distingue appunto l'ultimo periodo: concetti e metodi che hanno trasportato la teoria delle forme algebriche entro un quadro più ampio, in intimo collegamento con la teoria dei sistemi di moduli e dei corpi algebrici, fondata da L. Kronecker e da R. Dedekind e H. Weber (1881), poi elaborata ed estesa secondo diverse direzioni da numerosi autori.
Tra i teoremi stabiliti da Hilbert, limitiamoci a riportare il seguente, che è dei più notevoli per la sua grande generalità.
Data una qualsiasi successione F1, F2,... di forme algebriche con n variabili x1, x2, ..., xn, si può sempre scegliere in essa un numero finito m di forme Fi1, Fi2, ..., Fim in modo che ogni forma F della successione sia rappresentabile, come combinazione lineare di quelle, con un'espressione del tipo
dove A1, A2,..., Am, sono opportune forme delle x1, x2, ... xn i cui coefficienti appartengono al campo di razionalità definito dai coefficienti delle forme della data successione.
Forme quadratiche.
71. Hanno particolare importanza, per le svariate applicazioni in tutti i rami della matematica, le forme quadratiche di quante si vogliano variabili.
Se queste variabili si dicono x1, x2, ..., xn, una forma quadratica f delle medesime si suole rappresentare così:
dove si conviene che sia aik, = aki, Denotando con f1, f2, ..., fn le semiderivate parziali di f rispetto ad x1, x2, ..., xn, ossia ponendo
risulta l'identità
caso particolare della formola di Euler sulle funzioni omogenee (n 34).
Il determinante simmetrico A, formato con i coefficienti delle (1), si dice discriminante di f, ed è un invariante della stessa f, di peso 2. Inversamente, ogni invariante di f è il prodotto di una costante per una potenza di A.
Se Aik, k è il complemento algebrico di aik in A, si chiama forma aggiunta di f la forma quadratica delle n variabili controgredienti u1, u2, ..., un:
ed è un controvariante di f, di peso 2.
Eseguendo sulle x1, x2, ..., xn una trasformazione lineare a modulo non nullo, la f si muta in una forma quadratica delle nuove variabili, il discriminante della quale ha la stessa caratteristica, o rango, r del discriminante A di f. Il numero r dicesi caratteristica o rango di f, e la sua importanza è messa in chiaro da ciò, che sussiste anche il teorema inverso del precedente. In altri termini: date due forme quadratiche, affinché esista una sostituzione lineare che trasformi l'una nell'altra, è necessario e sufficiente che esse abbiano il medesimo rango.
Il rango r interviene pure nella considerazione delle forme quadratiche singolari (o riducibili). Una forma quadratica di n variabili dicesi singolare quando esista una sostituzione lineare (a modulo non nullo), per effetto della quale essa venga a dipendere da un minor numero di variabili; dicesi ordinaria nel caso contrario.
Orbene, perché una forma quadratica sia singolare, occorre e basta che il suo discriminante sia nullo (Sylvester, 1850); se la forma è di rango r, con un'opportuna sostituzione lineare essa può ridursi a contenere soltanto r variabili, ma non un numero di variabili inferiore ad r; e la riduzione può farsi con sole operazioni razionali.
Una forma quadratica, che sia il prodotto di due forme lineari distinte, è di rango 2, e inversamente; è invece di rango 1 quando, e soltanto quando, sia il quadrato d'una forma lineare (Brioschi, 1852).
Considerando insieme con f anche l'aggiunta ϕ, si ha di più: se f è di rango n, anche ϕ è di rango n; se f è di rango n − 1, il rango di ϕ è 1, e ϕ è il quadrato di una forma lineare; se il rango di f è minore di n − 1, il rango di ϕ è zero, ossia ϕ è identicamente nulla.
Da uno dei precedenti teoremi risulta che una forma quadratica si può, con una sostituzione lineare, ridurre alla forma canonica
dove c1, c2, ..., cr sono costanti non nulle, quando, e solo quando, il suo rango sia r. Una tale trasformazione può effettuarsi in infiniti modi: per esempio in modo che le costanti c1, c2, ..., cr abbiano valori prefissati arbitrarî. Assumendo tali valori eguali all'unità, la f si riduce alla forma normale
Metodi di riduzione a forma canonica furono dati dal Lagrange (1759), dal Gauss (1801), dal Plücker (1842), dal Jacobi (1857), dal Darboux (1874) e da altri.
72. Allorché, in particolare, la forma f sia reale, ossia abbia per coefficienti numeri reali, essa può, in infiniti modi, per mezzo di una sostituzione lineare reale (cioè a coefficienti reali), essere ridotta alla forma canonica (2), dove i coefficienti c1, c2, ..., cr sono reali (e non nulli). Ma in tutte le infinite rappresentazioni canoniche possibili di una stessa forma, i coefficienti ci, che sono positivi (e quindi pure quelli che sono negativi) si presentano nel medesimo numero.
Questo fondamentale teorema era gia noto a Gauss nel 1846-47, ed anche a Jacobi nel 1847, e fu di nuovo scoperto nel 1852 dal Sylvester, che lo chiamò legge d'inerzia delle forme quadratiche.
Se P è il numero dei coefficienti positivi, N quello dei negativi, cosicché P + N = r, la differenza s = P − N è stata chiamata da G. Frobenius (1894) segnatura della forma.
Perché due forme quadratiche reali possano trasformarsi l'una nell'altra mediante una sostituzione lineare reale, è necessario e sufficiente che abbiano lo stesso rango e la stessa segnatura.
Tra i varî modi con i quali una forma quadratica reale può ridursi a forma canonica mediante una sostituzione lineare reale, ha la maggiore importanza quello che fa uso di una sostituzione lineare ortogonale.
Una sostituzione lineare, che faccia passare dalle variabili x1, x2, ..., xn ad altre variabili y1, y2 ,..., yn, si dice ortogonale quando trasforma la somma dei quadrati delle antiche variabili nella somma dei quadrati delle nuove, quando cioè è tale che
Il modulo di una siffatta trasformazione ha per valore l'unità positiva oppure negativa, ed a seconda dei due casi ognuno de suoi elementi è eguale al proprio complemento algebrico, oppure a questo complemento mutato di segno (teoremi osservati, per n = 3 da Euler nel 1771 e da Lagrange nel 1788, in generale da Jacobi nel 1834).
Ciò posto, è sempre possibile (Cauchy, 1826), con una trasformazione ortogonale reale, ridurre una forma quadratica reale al tipo
Le quantità ρ1, ρ2, ..., ρn sono le radici dell'equazione
la quale, incontrata da P.S. Laplace (1772) in ricerche di meccanica celeste, prende il nome di equazione secolare. Sviluppata, e ordinata secondo le potenze decrescenti di ρ, essa diviene:
dove T, è la somma di tutti i minori principali di ordine i di A e in particolare:
Laplace per n = 2, Lagrange (1773) per n = 3, e Cauchy (1829) per n qualunque, hanno dimostrato che le radici ρ1, ρ2, ..., ρn dell'equazione secolare sono sempre reali. Circa i coefficienti T1, T2, ..., Tn, ognuno è un invariante ortogonale della forma f (Cauchy, 1826), cioè un'espressione che rimane invariata quando sulle variabili si esegua una qualsiasi sostituzione lineare ortogonale.
Sulle forme quadratiche vedansi i trattati, citati alla fine del n. 47, di Capelli, (p. 906, Cesàro (p. 59), Ricci (p. 435), Cipolla (p. 174 e 426); inoltre L. Bianchi, Lezioni di geometria analitica, Pisa 1915, p. 571; G. Scorza, Elementi di geometria analitica, Messina 1925, p. 251.