MASSIMI e MINIMI
. Preliminari. - In questa locuzione è contenuto il soggetto di molte ricerche matematiche, di vario carattere e di notevole interesse teorico e pratico. Esse hanno comune la ricerca di quello o di quegli stati di una quantità variabile che sono maggiori (o almeno non minori) di ogni altro stato di essa (massimi, o minori (o almeno non maggiori) di ogni altro stato di essa (minimi). Tale primitivo concetto si affina in certi casi in quello di massimo o minimo relativo, come si dirà più avanti.
Si concepisce come importanti problemi pratici siano legati a questionì siffatte; ogni esigenza di minimo costo, di minimo lavoro, di miglior impiego di materiale, ecc., si traduce in termini matematici in un problema di massimi e minimi. La scienza delle costruzioni, civili o meccaniche, ne dà quindi esempî frequenti. Anche le scienze fisico-chimiche si valgono spesso nei loro enunciati di massimi e minimi, in modo assai caratteristico; e cioè affermando che fra tutti i modi astrattamente possibili in cui potrebbe svolgersi un fenomeno, ferme restando certe condizioni (p. es., lo stato iniziale e finale del sistema), si attua in natura quello per il quale una certa quantità risulta massima o minima. Può esser questa una forma assai comoda ed espressiva di una legge naturale. V. per es.: azione minima; dinamica, n. 21; fermat; hamilton: Principio di H.; hertz: Principio di H.
Storia. - Considerazioni di massimo e minimo si trovano già frequentemente in Euclide; in aritmetica nei concetti di massimo comun divisore e minimo comune multiplo; in geometria, nei problemi di distanza di un punto da una retta, da un cerchio, da un piano. Notevole è anche negli Elementi una proposizione (VI, 27) in cui in sostanza si assegna il massimo parallelogrammo inscritto in un triangolo e avente un lato su un lato di questo; enunciato necessario a Euclide perché, nel problema della seguente prop. 28, i dati siano tali che il problema stesso risulti possibile. Ossia la discussione è premessa alla risoluzione.
La discussione dei problemi (in greco διορισμός, diorisma, v.) fu nell'antichità (ed è, in sostanza, anche oggi), sorgente feconda di proprietà di massimo e minimo. Se ne comprende la ragione: dovendosi costruire una figura, sottoposta a certe condizioni, e inoltre a quella che, p. es., una certa area abbia il valore s, dalla discussione del problema potrà risultare che il problema è possibile quando s è minore di una certa quantità S, e anche quando le è eguale, ma non quando è maggiore di S. Ciò significherà che, nella classe delle figure che soddisfano a quelle condizioni, quella in cui l'area s è massima è la figura in cui s ha il valore S.
Nei geometri greci gli esempî di diorismi sono frequenti; in Archimede se ne ha uno relativo a un problema di 3° grado.
Notevole sviluppo hanno le questioni di massimo e minimo in Apollonio, dove esse acquistano completa autonomia; l'autore le presenta anzi come "utili a chi vuol fare i diorismi": il rapporto è invertito. Il V libro delle Sezioni coniche è dedicato alla ricerca della massima e minima distanza di un punto da una conica, che conduce alla costruzione dei segmenti normali alla curva uscenti dal punto, e a una delicata discussione, svolta da Apollonio in modo mirabile. Nell'introduzione a questo V libro vi è un accenno a metodi diversi per trattare le questioni di massimo e minimo usati da altri geometri e aventi relazione con le tangenti; a quali procedimenti si alluda non è possibile precisare.
Più tardi, la scuola alessandrina si occupa ampiamente dell'importante questione degl'isoperimetri; rimandiamo per essa alla speciale trattazione (v. isoperimetri).
Per trovare nuovi contributi alle questioni di massimo e minimo bisogna giungere al tardo Medioevo e al Rinascimento, con N. Oresme, che fa un'osservazione - ripetuta più tardi da Keplero - ove si può vedere un germe del metodo differenziale, con Giordano Nemorario e Regiomontano, che risolvono problemi geometrici elementari. Più tardi N. Tartaglia dà, senza spiegazioni, la soluzione di un problema ehe si riduce a trovare il massimo di x (16 − x2) per 0 〈 x 〈 4; B. Cavalieri e M. Ricci danno il massimo di xy2 quando x e y sono numeri positivi di somma costante; E. Torricelli tratta il problema analogo per xyn con metodi elementari, di notevole eleganza; prevede anche il risultato per il caso generale xmyn (v. più avanti). Allo stesso si deve altresì la risoluzione geometrica del problema, proposto da Fermat: trovare nel piano di un triangolo un punto per il quale sia minima la somma delle distanze dai vertici. La soluzione è riportata da B. Cavalieri.
Con P. Fermat (Methodus ad disquirendam maximam et minimam, 1638, stampato a Tolosa nel 1679, ma reso noto da P. Hérigone sin dal 1642) siamo ormai agli albori del calcolo differenziale. Il metodo di Fermat - dato in forma quasi identica qualche tempo dopo anche da Antonio di Monforte - non ha solido fondamento logico né applicabilità generale, ma, quando è applicabile, coincide formalmente col metodo infinitesimale. Per incidenza, sarà da notare che a Fermat si deve anche l'espressione della legge di propagazione della luce nella forma di un principio di minimo: la traiettoria è tale che la durata della propagazione da un punto a un altro sia minima.
Grande influenza ebbero le idee di Fermat, a cui si riconnette probabilmente J. Hudde, che insegna a trovare massimi e minimi di quantità y legate alla variabile x da un'equazione algebrica (funzioni implicite).
Si arriva così insensibilmente alla grande scoperta di Newton e Leibniz che dà anche, per i massimi e minimi, metodi di grande semplicità e generalità. La regola generale per le funzioni di una variabile è data da Newton nella Methodus fluxionum del 1671, rimasta però inedita sino al 1736; da Leibniz nella Nova methodus pro maximis et minimis itemque tangentibus del 1684, ove s'insegna anche a distinguere i massimi dai minimi mediante l'uso della derivata seconda. L'uso delle derivate successive, nei casi dubbî, si deve a C. Maclaurin (1742).
A Eulero si deve una prima, imperfetta applicazione del metodo differenziale alle funzioni di più variabili; un miglioramento essenziale vi fu portato da Lagrange (1759).
A questo punto, gli analisti del sec. XVIII si trovano in possesso di un metodo che trasforma i problemi di massimo e minimo in problemi algebrici - equazioni o sistemi di equazioni - e lo applicano a questioni svariatissime che hanno ormai valore di esercizî. Trascurano così i metodi elementari, specialmente geometrici, che riprendono favore soltanto più tardi per opera di S. Lhuilier (1782) e poi, a notevole distanza di tempo, di J. Steiner. Questo, in due ampie memorie del 1842 (in Crelle's Journal) tratta sistematicamente molti e difficili problemi e in modo speciale gli isoperimetrici. I procedimenti di Steiner sono molto eleganti e veri modelli di ricerca geometrica; ma il loro valore dimostrativo è spesso viziato in un punto essenziale. Questo difetto (ipotesi sottintesa dell'esistenza del massimo o minimo) può essere in alcuni casi rimosso da un teorema di esistenza, di C. Weierstrass, che è uno dei contributi essenziali che la teoria ha ricevuto nel sec. XIX.
Negli ultimi 50 anni la teoria analitica dei massimi e minimi è stata completata in alcuni punti e sono stati perfezionati i metodi geometrici (R. Sturm). Inoltre in ossequio a una certa esigenza di "economia" del pensiero, e spesso anche in vista di esigenze didattiche, sono stati ripresi i metodi algebrici elementari e fondati in modo semplice e rigoroso sulla relazione di grandezza tra le varie medie di due o più numeri positivi e proprietà analoghe.
Per quella parte della teoria che fa capo al Calcolo delle variazioni, v. variazioni, calcolo delle.
Concetti fondamentali. - a) Nella loro forma più astratta i concetti di massimo e minimo possono formularsi così: Data una classe o insieme I di numeri reali, un elemento A di questo insieme si dice massimo (o minimo) di I, se, preso un elemento qualunque a di I, diverso da A, si ha sempre a 〈 A (o a > A).
Sugli elementi dell'insieme che si considera non è fatta alcuna ipotesi, ma nelle applicazioni si tratterà molto spesso dell'insieme dei valori che una funzione di una o più variabili assume in un certo campo (v. funzione). Si potrà trattare anche di una variabile dipendente da una funzione da scegliersi ad arbitrio in una certa classe, cioè di un funzionale (v. funzionali; variazioni, calcolo delle; alcune generalità che qui si daranno si applicano tuttavia anche a questi problemi).
b) Un insieme di numeri reali non ha necessariamente massimo e minimo; perché abbia, ad es., massimo, non basta neppure che gli elementi dell'insieme non superino un numero fisso. Di qui l'importanza dei "teoremi di esistenza". Alcuni di questi sono banali: un insieme di elementi in numero finito ammette massimo e minimo; un insieme di numeri interi assoluti ammette sempre un minimo, e ammette anche un massimo se essi sono inferiori a un numero fisso. Fondamentale, e di dimostrazione non immediata, per quanto ritenuto per molto tempo evidente, è invece il teorema di Weierstrass: "Una funzione f (x) definita e continua per a ≤ x ≥ b (compresi dunque gli estremi) ammette un valore massimo e un valore minimo". Lo stesso vale per una funzione di due o più variabili, definita e continua in un campo limitato e chiuso (incluso cioè il contorno).
Il teorema vale più generalmente per le funzioni continue in un insieme qualunque purché limitato e chiuso (v. insieme). La continuità è condizione essenziale; però per l'esistenza del massimo basta una proprietà più ristretta: la semicontinuità superiore (v. funzione, n. 9); così per l'esistenza del minimo basta la semicontinuità inferiore.
c) Nel caso delle funzioni si può introdurre un altro concetto di massimo e di minimo che, senza includere il precedente, né esservi incluso, ha però con esso stretti legami. Se la funzione f (x) è definita in un certo intervallo, ed esiste un punto x0 interno a questo, tale che il valore f (x0) è il massimo, non necessariamente dei valori assunti da f(x) in tutto l'intervallo, ma anche solo di quelli assunti nelle vicinanze di x0, p. es., tra x0 − h e x0 + h, dove h è un numero positivo, sia pur piccolissimo, ma determinato, si dice che in x0 la funzione ha un massimo relativo (fig. 1); il punto (x0, f (x0)) del diagramma della funzione è per esso un punto di massimo. Analogamente per il minimo relativo, e analogamente per più variabili. In quest'ultimo caso la funzione, p. es., f (x, y), avrà in (a, b) un massimo relativo se f (a, b) non è superato da nessuno dei valori che f (x, y) assume in un intorno, p. es., circolare, abbastanza piccolo, di (a, b).
Secondo queste definizioni, in uno stesso campo una funzione può essere più volte massima o minima; può avere un valore minimo maggiore di uno massimo, ecc.
I valori massimi e minimi delle funzioni nel senso esposto in b) e in c) si dicono spesso tutti estremi; estremi assoluti i primi, relativi i secondi. Estremanti sono poi i punti (valori, cioè, o gruppi di valori) dove una funzione assume i valori estremi.
La nomenclatura precedente è la più usata e d'accordo con quella adottata nel calcolo delle variazioni; vi sono però autori che dicono estremo relativo quello che noi qui di ciamo assoluto, e viceversa.
Si distingue talora il massimo proprio o in senso stretto - se la funzione nel punto è maggiore, non eguale, a nessuno dei valori vicini - da quello improprio o in senso esteso - quando vi sono, vicini quanto si vuole al punto di massimo, punti ove la funzione ha valore eguale al valore massimo. E così per il minimo. La funzione z = x2y2 ha un minimo improprio nel punto (0,0).
Per affermare che una funzione di due o più variabili ha in un punto un estremo relativo, non basta aver verificato che muovendosi da quel punto in tutte le direzioni si trovano sempre, in un primo momento, valori non minori o non minori di quello col quale si è partiti. Il fatto paradossale fu messo in luce da G. Peano con l'esempio della funzione
nel punto (0,0).
d) Sono conseguenze immediate delle proprietà elementari delle diseguaglianze certe proprietà di trasformazione, cui si ricorre spesso nella ricerca dei massimi e minimi. Eccone degli esempî. Se A è il massimo di certi numeri a, sarà A ± k il massimo dei numeri a ± k, mentre sarà Ak il massimo degli ak se k è positivo, il minimo se k è negativo. Se gli a sono positivi, sarà A2 il massimo degli a2,1/A il minimo degli 1/a, ecc.
Queste proprietà si applicano anche agli estremi delle funzioni, sia assoluti che relativi, e tornano a dire che, nelle condizioni poste, una funzione y e le altre y ± k, ky, y2,1/y, ecc., non hanno gli stessi estremi, ma hanno gli stessi estremanti.
Metodi di ricerca. - La ricerca dei massimi e minimi si può compiere per analisi, cioè trasformando il problema proposto successivamente in più altri sino a trovarne uno la cui soluzione è nota; sia per sintesi, cioè "scoprendo" prima, in qualche modo, la soluzione e poi verificandone l'esattezza con la dimostrazione di una diseguaglianza.
Per scoprire i massimi e i minimi è spesso molto efficace, e fu molto usato, un ragionamento il cui schema si può così formulare. Data una variabile, di cui si vuole il massimo, si cerchi un procedimento che, applicato a uno stato della variabile, riesca ad aumentarlo o, in casi particolari, a lasciarlo inalterato. Allora lo stato massimo deve essere tale che il procedimento lo lasci inalterato, e questa condizione basta spesso a individuarlo. Per es., tra i poligoni di n lati inscritti in un dato cerchio si voglia quello di area massima. Se ABCD... è uno dei poligoni in questione (fig. 2) e dimezzato l'arco ABC in B′ si considera il poligono AB′CD... si trova che esso è prevalente o equivalente al dato (tale essendo il triangolo AB′C rispetto al triangolo ABC); si ha l'equivalenza se AB = BC. Nel poligono di area massima deve dunque essere AB = BC (= CD = DE = ...): il poligono deve essere regolare. Più precisamente: se c'è un poligono di area massima, esso è regolare. L'argomentazione si può presentare anche come una riduzione all'assurdo: il poligono di area massima deve essere regolare perché altrimenti se ne potrebbe trovare uno più grande, contro l'ipotesi. Questi tipi di ragionamento sono stati usati, anche in tempi recenti (Steiner), con la convinzione che da essi risultasse dimostrato che la figura trovata ha effettivamente la proprietà di massimo. Ciò è da escludere; se però si possiede un teorema di esistenza (quello di Weierstrass, per il caso citato) l'argomentazione è sufficiente (ma non più così elementare).
Metodi elementari. - a) Si possono dire diretti i metodi fondati sulla dimostrazione di diseguaglianze che, potendosi scrivere sotto la forma:
rappresentano altrettante proprietà di massimo o minimo. Rientrano in questo, salvo la forma, i procedimenti classici, sino al Torricelli. Un gruppo notevole è quello che fa capo alla diseguaglianza, dimostrata per la prima volta in modo rigoroso da A.-L. Cauchy (1821) tra la media geometrica e l'aritmetica di n numeri positivi:
dove l'eguaglianza vale solo se x1 = x2 = xn. Ponendo qui x1 + x2 + ... + xn = s, si ha
onde "se n numeri positivi hanno la somma costante, il loro prodotto è massimo se essi sono eguali".
Se ne può dedurre il teorema più generale: se n numeri positivi hanno somma costante s, il massimo di x1k1 x2k3 ... xnkn, dove i ki sono interi positivi, si ha se le basi sono proporzionali agli esponenti
Questo teorema ha molte applicazioni; esso dà, p. es., il massimo di senm x cosn x, per x acuto. Ci si riduce infatti al massimo della funzione (sena x) m (cos2 x)n dove è sen x + cos2 x = 1; si trova così tg x = √m/n.
Un'applicazione più vasta è rappresentata dal metodo di Grillet o dei fattori indeterminati, che conduce a trovare il massimo della funzione
(i ki interi e positivi) in uno degli intervalli compresi tra due radici consecutive, in cui fx sia positiva. Converrà esporre il metodo nel caso semplice k1 = k2 = ... = kn = 1, cioè per la funzione
Si comincia a sostituire alla f (x) la funzione
dove le λi sono costanti da determinarsi con le condizioni seguenti: 1. che la somma dei fattori del secondo membro non dipenda da x, e sia quindi costante; 2. che esista un valore di x, nell'intervallo considerato, che renda eguali e positivi tutti i fattori. Si trova che a queste condizioni si può sempre soddisfare; e il valore di x risultante dà il massimo.
Convenientemente adoperato, questo metodo porta a trovare tutti gli estremi della f(x), cioè di un qualunque polinomio a radici tutte reali o per meglio dire riduce la ricerca alla risoluzione di un'equazione algebrica (che è poi l'equazione derivata f′ (x) = 0; v. più avanti).
b) Con mezzi elementari si dimostrano varie diseguaglianze tra medie, o più generalmente tra funzioni simmetriche di n numeri positivi, che sono analoghe a quella di Cauchy e dànno altrettante proprietà di massimo o minimo. Citiamo solo la relazione tra la media aritmetica e la media quadratica di n numeri
che dà il teorema: "se la somma di n numeri positivi è costante, la somma dei loro quadrati è minima quando gli n numeri sono eguali".
c) Quando nella diseguaglianza di Cauchy si ponga x1 x2 ... xn = p, essa si può scrivere x1 + x2 + ••• + xn ≥ n n√p cioè:
donde il teorema: "se il prodotto di n numeri positivi è costante, la loro somma è minima se gli n numeri sono eguali". Esso appare legato al teorema dato in a) da una specie di reciprocità o dualità. Analoghe trasformazioni si possono fare su tutte le formule di questo tipo. Ma la cosa è più generale; sussiste infatti il seguente principio di reciprocità: "Se le due funzioni y e z delle stesse variabili x1, x2, ... sono tali che y avendo un valore costante c, il massimo di z è una certa funzione ϕ(c) crescente con c, allora se z ha il valore costante ϕ(c) sarà c il minimo di y.
d) Rientrano in sostanza tra i metodi diretti quei procedimenti che da antichi e moderni sono stati usati per trovare gli estremi di grandezze geometriche, valendosi di considerazioni geometriche elementari. Essi raggiungono spesso rapidità ed eleganza notevoli, ma per la loro varietà stessa non è possibile riassumerne il carattere. Si riducono sempre a ogni modo alla prova di diseguaglianze, in cui ha naturalmente una parte preponderante la proprietà di minimo del segmento: "in un triangolo un lato è minore della somma degli altri due".
Daremo solo un cenno di alcuni procedimenti e risultati notevoli. Data una retta r e due punti A e B dalla stessa parte di essa, si voglia trovare su r un punto X tale che AX + XB sia minimo (fig. 3). Preso il simmetrico B′ di B rispetto ad r, si ha, comunque sia preso X sulla retta, AX + XB = AX + XB′; ora il minimo di AX + XB′ è il segmento AB′, che ci dà per X la posizione cercata. Essa è tale che AX e XB formano angoli eguali con la normale ad r in X; è evidente il legame col principio ottico di Fermat.
Con questa trasformazione per simmetria, eventualmente ripetuta, si risolvono varî problemi analoghi; in particolare quello di "inscrivere in un triangolo il triangolo di perimetro minimo". Se il triangolo è acutangolo si trova il triangolo che ha per vertici i piedi delle altezze; le altezze ne bisecano gli angoli. Se è ottusangolo non vi è un triangolo di perimetro minimo: vi è un limite inferiore dei perimetri dato dal doppio dell'altezza minore.
Fu già accennato al problema proposto da Fermat: "trovare nel piano di un triangolo il punto per il quale è minima la somma delle distanze dai vertici". Se gli angoli del triangolo sono 〈 120° il punto è interno al triangolo ed è tale che le sue congiungenti con i vertici formano angoli eguali (a 120°); se vi è un angolo > 120°, il punto è il vertice di questo.
Se deve essere minima la somma dei quadrati delle distanze, il punto è il baricentro. Più generalmente, se, essendo A1, A2, ..., A2 n punti e k1, k2, ... kn numeri reali di somma positiva, deve essere minima la somma Σki OAi2, il punto O deve essere il baricentro dei punti Ai con le masse ki.
Se per un punto deve essere minima la somma dei quadrati delle distanze dai lati di un triangolo, il punto deve avere le distanze dai lati proporzionali ai lati stessi (punto di Lemoine, per cui passano le simmediane).
In un triangolo, la distanza tra il centro O del cerchio circoscritto e quello I del cerchio inscritto è data da OI2 = R2 − 2 Rr, dove R, r sono i raggi dei due cerchi. Ne segue R − 2 r; vale l'eguaglianza se O coincide con I, cioè nel triangolo equilatero. Di qui: "fra i triangoli inscritti in un cerchio, l'equilatero ha il massimo cerchio inscritto"; e il teorema duale. Il metodo è applicabile in varî casi.
Sono stati qui lasciati da parte i numerosissimi problemi con carattere isoperimetrico (v. isoperimetri).
e) Il legame già notato tra la discussione dei problemi e le proprietà di massimo e minimo dà luogo a un metodo, che può dirsi indiretto, per trovare gli estremi assoluti di una funzione y = f(x) in un dato intervallo. Si supponga dato y e si cerchino i corrispondenti valori di x, o per lo meno le condizioni perché ne esistano nell'intervallo. Se queste condizioni avranno la forma a ≤ y ≤ β, sarà α il minimo, β il massimo cercato; sarà facile poi trovare gli estremanti. Se si trova solo y ≤ α o y ≤ β, vi sarà solo il minimo o solo il massimo. La condizione y > α (non y = α) darà a come limite inferiore, non raggiungibile.
Le possibilità del metodo sono limitate in quanto le sole equazioni che si sappiano discutere in modo semplice e rapido sono quelle di 2° grado. Ad ogni modo esso serve bene per i numerosi problemi elementari che conducono a funzioni di uno dei tipi:
Per la prima funzione si trova, per es., l'estremante x = − b/(2 a), e l'estremo y = (4 ac − b2)/(4 a); esso è un minimo se a > 0, un massimo Se a 〈 0.
Metodo differenziale. - a) È caratteristica dei metodi elementari di fornire, come loro risultato immediato, gli estremi assoluti; indirettamente, talvolta, estremi relativi. Quando infatti si trova con questi metodi il massimo valore di una funzione in un dato campo e il punto estremante cade nell'interno del campo, si ha quivi un massimo relativo.
Decisamente opposto è il carattere dei metodi infinitesimali, i quali hanno per scopo immediato la ricerca degli estremi relativi; da questi è facile in generale passare agli estremi assoluti (v., più avanti, f).
Il principio del metodo si può rintracciare già nell'osservazione di Oresme e di Keplero che una variabile nell'avvicinarsi a un suo estremo rallenta indefinitamente la sua variazione. Così un mobile, che, dopo aver proceduto in un dato senso, inverta il suo movimento, negli istanti prossimi a quello dell'inversione va lentissimamente.
È questa la circostanza che rende nella pratica sperimentale tanto facile la determinazione dei valori estremi quanto difficile quella delle condizioni in cui essi vengono assunti. Ecco un esempio. Un raggio che colpisce un prisma trasparente ortogonalmente ai suoi spigoli viene deviato; facendo rotare il prisma in un senso opportuno, la deyiazione diminuisce prima rapidamente, poi lentamente; vi è una posizione in cui per piccoli spostamenti del prisma il raggio sembra immobile: è la posizione di deviazione minima. Ciò favorisce la misura della deviazione minima; difficile è invece fissare in quale posizione del prisma essa avvenga.
Fermat sfrutta questo principio, ponendo quasi eguali il valore estremo f (A) della funzione e un valore vicino f (A + E), e poi trasforma l'equazione f (A + E) − f (A) = 0, nei casi elementari che egli tratta, dividendola per E, e ottenendo così una relazione non più identica per E = 0. Da essa, appunto per E = 0, ottiene i valori estremanti di A. In termini moderni, egli calcola il rapporto
degli incrementi della funzione e della variabile e poi fa tendere E a zero; il limite, eguagliato a zero, dà l'equazione da cui si ricava A.
Il limite considerato essendo semplicemente la derivata di f (x) (v. differenziale, calcolo), si ha dunque qui la regola fondamentale: "nei punti di massimo o minimo la derivata si annulla.
Newton, appoggiandosi all'interpretazione cinematica, da lui preferita (variabile = tempo, funzione = spazio) precisa in questo senso il ragionamento di Fermat: la derivata è la velocità, che nei punti estremi è nulla, perché se tale non fosse, il mobile dovrebbe proseguire in un senso o nell'altro. Il Leibniz si riferisce invece alla rappresentazione cartesiana della funzione, e vede che nei punti di massimo o minimo la tangente è parallela all'asse delle ascisse (fig. 4). Il coefficiente angolare, cioè la derivata (per il Leibniz il differenziale) deve dunque essere eguale a zero.
Le trattazioni moderne hanno dato a queste intuizíoni la necessaria esattezza, precisando che affinché ll risultato valga, occorre che nel punto estremante la derivata sia finita; si possono avere estremi anche con una derivata infinita, ma allora essa vale da una parte + ∞, dall'altra − ∞. È il caso della cuspide (v. curve), già notato da G.-F.-A. De L'Hôpital (1695); lo presenta la curva y = x2 3 per x = 0 (fig. 5).
b) La condizione dell'annullarsi della derivata è (nell'ipotesi che questa sia finita) necessaria per l'estremo, non sufficiente, come mostra la funzione y = x3 per x = 0 (fig. 6); inoltre non si ha in essa alcun criterio per distinguere il massimo dal minimo. Cauchy notò che se la derivata è positiva prima di a, negativa dopo a, si ha un massimo; si ha un minimo se si hanno i segni opposti.
È in generale preferito il criterio della derivata seconda (Leibniz): se in un punto dove è nulla la derivata prima, è negativa la derivata seconda, si ha un massimo; se è positiva si ha un minimo. Più generalmente (e si ha Così un criterio che in pratica risolve sempre la questione), vale la regola (Maclaurin): si calcolino le successive derivate della funzione sino a trovarne una che non si annulli nel punto; se questa è di ordine pari si ha un massimo o un minimo secondoché essa è negativa o positiva, se è di ordine dispari non si ha né massimo né minimo. In quest'ultimo caso, se la derivata prima si annulla, la tangente traversa la curva: si ha un flesso (v. curve) a tangente parallela all'asse delle x.
c) Per le funzioni di più variabili che ammettono in un dato campo derivate parziali finite si ha come condizione necessaria per un estremo relativo che le derivate parziali siano tutte nulle (Eulero). Applicato, p. es., a una funzione z = f (x, y) di due variabili e alla superficie che la rappresenta in coordinate cartesiane, questo criterio esprime che le sezioni della superficie con i piani paralleli ai piani xz e yz condotti per un punto di massima o di minima ordinata debbono avere in quel punto le tangenti parallele al piano xy. Si comprende che ciò non basta: le due sezioni debbono avere nel punto ambedue un massimo o ambedue un minimo. Ma ciò non dice ancora nulla sulla forma del rimanente della superficie nell'intorno del punto; le condizioni sufficienti per l'estremo possono dunque risultare solo da uno studio assai minuto.
Questo studio si imposta, secondo il Lagrange, sull'esame delle forme (o polinomî omogenei) dei varî gradi in cui si spezza l'incremento f (x0 + h, y0 + k) − f (x0, y0) secondo la formula del Taylor, cioè delle forme date in scrittura simbolica da
le quali tengono qui il posto delle derivate successive della regola di Maclaurin (più esattamente dei monomî hn f(n) (x0)/n!). Se la prima Fr di queste forme che non si annulli identicamente è definita (cioè conserva sempre uno stesso segno ed è, quindi, anzitutto di grado pari) si avrà in (x0, y0) un estremo della f; un massimo se Fr è negativa, un minimo se è positiva. Se Fr è indefinita (p. es. di grado di pari) non si ha né massimo né minimo.
Per questi casi il problema viene così ridotto a una difficile questione Algebrica: quella di riconoscere se una forma è o no definita; essa non è ancora risoluta in generale. Una soluzione esplicita si ha però per r = 2, alquanto complessa tuttavia nel caso di n variabili. Per due variabili x, y essa si enuncia nel modo seguente: se nel punto (x0, y0) si annullano le derivate prime e l'espressione (detta oggi hessiano della f)
è positiva, si ha nel punto un estremo relativo, e precisameme un massimo se le derivate ∂2f/∂2x2, ∂2f/∂y2, che necessariamente hanno lo stesso segno, sono negative, un minimo se sono positive. Se H è negativo non si ha nel punto né un massimo né un minimo.
Il caso escluso H = 0 appartiene al gruppo dei casi di una Fr semidefinita (cioè sempre ≥ 0 o ≤ 0), per cui bisogna ricorrere a metodi speciali (L. Scheeffer, E. Goursat, F. Severi) che in pratica conducono sempre allo scopo.
Nel caso di due variabili, i tre casi H > 0, H = 0, H 〈 0, corrispondono ai tre caratteri che può avere il punto (x0, y0, z0) sulla superficie = z = f(x, y) e cioè di essere ellittico, parabolico o iperbolico (v. superficie).
d) Teoricamente riducibile al precedente, ma in pratica più agevole a trattarsi direttamente, è il caso della ricerca degli estremí di una funzione di più variabili, le quali non siano indipendenti, bensì legate da una o più relazioni. Per es., se si ha una curva di equazione ϕ (x, y) = 0 e si cerca su essa un punto in cui risulta massimo o minimo il valore di una certa quantità, definita in ogni punto del piano e quindi rappresentabile con una funzione f (x, y) delle coordinate del punto, si ha un problema di questo genere. L'analogo problema per una curva gobba, definita come intersezione di due superficie ϕ1 (x, y, z) = o, ϕ2 (x, y, z) = 0 conduce invece al massimo di una funzione di tre variabili, legate da due relazioni. E così via.
Lagrange ha dato un metodo molto elegante per trattare queste questioni (metodo dei moltiplicatori). Sia f(x1, x2, ..., xn) la funzione data, ϕi (x1, x2, ... xn) = 0, con i = 1, 2,.... m, le equazioni di condizíone. Si considera allora la funzione F = f + Σλiϕi dove le λi sono costanti da determinare, e si scrivono le equazioni ∂F/∂xi = 0, a cui debbono soddisfare i suoi estremanti. Queste equazioni e le ϕi = 0 costituiscono un sistema di m + n equazioni in m + n incognite (le λi, e le xi) e da esse queste si potranno ricavare; o meglio, eliminando le λi, si ricaveranno le x,.
Sono queste condizioni necessarie per l'estremo; delle condizioni sufficienti non possiamo qui occuparci.
e) È interessante notare che con i metodi differenziali ogni proprietà di massimo o minimo che riguardi punti variabili su linee o superficie viene trasformata in una proprietà di derivate prime, che si potrà interpretare come proprietà di rette o piani tangenti, di rette o piani normali. Ecco alcuni esempî notevoli: I segmenti massimi o minimi tra quelli che congiungono un punto fisso con un punto di una linea o superficie sono normali a questa. I segmenti massimi o minimi tra quelli che congiungono un punto di una linea o superficie con un punto di un'altra linea o superficie sono normali ad ambedue.
Se A, B sono punti fissi, P un punto variabile su una linea o superficie, e la somma AP + PB ha un massimo o un minimo, la bisettrice dell'angolo APB deve essere normale alla linea o alla superficie. Se più generalmente deve essere massimo o minimo AP/a + PB/b (a e b costanti), e si tratta, per es., di una superficie, la normale PN alla superficie deve stare nel piano APB e deve essere sen (APN): sen (BPN) = a : b (principio di Fermat per la riflessione e rifrazione).
Si noti che se la condizione geometrica risulta dovunque verificata, la quantità di cui si cercano gli estremi deve aver dovunque l'estremo e quindi esser costante. Così se, variando P su una linea, OP deve essere sempre normale a questa, sarà OP = costante, e P descriverà una linea sferica; se, la linea essendo piana, l'angolo APB deve essere dimezzato dalla normale, AP + PB sarà costante e la linea un'ellisse, ecc. L'osservazione risale a E. Waring.
j) Come si è accennato, i metodi differenziali, atti per loro natura a fornire estremi relativi, permettono di trovare indirettamente anche estremi assoluti. Così per una funzione continua f (x), definita per a ≤ x ≤ b, il massimo assoluto è o un massimo relativo o f (a) o f (b); quindi il più grande tra questi numeri. Per una funzione di più variabili, definita in un campo chiuso C, il massimo assoluto è il più grande tra i seguenti valori: massimi relativi, massimo dei valori al contorno; quest'ultimo massimo si ricava a sua volta risolvendo una questione analoga, ma in generale più semplice.
g) Sono frequenti i casi in cui le difficili discussioni a cui dà luogo talvolta la ricerca degli estremi possono essere evitate con considerazioni che fanno capo al teorema di esistenza. P. es. se una funzione si annulla su tutto il contorno di un campo, e non è sempre nulla, essa assume entro il campo o il valore massimo o il minimo, o ambedue. Se vi è quindi entro il campo un solo punto in cui le derivate prime si annullano, esso è l'estremante cercato.
Indipendentemente da queste considerazioni, di carattere rigoroso, si evitano spesso in pratica le citate discussioni appoggiandosi, sia a una convinzione intuitiva, sia all'esperienza, da cui risulti che il massimo o il minimo effettivamente esistono. Benché privi di valore teorico, questi procedimenti sono però per il fisico e l'ingegnere, almeno come mezzi di ricerca, di incontestabile utilità.
Bibl.: Per i metodi elementari, v. A. Padoa, in Questioni riguardanti le matem. elem., raccolte da F. Enriques, III, Bologna 1927. Per i metodi differenziali, F. Enriques, ibid., vol. III, e i trattati di calcolo differenziale (v. differenziale, calcolo). Per i metodi sintetici, oltre la citata voce isoperimetri, R. Sturm, Maxima und Minima in der elementaren Geometrie, Lipsia 1910.