FUNZIONALE, ANALISI (v. funzionali, XVI, p. 180)
Portano questo nome gli sviluppi più moderni dell'analisi matematica, generati dalla fecondazione che le teorie classiche hanno ricevuto dalla topologia e dall'algebra astratte. Il nome è talvolta sostituito da quello di "Analisi astratta". La sua origine risale alla fine del sec. 19; particolarmente nei lavori di V. Volterra (1860-1940) che introdusse il termine "funzionale" per indicare una variabile reale dipendente non da un'altra variabile reale, ma da un'intera funzione. Fu allora subito evidente la differenza concettuale fra un funzionale F(f) e una funzione composta Φ[f (x)], questa seconda dipendendo non dall'intera funzione f (x) come tale, ma dai singoli valori che la f (x) assume al variare della x. È un funzionale, per es., un integrale
fra estremi prefissati a, b.
Ma furono i fondatori della topologia astratta, F. Hausdorff (1868-1942), M. Fréchet (1878-1973), L. E. J. Brouwer (1881-1966) e altri, ad arricchire l'analisi, attraverso opportuni, geniali procedimenti di astrazione e di generalizzazione, di una nuova visione di grande profondità e ampiezza, feconda di risultati generali e di notevole capacità applicativa. Questo arricchimento si è avuto tanto nella teoria generale delle funzioni, particolarmente nel problema dell'inversione, quanto in quella delle equazioni, infine nella scoperta di nuovi capitoli dell'analisi matematica. Il più importante di questi sembra essere quello delle "distribuzioni", (v. distribuzioni, teoria delle, in questa Appendice). Ma occorre iniziare il discorso con alcuni appropriati concetti di topologia astratta.
I) Spazio vettoriale. - È così chiamato (anche "lineare", da taluni autori) un insieme S di elementi ("vettori", o anche "punti") x, y, ... fra i quali sia definita un'operazione di composizione, detta "somma" x + y, e una "moltiplicazione" αx di un elemento qualunque x ∈ S per un qualunque scalare α (elemento appartenente a un corpo commutativo), in modo che riescano verificate le seguenti proprietà:
A) I risultati delle dette operazioni sono sempre vettori (cioè elementi di S);
B) 1) (x + y) + z = x + (y + z), (S-104???x, y, z) (proprietà associativa);
2) x + y = y + x (S-104???x, y) (proprietà commutativa);
3) Esiste un vettore ω ∈ S (detto "zero" o "origine" di S), tale che x + ω = x, (S-104???x);
4) S-104???x, esiste un elemento indicato con −x (∈S, detto "opposto" di x), tale che x + (− x) = ω. Per semplicità si scrive x − y in luogo di x + (− y).
3) α(βx) = (αβ)x, (S-104???x; S-104???α, β);
4) 1 • x = x, (S-104???x).
Di regola si assumono come scalari i numeri a, b, c, ..., reali o complessi, e corrispondentemente S si chiama uno spazio vettoriale "reale", o, rispettivamente, "complesso". È quanto faremo nel seguito, tralasciando per semplicità l'aggettivo "reale", o l'aggettivo "complesso" (Deve allora intendersi il discorso come indifferentemente valido nei due casi; se il contrario si presenta, l'aggettivo verrà specificato).
Si dimostra immediatamente che
II) Spazio vettoriale normato. - Un0 spazio vettoriale S è così chiamato, se in esso è definita una funzione reale che indicheremo col simbolo ∥Ix∥ e chiameremo "norma" di x, con le seguenti proprietà:
A) ∥x∥ > 0, (S-104???x ≠ ω);
B) 1) ∥ax∥ = ∣a∣ • ∥x∥, (S-104???a, x), da cui si deduce subito che ∥ω∥ = 0, ∥− x∥ = ∥x∥ (S-104???x);
2) ∥x + y∥ ≤ ∥x∥ + ∥y∥, (S-104???x, y) (proprietà "triangolare", da cui si deduce che ∣∥x∥ − ∥y∥∣ ≤ ∥x + y∥).
Se, S-104???x, y, si pone: d(x, y) = ∥x − y∥, si viene a definire una funzione reale, non negativa, delle coppie di elementi x, y (cioè una funzione in S × S), alla quale può darsi il nome di "distanza", acquistando così S una struttura di "spazio metrico" e quindi anche topologico (precisamente nel senso di Hausdorff).
In uno spazio vettoriale normato, introdotta (come sempre si sottintende) una distanza nel senso detto, si può parlare dunque di "convergenza". Perciò, trattandosi, per es., di una successione {xn} di vettori, si dirà che essa converge (s'intende: "in norma") a x, e si scrive
(v. limite in questa App.), se è
E condizione necessaria (detta "di Cauchy") affinché una successione converga, è che riesca:
Una successione soddisfacente alla condizione di Cauchy, si dice una "successione principale, o di Cauchy".
Si dimostra subito che ogni spazio vettoriale normato è connesso.
III) Spazio di Banach. - In uno spazio vettoriale normato S possono esistere successioni di Cauchy non convergenti. Ma se S è tale che ogni successione di Cauchy sia convergente, allora S si dice "completo" (termine d'uso generale in topologia). Uno spazio vettoriale normato che sia anche completo, prende il nome di "spazio di Banach".
Esempi.
1) L'insieme S delle funzioni reali x = x(t) che sono continue nell'intervallo chiuso [0, 1], è uno spazio vettoriale reale (ovviamente intendendo le due operazioni di somma e di moltiplicazione nel modo solito, corrispondentemente a ogni singolo valore di t, e assumendo per ω la costante 0). Specificando la struttura di tale insieme con opportune definizioni della norma ∥ x ∥, possono ottenersi altrettanti spazi vettoriali normati. Per es.:
a) ∥ x ∥ = max ∣ x(t) ∣, (0 ≤ t ≤ 1). Lo spazio, che indichiamo allora col simbolo C0, risulta di Banach. Si usa anche dire che si è introdotta in S la "metrica di Lagrange".
Sia CL tale spazio, che si dice ottenuto introducendo in S la "metrica di Lebesgue". Se consideriamo la successione di funzioni xn = xn(t) ∈ CL così definite:
si trova che è
con
ma x(t) ∉ S. D'altra parte
e quindi
Dunque CL non è completo, cioè non è uno spazio di Banach.
2) L'insieme L(p) con 1 ≤ p 〈 + ∞ delle classi di funzioni reali x = x(t) misurabili (secondo Lebesgue) e di potenza p-esima sommabile (secondo Lebesgue) su [0, 1], è uno spazio vettoriale (si tratta di "classi" di funzioni, in quanto s'identificano due funzioni che differiscono su un insieme di misura nulla). Scegliendo:
tale spazio è di Banach. Per p = 2, lo spazio L(2) è, come si dice, di Hilbert.
IV) Spazi separabili. - Sono così chiamati quei particolari spazi metrici S che contengono una successione B (chiamata "base" di S) di punti "densa su di essi". Cioè: S-104???x ∈ S, deve potersi estrarre una successione {xn} (n = 1, 2, 3, ...) da B, tale che
Così si dimostra facilmente che sono separabili: lo spazio C0 dell'es. III. 1ª), lo spazio L(p) dell'es. III. 2), ecc.
V) Varietà lineari di uno spazio vettoriale normato. - Sia Σ un tale spazio che, per semplicità, supporremo reale. Un insieme V ⊆ Σ si dice una "varietà lineare" se, presi comunque 2 punti x1, x2 ∈ V e 2 numeri reali c1, c2, anche il punto c1x1 + c2x2 appartiene a V. Evidentemente è ω ∈ V, S-104???V ⊆ Σ.
VI) Funzionali lineari. - Nell'a. f. interessano le funzioni numeriche F(x), il cui insieme A di definizione sia contenuto in uno spazio del tutto generico. Qui ci limitiamo a considerare funzioni F(x) reali definite in A ⊆ Σ, essendo Σ uno spazio vettoriale normato. Seguendo l'uso, chiamiamo F(x) un "funzionale".
Un tale funzionale F(x) si dice "continuo" in A, se è continuo in ogni punto x0 di A che sia d'accumulazione per A (cioè se
Particolarmente importanti sono i funzionali F(x) definiti sulle varietà lineari (cioè A =V ⊆ Σ). Per essi s'introducono i seguenti concetti.
a) F(x) "additivo" in V, quando
b) F(x) "omogeneo" in V, quando
c) F(x) "lineare" in V, quando F(x) è simultaneamente continuo e additivo in V.
Si dimostra che, per ogni F(x) additivo oppure omogeneo in V, risulta F(ω) = 0, e che ogni F(x) lineare in V, è ivi anche omogeneo. Si dimostrano inoltre i fondamentali teoremi:
1) Affinché un funzionale F(x), additivo su una varietà lineare V, sia ivi continuo, è necessario e sufficiente che esista un numero positivo M tale che risulti ∣F(x)∣ ≤ M ∥x∥, (S-104???x ∈ V).
2) (Teorema di H. Hahn e S. Banach, detto "del prolungamento"). Per qualunque funzionale F(x), lineare su una varietà lineare V di uno spazio Σ di Banach, è possibile definire in tutto Σ almeno un funzionale lineare Φ(x), tale che sia
Applicando il teorema precedente, si può prendere per M il minimo del numero positivo ivi indicato, adottando per esso rispettivamente i simboli:
talché si avrà
Il teorema di Hahn e Banach si completa allora, dimostrandosi che è
VII) Trasformazioni funzionali. - Nell'a. f. interessano anche funzioni T(x) il cui insieme A di definizione sia contenuto in uno spazio Σ di Banach, e i cui valori x′ = T(x) appartengano anch'essi a uno spazio Σ′ di Banach (non necessariamente distinto da Σ). Si dice che una tale funzione definisce una "trasformazione funzionale" di A.
Una tale trasformazione T(x) si dice "completamente continua" in A, se:
1) T(x) è continua in A,
2) T(x) trasforma ogni porzione limitata di A in un insieme compatto di punti di Σ′ (Per i concetti di "limitatezza" e di "compattezza", v. limite in questa App., tenendo conto che Σ e Σ′ sono spazi metrici).
Quando A sia una varietà lineare V ⊆ Σ, presentano particolare importanza anche le definizioni a1), b1), c1) che si ottengono rispettivamente dalle a), b), c) del n. VI, sopra enunciate, quando in esse si sostituisca la lettera T alla F. Analogamente si dimostra che, per ogni trasformazione T(x) additiva oppure omogenea in V, risulta T(ω) = ω′ (zero di Σ′), e che ogni T(x) lineare in V, è ivi anche omogenea. Così pure vale l'analogo del teor. VI. 1), ove la maggiorazione indicata venga sostituita dall'altra:
Il fondamentale problema dell'invertibilità d'una trasformazione funzionale consiste nel considerare la relazione
come un'equazione nell'incognita x. Esso si articola, a priori, nelle due questioni seguenti:
a) Supponendo di aver sostituito nella [1] un ben determinato punto x′ ∈ Σ′, è la [1] stessa risolubile?
b) Se la domanda precedente ammette risposta positiva, quante e quali sono le soluzioni della [1]?
Ovviamente la domanda a) ammette risposta positiva se, e solo se, indicato con A l'insieme di definizione della T(x), venga scelto x′ nell'immagine o trasformato A′ = T(A) di A in Σ′. E la domanda b) acquista particolare interesse quando esista un sottoinsieme B ⊆ A che corrisponda biunivocamente, per effetto della T(x), alla sua immagine B′ = T(B), e si scelga x′ in B′: perché, in tal caso, la cercata soluzione x della [1] è unica. Si dice allora che la T(x) è "univocamente invertibile", o semplicemente "invertibile" in B.
Se T(x) è definita in tutto Σ e ivi invertibile, e se T(Σ) = Σ′ (cioè se B = A = Σ e B′ = A′ = Σ′), si dice che T(x) è "completamente invertibile".
Se A è una varietà lineare V (n. V) di Σ, allora anche l'immagine V′ = T(V), per effetto d'una trasformazione lineare, è una varietà lineare di Σ′; se inoltre la T(x) è invertibile in V, allora la trasformazione:
inversa della [1], risulta additiva e omogenea in V′. Infine, se la trasformazione lineare T(x) è invertibile in V, e se le due varietà lineari V ⊆ Σ, V′ = T(V) ⊆ Σ′ sono entrambe chiuse, allora la trasformazione inversa [2] risulta anch'essa lineare.
Il problema dell'invertibilità è stato ampiamente e profondamente studiato per trasformazioni funzionali della forma:
ove S(x) si suppone definita in tutto Σ, ivi lineare e completamente continua (allora dev'essere ovviamente Σ′ = Σ). Una trasformazione come la [3] si dice del "tipo Riesz", e per essa vale il:
Teorema (detto "dell'alternativa"). Per l'equazione di tipo Riesz, nell'incognita x,
si distinguono le due ipotesi possibili:
I) L'equazione, cosiddetta "omogenea associata alla [4]",
ammetta l'unica soluzione x = ω;
II) La [40] ammetta invece un numero finito di soluzioni
linearmente indipendenti, cioè di soluzioni tali che si abbia
solo se c1 = c2 = ... = cn = 0.
Nelle due ipotesi, si hanno rispettivamente l'una o l'altra delle due tesi:
I) La [4] è univocamente risolubile (S-104???x′ ∈ Σ).
II) Esistono n funzionali lineari X1, X2, ..., Xn linearmente indipendenti (la definizione di tale locuzione è analoga a quella di poco sopra), tali che la [4] è risolubile per tutti e soli i punti x′ ∈ Σ per i quali è
Se x′ soddisfa la [5], detta ù una soluzione qualunque della [4], ogni altra soluzione della stessa [4] è della forma
ove le ci sono n costanti reali arbitrarie.
Se, nelle [4] e [40], s'introduce un parametro reale λ, scrivendo le due equazioni nella forma più generale:
si può ancora dimostrare che i valori del parametro λ per i quali la [40′] ammette soluzioni ≠ ω, costituiscono al più un'infinità numerabile priva di punti d'accumulazione al finito. Tali valori di λ prendono il nome di "autovalori" della [40′], o anche della [4′].
I teoremi qui enunciati costituiscono il fondamento di una teoria generale nella quale rientrano, come casi particolari (e quindi con enorme economia di strumenti dimostrativi), molte trattazioni tradizionali ormai classiche: per es. quella delle equazioni integrali lineari di Fredholm (con contributi metodologici originali di R. Caccioppoli, 1938), quella del problema di Dirichlet, ecc.
VIII) Contrazioni e teorema del punto unito. - Una trasformazione funzionale x′ = T(x), definita come nel n. VII, si dice "lipschitziana" (dal nome dell'analista tedesco R. O. S. Lipschitz, 1832-1903) nel sottoinsieme B ⊆ A, se esiste una costante reale M > 0 tale che
È immediato che una tale trasformazione è continua in B. Ma esistono trasformazioni continue non lipschitziane, per es.:
Se Σ = Σ′ e se M 〈 1, la trasformazione lipschitziana suol chiamarsi una "contrazione" di B perché, interpretata geometricamente, la sua proprietà caratteristica consiste nel ridurre le distanze ∥ x2 − x1 ∥ di tutte le coppie di punti di B, in distanze ∥ T(x2) − T(x1) ∥ minori (anzi minori in rapporto non superiore a una costante M 〈 1. Il termine "contrazione" diviene particolarmente significativo quando T(x) trasforma B "in sé", cioè quando l'immagine B′ = T(B) sia contenuta in B (v. la simbolica fig. 1, ov'è posto x1′ = T(x1), x2′ = T(x2)).
Il seguente teorema (detto "del punto unito)) è fondamentale in tutta l'a. f. moderna: "se T(x) è una contrazione di B in sé e B è compatto, allora l'equazione x = T(x) ammette una e una sola soluzione ù in B".
Esempi.
1) T(x) sia una funzione reale f (x) di una variabile reale x, definita nell'intervallo chiuso [a, b], ivi dotata di derivata prima limitata. Si avrà, per il teorema della media,
Posto M = estr. sup. ∣ f ′(x) ∣〈 + ∞ (S-104???x ∈ [a, b]), risulta
La f (x) è dunque lipschitziana in [a, b] ed è anzi ivi una contrazione nell'ipotesi M 〈 1. Se a tale ipotesi si aggiunge quella che l'immagine f ([a, b]) sia contenuta in [a, b], il teorema del punto unito assicura l'esistenza di uno ed un solo valore ù in [a, b], tale che ù = f (ù). La fig. 2 rende intuitiva questa conclusione.
La dimostrazione, che suol darsi del teorema del punto unito, indica anche il "metodo di approssimazioni successive" per avvicinarsi, quanto si vuole, alle soluzione ù cercata. Esso consiste nel partire da un valore x0 genericamente prefissato in B e nel calcolare le successive "iterate" xn+1 = T(xn) (n = 0, 1, 2, ...). Si avrà allora:
Per l'es. in esame, il metodo ha origini molto antiche (arabe e forse addirittura greche), e un'importante interpretazione geometrica (fig. 3): questa invece venne trovata nel sec. 17°, nel clima della scoperta della geometria analitica. Nel sec. XX ha avuto varie generalizzazioni e numerose applicazioni, in particolare alle equazioni differenziali (cosiddetto metodo della "gabbia" di E. Stiefel, 1952).
2) x′ = T(x) sia la trasformazione
Supponendo x(t) variabile nell'insieme C0 delle funzioni continue in [0, h], insieme che, come sappiamo (n. III, es.1, a), è, con la metrica di Lagrange, uno spazio di Banach, il secondo membro della [5] è una trasformazione funzionale di tale spazio in sé.
Per tale trasformazione, risulta, S-104???t ∈ [0, h]:
La [5] è pertanto lipschitziana e, per h 〈 1, risulta essere una contrazione. Se ne deduce che l'equazione funzionale, cosiddetta "equazione integrale di Volterra di 2ª specie",
ammette una e una sola soluzione continua in [0, h]. Per trovarla, si può applicare il seguente metodo di "approssimazioni successive", espresso dalla formula ricorrente:
Come "approssimazione iniziale", si assume il valore costante x0(t) = 0 (con t ∈ [0, h]), che soddisfa ovviamente al "valore iniziale" x(0) = 0 imposto dalla [6]. si ottiene allora successivamente:
Osservando che l'espressione trovata, per l'n-esima approssimazione xn(t), è quella dell'n-esima ridotta della serie esponenziale, risulta:
La funzione ù(t) = exp t − 1 è dunque la cercata soluzione della [6], e la convergenza [7] che, com'è noto da teoremi elementari sulle serie di potenze, è uniforme in [0, h], può anche interpretarsi come convergenza:
in C0, cioè appunto con la metrica di Lagrange.
La risoluzione della [6], nell'analisi classica, si otteneva con altri procedimenti: per es. con quello, semplicissimo, consistente nel trasformare la [6] in un'equazione differenziale. Infatti, derivando membro a membro la [6], essa diviene: x′(t) = x(t) + 1 e, integrando per separazione delle variabili, dx/(x + 1) = dt, da cui ln ∣ x + 1 ∣ = t + C, ∣ x + 1 ∣ = exp (t + C), e ancora, facendo assorbire il doppio segno alla costante d'integrazione,
Infine, tenendo conto del valore iniziale x(0) = 0, risulta k = 1 e perciò x(t) = exp t − 1, c.d.d.
Il procedimento delle approssimazioni successive sopra indicato è, in sostanza, quello, già noto da tempo, col quale si suol dimostrare l'esistenza e l'unicità della soluzione d'una generica equazione integrale di volterra di 2ª specie. Ma, nell'a. f., tale esistenza e unicità è già dimostrata a priori, in un quadro teorico estremamente più generale, più semplice e di rara eleganza.
Bibl.: V. Volterra, Leçons sur les fonctions de lignes, Parigi 1913; F. Hausdorff, Grundzüge der Mengenlehre, Lipsia 1914; M. Fréchet, Les espaces abstraits, Parigi 1928; S. Banach, Théorie des opérations linéaires, Varsavia 1932; R. Caccioppoli, numerosi lavori pubblicati nei Rendic. Accad. Lincei (1930-1940); v. anche Opere, Roma 1963; N. Bourbaki, Éléments de mathématiques. Théorie des ensembles, Topologie générale, Espaces vectoriels topologiques, Parigi 1938-1955; C. Miranda, Problemi di esistenza in analisi funzionale, Pisa 1948-49; F. Riesz, B. Sz. Nagy, Leçons d'analyse fonctionnelle, Budapest 1955. Si segnala in particolare l'opera di C. Miranda per le sue doti eccezionali di chiarezza, di eleganza e di sintesi: è stata seguita molto da vicino nel presente articolo.