Dal punto utopia all'ottimo paretiano: i problemi di ottimizzazione vettoriale
Nell’usuale ottimizzazione si ha a che fare con un’unica funzione obiettivo che dipende da una o più variabili indipendenti. Si tratta appunto di trovare i valori delle variabili che, per esempio, massimizzano la funzione obiettivo. L’esistenza del valore massimizzante non è a priori garantita ma può essere assicurata da alcune condizioni sufficienti quali per esempio il teorema di Weierstrass (che richiede che la funzione obiettivo sia continua e l’insieme ammissibile sia chiuso e limitato). I metodi per risolvere un problema di ottimizzazione scalare sono diversi a seconda della complessità della questione da affrontare ma sostanzialmente, sia nei problemi di ottimizzazione libera sia in quelli che portano al teorema di → Kuhn-Tucker, si basano su una condizione necessaria del primo ordine (annullamento del gradiente) e una condizione sufficiente del secondo ordine (studio del segno del differenziale secondo).
Nella teoria delle decisioni si ha invece a che fare con più funzioni obiettivo, che dipendono da una o più variabili. Questi obiettivi risultano spesso conflittuali tra di loro; è difficile ordinarli secondo una precisa gerarchia ed è altrettanto problematico trovare un valore delle variabili indipendenti che massimizzi – per brevità vengono omesse le analoghe considerazioni valide nel caso di un problema di minimo – simultaneamente tutti gli obiettivi. La politica, gli affari e in generale ogni decisione che coinvolge una collettività riguarda sempre la soddisfazione di bisogni diversi e di punti di vista tra loro conflittuali. Ma, anche per un singolo individuo, è problematico individuare uno stile di vita che massimizzi la sua ricchezza e nel contempo il suo stato di salute psico-fisico. Non a caso un tale valore da attribuire alle variabili indipendenti, se esiste, è chiamato punto utopia.
Un problema di ottimizzazione vettoriale può essere formalizzato come la ricerca dei valori da attribuire alla variabile indipendente x ∈ Rn in una regione ammissibile solitamente delimitata da disuguaglianze, in modo tale da ottenere il valore massimo per la funzione obiettivo f(x) = (f1(x), f2(x), …, fp(x)).
La prima difficoltà da affrontare è dunque quella di specificare che cosa si intenda per valore di massimo della funzione obiettivo. A differenza di R, l’insieme delle immagini contenuto in Rp è solo parzialmente ordinato. Una prima soluzione è stata data dall’economista italiano Vilfredo Pareto che, in alcuni articoli pubblicati già alla fine dell’Ottocento, introdusse quello che verrà poi indicato con il nome di ottimo paretiano. Un punto x0 è detto ottimo paretiano quando nella regione ammissibile non c’è nessun altro x che permetta di ottenere un valore maggiore per tutte le funzioni obiettivo. In altre parole, un ottimo paretiano è un punto che non è dominato da nessun’altra soluzione: ci possono essere altre situazioni tali da migliorare eventualmente qualche funzione obiettivo, ma non ce n’è alcun’altra che sia decisamente migliore nel senso che migliori tutti gli obiettivi. Formalmente, x0 è un ottimo paretiano quando nella regione ammissibile non esiste alcun x tale che fi(x) > fi(x0) per ogni i = 1, 2, …, p. Naturalmente l’insieme degli ottimi paretiani, detti anche punti efficienti o Pareto-efficienti, contiene il precedente insieme dei punti utopia.
Si può dare un’immagine geometrica degli ottimi paretiani considerando una funzione obiettivo costituita da soli due criteri. In questo caso la condizione per cui non esiste alcun altro x tale che simultaneamente risulti f1(x) > f1(x0) e f2(x) > f2(x0) implica che nello spazio bi-dimensionale delle immagini non c’è alcun punto situato in alto a destra del punto (f1(x0), f2(x0)).
Nel corso di un secolo, la definizione paretiana ha subito varie estensioni. Si è introdotta la differenza tra punti efficienti e punti debolmente efficienti. Si sono date diverse definizioni di punti propriamente efficienti. Ancora, la definizione di ottimo paretiano è stata generalizzata mediante l’introduzione di un generico cono puntato al posto di R+p (così indicando le p-ple ordinate di reali positivi). Infatti la definizione di ottimo paretiano può essere formulata dicendo che nella regione ammissibile non esiste alcun altro x tale che f(x) – f(x0) ∈ R+p ed è questa relazione che può essere generalizzata sostituendo un generico cono puntato al caso particolare di R+p.
Dopo aver dato la definizione di punto efficiente – si torni per semplicità a quella paretiana – il problema che si pone è quello di assegnare condizioni sufficienti che garantiscano l’esistenza di tali soluzioni e di metodi di calcolo per la loro ricerca. Una strada è quella di ripetere nel caso vettoriale quanto già sperimentato per l’ordinaria ottimizzazione scalare, assegnando condizioni simili a quelle di Kuhn-Tucker. Vengono però meno la semplicità della procedura e la possibilità di implementare comodi algoritmi di calcolo. Spesso si preferisce seguire allora l’idea della scalarizzazione. Si tratta di sostituire alla funzione vettoriale f(x) = (f1(x), f2(x), …, fp(x)) una funzione scalare che in qualche modo ne rappresenti tutte le componenti e per la quale l’insieme dei punti di massimo – indubbiamente più semplici da calcolare, perché si tratta di una funzione scalare – sia molto simile all’insieme dei punti Pareto-efficienti. La scalarizzazione più naturale considera la funzione ottenuta sommando le singole componenti della funzione vettoriale, magari moltiplicate per certi “pesi” che ne esprimano l’importanza. Si sostituisce, in altre parole, alla precedente funzione vettoriale la funzione scalare
ottenuta da una combinazione lineare degli originari criteri, e ricercando poi i punti di massimo di questa funzione scalare e le relazioni tra l’insieme di tali soluzioni e i punti di ottimo vettoriale che si volevano determinare. A questo proposito, si dimostra che l’insieme delle soluzioni del problema scalare a cui ci si è ricondotti è contenuto nell’insieme dei punti Pareto-efficienti: tutte le soluzioni trovate tramite la scalarizzazione lineare sono anche soluzioni del problema vettoriale. Ce ne possono tuttavia essere altre che, con questo metodo, sfuggono al calcolo. Questa eventualità viene fugata da opportune condizioni sufficienti. Per esempio, si dimostra che, se l’insieme Z delle immagini è tale che Z + R+p è convesso, allora le soluzioni scalari sono tutte e sole i punti debolmente efficienti oggetto del problema multi-criteria.