CONTROLLI AUTOMATICI
(App. III, I, p. 430; IV, I, p. 523)
Teoria del controllo. - I c.a. hanno vissuto un periodo di profondi mutamenti; ciò è dovuto in massima parte allo sviluppo impetuoso delle nuove tecnologie e alla diffusione dei concetti tipici di tale disciplina in settori non tradizionalmente ingegneristici. Questi due aspetti, seppure distinti, hanno favorito entrambi lo sviluppo di metodi orientati alla concezione di strategie di c. per classi via via più generali di modelli atti a rappresentare processi di diversa natura e complessità; ciò a conforto dell'impostazione teorica del problema in cui viene separata la fase di sintesi, cioè di concezione del controllore tipica della teoria del c., da quelle di analisi (teoria dei sistemi) e di realizzazione tecnica (tecnica dei controlli).
I risultati teorici e le applicazioni più avanzate a partire dagli anni Sessanta caratterizzano la teoria moderna del c. automatico. L'approccio recente nasce con la teoria dei sistemi ed è fondato sulla descrizione del processo mediante un sistema di equazioni differenziali in luogo della matrice delle funzioni di trasferimento (v. servosistema: Funzioni di trasferimento, in App. III, ii, p. 713). La descrizione del processo mediante la matrice delle funzioni di trasferimento, e la conseguente interpretazione in termini di comportamento in frequenza (App. IV, i, p. 523), è legata a particolari ipotesi, quali la linearità e la stazionarietà del processo; inoltre i risultati della teoria classica del c. sono spesso poco chiari e di difficile applicazione nel caso generale di processi a più ingressi e uscite. Il successo della teoria moderna è legato sia alla possibilità di risolvere, utilizzando i potenti mezzi di calcolo oggi disponibili, sistemi complessi non trattabili mediante la teoria classica, sia all'intrinseca caratterizzazione del comportamento nel dominio del tempo che consente l'estensione dei concetti a classi più generali di sistemi.
Nella teoria moderna del c. il processo è rappresentato da un modello matematico che, adottando la notazione vettoriale (v. equazioni, in App. IV, i, p. 714), è del tipo
dx(t)/dt=f(x(t),u(t),z(t)), m(t)=w(x(t),z(t)), y(t)=h(x(t),z(t)). [1]
Il comportamento del processo rispetto al tempo, t, è quindi descritto da cinque tipi di variabili: le variabili di c., u(t), che rappresentano i canali attraverso i quali è possibile modificare il comportamento del processo; i disturbi, z(t), che influenzano il comportamento del processo, sono talvolta misurabili, ma non possono essere modificati; le grandezze misurate m(t); le uscite del processo, y(t), che sono un sottoinsieme delle variabili misurate e rappresentano le grandezze su cui si vuole esercitare il c.; infine, le variabili di stato x(t), che rappresentano, con la loro evoluzione nel tempo, il comportamento del processo nella forma più completa. Le funzioni f, h e w hanno una struttura corrispondente a classi di processi e dipendono da parametri che supporremo noti in una prima fase. Se, per es., tali funzioni sono lineari, il modello matematico rappresenta un processo lineare.
Il modello matematico introdotto può essere assunto a rappresentare una vasta classe di processi che sono caratterizzati dall'evoluzione, in modo continuo rispetto al tempo, di un numero finito di variabili. Nella terminologia della teoria dei sistemi le [1] costituiscono la rappresentazione differenziale con lo stato di un sistema a tempo continuo, stazionario, a dimensione finita.
Una formulazione equivalente viene utilizzata per descrivere i processi a tempo discreto, in cui le evoluzioni avvengono in modo discontinuo a intervalli temporali di ampiezza costante assunta per convenzione unitaria; con le convenzioni adottate e sostituendo nella [1] la derivata rispetto al tempo con il valore dello stato al tempo (t+1), x(t+1), si ottiene una rappresentazione con lo stato di un sistema a tempo discreto, stazionario, a dimensione finita.
Con riferimento allo schema di fig. 1 la teoria del c. studia la concezione del modello matematico del sottosistema che interagendo con il processo nel modo ivi indicato garantisce il soddisfacimento di prefissate specifiche del sistema complessivo. Secondo tale schema la legge di c. dipende dalle variabili misurabili e da ulteriori variabili esterne, v(t); m(t) e v(t) sono gli ingressi del controllore, v(t) sono gli ingressi del sistema di controllo. Si noti che se, come spesso accade, solo le uscite sono misurabili, lo schema di fig. 1 si riduce a quello tradizionale. Se si assume che gli ingressi siano variabili deterministiche e che inoltre le misure non siano affette da rumore, il problema di c. è detto deterministico. Se, invece, si assume che alcuni o tutti gli ingressi siano variabili aleatorie, di cui si conoscono alcune statistiche, e che le misure siano affette da rumore, il problema di c. è detto stocastico.
Le considerazioni che sono alla base della moderna teoria del c. sono legate alla completezza del modello matematico utilizzato per rappresentare un dato sistema. La teoria classica del c. è, come si è detto, fondata sull'utilizzazione della funzione di trasferimento nel rappresentare il comportamento dinamico del sistema di c. e dei sottosistemi che lo compongono. L'opportunità di utilizzare tecniche di sintesi fondate sulla rappresentazione con lo stato fu messa in evidenza negli anni Cinquanta. Per chiarirne le motivazioni si pensi al sistema che si ottiene effettuando una interconnessione in cascata di due processi lineari stazionari in assenza di disturbi. Il sistema risultante, caratterizzato da una funzione di trasferimento pari al prodotto di quelle dei due sottosistemi, può apparire, a seguito di semplificazioni matematiche, di ordine inferiore alla somma degli ordini dei due processi. Ciò corrisponde, necessariamente, a un'inadeguata rappresentazione matematica del comportamento dinamico del sistema complessivo. L'interpretazione di questo fenomeno di semplificazione, talvolta imposto dalla strategia di c. adottata (v. servosistema, in App. III, ii, p. 705), conduce all'adozione della rappresentazione con lo spazio di stato. L'analisi nel dominio del tempo mette bene in evidenza questi aspetti utilizzando i concetti di raggiungibilità e osservabilità.
Raggiungibilità. - Con riferimento a un assegnato sistema la proprietà di raggiungibilità di un insieme di stati è legata all'esistenza di c. in grado di forzare le evoluzioni ad assumere, in un tempo finito, ogni valore in tale insieme. Si consideri, per semplicità, la rappresentazione con lo stato di un sistema lineare stazionario in assenza di disturbi; la caratterizzazione dell'insieme degli stati raggiungibili consente di rappresentare il sistema dato come l'interconnessione, indicata in fig. 2 A, di due sottosistemi: il primo, S1, tutto raggiungibile, l'altro, S2, non raggiungibile. Questa decomposizione mette bene in evidenza che il sistema è rappresentato nel suo comportamento forzato ingresso-uscita dalla sola funzione di trasferimento di S1 che fornisce, comunque, una descrizione inadeguata della dinamica. È inoltre manifesta l'impossibilità di modificare, attraverso le variabili di c., il comportamento del sottosistema non raggiungibile; è quindi necessario, sia in fase di sintesi di strategie di c. su processi intrinsecamente non raggiungibili, sia in fase di valutazione delle prestazioni nel caso in cui appaiano parti non raggiungibili a seguito di una sintesi, verificare il soddisfacimento delle specifiche di progetto da parte del sottosistema non raggiungibile. La proprietà di raggiungibilità permette di spiegare il citato fenomeno di cancellazione nel calcolo della funzione di trasferimento di una interconnessione in cascata; infatti la semplificazione di un fattore comune tra denominatore della funzione di trasferimento del primo sottosistema e numeratore del secondo corrisponde a una perdita di raggiungibilità del sistema risultante che manifesta una struttura interna del tipo indicato in fig. 2 A.
Osservabilità. - La proprietà di osservabilità è in relazione alla completezza delle informazioni contenute nell'andamento delle variabili misurabili in merito al comportamento dinamico del sistema. Più precisamente può accadere che un processo, o un sistema di c., sia caratterizzato dal fatto che le evoluzioni delle grandezze misurate a partire da stati iniziali diversi siano coincidenti. Si dirà in tal caso che il sistema non è tutto osservabile in quanto non è possibile dalle osservazioni distinguere i suddetti stati. Con riferimento, per semplicità, a un sistema lineare stazionario in cui le osservazioni sono assunte coincidenti con le uscite, anche in questo caso la caratterizzazione dell'insieme degli stati non osservabili consente di rappresentare il sistema dato come l'interconnessione, indicata in fig. 2 B, di due sottosistemi: il primo, S1, tutto osservabile, l'altro, S2, non osservabile. Il sistema è rappresentato nel suo comportamento forzato ingresso-uscita dalla sola funzione di trasferimento di S1 che fornisce, comunque, una descrizione inadeguata della dinamica. Tale decomposizione mette bene in evidenza come sia opportuno, in fase di sintesi e in fase di valutazione, adottare opportune cautele. In fase di sintesi, infatti, se il processo non è tutto osservabile, una legge di c. elaborata a partire dalle uscite non potrà consentire modifiche diverse sul comportamento del sistema a partire da stati non distinguibili. Se, invece, a seguito di una sintesi il sistema di c. non è del tutto osservabile, sarà necessario, in fase di valutazione, verificare il soddisfacimento delle specifiche di progetto da parte del sottosistema non osservabile. La proprietà di osservabilità permette di spiegare il citato fenomeno di cancellazione nel calcolo della funzione di trasferimento di una interconnessione in cascata; infatti la semplificazione di un fattore comune tra numeratore della funzione di trasferimento del primo sottosistema e denominatore del secondo corrisponde a una perdita di osservabilità del sistema risultante che manifesta una struttura interna del tipo indicato in fig. 2 B.
Le precedenti considerazioni mettono in evidenza l'opportunità di studiare i sistemi di c. mediante la rappresentazione con lo spazio di stato. In quanto segue vengono sinteticamente esposti alcuni concetti e risultati che hanno caratterizzato l'evoluzione della teoria e delle applicazioni negli anni più recenti. Ciascun tema potrebbe costituire l'oggetto di un'ampia trattazione; la sintesi qui presentata ha il solo scopo di fornire una panoramica sui metodi più significativi.
Problema generale del regolatore lineare. - Il problema generale del regolatore estende al caso di un processo lineare stazionario a più ingressi e uscite il problema classico dell'asservimento proporzionale (v. servosistema, in App. III, ii, p. 705).
Si consideri un processo lineare stazionario descritto, adottando la notazione matriciale (v. matrice, in App. IV, ii, p. 415), da equazioni della forma
Il problema generale del regolatore consiste nel progetto di un compensatore rappresentato dal seguente modello matematico
in modo che il sistema di c. di fig. 1 abbia autovalori assegnati e uscite asintoticamente convergenti verso le uscite desiderate, yd(t)=v(t), per ogni possibile andamento di z(t) e yd(t) in un'assegnata classe di funzioni. Si assume, inoltre, che gli elementi di tale classe siano le funzioni aventi andamenti esponenziali, polinominali e oscillatori non decrescenti. L'analogia e la generalità del problema posto rispetto al problema dell'asservimento proporzionale è subito vista se si nota che le specifiche nel problema classico in termini di stabilità, comportamento al transitorio e rapidità di risposta corrispondono a una prefissata scelta degli autovalori e che la classe di funzioni di disturbo e gli andamenti desiderati, qui adottati, sono dello stesso tipo di quelli a cui ci si riferisce nella sintesi classica. La soluzione proposta dalla teoria moderna del c. è semplice ed elegante. La trattazione del problema, per la quale si rinvia il lettore a testi specialistici, va al di là degli scopi di questa presentazione. Si nota soltanto che nelle ipotesi di completa raggiungibilità e osservabilità, il problema si riconduce allo studio di un sistema algebrico di equazioni lineari i cui coefficienti sono ottenuti dalle matrici che definiscono la rappresentazione del processo.
Un momento essenziale nella risoluzione del problema generale del regolatore consiste nell'assegnazione degli autovalori; per questo motivo, e anche perché tale metodo si pone come una procedura autonoma di sintesi, le considerazioni che seguono verranno orientate a discutere tale problema.
Assegnazione degli autovalori. - Si consideri il processo descritto dalle [2] in assenza di disturbi; il problema consiste nel sintetizzare un controllore, descritto dalle [3], in modo che il sistema di c. indicato in fig. 1 abbia autovalori coincidenti con un insieme di numeri complessi assegnati o, più in generale, appartenenti a una data regione del piano complesso. Com'è noto, gli autovalori di un sistema lineare caratterizzano il suo comportamento dinamico, in particolare la proprietà di stabilità e la velocità di risposta. Risolvere il problema posto corrisponde, quindi, a imporre, mediante il controllore, assegnate caratteristiche di stabilità e velocità di risposta al sistema di controllo.
Il problema in esame può essere risolto, in virtù di un importante risultato noto come principio di separazione, utilizzando una legge di c. lineare a partire dalle osservazioni di un sistema dinamico che ha la proprietà di ricostruire asintoticamente l'evoluzione dello stato del processo. Più precisamente il problema può essere risolto sulla base di due metodi che vengono esposti in quanto segue: a) l'assegnazione degli autovalori mediante reazione dallo stato; b) la costruzione di un osservatore asintotico dello stato.
a) Assegnazione degli autovalori mediante reazione dallo stato: con riferimento alle [2] in assenza di disturbi il problema consiste nel progetto di una legge di c. della forma
u(t)=Ex(t)+v(t) [4]
in modo che la matrice dinamica del sistema di c., rappresentato in base alle [2] e [4] dal sistema di equazioni
dx(t)/dt=(A+BE)x(t)+Bv(t) [5]
abbia autovalori assegnati.
Il problema ammette una semplice formulazione matematica: assegnate le matrici A e B, calcolare una matrice E, di dimensioni opportune, in modo che (A+BE) abbia autovalori coincidenti con n numeri complessi fissati (n rappresenta il numero delle variabili di stato). Utilizzando metodi della teoria delle matrici (v. matrice, in App. IV, ii, p. 415) si può dimostrare che la seguente condizione
rango (B AB A2B ..... An−1B)=n [6]
è necessaria e sufficiente per risolvere il problema rispetto a una qualsiasi ennupla di numeri complessi (problema dell'assegnabilità degli autovalori). La questione interessante dal punto di vista della teoria del c. è che la matrice indicata caratterizza l'insieme degli stati raggiungibili; più precisamente sono raggiungibili tutti e soli gli stati esprimibili come combinazione lineare delle colonne di tale matrice. La [6] esprime quindi la condizione di completa raggiungibilità del sistema. Il risultato ora esposto mette bene in evidenza il ruolo che svolge nella fase di sintesi la proprietà di completa raggiungibilità; sotto tale ipotesi è possibile imporre un arbitrario e predeterminato comportamento dinamico all'evoluzione nello stato.
L'estensione del risultato in esame al caso in cui il processo non sia completamente raggiungibile è immediata se si tiene conto della scomposizione rispetto a tale proprietà, rappresentata in fig. 2 A. Come suggerisce l'intuizione possono, infatti, essere assegnati ad arbitrio gli autovalori del sottosistema S1 mentre non possono essere modificati quelli del sottosistema S2.
Nell'ipotesi che le variabili misurabili coincidano con lo stato, tale tecnica fornisce un metodo di sintesi direttamente applicabile una volta che le specifiche di progetto siano state riformulate in termini di una predeterminata localizzazione degli autovalori. Alla luce di quanto detto il problema può essere risolto se e solo se gli autovalori del sottosistema non raggiungibile soddisfano, a priori, alle specifiche di progetto.
La scelta degli autovalori del sistema di c. in funzione delle specifiche di progetto è un problema di grande importanza in cui un'approfondita conoscenza del processo e delle componenti dell'impianto, nonché la sensibilità del progettista, svolgono un ruolo non trascurabile. Una procedura sistematica che può essere utilizzata sia per la scelta degli autovalori sia per l'individuazione della corrispondente legge di reazione, tra quelle che garantiscono la localizzazione fissata, fa riferimento al c. ottimo e sarà esposta nel seguito. L'interesse a utilizzare un criterio di ottimo può essere compreso su base intuitiva se si considera che quanto più si vogliono modificare le prestazioni dinamiche del processo tanto più elevata è l'ampiezza degli ingressi al processo stesso; limitazioni di carattere pratico su tale ampiezza rendono conto dell'impossibilità d'imporre modifiche arbitrarie della dinamica e dell'opportunità di utilizzare un criterio di ottimo che, tenendo conto dei vincoli, consenta di risolvere nel migliore dei modi il problema.
b) Costruzione di un osservatore asintotico dello stato: alla luce di quanto sinora esposto, la modifica della dinamica di un assegnato processo può essere effettuata mediante una reazione dallo stato. Poiché in generale tali grandezze non sono misurabili, si pone spontanea la ricerca di un dispositivo che consenta di ricostruirne le evoluzioni a partire dalle variabili misurate.
Con riferimento al caso generale in cui il numero delle variabili misurate fra loro indipendenti è inferiore al numero delle variabili di stato, il problema consiste nella sintesi di un dispositivo dinamico le cui uscite tendano asintoticamente, con decadimento esponenziale prefissato, a riprodurre il comportamento dello stato. Si consideri a tal fine il seguente sistema di equazioni differenziali:
dζ(t)/dt=Fζ(t)+Gu(t)+Km(t) ζ(0)=z0 in Rn [7]
assunte a rappresentare un dispositivo con ingressi coincidenti con gli ingressi e le variabili misurabili del processo e uscite coincidenti con le componenti di ζ. Con riferimento alla struttura fissata il problema posto consiste nel calcolare i valori da dare ai coefficienti delle matrici F, G e K in modo che per qualunque x0 e ζ0, e per ogni ingresso del processo, l'uscita ζ (t) tende ad assumere, con decadimento esponenziale prefissato, l'andamento dello stato, x(t). A tal fine, se si indica con e(t) la differenza tra ζ(t) e x(t), errore di osservazione, dalle equazioni [2] e [7], è immediato dedurre le equazioni che descrivono la dinamica dell'errore; esse sono:
de(t)/dt=Fz(t)+Gu(t)+KWx(t)−Ax(t)−Bu(t). [8]
Assumendo, nella [8], G=B e F=(A−KW), si ottiene:
de(t)/dt=(A−KW)e(t), e(0)=e0=ζ0−x0. [9]
Questa ultima espressione mette bene in evidenza che il problema posto ammette soluzione se e solo se è possibile assegnare gli autovalori della matrice (A−KW) in modo da garantire il decadimento voluto. Anche in questo caso il problema ammette una semplice formulazione matematica: assegnate le matrici A e C, calcolare una matrice K, di dimensioni opportune, in modo che (A−KC) abbia autovalori coincidenti con n numeri complessi fissati. Ricordando che gli autovalori di una matrice coincidono con quelli della sua trasposta e notando che la trasposta di (A−KW) ha la stessa struttura della matrice dinamica nella [5], possiamo utilizzare il risultato esposto in precedenza per concludere che la condizione necessaria e sufficiente per ricostruire, dalle osservazioni, il comportamento dello stato con un decadimento arbitrario e prefissato (problema dell'osservatore asintotico), è che:
rango (C′ A′C′A′2C′ ..... A′n−1C′)′=n [10]
dove si è indicato con l'apice l'operazione di trasposizione. La questione interessante dal punto di vista della teoria del c. è che la matrice indicata caratterizza l'insieme degli stati non osservabili; più precisamente sono non osservabili tutti e soli gli stati che appartengono al kernel di tale matrice. La [10] esprime quindi la condizione di completa osservabilità del sistema.
Il risultato ora esposto mette bene in evidenza il ruolo che svolge la proprietà di completa osservabilità; sotto tale ipotesi è possibile imporre una predeterminata e arbitraria velocità di convergenza al dispositivo di ricostruzione dello stato.
L'estensione del risultato in esame al caso in cui il processo non sia completamente osservabile è immediata se si tiene conto delle considerazioni precedenti a proposito dell'assegnazione degli autovalori e della scomposizione rispetto a tale proprietà rappresentata in fig. 2 B. Come suggerisce l'intuizione, infatti, è possibile ricostruire, con arbitraria velocità di convergenza, le evoluzioni dello stato del sottosistema osservabile mentre le evoluzioni dello stato del sottosistema non osservabile possono essere ricostruite solo se gli autovalori del sottosistema S2 sono a parte reale negativa, e in tal caso con una velocità che dipende da questi e non può essere modificata. Per comprendere quest'ultima affermazione è sufficiente osservare che un ricostruttore dello stato per un sistema completamente non osservabile, privo di misure, ma stabile, con autovalori a parte reale negativa, è rappresentato da un dispositivo descritto dalle equazioni [7] con K=0. Estendendo la precedente considerazione al sottosistema S2 si giunge alla conclusione che il problema dell'osservazione dello stato con prefissate specifiche di decadimento esponenziale dell'errore è risolubile se e solo se gli autovalori del sottosistema non osservabile soddisfano, a priori, alle specifiche imposte.
I due risultati sinteticamente esposti ai punti a) e b) consentono di risolvere il problema dell'assegnazione degli autovalori mediante reazione dalle variabili misurate; è infatti possibile verificare che il sistema di c. di fig. 3 ha autovalori coincidenti con i (2n) numeri complessi assegnati alle matrici (A+BE) e (A−KW). Tale schema, infine, è equivalente a quello di fig. 1 con un compensatore del tipo [3] descritto dalle seguenti matrici:
M=A+BE−KW P=B N=K H=E L=I.
Questo risultato, noto come principio di separazione, consente di separare il progetto del sistema di c. in due fasi indipendenti: assegnazione degli autovalori con reazione dallo stato e costruzione di un osservatore asintotico.
Controllo ottimo. − La teoria del c. ottimo è fondata sulla formulazione del problema di sintesi in termini di ottimizzazione di un funzionale che rappresenta le prestazioni del sistema di controllo. Il problema di sintesi è concettualmente separabile in due fasi: una prima fase in cui gli obiettivi e le specifiche vengono utilizzati per esprimere il funzionale; una seconda fase in cui, con riferimento ai metodi della ottimizzazione, viene calcolata la strategia di controllo. Il funzionale viene usualmente definito per rappresentare gli scostamenti rispetto al comportamento teoricamente desiderato; per tale motivo è denominato funzionale di costo o di penalità. Esiste una vasta letteratura sul c. ottimo sia per la definizione del funzionale di costo, questione spesso di notevole difficoltà in cui svolge un ruolo non trascurabile la sensibilità del progettista, sia per lo studio matematico della ottimizzazione per fissate classi di processi e funzionali di costo (esistenza, proprietà e calcolo della soluzione).
Un problema particolare, ma d'interesse per le connessioni che manifesta con l'assegnazione degli autovalori, è quello del regolatore ottimo. Esso consiste nella ricerca di una soluzione ottima al problema classico del regolatore in cui si richiede al sistema di c. di annullare l'effetto di disturbi. Se si assume di rappresentare l'effetto dei disturbi come una perturbazione sullo stato rispetto al valore nullo desiderato e imposto dal problema di regolazione, il problema si riduce alla ricerca di una strategia di c. che conduca lo stato a zero il più rapidamente possibile compatibilmente con prefissati vincoli sulle ampiezze dei controlli.
Ciò premesso, una naturale formulazione in termini di ottimo è la seguente: individuare una legge di c. u(t) agente sul processo [2] in modo che sia minimo il valore assunto dal seguente funzionale di costo:
In tale formulazione si assume di rappresentare mediante un funzionale di costo quadratico sia lo scostamento dello stato rispetto al valore nullo teoricamente desiderato, sia il costo del controllo. Nella [11] Qx e Ru sono matrici opportune a elementi reali, assunte rispettivamente semidefinita e definita positiva.
Il problema di minimo impostato può essere risolto utilizzando la tecnica dei moltiplicatori di Lagrange e il calcolo delle variazioni. Con riferimento al caso generale di un processo descritto da un sistema di equazioni differenziali del tipo [1] in assenza di disturbi, si consideri il seguente funzionale:
ove, tf e Qf rappresentano il tempo finale e un eventuale costo corrispondente a uno stato finale non nullo.
Il vincolo espresso dalle [1] può essere rappresentato introducendo un vettore di moltiplicatori di Lagrange, l′, e definendo un nuovo funzionale, J′, che assume gli stessi valori di J quando x(t) e u(t) soddisfano alle [1]:
Nella precedente equazione H=L+l′f prende il nome di hamiltoniano.
Se si suppone che il controllo u(t) nella [13] sia quello ottimo, semplici manipolazioni, che fanno riferimento al calcolo delle variazioni, consentono d'individuare le condizioni necessarie di ottimalità espresse dalle note equazioni di Eulero-Lagrange
[14]
Per un sistema lineare con funzionale quadratico espresso dalla [11], si ottengono le seguenti equazioni
che assieme alle [2] definiscono il seguente sistema di 2n equazioni differenziali lineari:
con condizioni iniziali sullo stato x(0)=x0 e finali sul moltiplicatore l, l(tf)=0. La presenza di condizioni iniziali a istanti temporali diversi rende non facile il problema del calcolo delle soluzioni.
Una situazione di particolare interesse, che si vuole qui mettere in evidenza, si presenta se si assume tf='. In tale caso sotto le ipotesi che il processo sia stabilizzabile, cioè che gli autovalori del sottosistema non raggiungibile siano a parte reale negativa, e che rispetto alle variabili Qxx(t) lo stato sia ricostruibile, cioè che gli autovalori del sottosistema non osservabile siano a parte reale negativa, le soluzioni l(t) e x(t) della [16] sono legate da una relazione lineare del tipo
l(t)=Px(t). [17]
Sostituendo tale relazione nelle [16] si perviene alla seguente equazione matriciale nota come equazione algebrica di Riccati:
PA+A′P−PBRu−1B′P+Qx=0. [18]
La [18] è un'equazione algebrica quadratica, nell'incognita P, di non facile soluzione; metodi di calcolo approssimati e, in particolari situazioni, diretti sono ampiamente trattati in letteratura. Nelle ipotesi assunte di stabilizzabilità e ricostruibilità la [18] ammette una sola soluzione definita positiva. In tal caso dalle [15] e [17] si ottiene:
u(t)=−Ru−1B′Px(t)=Ex(t) [19]
che esprime la soluzione del problema di ottimo nella forma di reazione lineare dallo stato. Una proprietà che è interessante mettere in luce, in relazione all'adozione della strategia di controllo ottima data dalla [19], è la coincidenza degli autovalori del sistema di c. con gli n autovalori a parte reale negativa della cosiddetta matrice hamiltoniana, cioè la matrice dinamica del sistema [16].
Le precedenti considerazioni stabiliscono un interessante legame con il problema dell'assegnazione degli autovalori che si concretizza nelle due proprietà seguenti:
a) alla scelta di un funzionale di costo quadratico corrisponde una precisa localizzazione degli autovalori del sistema di c.: gli autovalori a parte reale negativa della matrice hamiltoniana;
b) tra le possibili reazioni dallo stato atte a garantire l'assegnazione voluta, ne esiste una, quella data dalla [19], che rende minimo il valore del funzionale.
Controllo stocastico. − Com'è noto, una delle principali motivazioni che inducono all'impiego di strategie di c. a controreazione è la riduzione degli effetti dei disturbi. Nella teoria del c. deterministico i disturbi possono essere rappresentati: in modo diretto, mediante funzioni appartenenti a una determinata classe, come indicato nella formulazione del problema generale del regolatore lineare; in modo indiretto, assumendo una indeterminazione sullo stato iniziale, come indicato nella formulazione del regolatore ottimo a indice quadratico. Il primo modo di rappresentare il disturbo è applicabile quando si conoscono le cause di perturbazione e sono quindi ipotizzabili gli andamenti temporali delle perturbazioni stesse; il secondo rappresenta un artificio che può essere utilizzato in presenza di perturbazioni non previste e quindi non modellabili. Una rappresentazione più aderente alla realtà consiste nell'assumere che i disturbi siano processi aleatori; tale rappresentazione, oltre a essere più aderente alla realtà, è certamente da preferirsi se si considera che gli errori di misura, spesso non trascurabili in un sistema di c., sono dello stesso tipo.
In quanto segue si vuole mettere in luce un risultato di notevole importanza applicativa nella sintesi di un sistema di c. in cui si tenga conto della natura aleatoria delle misure e dei disturbi. Tale risultato, con riferimento alla classe dei sistemi lineari e stazionari, rappresenta la generalizzazione delle tecniche di sintesi discusse in precedenza e costituisce il punto di partenza per lo studio di sistemi di c. più complessi che caratterizzano la teoria del c. stocastico.
Il modello di un sistema lineare stazionario con disturbi aleatori agenti sull'ingresso e sulle variabili misurate è comunemente descritto da un sistema di equazioni del tipo delle [2], ove il termine Wzz(t) viene sostituito dagli errori di misura che saranno indicati con w(t). Nella rappresentazione del processo z(t) e w(t) sono processi aleatori che hanno le proprietà di un rumore bianco gaussiano. Una trattazione completa di tali sistemi di c. è fondata sulla teoria dei processi stocastici e va al di là degli scopi della presente trattazione. Per quanto qui interessa giova ricordare che tali proprietà conferiscono al processo aleatorio una generalità atta a rappresentare una vasta gamma di fenomeni.
Il principale risultato della teoria del c. lineare stocastico, che rappresenta anche uno dei principali risultati della teoria del c. moderno, è messo in luce dalla risoluzione, mediante reazione dalle misure, del problema del regolatore ottimo per un processo caratterizzato dalla presenza di disturbi ed errori di misura aleatori aventi le caratteristiche indicate. Il problema in questione noto in letteratura come regolatore lineare ottimo gaussiano a indice quadratico (LQG) consiste nel progetto di un controllore descritto dalle [3] e agente sul processo secondo lo schema di fig. 1, in modo che sia minimo il valore assunto dal funzionale di costo [11]. La soluzione è fondata sul teorema di separazione che estende al caso stocastico, e generalizza nel senso che viene precisato nel seguito, il risultato messo in evidenza a proposito dell'assegnazione degli autovalori sancito dal principio di separazione.
Il teorema di separazione stabilisce che la soluzione al problema è data dalla legge di c. lineare [19], che risolve il problema di c. ottimo deterministico, applicata alle uscite di un sistema dinamico che rappresenta un filtro ottimo per la stima dello stato noto come il filtro di Kalman. La questione interessante è che il filtro di Kalman ha la struttura di un osservatore asintotico del tipo [7] in cui la matrice K, in generale dipendente dal tempo, è calcolata in modo da minimizzare la matrice di covarianza dell'errore. Inoltre tale filtro è osservatore ottimo nel senso che è il migliore che si possa realizzare rispetto a ogni ragionevole criterio nell'ipotesi che i processi aleatori siano gaussiani con caratteristiche di rumore bianco. In fig. 3, lo stesso schema del controllore, con un'opportuna K (t), fornisce una soluzione al problema del regolatore lineare ottimo gaussiano a indice quadratico.
L'importanza del risultato stabilito è duplice: sia nel c. stocastico che in quello deterministico. Nel c. stocastico sancisce la possibilità di separare il progetto in due fasi indipendenti: la sintesi di un controllore ottimo mediante reazione dallo stato ignorando la presenza dei disturbi e degli errori di misura; la sintesi di un filtro di Kalman per il processo assegnato. Nel c. deterministico generalizza al c. ottimo il risultato stabilito dal principio di separazione con riferimento all'assegnazione degli autovalori.
Controllo adattativo. − Le indeterminazioni e le approssimazioni spesso presenti nell'individuazione del modello matematico del processo, così come eventuali variazioni delle caratteristiche di funzionamento, rappresentano, in molti casi pratici, un'importante limitazione nell'applicazione dei metodi di sintesi esposti in precedenza. Infatti, secondo tale approccio, il controllore viene progettato a partire dal modello matematico del processo e non viene modificato.
Una strategia di c. di tipo diverso, ma sempre fondata sullo schema concettuale di fig. 1, è quella che fa riferimento al c. adattativo. L'idea di fondo è che eventuali indeterminazioni e approssimazioni di cui non si è tenuto conto in una prima fase di progetto, al pari di variazioni sulle caratteristiche di funzionamento, inducono scostamenti degli andamenti delle variabili misurate rispetto al comportamento voluto che possono essere utilizzati, durante il normale funzionamento del sistema di c., per modificare alcuni parametri o la struttura stessa del controllore. Si cerca, quindi, di modificare le caratteristiche del controllore adattandole alle condizioni di funzionamento. La differenza sostanziale rispetto alle strategie di c. sinora esaminate risiede nel fatto che, in questo caso, le stesse strategie di c. vengono variate, in funzione dei valori delle variabili misurate, al fine di raggiungere il soddisfacimento delle specifiche di progetto.
Nella teoria del c. adattativo possiamo individuare un approccio sistematico, che fa riferimento al c. ottimo stocastico, e un approccio euristico fondato sui seguenti tre schemi principali: adattamento dei parametri, modello di riferimento, regolatore autoadattativo.
Lo schema di un sistema di c. adattativo fondato sul c. ottimo stocastico è indicato in fig. 4. Il processo viene descritto mediante un modello stocastico, e il controllore viene calcolato, con tecniche di programmazione dinamica, in modo da minimizzare un funzionale di costo. Come indicato nella fig. 4, il controllore risulta composto di due parti: uno stimatore dei parametri e un dispositivo di c. a controreazione. Tale schema di c. rappresenta concettualmente la generalizzazione, alla stima dei parametri, dello schema di c. ottimo con stima dello stato esposto in precedenza.
La tecnica dell'adattamento dei parametri del regolatore è spesso utilizzata per risolvere i problemi connessi alle variazioni di parametri del processo durante il normale funzionamento del sistema di c.; lo schema, indicato in fig. 5, è fondato sull'ipotesi che le variabili misurate siano correlate alle variazioni dei parametri. Secondo tale approccio la struttura del regolatore è fissa, mentre i parametri del regolatore vengono adattati in funzione del comportamento del sistema.
Uno schema più complesso, che al pari del precedente si presta a risolvere i problemi inerenti alle variazioni dei parametri, è quello con modello di riferimento. In tale schema (fig. 6) il modello di riferimento rappresenta il comportamento dinamico desiderato. Il controllore può essere visto come l'azione combinata di due cicli di reazione: uno interno di tipo tradizionale, e uno esterno dedicato all'adattamento dei parametri con l'obiettivo di ridurre lo scostamento tra l'andamento desiderato, uscita del modello di riferimento, e quello effettivo, uscita del processo. Tale schema di c. è detto diretto in quanto i parametri del regolatore vengono aggiornati in linea. Il problema centrale consiste nel calcolo della strategia di adattamento in modo da condurre a zero l'errore.
Lo schema di un regolatore autoadattativo è indicato in fig. 7: anche questo può essere visto come composto di due cicli di reazione: uno interno di tipo tradizionale e uno esterno composto di uno stimatore ricorsivo dei parametri e da dispositivi di calcolo delle strategie di controllo. Un regolatore autoadattativo può essere visto come un meccanismo di modellizzazione e progetto agente in tempo reale. Secondo tale metodo si procede, durante il normale funzionamento del sistema di c., alla stima dei parametri del processo; la stima ottenuta viene utilizzata per il calcolo dei parametri del regolatore in base alla strategia di c. impiegata. Questo metodo è molto flessibile rispetto all'adozione di diverse strategie di stima dei parametri e di controllo.
I sistemi di c. realizzati mediante tecniche adattative sono molto complessi da analizzare in quanto sono intrinsecamente non lineari e non stazionari. I progressi nello sviluppo della teoria sono lenti e ci sono molti risultati ancora non chiaramente dimostrati, tutto ciò a causa della complessità dei modelli atti a rappresentare anche i più semplici schemi adattativi. Le complicazioni teoriche dovute alla complessità della struttura sono compensate dai risultati molto confortanti in numerose applicazioni e dalla facilità di realizzazione utilizzando i moderni dispositivi di calcolo (microprocessori).
Controllo digitale. − La locuzione controllo digitale fa riferimento a un sistema di c. in cui il controllore agente su di un processo a tempo continuo è realizzato con dispositivi digitali, cioè con calcolatori numerici. Lo schema di un sistema di c. digitale è indicato in fig. 8. Esso è composto di cinque parti: il processo, due dispositivi di conversione analogica-digitale (A-D) e digitale-analogica (D-A), l'algoritmo di c. e un dispositivo per la sincronizzazione del calcolo. Gli istanti di tempo in cui i segnali continui (analogici) vengono convertiti in segnali digitali sono detti istanti di campionamento; il tempo tra due successivi campionamenti è detto periodo di campionamento.
I vantaggi legati all'adozione di uno schema di c. di tale tipo hanno trovato una prima motivazione nella possibilità di cambiare il controllore riprogrammando l'algoritmo di c. e di controllare più processi simultaneamente programmando su di uno stesso calcolatore diversi algoritmi di c. (v. elaboratori elettronici, in questa Appendice); tali vantaggi sono tanto più evidenti oggi se si tiene conto dell'evoluzione della tecnologia digitale e dei bassi costi a fronte di prestazioni sempre più elevate. Un ulteriore vantaggio, e certo non meno significativo, è rappresentato dall'evoluzione che la teoria del c. digitale ha subìto negli ultimi venti anni. Rispetto all'impostazione iniziale (App. III, i, p. 430) in cui il calcolatore numerico veniva impiegato per realizzare in modo approssimato un controllore continuo, il cambiamento più significativo è rappresentato dalla nascita di metodologie di c. che, tenendo conto della natura dei segnali impiegati, sfruttano a pieno le potenzialità offerte dall'adozione di dispositivi digitali e consentono di ottenere un sistema di c. con prestazioni superiori rispetto allo schema analogico. I più recenti sviluppi sono fondati sulla concezione di uno schema di c. con più cicli di reazione caratterizzati da differenti periodi di campionamento; tale tecnica si presenta promettente nello sviluppo della teoria.
Controllo non lineare. − L'adozione della rappresentazione con lo stato per descrivere il comportamento dinamico di un processo assieme allo sviluppo, la diffusione e la sistematizzazione dei risultati delle tecniche matematiche di analisi non lineare hanno consentito, negli anni più recenti, lo sviluppo di metodologie di c. non lineare che vedono nei nostri giorni le prime importanti applicazioni nei settori a tecnologia avanzata (v. automatica, in questa Appendice).
Un primo approccio alla realizzazione di sistemi di c. per processi intrinsecamente non lineari (v. servosistema, App. III, ii, p. 705) consiste nell'utilizzare, nella fase di progetto, la rappresentazione lineare approssimante il comportamento del processo. Tale approccio, seppure adatto a risolvere alcuni problemi pratici, presenta evidenti limitazioni in quanto non si tiene conto, nella sintesi del controllore, dei fenomeni non lineari che caratterizzano il comportamento del processo, che sono a priori assunti noti e rappresentati nel modello stesso. A partire dai primi anni Settanta, in cui si assiste alla formalizzazione di alcune strategie di c. per la classe dei modelli bilineari, adatti a descrivere con buona approssimazione una vasta classe di processi, la teoria del c. non lineare si è arricchita di importanti risultati ed è oggi composta di un insieme di metodi sufficientemente generali per una vasta classe di modelli, quelli in cui la funzione f, nelle [1], assume una struttura affine rispetto alle variabili di c., cioè del tipo
f(x,u,z)=f(x)+g(x)u+p(x)z.
Lo studio dei sistemi di c. per processi di tale tipo è fondato in massima parte sulle tecniche della geometria differenziale e sulla relativamente recente formalizzazione dei metodi di tale disciplina. I risultati ottenuti nella teoria del c. non lineare, a cui ha contribuito in modo significativo la scuola italiana, sono numerosi e consentono di risolvere alcuni importanti problemi di c. quali: la linearizzazione mediante reazione dallo stato, il c. non interagente, il disaccoppiamento dal disturbo, la riproduzione di un desiderato comportamento ingresso-uscita, alcuni problemi di stabilizzazione.
Per una descrizione di tali metodi in relazione alle applicazioni recenti nei settori avanzati, v. automatica, in questa Appendice; è qui opportuno sottolineare l'importanza dei metodi di sintesi che consentono di rendere lineare il processo mediante un'opportuna reazione dallo stato in quanto sul sistema di c., così modificato in una prima fase, possono essere applicati i metodi noti per i sistemi lineari e, tra questi, quelli qui esposti.
Bibl.: W. M. Wonham, Linear multivariable control: a geometric approach, New York 19792; T. Kailath, Linear systems, ivi 1980; Computer controlled systems: theory and design, ivi 1984; B. Friedland, Control systems design: an introduction to state-space methods, ivi 1986; Systems & control Enciclopedia, ivi 1988; K. J. Aström, B. Wittenmark, Adaptive control, Reading (Mass.) 1989; A. Isidori, Nonlinear control systems: an introduction, New York 19892.