IMMAGINE
(XVIII, p. 887)
Elaborazione analogica e numerica delle immagini. - Introduzione. - Con il termine i. in bianco e nero s'intende riferirsi a una distribuzione di luminanza o livello di grigio f variabile in modo continuo nel piano (x,y), rappresentabile in forma matematica mediante una funzione del tipo f(x,y). I. fisse in bianco e nero di questo tipo sono comunemente disponibili su carta, su pellicola fotografica, film o schermo elettronico. I. in bianco e nero variabili nel tempo, acquisite per es. dall'ambiente esterno con camere televisive, trasduttori ottici, ecc., sono rappresentabili come funzioni f(x,y,t) di tre variabili, essendo x e y le coordinate spaziali precedenti e t la variabile tempo.
I. a colori possono poi essere scomposte in tre i. nei tre colori primari (rosso, verde, blu), rappresentabili in forma matematica con funzioni bidimensionali (2D) o tridimensionali (3D) del tipo precedente.
Oggetti fissi o in movimento possono analogamente essere rappresentati con funzioni del tipo f(x,y,z) o f(x,y,z,t), ove z è la terza coordinata spaziale che insieme con x e y permette d'individuare un punto qualunque nello spazio. Più in generale con n variabili x1, x2,...xn, si parla di i. multidimensionali, rappresentabili con funzioni a n dimensioni (nD) del tipo f(x1, x2,..., xn), che possono essere presentate in forma di i. comuni, considerando solo due o tre delle x1, x2,...xn effettivamente variabili e le altre costanti.
Come nel caso dei segnali, anche per le i. si possono sviluppare due tipi principali di analisi: analisi deterministica, nella quale si considera una funzione univoca, che rappresenta l'i. f(x,y) in ogni suo punto (x,y) (è il caso di i. senza rumore); analisi statistica o aleatoria, nella quale le proprietà dell'i. sono definite in modo statistico o aleatorio con un'opportuna ''funzione probabilità'' (è il caso delle i. con rumore).
Sulle i. di tipo deterministico o aleatorio possono poi essere effettuate due forme distinte di elaborazione: elaborazione analogica sulle funzioni continue che rappresentano le i.; elaborazione numerica sui campioni (rappresentati in forma numerica) delle immagini.
Elaborazione analogica delle immagini. - Data un'i., rappresentata da una funzione f(x,y), è anzitutto di grande importanza la trasformata di Fourier bidimensionale, definita dalla relazione:
ove ωx, ωy sono le pulsazioni spaziali, essendo νx=qx/(2π) e νy=qy/ (2π) le frequenze spaziali, e j è l'unità immaginaria (j=√−1).
Se la funzione f(x,y) è assolutamente integrabile (vale a dire è limitato l'integrale del suo modulo nel dominio infinito), la funzione stessa può essere nuovamente ottenuta dalla sua trasformata di Fourier mediante la relazione inversa:
Le funzioni f(x,y) e F(ωx,ωy) sono chiamate coppie di trasformate di Fourier. Inoltre la [2] esprime l'i. f(x,y) come somma doppia di un numero infinito di oscillazioni sinusoidali elementari. La F(ωx,ωy), esprimente la distribuzione delle componenti della funzione f(x,y) sugli assi delle frequenze spaziali, è anche detta spettro di f(x,y).
Un sistema 2D è, nella sua forma più generale, definito da un operatore T{·}, che fa corrispondere a una funzione (i.) d'ingresso f(x,y) una funzione (i.) di uscita g(x,y), cioè:
Un sistema 2D lineare additivo, spazialmente invariante, è individuato dalla sua risposta impulsiva h(x,y), che è l'uscita del sistema con la funzione impulsiva (o operatore delta di Dirac) in ingresso. L'uscita del sistema è esprimibile mediante la convoluzione della funzione d'ingresso con la risposta impulsiva:
La trasformata di Fourier della risposta impulsiva, H(ωx,ωy), rappresenta la funzione di trasferimento o risposta in frequenza del sistema, che è costituito dal rapporto fra la trasformata della funzione di uscita e la trasformata della funzione d'ingresso, cioè (fig. 1):
Una classe di sistemi 2D lineari additivi di particolare interesse è rappresentata dai sistemi non distorcenti, per i quali la funzione di uscita può essere espressa nel seguente modo:
dove A, xo e yo sono opportune costanti, cioè i valori della funzione d'ingresso sono stati semplicemente spostati secondo x e y e moltiplicati per un fattore costante. Non è difficile provare che per un tale sistema la risposta in frequenza obbedisce alle seguenti condizioni di non distorsione:
ove |H(ωx,ωy)| rappresenta il modulo e ϕ(ωx,ωy) la fase della risposta in frequenza.
Sistemi 2D di notevole interesse per l'elaborazione delle i. sono rappresentati dai filtri 2D, per i quali in genere |H(ωx,ωy)|=1. Filtri 2D di tipo passa-alto, cioè che lasciano passare le alte frequenze spaziali, possono essere notevolmente utili per esaltare il contrasto (e quindi evidenziare meglio le strutture contenute nelle i.), mentre filtri 2D di tipo passa-basso, cioè che tolgono le alte frequenze, possono permettere di ridurre lo spettro all'estensione effettivamente utile eliminando allo stesso tempo le componenti di rumore in alta frequenza.
In definitiva l'uso appropriato di filtri 2D (fisicamente realizzabili con lenti o sistemi ottici) permette di ottenere i. di migliore qualità.
Elaborazione numerica delle immagini. - Data un'i., rappresentata dalla funzione continua f(x,y), i suoi ''campioni'' f(n1,n2)=f(n1X,n2X) sono ottenuti moltiplicando f(x,y) per la funzione impulsiva δ(x- n1X,y-n2X), essendo X il passo di campionamento spaziale. Per effettuare un campionamento corretto, tale che dai campioni si possa tornare alla funzione continua f(x,y) senza perdita alcuna d'informazione, occorre che X soddisfi la seguente relazione (teorema del campionamento di Shannon):
ove νM è la massima frequenza spaziale secondo x e y.
Con il campionamento viene interrotta la continuità dei valori della funzione f(x,y) nel piano (x,y). Per arrivare alla forma numerica, compatibile con i sistemi di elaborazione, è necessario che siano effettuate altre due elaborazioni: la quantizzazione, la quale consiste nel rappresentare i singoli campioni f(n1,n2) con un numero finito di livelli (valori quantizzati) multipli di un ''quanto'' Δf; la codifica binaria, con la quale il numero di livelli è espresso in forma binaria (cioè in ''parole'' di un certo numero di 0 e 1).
Per analizzare i valori campionati o numerici f(n1,n2), viene utilizzata la trasformata z 2D, che è definita dalla seguente relazione
ove z1 e z2 sono variabili complesse, collegate alle variabili di Laplace p1 e p2 e al passo di campionamento X dalle seguenti espressioni:
essendo σ1 e σ2 le parti reali e jωx e jωy le parti immaginarie delle variabili p1 e p2. La trasformata z 2D inversa è definita dalla seguente relazione:
ove C1 e C2 sono due contorni chiusi intorno all'origine entro la regione di convergenza.
Una delle proprietà più importanti della trasformata z 2D è la convoluzione discreta 2D di due sequenze 2D f(n1,n2) e h(n1,n2);
la cui trasformata z 2D è espressa da:
essendo H(z1,z2) la trasformata z 2D di h(n1,n2).
Dalla trasformata di Fourier continua 2D o dalla trasformata z 2D è possibile derivare la trasformata di Fourier discreta 2D (DFT):
e la relativa trasformata inversa (IDFT):
ove gli indici k1 e k2 corrispondono alle frequenze spaziali νx=k1Δν, νy=k2Δν, essendo Δν un incremento costante di frequenza (passo di campionamento nelle frequenze spaziali).
Questa trasformata discreta permette di effettuare stime dello spettro di f(n1,n2) e quindi di f(x,y); F(ωx,ωy) rappresenta la prima parte, intorno alla frequenza zero, dello spettro periodico di f(n1,n2). Si deve inoltre osservare che sono disponibili algoritmi veloci per effettuare la DFT (e IDFT) e in particolare la trasformata di Fourier Veloce (FFT, Fast Fourier Transform), che riduce molto i tempi di elaborazione.
Sono state definite anche molte altre trasformate discrete o numeriche (coseno e seno, di Hadamard e Walsh, di Haar, di KarhunenLoeve, ecc.), che utilizzano insiemi diversi di funzioni ortonormali, per gran parte delle quali sono disponibili algoritmi veloci di calcolo.
Il funzionamento di un sistema numerico 2D può essere descritto (analogamente al caso continuo) mediante le [14] e [15] della convoluzione discreta, ove h(n1,n2) è la risposta impulsiva numerica del sistema e H(z1,z2) è la sua funzione di trasferimento.
Una forma ancora più generale, utile per la progettazione e realizzazione dei sistemi numerici, è la seguente:
ove a(k1,k2) e b(k1,k2) sono le sequenze 2D che definiscono il comportamento del sistema numerico 2D ed è esplicitamente presente una reazione in quanto vengono rielaborati i dati di uscita, escluso g(n1n2) (fig. 2). È facile ottenere la funzione di trasferimento del sistema numerico 2D definito dalla relazione [18]:
Di particolare importanza per l'elaborazione delle i. sono (come nel caso continuo) i filtri numerici, il cui comportamento generale può essere descritto mediante le [18] e [19]. Filtri numerici 2D con tutti i b(k1,k2)=0 sono detti con Risposta Impulsiva Finita (FIR), mentre gli altri sono detti con Risposta Impulsiva Infinita (IIR). Possono essere definiti filtri numerici 2D di tipo passa-basso, passa-alto e passabanda come nel caso analogico, che permettono di aumentare il contrasto (fig. 3) o più in generale di migliorare la qualità delle immagini. Per ridurre il rumore nelle i., possono essere utilizzati filtri numerici 2D di tipo inverso o di Kalman.
Per l'elaborazione numerica delle i., sono disponibili anche operatori spaziali più semplici, che elaborano localmente i campioni f(n1,n2) con operazioni di differenza, media o moltiplicazione per opportune costanti. Di particolare interesse sono gli operatori locali spaziali 2 × 2 e 3 × 3 per l'estrazione dei contorni, che stimano il valore del gradiente mediante le due componenti ortogonali Dx e Dy, ottenendo il modulo D e la direzione :
Una volta che sia valutato il gradiente, viene confrontata la sua ampiezza con un certo valore di soglia: se essa è maggiore del valore di soglia, si assume che il punto considerato (nell'intorno del quale è stato valutato il gradiente) fa parte di un contorno, la cui direzione è ortogonale alla direzione del gradiente.
Un esempio di stima dei valori Dx e Dy è riportato nelle seguenti relazioni:
Altre tecniche di elaborazione numerica delle i. sono rivolte alla compressione dei dati, cioè alla riduzione della quantità dei campioni che rappresentano l'i.: a questo fine sono utilizzati filtri numerici passa-basso od operatori di media, previsori lineari di vario ordine e trasformazioni numeriche (per es. la FFT). L'efficacia di quest'ultima tecnica è legata al fatto che in genere il dominio trasformato è più compatto del dominio originale dei dati spaziali: la compressione viene poi aumentata con l'introduzione di soglie o di codifiche a lunghezza di parola variabile sui dati trasformati.
Infine tecniche di elaborazione numerica di notevole importanza sono rappresentate dal riconoscimento di forme o strutture presenti nelle i.: si usano in particolare tecniche basate su prototipi, su analisi statistiche o decomposizioni strutturali (il riconoscimento avviene nel dominio spaziale o nei domini trasformati quali quello della FFT). Si può usare il filtraggio numerico come utile pre-elaborazione per evidenziare le strutture e ridurre il rumore (fig. 4).
Le tecniche di elaborazione numerica delle i. sono divenute di grande importanza per lo straordinario sviluppo della microelettronica digitale, con produzione di circuiti integrati ad altissima integrazione (VLSI), di calcolatori potenti e veloci e in particolare di strutture di elaborazione multipla e parallela, particolarmente adatte al trattamento delle immagini.
Bibl.: A. Papoulis, Systems and transforms with applications in optics, New York 1968; Digital pattern recognition, a cura di K. S. Fu, Berlino 1976; V. Cappellini, Elaborazione numerica delle immagini, Torino 1985.