24.5 Analiza Fourier a imaginii

Analiza Fourier este utilizată în procesarea imaginilor în același mod ca și cu semnalele unidimensionale. Dar, imaginile nu au informația lor codificată în domeniul frecvență, făcând tehnicile mult mai puțin utile. De exemplu, atunci când transformata Fourier este aplicată unui semnal audio, forma de undă confuză din domeniul timp este transformată într-un spectru de frecvență ușor de înțeles. În comparație, aplicarea transformatei Fourier unei imagini convertește informația directă din domeniul spațial într-o formă codificată în domeniul frecvență. Pe scurt, nu vă așteptați ca transformata Fourier să vă ajute să înțelegeți informațiile codificate în imagini.

De asemenea, nu te uita la domeniul frecvență pentru modelul filtrului. Caracteristica de bază a imaginilor este muchia, linia care separă un obiect sau regiune de un alt obiect sau regiune. Deoarece o muchie este compusă dintr-o gamă largă de componente de frecvență, încercarea de a modifica o imagine prin manipularea spectrului de frecvențe nu este, în general, productivă. Filtrele de imagine sunt în mod obișnuit concepute în domeniul spațial, unde informația este codată în cea mai simplă formă a ei. Gândesc în termeni de netezire și operații de intensificare a muchiei (domeniul spațial), mai degrabă decât filtre high-pass și low-pass (domeniul frecvență).

Cu toate acestea, analiza Fourier a imaginii are câteva proprietăți utile. De exemplu, convoluția în domeniul spațial corespunde multiplicării în domeniul frecvență. Acest lucru este important deoarece multiplicarea este o operație matematică mai simplă decât convoluția. Ca și în cazul semnalelor unidimensionale, această proprietate permite convoluția FFT și diferite tehnici de deconvoluție. O altă proprietate utilă a domeniului frecvență este teorema despicării Fourier, relația dintre o imagine și proiecțiile ei (imaginea văzută de pe laturile sale). Aceasta este baza tomografiei computerizate, o tehnică de imagistică cu raze X, utilizată pe scară largă în medicină și industrie.

Spectrul de frecvență al unei imagini poate fi calculat în mai multe moduri, dar metoda FFT prezentată aici este singura care este practică. Imaginea originală trebuie să fie compusă din N rânduri cu N coloane, unde N este o putere a lui doi, adică 256, 512, 1024 etc. Dacă dimensiunea imaginii originale nu este o putere a lui doi, sunt adăugați pixeli cu o valoare a zero pentru a face dimensiunea corectă. Vom numi matricea bidimensională care ține imaginea matrice reală. În plus, este necesară o altă matrice de aceeași dimensiune, pe care o vom numi matricea imaginară.

Rețeta pentru calculul transformatei Fourier a unei imagini este destul de simplă: luați FFT unidimensional pentru fiecare rând, urmat de FFT unidimensional al fiecăreia dintre coloane. Mai precis, începeți prin luarea FFT a valorilor a N pixeli în rândul 0 al matricei reale. Partea reală a ieșirii FFT este plasată înapoi în rândul 0 al matricei reale, în timp ce partea imaginară a ieșirii FFT este plasată în rândul 0 al matricei imaginare. După repetarea acestei proceduri pe rândurile 1 până la N -1, ambele matrici reală și imaginară conțin o imagine intermediară. Apoi, procedura se repetă pe fiecare dintre coloanele datelor intermediare. Luați valorile a N pixeli din coloana 0 din matrice reale, și valorile a N pixeli din coloana 0 a matricei imaginare și calculați FFT. Partea reală a ieșirii FFT este plasată înapoi în coloana 0 a matricei reale, în timp ce partea imaginară a ieșirii FFT este plasată înapoi în coloana 0 a matricei imaginare. După ce se repetă pe coloanele 1 până la N -1, ambele matrici au fost suprascrise cu spectrul de frecvență al imaginii.

Deoarece direcțiile verticală și orizontală sunt echivalente într-o imagine, acest algoritm poate fi de asemenea realizat prin transformarea coloanelor în primul rând și apoi prin transformarea rândurilor. Indiferent de ordinea utilizată, rezultatul este același. Din modul în care FFT ține evidența datelor, amplitudinile componentelor cu frecvență joasă ajung la colțurile spectrului bidimensional, în timp ce frecvențele înalte se află în centru. Transformata Fourier inversă a unei imagini este calculată aplicând FFT invers pentru fiecare rând, urmată de FFT inversă a fiecărei coloane (sau invers).

Figura 24-9 prezintă un exemplu de transformată Fourier a unei imagini. Figura (a) este imaginea originală, o vedere microscopică a etajului de intrare a unui circuit integrat 741 op amp. Figura (b) prezintă părțile reală și imaginară ale spectrului de frecvență al acestei imagini. Deoarece domeniul frecvență poate conține valori negative ale pixelilor, valorile în tonuri de gri din aceste imagini sunt decalate astfel încât valorile negative sunt întunecate, zero este gri, iar valorile pozitive sunt luminoase. Componentele de frecvență joasă dintr-o imagine sunt în mod normal mult mai ample în amplitudine decât componentele de înaltă frecvență. Aceasta explică pixelii foarte luminoși și întunecați din cele patru colțuri ale lui (b). În afară de aceasta, spectrele imaginilor tipice nu au nici o ordine perceptibilă, aparând aleatoriu. Desigur, imaginile pot fi plănuite pentru a avea spectrul dorit.

Așa cum se arată în (c), forma polară a unui spectru de imagini este doar puțin mai ușor de înțeles. Frecvențele joase în magnitudine au valori pozitive mari (colțurile albe), în timp ce frecvențele înalte au valori pozitive mici (centrul negru). Faza arată la fel la frecvențe joase și înalte, care apar la întâmplare între -π și π radiani.

Figura (d) prezintă un mod alternativ de afișare a unui spectru de imagine. Deoarece domeniul spațial conține un semnal discret, domeniul frecvență este periodic. Cu alte cuvinte, matricele din domeniul frecvență sunt duplicate de nenumărate ori în stânga, dreapta, sus și în jos. De exemplu, ne imaginăm un perete de piatră, cu fiecare dală având magnitudinea N×N prezentată în (c). Figura (d) este, de asemenea, o secțiune N×N a acestui perete de piatră, dar se ating patru dale; centrul imaginii fiind locul în care se ating patru plăci. Cu alte cuvinte, (c) este aceeași imagine ca și (d), cu excepția faptului că a fost deplasată N/2 pixeli orizontal (fie stânga sau dreapta) și N/2 pixeli pe verticală (în sus sau în jos) în spectrul de frecvență periodic. Acest lucru aduce pixelii luminoși în cele patru colțuri ale (c) împreună în centrul (d).

Figura 24-9 Spectrul de frecvență al unei imagini.

Imaginea exemplu, arătată în (a), este o fotografie microscopică a suprafeței de siliciu a unui circuit integrat. Spectrul de frecvență poate fi afișat ca părți reală și imaginară, arătat în (b), sau ca magnitudine și fază, arătat în (c). Figurile (b) și (c) sunt afișate cu frecvențele joase la colțuri și frecvențele înalte la centru. Deoarece domeniul frecvență este periodic, afișarea poate fi rearanjată pentru a inversa aceste poziții. Aceasta este arătată în (d), unde magnitudinea și faza sunt afișate cu frecvențele joase la centru și frecvențele înalte la colțuri.


b. Spectrul de frecvență afișat în forma dreptunghiulară (ca parte reală și imaginară).





c. Spectrul de frecvență afișat în forma polară (ca magnitudine și fază).





d. Spectrul de frecvență afișat în forma polară, cu spectrul deplasat pentru a plasa frecvența zero la centru.

Figura 24-10 ilustrează modul în care este organizat domeniul frecvență bidimensional (cu frecvențele joase plasate în colțuri). Rândul N/2 și coloana N/2 sparge spectrul de frecvențe în patru cadrane. Pentru partea reală și magnitudinea, cadranul din dreapta-sus este o imagine în oglindă a stânga-jos, în timp ce stânga-sus este o imagine în oglindă pentru dreapta-jos. Această simetrie se menține, de asemenea, pentru partea imaginară și fază, cu excepția faptului că valorile pixelilor oglindă sunt opuse în semn. Cu alte cuvinte, fiecare punct din spectrul de frecvențe are un punct pereche plasat simetric pe cealaltă parte a centrului imaginii (rândul N/2 și coloana N/2). Unul dintre puncte este frecvența pozitivă, în timp ce celălalt este frecvența negativă pereche, așa cum este discutată în capitolul 10 pentru semnalele unidimensionale. În forma ecuației, această simetrie este exprimată ca:

Ecuația 24-2 Simetria domeniului frecvență bi-dimensional.

Aceste ecuații pot fi utilizate în ambele formate, când frecvențele joase sunt afișate la colțuri, sau când deplasarea le pune la centru. În forma polară, magnitudinea are aceeași simetrie ca partea reală, în timp ce faza are aceeași simetrie ca partea imaginară.

Aceste ecuații iau în considerare faptul că spectrul de frecvențe este periodic, repetându-se la fiecare N eșantioane cu indici care rulează de la 0 la N-1. Cu alte cuvinte, X [r, N] trebuie interpretat ca X [r, 0], X [N, c] ca X [0, c] și X [N, N] ca X [0,0]. Această simetrie face ca patru puncte în spectru să se potrivească cu ele însăși. Aceste puncte sunt situate la: [0,0], [0, N/2], [N/2,0] și [N/2, N/2].

Fiecare pereche de puncte din domeniul frecvență corespunde unui sinusoid din domeniul spațial. Așa cum este arătat în (a), valoarea la corespunde sinusoidului de frecvență zero în domeniul spațial, adică componenta DC a imaginii. Există un singur punct afișat în această figură, deoarece acesta este unul dintre punctele care este propria sa pereche. După cum se arată în (b), (c) și (d), alte perechi de puncte corespund sinusoidelor bidimensionale care arată ca valuri pe ocean. Sinusoidele unidimensionale au frecvență, fază și amplitudine. Sinusoidele cu două dimensiuni au și direcție.

Frecvența și direcția fiecărei sinusoide este determinată de localizarea perechii de puncte în domeniul frecvență. Așa cum este arătat, trageți o linie de la fiecare punct la poziția de frecvență zero la colțul exterior al cuadrantului în care se află punctul, adică [0,0], [0,N/2], [N/2,0] și [N/2,N/2] (după cum indică cercurile din această figură). Direcția acestei linii determină direcția sinusoidei spațiale, în timp ce lungimea sa este proporțională cu frecvența undei. Acest lucru duce la poziționarea frecvențelor joase în apropierea colțurilor și a frecvențelor înalte în apropierea centrului.

Când spectrul este afișat cu frecvență zero la centru (figura 24-9d), linia din fiecare pereche de puncte este trasă la valoarea DC în centrul imaginii, adică [N/2,N/2]. Această organizare este mai ușor de înțeles și de lucrat cu ea, deoarece toate liniile sunt trase la același punct. Un alt avantaj al plasării zero în centru este că se potrivește cu spectrele de frecvență ale imaginilor continue. Când domeniul spațial este continuu, domeniul frecvență este aperiodic. Aceasta plasează frecvența zero la centru, frecvența devenind mai mare în toate direcțiile, până la infinit. În general, spectrele de frecvență ale imaginilor discrete sunt afișate cu frecvență zero la centru ori de câte ori oamenii vor vedea datele, în manuale, în articole de jurnal și în documentația algoritmului. Dar, majoritatea calculelor sunt efectuate cu matrice de calculatoare care stochează datele în alt format (frecvențe joase la colțuri). Acest lucru se datorează faptului că FFT are acest format.

Figura 24-10 Sinusoide bi-dimensionale.

Undele sinus și cosinus de imagine au atât o frecvență cât și o direcție. Aici sunt arătate patru exemple. Aceste spectre sunt afișate cu frecvențele joase la colțuri. Cercurile în aceste spectre arată locația frecvenței zero.

Chiar și cu FFT, timpul necesar pentru calcularea transformatei Fourier este un obstacol extraordinar în procesarea imaginilor. De ex., transformata Fourier a unei imagini de 512×512 necesită câteva minute pe un computer personal. Acesta este de aproximativ 10.000 de ori mai lent decât este necesar pentru procesarea imaginii în timp real, 30 de cadre pe secundă. Acest timp lung de execuție rezultă din cantitatea masivă de informații conținute în imagini. Pentru comparație, există aproximativ același număr de pixeli într-o imagine tipică, câte cuvinte există în această carte. Procesarea imaginii prin intermediul domeniului frecvență va deveni mai populară pe măsură ce computerele devin mai rapide. Aceasta este o tehnologie din secolul douăzeci și unu; urmăriți-o să apară!

Secțiunea următoare: Convoluția FFT