23.1 Structura imaginii digitale

Figura 23-1 ilustrează structura unei imagini digitale. Această imagine exemplu este de pe planeta Venus, achiziționată de radar cu microunde de la o sondă spațială orbitală. Imagistica cu microunde este necesară deoarece atmosfera densă blochează lumina vizibilă, făcând imposibilă fotografierea standard. Imaginea prezentată este reprezentată de 40.000 de mostre aranjate într-o matrice bidimensională de 200 de coloane cu 200 de rânduri. La fel ca la semnalele unidimensionale, aceste rânduri și coloane pot fi numerotate de la 0 la 199 sau de la 1 la 200. În jargonul imagistic, fiecare eșantion este numit pixel, o contracție a expresiei: picture element. Fiecare pixel în acest exemplu este un număr unic cuprins între 0 și 255. Când imaginea a fost achiziționată, acest număr s-a referit la cantitatea de energie a microundei reflectată din locația corespunzătoare de pe suprafața planetei. Pentru a afișa această imagine ca imagine vizuală, valoarea fiecărui pixel este convertită într-o gamă de gri (grayscale), unde 0 este negru, 255 este alb, iar valorile intermediare sunt nuanțe de gri.

Imaginile au informația lor codificată în domeniul spațial, echivalentul imaginii în domeniul timp. Cu alte cuvinte, trăsăturile din imagini sunt reprezentate de muchii, nu de sinusoide. Aceasta înseamnă că spațierea și numărul de pixeli sunt determinate de cât de mici dintre caracteristici trebuie văzute, mai degrabă decât de constrângerile formale ale teoremei de eșantionare. Aliasing-ul poate apărea în imagini, dar este, în general, considerat mai degrabă o neplăcere decât o problemă majoră. De exemplu, costumele cu dungi arată groaznic la televizor, deoarece modelul repetitiv este mai mare decât frecvența Nyquist. Frecvențele alias apar ca benzi luminoase și întunecate care se mișcă peste haine, când persoana își schimbă poziția.

O imagine digitală "tipică" este compusă din aproximativ 500 de rânduri cu 500 de coloane. Aceasta este calitatea imaginii întâlnite în televiziune, aplicații de calculator personal și cercetare științifică generală. Imaginile cu mai puțini pixeli, de ex. 250 cu 250, sunt considerate ca având o rezoluție neobișnuit de slabă. Acesta este în mod frecvent cazul noilor modalități imagistice; pe măsură ce tehnologia se maturizează, se adaugă mai mulți pixeli. Aceste imagini cu rezoluție scăzută arată foarte nenatural, iar pixelii individuali pot fi adesea văzuți. În celălalt capăt, imaginile cu mai mult de 1000 cu 1000 de pixeli sunt considerate excepțional de bune. Aceasta este calitatea celor mai bune imagini de pe computer, televizoare de înaltă definiție și filme de 35 mm. Există, de asemenea, aplicații care necesită o rezoluție chiar mai mare, necesitând câteva mii de pixeli pe fiecare parte: imagini digitale cu raze X, fotografii spațiale și reclame lucioase în magazine.

Cea mai puternică motivație pentru utilizarea imaginilor cu rezoluție inferioară este aceea că există mai puțini pixeli de manipulat. Acest lucru nu este banal; una dintre cele mai dificile probleme în procesarea imaginilor este gestionarea unor cantități masive de date. De exemplu, o secundă de audio digital necesită aproximativ opt kilobytes. În comparație, o secundă de televiziune necesită aproximativ opt megabytes. Transmiterea unei imagini de 500 cu 500 de pixeli pe un modem de 33,6 kbps necesită aproape un minut! Sărirea la o dimensiune a imaginii de 1000 cu 1000 cvadruplează aceste probleme.

Se utilizează 256 nivele de gri (nivele de cuantificare) care se utilizează în procesarea imaginilor, corespunzând unui singur octet (byte) per pixel. Există mai multe motive pentru aceasta. În primul rând, un singur octet este convenabil pentru gestionarea datelor, deoarece acesta este modul în care computerele stochează de obicei date. În al doilea rând, numărul mare de pixeli dintr-o imagine compensează într-o anumită măsură un număr limitat de pași de cuantificare. De exemplu, imaginați-vă un grup de pixeli adiacenți care se alternează în valoare între numerele digitale (DN) 145 și 146. Ochiul uman percepe regiunea ca o luminozitate de 145,5. Cu alte cuvinte, imaginile sunt foarte dithered. În al treilea rând, și cel mai important, dimensiunea treptei de luminozitate de 1/256 (0,39%) este mai mică decât poate percepe ochiul. O imagine prezentată unui observator uman nu va fi îmbunătățită prin utilizarea a peste 256 nivele.

Totuși, unele imagini trebuie să fie stocate cu mai mult de 8 biți pe pixel. Rețineți că majoritatea imaginilor întâlnite în DSP reprezintă parametri nevizuali. Imaginea achiziționată poate fi capabilă să profite de mai multe nivele de cuantizare pentru a capta în mod corespunzător detalii subtile ale semnalului. Ideea este să nu vă așteptați la ochiul uman să vadă toate informațiile conținute în aceste nivele fin distanțate. Vom analiza modalitățile în jurul acestei probleme în timpul unei discuții ulterioare despre luminozitate și contrast.

Figura 23-1 Structura imaginii digitale.

Această imagine exemplu este planeta Venus, cum este văzută în microundele reflectate. Imaginile digitale sunt reprezentate printr-o matrice bi-dimensională de numere, fiecare fiind numit pixel. În această imagine, matricea are 200 de linii și 200 de coloane, cu fiecare pixel un număr între 0 și 255. Când această imagine a fost achiziționată, valoarea fiecărui pixel a corespuns nivelului de energie al microundei reflectate. O imagine grayscale este formată prin atribuirea fiecărei valori de la 0 la 255 de nuanțe diferite de gri.

Valoarea fiecărui pixel din imaginea digitală reprezintă o regiune mică în imaginea continuă care este digitalizată. De exemplu, imaginați-vă că sonda Venus preia probe la fiecare 10 metri de-a lungul suprafeței planetei, pe măsură ce orbitează deasupra. Aceasta definește o spațiere de eșantion pătrat și o rețea de eșantionare, fiecare pixel reprezentând o arie de 10 metri pe 10 metri. Acum, imaginați-vă ce se întâmplă într-o singură măsurare a reflectării microundei. Sonda spațială emite o explozie (burst) extrem de focalizată a energiei de microunde, lovind suprafața, de exemplu, într-o zonă circulară de 15 metri în diametru. Fiecare pixel conține, deci, informații despre această zonă circulară, indiferent de mărimea grilei de eșantionare.

Această regiune a imaginii continue care contribuie la valoarea pixelului este denumită diafragma de eșantionare (sampling aperture). Mărimea diafragmei de eșantionare este adesea legată de capacitățile inerente ale sistemului particular de imagistică utilizat. De exemplu, microscoapele sunt limitate de calitatea opticii și de lungimea de undă a luminii, camerele foto electronice sunt limitate prin difuzia aleatorie a electronilor în senzorul de imagine și așa mai departe. În majoritatea cazurilor, grila de eșantionare este realizată aproximativ la fel ca diafragma de eșantionare a sistemului. Rezoluția în imaginea digitală finală va fi limitată primar de cea mai mare dintre cele două, grila de eșantionare sau de diafragma de eșantionare. Vom reveni la acest subiect în capitolul 25 atunci când discutăm despre rezoluția spațială a imaginilor digitale.

Culoarea este adăugată la imaginile digitale folosind trei numere pentru fiecare pixel, reprezentând intensitatea celor trei culori primare: roșu, verde și albastru. Amestecarea acestor trei culori generează toate culorile posibile pe care ochiul uman le poate percepe. Un singur octet este folosit frecvent pentru a stoca fiecare dintre intensitățile culorilor, permițând imaginii să capteze un total de 256 x 256 x 256 = 16,8 milioane de culori diferite.

Culoarea este foarte importantă atunci când obiectivul este acela de a prezenta observatorului o imagine reală a lumii, cum ar fi în televiziune și în fotografie. Totuși, acest lucru nu este de obicei modul în care imaginile sunt folosite în știință și inginerie. Scopul, aici, este de a analiza un semnal bidimensional prin utilizarea sistemului vizual vizual ca un instrument. Imaginile alb-negru sunt suficiente pentru acest lucru.

Secțiunea următoare: Aparate de fotografiat și ochii