25.3 Raportul semnal-zgomot SNR

Un obiect este vizibil într-o imagine, deoarece are o luminozitate diferită de cea din jur. Adică, contrastul obiectului (semnalul) trebuie să depășească zgomotul imaginii. Acest lucru poate fi împărțit în două clase: limitări ale ochiului și limitări ale datelor.

Figura 25-7 ilustrează un experiment pentru măsurarea capacității ochiului de a detecta semnale slabe. În funcție de condițiile de observare, ochiul uman poate detecta un contrast minim de 0,5% până la 5%. Cu alte cuvinte, oamenii pot distinge între 20 și 200 de nuanțe de gri dintre negrul cel mai negru și albul cel mai alb. Numărul exact depinde de o varietate de factori, cum ar fi ca luminozitatea fulgerului ambiental, distanța dintre cele două regiuni de comparat și modul în care se formează imaginea în tonuri de gri (monitor video, fotografie, halfton etc.).

Figura 25-7 Detectarea contrastului.

Ochiul uman poate detecta un contrast minim de aproximativ 0,5 la 5%, în funcție de condițiile de observare.
Contrast 100% este diferența între negru pur și alb pur.

Figura 25-8 SNR minim detectabil.

Un obiect este vizibil într-o imagine numai dacă contrastul său este suficient de mare pentru a depăși zgomotul aleator de imagine. În acest exemplu, cele trei pătrate au SNR de 2, 1 și 0,5 (unde SNR este definit ca fiind contrastul obiectului împărțit la deviația standard a zgomotului).

Transformarea în nuanțe de gri din capitolul 23 poate fi utilizată pentru a stimula contrastul unei game selectate de valori ale pixelilor, oferind un instrument valoros în depășirea limitărilor ochiului uman. Contrastul la un nivel de luminozitate este mărit, la prețul de reducere a contrastului la alt nivel de luminozitate. Dar, aceasta lucrează numai atunci când contrastul obiectului nu este pierdut în zgomotul aleator al imaginii. Aceasta este o situație mai gravă; semnalul nu conține suficiente informații pentru a dezvălui obiectul, indiferent de performanța ochiului.

Figura 25-8 arată o imagine cu trei pătrate având contraste de 5%, 10% și 20%. Fundalul conține zgomot aleator distribuit normal, cu o deviație standard de aproximativ 10% contrast. SNR este definit ca contrastul împărțit prin deviația standard a zgomotului, rezultând că cele trei pătrate au SNR de 0,5, 1,0 și 2,0. În general, problema începe când SNR scade sub aproximativ 1.0.

Valoarea exactă pentru SNR minim detectabil depinde de mărimea obiectului; cu cât obiectul este mai mare, cu atât este mai ușor să se detecteze. Pentru a înțelege acest lucru, imaginați-vă netezirea imaginii din figura 25-8 cu un kernel filtru pătrat de 3×3. Acesta lasă contrastul la fel, dar reduce zgomotul cu un factor de trei (adică rădăcina pătrată a numărului de pixeli din kernel). Deoarece SNR este triplat, pot fi văzute obiecte cu contrast mai mic. Pentru a vedea obiecte mai palide, kernelul filtrului poate fi chiar mai mare. De ex., un kernel de 5×5 îmbunătățește SNR cu un factor de √25. Această strategie poate fi continuată până când kernelul filtrului este egal cu dimensiunea obiectului de detectat. Aceasta înseamnă că abilitatea de a detecta un obiect este proporțională cu rădăcina pătrată a ariei lui. Dacă diametrul unui obiect este dublat, acesta poate fi detectat în zgomot de două ori mai mare.

Procesarea vizuală în creier se comportă în același mod, netezind imaginea văzută cu mărimi diferite ale kernelurilor de filtrare, în încercarea de a recunoaște obiecte cu contrast scăzut. Cele trei profile din Fig. 25-8 ilustrează cât de buni sunt oamenii în detectarea obiectelor în medii zgomotoase. Chiar dacă obiectele pot fi identificate cu greu în profiluri, ele sunt evidente în imagine. Pentru a aprecia cu adevărat capacitățile sistemului vizual uman, încercați să scrieți algoritmi care operează în acest mediu SNR redus. Vei fi umilit de ceea ce creierul tău poate face, dar codul tău nu poate!

Zgomotul imaginii aleator vine în două forme comune. Primul tip, prezentat în fig. 25-9a, are o amplitudine constantă. Cu alte cuvinte, regiunile întunecate și luminoase din imagine sunt la fel de zgomotoase. În comparație, (b) ilustrează zgomotul care crește cu nivelul semnalului, rezultând zonele luminoase fiind mai zgomotoase decât cele întunecate. Ambele surse de zgomot sunt prezente în majoritatea imaginilor, dar unul sau celălalt este de obicei dominant. De exemplu, este normal ca zgomotul să scadă odată cu scăderea nivelului de semnal, până la atingerea unui platou cu zgomot de amplitudine constantă.

O sursă comună de zgomot de amplitudine constantă este preamplificatorul video. Toate circuitele electronice analogice produc zgomot. Dar, el face cel mai mult rău acolo unde semnalul amplificat este cel mai mic, chiar la CCD sau alt senzor de imagine. Zgomotul preamplificatorului provine din mișcarea aleatorie a electronilor din tranzistoare. Acest lucru face ca nivelul de zgomot să depindă de modul în care sunt proiectate elementele electronice, dar nu la nivelul semnalului de amplificat. De exemplu, o cameră tipică CCD va avea un SNR de aproximativ 300 până la 1000 (40 până la 60 dB), definit ca un nivel al semnalului la scală maximă împărțit la deviația standard a zgomotului de amplitudine constantă.

Figura 25-9 Zgomotul imaginii.

Zgomotul aleator în imagini ia două forme generale. În (a), amplitudinea zgomotului rămâne constantă în timp ce nivelul semnalului se schimbă. Aceasta este tipic zgomotului electronic. În (b), amplitudinea zgomotului crește cu rădăcina pătrată a nivelului de semnal. Acest tip de zgomot apare la detectarea unui număr mic de particule, cum ar fi fotonii de lumină, electronii sau raze-x.

Zgomot care crește cu nivelul semnalului rezultă când imaginea a fost reprezentată de un număr mic de particule individuale. De exemplu, acestea ar putea fi razele X care trec printr-un pacient, fotonii de lumină care intră într-o cameră sau electronii din well-urile unui CCD. Matematica ce guvernează aceste variații se numește statistică de numărare sau statistică Poisson. Să presupunem că fața unui CCD este uniform luminată, astfel încât în ​​fiecare well să fie generată o medie de 10.000 de electroni. Prin șansă, unele well vor avea mai mulți electroni, în timp ce unele vor avea mai puțini. Pentru a fi mai exact, numărul de electroni va fi distribuit normal cu o medie de 10.000, cu o anumită deviație standard care descrie cât de multe variații există de la well-la-well. O caracteristică-cheie a statisticii Poisson este că deviația standard este egală cu rădăcina pătrată a numărului de particule individuale. Adică, în cazul în care există N particule în fiecare pixel, media este egală cu N și deviația standard este egală cu √N. Acest lucru face raportul semnal-zgomot egal cu N/√N, sau pur și simplu, √N. În formă de ecuații:

Ecuația 25-1 Statistica Poisson.

Într-un semnal distribuit Poisson, media μ, este numărul mediu de particule individuale, N. Deviația standard F este egală cu rădăcina pătrată a numărului mediu de particule individuale. Raportul semnal-zgomot (SNR) este media împărțită la deviația standard.

μ' = N F' = √N SNR' = √N

În exemplul CCD deviația standard este √10.000 = 100. De asemenea, raportul semnal-zgomot este √10.000 = 100. Dacă numărul mediu de electroni pe well este mărit la un milion, atât deviația standard cât și SNR cresc la 1.000. Asta înseamnă că zgomotul devine mai mare pe măsură ce semnalul devine mai mare, așa cum se arată în figurile 25-9b. Dar, semnalul devine mai rapid decât zgomotul, având ca rezultat o îmbunătățire generală a SNR. Nu vă păcăliți în a gândi că un semnal mai mic va oferi mai puțin zgomot și, prin urmare, informații mai bune. Rețineți că obiectivul dvs. nu este de a reduce zgomotul, ci de a extrage un semnal din zgomot. Aceasta face SNR parametrul cheie.

Multe sisteme de imagini operează prin convertirea unui tip de particule în altul. De exemplu, considerați ceea ce se întâmplă într-un sistem medical de imagistică cu raze X. Într-un tub cu raze X, electronii lovesc o țintă de metal, care produce raze x. După trecerea prin pacient, razele X lovesc un detector cu tub vidat cunoscut ca intensificator de imagine. Aici, razele X sunt convertite ulterior în fotoni de lumină, apoi electroni și apoi înapoi în fotoni de lumină. Acești fotoni de lumină intră în camera unde sunt transformați în electroni în well-ul unui CCD. În fiecare din aceste forme intermediare, imaginea este reprezentată de un număr finit de particule, rezultând un zgomot suplimentar așa cum este dictat de Ec. 25-1. SNR final reflectă zgomotul combinat al tuturor etapelor; totuși, o etapă este de obicei dominantă. Aceasta este etapa cu cel mai rău SNR deoarece are cele mai puține particule. Această etapă limitatoare se numește radiator cuantic.

În sistemele de vedere nocturne, radiatorul cuantic este numărul de fotoni de lumina care poate fi capturat de aparatul de fotografiat. Cu cât este mai întunecată noaptea, cu atât mai zgomotoasă este imaginea finală. Imagistica cu raze X este un exemplu similar; radiatorul cuantic este numărul de raze X care lovește detectorul. Nivelele ridicate de radiații oferă imagini mai puțin zgomotoase, în detrimentul mai multor radiații pentru pacient.

Când este zgomotul din statistica Poisson zgomotul primar dintr-o imagine? Este dominant ori de câte ori zgomotul rezultat din radiatorul cuantic este mai mare decât alte surse de zgomot din sistem, cum ar fi de la electronică. De exemplu, considerați o cameră CCD tipică cu un SNR de 300. Adică, zgomotul de la preamplificatorul CCD este 1/300 din semnalul de scală maximă. Un zgomot echivalent ar fi produs dacă radiatorul cuantic al sistemului conține 90.000 de particule pe pixel. Dacă radiatorul cuantic are un număr mai mic de particule, zgomotul Poisson va domina sistemul. Dacă radiatorul cuantic are un număr mai mare de particule, zgomotul preamplificatorului va fi predominant. În consecință, majoritatea CCD-urilor sunt proiectate cu o capacitate well completă de 100.000 până la 1.000.000 de electroni, minimizând zgomotul Poisson.

Secțiunea următoare: Prelucrarea imaginilor morfologice