22.3 Calitatea sunetului vs. rata datelor

La proiectarea unui sistem audio digital există două întrebări: (1) cât de bine trebuie să sune? și (2) ce rată de date poate fi tolerată? Răspunsul la aceste întrebări conduce la una din cele trei categorii.

În primul rând, muzica de înaltă fidelitate, unde calitatea sunetului este de cea mai mare importanță și aproape orice rată de date va fi acceptabilă.

A doua, comunicarea telefonică, care necesită vorbirea să sune natural și o rată scăzută a datelor pentru a reduce costul sistemului.

În al treilea rând, vorbirea comprimată, în care reducerea ratei de date este foarte importantă și pot fi tolerate unele caracteristici artificiale ale calității sunetului. Acestea includ comunicația militară, telefoanele celulare și vorbirea stocată digital pentru mesageria vocală și multimedia.

Tabelul 22-2 prezintă compromisul între calitatea sunetului și rata datelor pentru aceste trei categorii. Sistemele de muzică de înaltă fidelitate eșantionează suficient de repede (44,1kHz) și cu o precizie suficientă (16 biți), astfel încât să capteze aproape toate sunetele pe care oamenii le pot auzi. Această calitate magnifică a sunetului vine la prețul unei rate mari de date, 44,1 kHz × 16 biți = 706 kbiți/sec. Aceasta este forța brută pură.

În timp ce muzica necesită o lățime de bandă de 20 kHz, vorbirea naturală necesită doar aproximativ 3,2 kHz. Chiar dacă gama de frecvență a fost redusă la doar 16% (3,2 kHz din 20 kHz), semnalul conține încă 80% din informația de sunet originală (8 din 10 octave). Sistemele de telecomunicații funcționează în mod obișnuit cu o rată de eșantionare de aprox. 8 kHz, permițând vorbirii să sune natural, dar reduce semnificativ calitatea muzicii. Probabil sunteți deja familiarizați cu această diferență în calitatea sunetului: posturile de radio FM difuzate cu o lățime de bandă de aproape 20 kHz, în timp ce posturile de radio AM sunt limitate la aproximativ 3,2 kHz. Vocile sună normal pe posturile AM, dar muzica este slabă și nesatisfăcătoare.

Sistemele numai-vocale reduc de asemenea precizia de la 16 biți la 12 biți per eșantion, cu o schimbare puțin vizibilă a calității sunetului. Acest lucru poate fi redus la numai 8 biți pe eșantion dacă dimensiunea pasului de cuantificare este făcută inegal. Aceasta este o procedură pe scară largă numită companding, și va fi discutată mai târziu în acest capitol. O rată de eșantionare de 8 kHz, cu o precizie ADC de 8 biți pe probă, are ca rezultat o rată a datelor de 64 kb/sec. Aceasta este rata de date a forței brute pentru vorbirea naturală. Observați că vorbirea necesită mai puțin de 10% din rata de transmisie a muzicii de înaltă fidelitate.

Tabelul 22-2 Rata datelor audio vs. calitatea sunetului.
Calitatea sonoră a unui semnal audio digitizat depinde de rata datelor sale, produsul ratei sale de eșantionare și numărul de biți pe eșantion. Aceasta poate fi împărțită în trei categorii, muzica de înaltă fidalitate (706 Kbiți/sec), vorbire de calitate la telefon (64 Kbiți/sec) și vorbire comprimată (4 Kbiți/sec).

Rata de date de 64k biți/sec reprezintă aplicarea directă a teoriei de eșantionare și de cuanti-ficare a semnalelor audio. Tehnicile de scădere a ratei de date se bazează în continuare pe comprimarea fluxului de date prin eliminarea redundanțelor inerente în semnalele de vorbire. Comprimarea datelor este subiectul capitolului 27. Una dintre cele mai eficiente metode de comprimare a unui semnal audio este codarea liniară predictivă (Linear Predictive Coding), din care există mai multe variante și subgrupe. În funcție de calitatea vorbirii solicitate, LPC poate reduce rata datelor la doar 2-6k biți/sec. Vom revizita LPC mai târziu în acest capitol cu sinteza vorbirii.

Secțiunea următoare: Audio de înaltă fidelitate