22.4 Înalta fidelitate audio

Audiofilii solicită cea mai bună calitate a sunetului, iar toți ceilalți factori sunt considerați secundari. Dacă ar fi trebuit să descrieți starea de spirit într-un singur cuvânt, ea ar fi: exagerare. Mai degrabă decât să se potrivească doar cu abilitățile urechii umane, aceste sisteme sunt proiectate să depășească limitele auzului. Este singura modalitate de a fi siguri că muzica reprodusă este impecabilă. Audio digital a fost adus în lume prin disc compact cu laser sau CD. Aceasta a fost o revoluție în muzică; calitatea sunetului sistemului CD depășește cu mult sistemele mai vechi, cum ar fi înregistrările și casetele. DSP a fost în fruntea acestei tehnologii.

Figura 22-5 ilustrează suprafața unui disc compact cu laser, cum ar fi văzută printr-un microscop de mare putere. Suprafața principală este strălucitoare (reflectând lumina), informația digitală fiind stocată ca o serie de gropi negre arse pe suprafață cu un laser. Informația este aranjată într-o singură pistă care se spiralează din exterior spre interior, la fel ca și înregistrarea de gramofon. Rotația CD-ului se modifică de la aproximativ 210 la 480 rpm, deoarece informația este citită de la exteriorul spre interiorul spiralei, ceea ce face ca viteza de scanare să fie constantă de 1,2 metri pe secundă. (În comparație, înregistrările de gramofon se rotesc la o rată fixă, cum ar fi 33, 45 sau 78 rpm). În timpul redării, un senzor optic detectează dacă suprafața este reflectorizantă sau nu, generând informație binară corespunzătoare.

După cum arată geometria din figura 22-5, CD-ul stochează aproximativ 1 bit per (μ)2, corespunzând la 1 milion de biți pe (mm)2 și 15 miliarde de biți pe disc. Este vorba despre aceeași dimensiune a caracteristicilor folosite în fabricarea circuitelor integrate și pentru un motiv bun. Una dintre proprietățile luminii este că nu poate fi focalizată la mai puțin de decât aproximativ jumătate din lungimea de undă, sau 0,3 μm. Deoarece ambele circuite integrate și discurile laser sunt create prin mijloace optice, neclaritatea luminii sub 0,3 μm limitează cât de mică poate fi folosită.

Figura 22-6 prezintă o diagramă bloc a unui sistem tipic de redare compact disc. Rata de date brute este de 4,3 milioane de biți pe secundă, ceea ce corespunde unui bit la 0,28 μm lungime de pistă. Totuși, aceasta este în conflict cu geometria specificată a CD-ului; fiecare groapă nu trebuie să fie mai scurtă de 0,8 μm și nu mai lungă de 3,5 μm. Cu alte cuvinte, fiecare unu binar unul trebuie să facă parte dintr-un grup de 3 până la 13 de unu. Acest lucru are avantajul de a reduce rata de eroare datorată restabilirii optice, dar cum forțezi datele binare să respecte această grupare ciudată?

Răspunsul este o schemă de codare numită modulare de la opt la patruzeci (Eigth-to-Fourteen Modulation). În loc să stocheze direct un octet de date pe disc, cele 8 biți sunt trecute printr-un tabel de căutare care scoate 14 biți. Acești 14 de biți au caracteristicile de grupare dorite și sunt stocate pe discul laser. La redare, valorile binare citite de pe disc sunt transmise prin inversul EFM tabelului de căutare, rezultând fiecare grup de 14 biți readus înapoi la cei 8 biți corecți.

Figura 22-5 Suprafața compact-disc.

Adâncituri de 0,16 microni sunt arse pe suprafața CD-ului pentru a reprezenta unități și zerouri. Aceasta rezultă într-o densitate de 1 bit/μm2, sau un milion biți pe mm2.

Figura 22-6 Diagrama bloc de redare a compact discului.
Informația digitală este recuperată din disc cu un senzor optic, corectată pentru codare EFM și Reed-Solomon, și convertită în semnale analogice stereo.

Pe lângă EFM, datele sunt codificate într-un format numit codare Reed-Solomon pe două nivele. Aceasta implică combinarea canalelor stereo stânga și dreapta împreună cu datele pentru detectarea și corectarea erorilor. Erori digitale detectate în timpul redării sunt fie: corectate prin utilizarea datelor redundante în schema de codare, ascunse prin interpolarea între eșantioanele adiacente, fie dezactivate prin setarea valorii eșantionului la zero. Aceste scheme de codificare au ca rezultat triplarea ratei de date, adică 1,4 Mbiți/sec pentru semnalele audio stereo versus 4,3 Mbiți/sec stocați pe disc.

După decodificare și corecție de eroare, semnalele audio sunt reprezentate ca eșantioane de 16 biți la o rată de eșantionare de 44,1 kHz. În cel mai simplu sistem, aceste semnale ar putea fi rulate printr-un DAC de 16 biți, urmat de un filtru analogic low-pass. Dar, acest lucru ar impune ca electronica analogică de înaltă performanță să treacă frecvențe sub 20 kHz, în timp ce rejectează toate frecvențele de peste 22,05 kHz, jumătate din rata de eșantionare. O metodă mai obișnuită este utilizarea unei tehnici multirate, adică conversia datelor digitale la o rată de eșantionare mai mare, înainte de DAC. Un factor de patru este utilizat în mod obișnuit, convertindu-se de la 44,1 kHz la 176,4 kHz. Aceasta se numește interpolare, și poate fi explicat ca un proces în două etape (deși nu se poate realiza real în acest fel). În primul rând, trei eșantioane cu valoarea zero sunt plasate între eșantioanele originale, producând o rată de eșantionare mai mare. În domeniul frecvență, acest lucru are efectul duplicării spectrului de frecvențe de la 0 la 22,05 kHz de trei ori, de la 22,05 la 44,1 kHz, de la 41 la 66,15 kHz și de la 66,15 la 88,2 kHz. În a doua etapă, se utilizează un filtru digital eficient pentru a elimina frecvențele nou adăugate.

Creșterea ratei de eșantionare face intervalul de eșantionare mai mic, rezultând un semnal mai neted generat de DAC. Semnalul conține încă frecvențe între 20 Hz și 20 kHz; dar, frecvența Nyquist a crescut cu un factor de patru. Aceasta înseamnă că filtrul analogic trebuie doar să treacă frecvențe sub 20 kHz, în timp ce blochează frecvențele de peste 88,2 kHz. Acest lucru se face, de obicei, cu un filtru Bessel cu trei poli. De ce să folosiți un filtru Bessel dacă urechea este insensibilă la fază? Exagerare, vă amintiți?

Deoarece există de patru ori mai multe eșantioane, numărul de biți per eșantionă poate fi redus de la 16 biți la 14 biți, fără a degrada calitatea sunetului. Corecția sin(x)/x necesară să compenseze pentru menținerea zeroth order a DAC poate face parte din filtrul analogic sau digital.

Sistemele audio cu mai multe canale se spune că sunt în stereo (din cuvântul grecesc pentru solid sau tri-dimensional). Mai multe canale transmit sunetul către ascultător din diferite direcții, oferind o reproducere mai exactă a muzicii originale. Muzica transmisă printr-un sistem mono (un canal) sună adesea artificial și fadă. În comparație, o reproducere stereo bună face ca ascultătorul să se simtă ca și cum muzicienii sunt la numai câțiva metri distanță. Din anii 1960, muzica de înaltă fidelitate a folosit două canale (stânga și dreapta), în timp ce imaginile video au folosit patru canale (stânga, dreapta, centru și surround). În înregistrările stereo timpurii (de exemplu, Beatles sau Mamas și Papas), cântăreții individuali pot fi adesea auziți doar într-un singur canal sau în celălalt. Acest lucru a progresat rapid într-o mixare mai sofisticată, unde sunetul de la mai multe microfoane din studioul de înregistrare este combinat în cele două canale. Mix-down este o artă, care are ca scop să ofere ascultătorului percepția că este acolo.

Sunetul cu patru canale folosit în imagini video este denumit Dolby Stereo, cu versiunea casnică numită Dolby Surround Pro Logic. ("Dolby" și "Pro Logic" sunt mărci comerciale ale Dolby Laboratories Licensing Corp.). Cele patru canale sunt codificate în canalele standard stânga și dreapta, permițând sistemelor stereo regulate cu două canale să reproducă muzica. Un decodor Dolby este utilizat în timpul redării pentru a recrea cele patru canale de sunet. Canalele stânga și dreaptă, de la boxe plasate pe fiecare parte a ecranului de film sau televizor, sunt similare cu cele ale unui sistem stereo obișnuit cu două canale. Difuzorul pentru canalul central este, de obicei, plasat direct deasupra sau dedesubtul ecranului. Scopul său este de a reproduce vorbirea și alte sunete conectate vizual, ținându-le în centrul atenției pe ecran, indiferent de poziția de așezare a spectatorului/ascultătorului. Difuzoarele surround sunt amplasate în partea stângă și dreaptă a ascultătorului, și poate implica până la douăzeci de vorbitori într-un auditoriu larg. Canalul surround conține doar frecvențe din gama de mijloc (de exemplu, 100 Hz până la 7 kHz) și este întârziat cu 15-30 de milisecunde. Această întârziere face ca ascultătorul să perceapă că vorbirea vine de pe ecran, și nu din lateral. Adică, ascultătorul aude vorbirea care vine din față, urmat de o versiune întârziată a discursului care vine de pe laturi. Mintea ascultătorului interpretează semnalul întârziat ca o reflecție de la pereți și îl ignoră.

Secțiunea următoare: Companding