22.2 Timbru

Percepția unui sunet continuu, cum ar fi o notă de la un instrument muzical, este deseori împărțită în trei părți: intensitate (loudness), înălțime (pitch) și timbru. Loudness este o măsură a intensității undei sonore, așa cum a fost descris anterior. Pitch este frecvența componentei fundamentale în sunet, adică frecvența cu care forma de undă se repetă. Deși există efecte subtile în ambele percepții, ele sunt un meci simplu, cu cantități fizice caracterizate ușor.

Timbrul este mai complicat, fiind determinat de conținutul armonic al semnalului. Figura 22-2 ilustrează două forme de undă, fiecare formată prin adăugarea unei unde sinusoidale de 1 kHz cu o amplitudine unu, la o undă sinusoidală de 3 kHz cu o amplitudine jumătate. Diferența dintre cele două forme de undă este aceea că una arătată în (b) are cea mai mare frecvență inversată înainte de adăugare. Altfel, a treia armonică (3 kHz) este defazată cu 180 de grade față de prima armonică (1 kHz). În ciuda formelor de undă foarte diferite din domeniul timp, aceste două semnale sună identic. Acest lucru se datorează faptului că auzul se bazează pe amplitudinea frecvențelor și este foarte insensibil la faza lor. Forma undei din domeniul timp este doar indirect legată de auz și de obicei nu este luată în considerare în sistemele audio.

Figura 22-2 Detectarea fazei de urechea umană.
Urechea umană este foarte insensibilă la faza relativă a sinusoidelor componente. De exemplu, aceste două forme de undă ar trebui să sune identic, deoarece amplitudinile componentelor lor sunt la fel, cu toate că fazele lor relative sunt diferite.

Insensibilitatea urechii la fază poate fi înțeleasă examinând modul cum sunetul se propagă prin mediul înconjurător. Să presupunem că ascultați o persoană care vorbește într-o cameră mică. O mare parte din sunetul care vă atinge urechile se reflectă din pereți, tavan și podea. Deoarece propagarea sunetului depinde de frecvență (cum ar fi: atenuarea, reflexia și rezonanța), frecvențe diferite vor ajunge la ureche pe diferite căi. Aceasta înseamnă că faza relativă a fiecărei frecvențe se va schimba în timp ce vă deplasați în jurul camerei. Deoarece urechea ignoră aceste variații de fază, percepeți vocea ca neschimbată pe măsură ce vă mișcați poziția. Din punct de vedere fizic, faza unui semnal audio devine haotică, deoarece se propagă printr-un mediu complex. Altfel, urechea este insensibilă la fază, deoarece conține puține informații utile.

Totuși, nu se poate spune că urechea este complet surdă la fază. Aceasta deoarece o schimbare de fază poate rearanja secvența de timp a unui semnal audio. Un exemplu este sistemul chirp (cap. 11) care schimbă un impuls într-un semnal de durată mult mai lung. Deși diferă numai în faza lor, urechea poate distinge între cele două sunete datorită diferenței de durată. În cea mai mare parte, aceasta este doar o curiozitate, nu ceva care se întâmplă în mediul normal de ascultare.

Să presupunem că noi cerem unui violonist să redea o notă, să zicem, A mai jos de C mediu. Când forma de undă este afișată pe un osciloscop, ea apare ca dinți de fierăstrău, prezentată în figura 22-3a. Acesta este un rezultat al sacâzului cleios aplicat fibrelor arcului violonistului. Pe măsură ce arcul este tras peste coardă, forma de undă se formează pe măsură ce coarda se lipește de arc, se trage înapoi și în cele din urmă se rupe liber. Acest ciclu se repetă de fiecare dată, rezultând forma de undă a dinților de fierăstrău.

Figura 22-3b arată modul cum acest sunet este perceput de ureche, o frecvență de 220 Hz, plus armonici la 440, 660, 880 Hz etc. Dacă această notă a fost redată pe un alt instrument, forma de undă ar arăta diferit; totuși, urechea ar auzi încă o frecvență de 220 Hz plus armonici. Deoarece cele două instrumente produc aceeași frecvență fundamentală pentru această notă, ele sună similar și se spune că au o înălțime identică. Deoarece amplitudinea relativă a armonicelor este diferită, ele nu vor suna identic și se va spune că au timbru diferit.

Se spune adesea că timbrul este determinat de modelul formei de undă. Acest lucru este adevărat, dar ușor de înșelat. Percepția timbrului rezultă de la armonicile detectate de ureche. În timp ce conținutul armonic este determinat de modelul formei de undă, insensibilitatea urechii la fază face relația foarte unilaterală. Adică, o anumită formă de undă va avea doar un timbru, în timp ce un timbru special are un număr infinit de forme de undă posibile.

Urechea este foarte obișnuită să audă o fundamentală plus armonici. Dacă unui ascultător îi este prezentată o combinație a undelor sinusoidale de 1 kHz și 3 kHz, acesta vor raporta că sună natural și plăcut. Dacă se utilizează unde sinusoidale de 1 kHz și 3,1 kHz, aceasta va suna criticabil.

Figura 22-3 Forma de undă la vioară.
O vioară atinsă de arcuș produce o formă de undă în dinți de fierăstrău, cum se arată în (a). Sunetul auzit de ureche este arătat în (b), frecvența fundamentală plus armonici.

Aceasta este baza scării muzicale standard, ilustrată de clapele de pian din figura 22-4. Lovirea celei mai din stânga clape pe pian produce o frecvență fundamentală de 27,5 Hz, plus armonici la 55, 110, 220, 440, 880 Hz etc. (există și armonici între aceste frecvențe, dar ele nu sunt importante pentru această discuție). Aceste armonici corespund frecvenței fundamentale produse de alte clape de pe claviatură. În mod specific, fiecare a șaptea clapă albă este o armonică a clapei extreme stângi. Adică, a opta clapă de la stânga are o frecvență fundamentală de 55 de Hz, cea de-a 15-a clapă are o frecvență fundamentală de 110 Hz etc. Fiind armonice între ele, aceste clape sună similar atunci când se apasă și sunt armonioase atunci când se apasă la unison. Din acest motiv, ele sunt toate numite nota A. În același mod, clapa albă imediat din dreapta fiecărui A se numește B, iar ele sunt toate armonice una față de cealaltă. Acest model se repetă pentru cele șapte note: A, B, C, D, E, F și G.

Figura 22-4 Clapele pianului.
Clapele pianului constituie o scală de frecvență logaritmică, cu dublarea frecvenței fundamentale după fiecare șapte clape albe. Aceste clape albe sunt notele: A, B, C, D, E, F și G.

Termenul octavă înseamnă un factor de doi în frecvență. Pe pian, o octavă cuprinde opt clape albe, care reprezintă numele (octo este în latină pentru opt). Cu alte cuvinte, frecvența pianelor se dublează după fiecare șapte clape albe, iar întreaga claviatură se întinde puțin peste șapte octave. Gama de auz uman este în general citată ca 20 Hz la 20 kHz, corespunzând la aproximativ 1/2 octavă la stânga și două octave la dreapta claviaturii pentru pian. Deoarece octavele se bazează pe dublarea frecvenței la fiecare număr fix de clape, ele sunt o reprezentare logaritmică a frecvenței. Acest lucru este important deoarece informația audio este, în general, distribuită în același mod. De exemplu, cât mai multă informație audio este transmisă în octava între 50 Hz și 100 Hz, ca în octava între 10 kHz și 20 kHz. Chiar dacă pianul acoperă doar aprox. 20% din frecvențele pe care le pot auzi oamenii (4 kHz din 20 kHz), poate produce mai mult de 70% din informația audio pe care o pot percepe oamenii (7 din 10 octave). De asemenea, frecvența cea mai mare pe care un om o poate detecta scade de la aproximativ 20 kHz la 10 kHz pe parcursul vieții unui adult. Totuși, aceasta reprezintă doar o pierdere de aproximativ 10% din capacitatea de auz (o octavă din zece). După cum se arată în continuare, această distribuție logaritmică a informațiilor afectează direct rata de eșantionare necesară a semnalelor audio.

Secțiunea următoare: Calitatea sunetului vs. rata datelor