2.5 Distribuția normală

Semnalele formate din procese aleatorii au, de obicei, un pdf în formă de clopot. Aceasta se numește distribuție normală, distribuție Gauss sau un Gaussian, după marele matematician german, Karl Friedrich Gauss (1777-1855). Motivul pentru care această curbă apare atât de frecvent în natură va fi discutată în curând împreună cu generarea zgomotului digital. Forma de bază a curbei este generată de un exponent pătrat negativ:

y(x) = e-x2

Această curbă brută poate fi transformată în Gaussian complet prin adăugarea unei valori reglabile, μ, și deviației standard, σ. În plus, ecuația trebuie să fie normalizată astfel încât suprafața totală sub curbă să fie egală cu unu, o cerință a tuturor funcțiilor de distribuție a probabilității. Aceasta are ca rezultat forma generală a distribuției normale, una dintre cele mai importante relații în statistică și probabilitate:

Ecuația 2-8

Ecuația pentru distribuția normală, numită și distribuție Gauss, sau simplu un Gaussian. În această relație, P(x) este funcția distribuția probabilității, μ este media, iar σ este deviația standard.

Figura 2-8 prezintă câteva exemple de curbe Gauss cu diferite medii și deviații standard. Media centrează curba peste o anumită valoare, în timp ce deviația standard controlează lățimea formei de clopot.

O caracteristică interesantă a Gaussianului este că lateralele scad spre zero foarte rapid, mult mai repede decât ca alte funcții comune, cum ar fi exponențialele descrescătoare sau 1/x. De exemplu, la două, patru și șase deviații standard de la medie, valoarea curbei Gaussian a scăzut la aproximativ 1/19, 1/7563 și respectiv 1/166.666.666. De aceea, semnalele distribuite normal, cum ar fi cele ilustrate în figura 2-6c, par să aibă o valoare vârf-la-vârf aproximativă. În principiu, semnalele de acest tip pot experimenta excursii de amplitudine nelimitată. În practică, scăderea bruscă a pdf-ului Gaussian dictează ca aceste extreme aproape să nu apară niciodată. Aceasta conduce la o formă de undă având un aspect relativ limitat, cu o amplitudine aparentă de vârf-la-vârf de aproximativ 6-8σ.

Figura 2-8

Exemple de curbe Gauss. Figura (a) arată forma unei curbe brute fără normalizare sau adăugare de parametri ajustabili. În (b) și (c) curba Gauss completă este arătată pentru diferite medii și deviații standard.

Așa cum am arătat anterior, integrala pdf-ului este folosită pentru a găsi probabilitatea ca un semnal să se afle într-un anumit interval de valori. Aceasta face ca integrala pdf-ului suficient de importantă pentru a se da propriul său nume, funcția de distribuție cumulativă (cdf). O problemă deosebit de neplăcută cu Gaussian este aceea că nu poate fi integrată prin metode elementare. Pentru a obține acest lucru, integrarea Gaussian-ului poate fi calculată prin integrare numerică. Aceasta implică eșantionarea curbe Gaussiene continue foarte fin, să zicem, câteva milioane de puncte între -10σ și + 10σ. Eșantioanele din acest semnal discret sunt apoi adunate pentru a simula integrarea. Curba discretă care rezultă din această integrare simulată este apoi stocată într-un tabel pentru utilizare în calcularea probabilităților.

Cdf-ul distribuției normale este prezentat în figurile 2-9, cu valorile sale numerice enumerate în Tabelul 2-5. Deoarece această curbă este utilizată atât de frecvent în probabilitate, ea are propriul simbol: Φ (x) (majusculă phi greacă). De exemplu, Φ (-2) are o valoare de 0,0228. Aceasta indică faptul că există o probabilitate de 2,28% ca valoarea semnalului să fie între -∞ și două abateri standard mai mici decât media, la orice timp ales aleator. De asemenea, valoarea: Φ (1) = 0,8413, înseamnă că există o șansă de 84,13% ca valoarea semnalului, la un moment ales aleatoriu, să fie între -∞ și o deviație standard peste medie. Pentru a calcula probabilitatea ca semnalul să fie între două valori, este necesar să se scadă numerele corespunzătoare găsite în tabelul Φ (x). De exemplu, probabilitatea ca valoarea semnalului, la un timp ales aleatoriu, să fie între două deviații standard sub medie și o deviație standard peste medie este dată de Φ(1) - Φ(-2) = 0,8185 sau 81,85%.

Folosind această metodă, eșantioanele prelevate dintr-un semnal distribuit normal vor fi în limita a ±1σ din medie aproximativ 68% din timp. Ele vor fi în interiorul a ±2σ aproximativ 95% din timp, și în interiorul ±3σ aproximativ 99,75% din timp. Probabilitatea ca semnalul să fie mai mare de 10 abateri standard față de medie este atât de minusculă, ar fi de așteptat să apară doar câteva microsecunde de la începutul universului, aproximativ 10 miliarde de ani!

Ecuația 2-8 poate fi de asemenea folosită pentru a exprima funcția masă de probabilitate a semnalelor discrete distribuite normal. În acest caz, x este limitat să fie unul dintre nivelele cuantificate pe care semnalul le poate prelua, cum ar fi una din cele 4096 de valori binare care ies din convertor analogic-digital de 12 biți. Ignorați termenul 1/√2πσ, este utilizat numai pentru a face suprafața totală sub curba pdf să fie egală cu unu. În schimb, trebuie să includeți orice termen este necesar pentru a face suma tuturor valorilor din pmf egală cu unu. În cele mai multe cazuri, acest lucru se face generând curba fără a vă îngrijora de normalizare, însumând toate valorile nenormalizate și apoi împărțind toate valorile cu suma.

Figura 2-9 și Tabelul 2-5

Φ(x), funcția distribuție cumulativă a distribuției normale (media = 0, deviația standard = 1). Aceste valori sunt calculate prin integrare numerică a distribuției normale prezentate în fig. 2-8b. În cuvinte, Φ(x) este probabilitatea la care valoarea unui semnal distribuit normal, la un timp ales aleatoriu, va fi mai mică decât x. În acest tabel, valoarea lui x este exprimată în unități ale deviației standard raportate la medie.

Secțiunea următoare: Generarea zgomotului digital