2.2 Media și deviația standard

Media, indicată de μ, este jargonul statisticianului pentru valoarea medie a unui semnal. Se găsește exact așa cum v-ați aștepta: adunați toate eșantioanele împreună și împărțiți cu N. Aceasta este în formă matematică:

Ecuația 2.1
Calcularea mediei unui semnal. Semnalul este conținut în xo, ..., xN-1, i este index care dă aceste valori, iar μ este media.

În cuvinte, suma valorilor din semnal, xi, prin indicele i, rulează de la 0 la N-1. Atunci, terminați calculul împărțind suma cu N. Aceasta este identică cu ecuația: μ = (x0 + x1 + x2 + ... + xN-1)/N. Dacă nu sunteți deja familiarizați cu Σ (sigma mare) care este folosit pentru a indica adunarea, studiați aceste ecuații cu atenție și comparați-le cu programul de calculator din Tabelul 2-1. Însumările de acest tip sunt abundente în DSP și trebuie să înțelegeți complet această notație. În electronică, media se numește uzual valoare DC (curent continuu). De asemenea, AC (curent alternativ) se referă la modul în care semnalul fluctuează în jurul valorii medii. Dacă semnalul este o formă de undă simplă repetată, cum ar fi o undă sinusoidală sau pătrată, excursiile sale pot fi descrise prin amplitudinea vârf-vârf. Din păcate, cele mai multe semnale achiziționate nu prezintă o valoare de vârf la vârf bine definită, dar au o natură aleatorie, cum ar fi semnalele din figura 2-1. O metodă mai generalizată trebuie utilizată în aceste cazuri, numită deviația standard, notată cu σ (sigma mic).

Ca punct de plecare, expresia |xi -μ| descrie cât de departe deviază eșantionul al i-lea de medie. Abaterea medie a unui semnal se găsește prin însumarea abaterilor tuturor eșantioanelor individuale și apoi împărțind la numărul de eșantioane, N. Observați că luăm valoarea absolută a fiecărei deviații înainte de sumare; în caz contrar, termenii pozitivi și negativi ar fi în medie la zero. Abaterea medie oferă un singur număr, reprezentând distanța tipică la care eșantioanele sunt de medie. În timp ce este convenabil și simplu, abaterea medie nu este aproape niciodată utilizată în statistici. Acest lucru se datorează faptului că nu se potrivește bine fizicii modului în care funcționează semnalele. În majoritatea cazurilor, parametrul important nu este devierea de la medie, ci puterea reprezentată prin abaterea de la medie. De exemplu, atunci când semnalele de zgomot aleatorii se combină într-un circuit electronic, zgomotul rezultant este egal cu puterea combinată a semnalelor individuale, nu cu amplitudinea lor combinate.

Deviația standard este similară cu deviația medie, cu excepția faptului că medierea se face cu putere în loc de amplitudine. Acest lucru se realizează prin împărțirea fiecărei deviații înainte de a face media (amintiți-vă, puterea ~ tensiunea2). Pentru a termina, rădăcina pătrată este luată pentru a compensa ridicarea la pătrat inițială. În forma unei ecuații, se calculează deviația standard:

Ecuația 2.2
Calcularea deviației standard a unui semnal. Semnalul este stocat în xi, μ este media găsită din Ec. 2.1, N este numărul de eșantioane, și σ este deviația standard.

În notația alternativă: sigma = sqrt ((x0 -μ)2 + (x1 -μ)2 + ... + (xN-1 -μ)2 /(N-1)). Observați că media este realizată prin împărțirea cu N-1 în loc de N. Aceasta este o caracteristică subtilă a ecuației care va fi discutată în secțiunea următoare. Termenul σ2 apare frecvent în statistici și este dat de numele varianță. Deviația standard este o măsură a cât de mult fluctuează semnalul de la medie. Varianța reprezintă puterea acestei fluctuații. Un alt termen cu care ar trebui să vă familiarizați este valoarea rms (root-mean-square), folosită frecvent în electronică. Prin definiție, abaterea standard măsoară numai porțiunea AC a unui semnal, în timp ce valoarea efectivă (rms) măsoară componentele AC și DC. Dacă un semnal nu are componentă DC, valoarea sa efectivă este identică cu deviația standard. Figura 2-2 prezintă relația dintre abaterea standard și valoarea vârf-vârf a mai multor forme de undă comune.

Fig. 2-2 Raportul amplitudinii vârf-la vârf la deviația standard pentru câteva forme de undă comune. Pentru unda dreptunghiulară raportul este 2; pentru unda triunghiulară este 3,46; pentru unda sinus este 2,83.
Deoarece zgomotul aleatoriu nu are valoare vârf-la-vârf exactă, el este aproximativ de 6...8 ori deviația standard.

Tabelul 2-1 enumeră o rutină de calcul pentru calcularea mediei și a deviației standard folosind ecuațiile 2-1 și 2-2. Programele din această lucrare sunt destinate să transmită algoritmi în modul cel mai simplu; toți ceilalți factori sunt tratați ca secundari. Bune tehnici de programare sunt ignorate dacă face logica programului mai clară. De exemplu: se folosește o versiune simplificată a BASIC, sunt incluse numerele de linie, singura structură de control permisă este bucla FOR-NEXT, nu există declarații I/O etc. Gândiți-vă la aceste programe ca o modalitate alternativă de înțelegere a ecuațiilor folosit în DSP. Dacă nu puteți înțelege unul, poate celălalt vă va ajuta. În BASIC, caracterul % de la sfârșitul unui nume de variabilă indică faptul că este un număr întreg. Toate celelalte variabile sunt virgulă mobilă. Capitolul 4 discută în detaliu aceste tipuri de variabile.

Această metodă de calcul a mediei și deviației standard este adecvată pentru multe aplicații; totuși, are două limitări. În primul rând, dacă media este mult mai mare decât deviația standard, ec. 2-2 implică scăderea a două numere care sunt foarte apropiate în valoare. Acest lucru poate duce la o eroare de rotunjire excesivă în calcule, un subiect discutat mai detaliat în capitolul 4. În al doilea rând, este adesea de dorit să recalculați media și deviația standard, deoarece se achiziționează noi eșantioane și se adaugă la semnal. Vom numi acest tip de calcul: prelucrare statistică. În timp ce metoda Ec. 2-1 și 2-2 poate fi folosită pentru prelucrarea statistică, ea necesită ca toate eșantioanele să fie implicate în fiecare calcul nou. Aceasta este o utilizare foarte ineficientă a puterii computerizate și a memoriei.

O soluție la aceste probleme poate fi găsită prin manevrarea ecuațiilor 2-1 și 2-2 pentru a oferi o altă ecuație pentru calculul deviației standard:

Ecuația 2.3
Calcularea deviației standard utilizând prelucrarea statistică. Această ecuație oferă același rezultat ca Ec. 2.2, dar cu rotunjire mai mică a zgomotului și o eficiență de calcul mai mare. Semnalul este exprimat în termenii a trei parametri acumulați: N, numărul total de eșantioane; sum, suma acestor eșantioane; și sum of squares, suma pătratelor eșantioanelor. Media și deviația standard sunt apoi calculate din acești trei parametri acumulați.

În timp ce se deplasează semnalul, se păstrează o variație de funcționare a trei parametri: (1) numărul de eșantioane deja prelucrate, (2) suma acestor eșantioane și (3) suma pătratelor eșantioanelor (adică, pătratul valorii fiecărui eșantion și adăugați rezultatul la valoarea acumulată). După ce au fost procesate un număr de eșantioane, media și abaterea standard poate fi calculată eficient folosind doar valoarea curentă a celor trei parametri. Tabelul 2-2 prezintă un program care raportează media și deviația standard în acest mod, pe măsură ce se ia în considerare fiecare eșantion nou. Aceasta este metoda utilizată în calculatoarele de mână pentru a găsi statisticile unei secvențe de numere. De fiecare dată când introduceți un număr și apăsați tasta Σ (sumare), cei trei parametri sunt actualizați. Media și deviația standard pot fi găsite atunci când se dorește, fără să recalculeze întreaga secvență.

Înainte de a încheia această discuție cu privire la medie deviația standard, trebuie menționați încă doi termeni. În unele situații, media descrie ceea ce se măsoară, în timp ce deviația standard reprezintă zgomotul și alte interferențe. În aceste cazuri, deviația standard nu este importantă în sine, ci numai în comparație cu media. Acest lucru dă naștere termenului: raportul semnal-zgomot (SNR), care este egal cu media împărțită la deviația standard. Se utilizează și un alt termen, coeficientul de variație (CV). Aceasta este definită ca deviația standard împărțită la medie, înmulțită cu 100%. De exemplu, un semnal (sau alt grup de valori de măsură) cu un CV de 2% are un SNR de 50. Date mai bune înseamnă o valoare mai mare pentru SNR și o valoare mai mică pentru CV.

Secțiunea următoare: Semnal vs. procesul de bază