2.3 Semnal vs. proces de bază

Statistica este știința interpretării datelor numerice, cum ar fi semnalele achiziționate. În comparație, probabilitatea este folosită în DSP pentru a înțelege procesele care generează semnale. Deși sunt strâns legate, distincția dintre semnalul achiziționat și procesul de bază este cheia multor tehnici DSP.

De exemplu, imaginați crearea unui semnal de 1000 de puncte prin aruncarea unei monede de 1000 de ori. Dacă fața este cap, eșantionul corespunzător are o valoare de unu. Pe partea opusă, eșantionul este setat la zero. Procesul care a creat acest semnal are o medie de exact 0,5, determinată de probabilitatea relativă a fiecărui rezultat posibil: 50% cap, 50% opusul. Dar, este puțin probabil ca semnalul efectiv de 1000 de puncte să aibă o medie exactă de 0,5. Șansa aleatoare va face numărul de unu și zerouri să fie ușor diferite de fiecare dată când este generat semnalul. Probabilitățile procesului de bază sunt constante, însă statistica semnalului achiziționat se modifică de fiecare dată când se repetă experimentul. Această neregularitate întâmplătoare găsită în datele reale se numește precum: variație statistică, fluctuație statistică și zgomot statistic.

Aceasta prezintă un pic de dilemă. Când vedeți termenii: medie și abaterea standard, cum știți dacă autorul se referă la statistica unui semnal real sau probabilitățile procesului care a creat semnalul? Din nefericire, singura modalitate de a vă spune este contextul. Acest lucru nu este valabil pentru toți termenii utilizați în statistică și probabilități. De exemplu, histograma și funcția masă de probabilitate (discutate în secțiunea următoare) sunt concepte care se potrivesc cu nume separate.

Acum, înapoi la Ec. 2-2, calculul deviației standard. După cum s-a menționat anterior, această ecuație împarte cu N-1 în calculul mediei deviațiilor pătrate, mai degrabă decât simplu prin N. Pentru a înțelege de ce este așa, imaginați-vă că doriți să găsiți media și deviația standard a unui proces care generează semnale. În acest scop, obțineți un semnal de N eșantioane din proces și calculați media semnalului prin Ec. 2.1. Apoi puteți folosi acest lucru ca o estimare a mediei procesului de bază; dar, știți că va exista o eroare din cauza zgomotului statistic. În special, pentru semnalele aleatoare, eroarea tipică dintre media punctelor N și media procesului de bază este dată de:

Ecuația 2.4
Eroarea tipică în calcularea mediei unui proces de bază prin utilizarea unu număr finit de eșantioane, N. Parametrul σ este deviația standard.

Dacă N este mic, zgomotul statistic în media calculată va fi foarte mare. Cu alte cuvinte, nu aveți acces la suficiente date pentru a caracteriza procesul în mod corespunzător. Cu cât valoarea N este mai mare, cu atât mai mică va deveni eroarea așteptată. O piatră de hotar în teoria probabilităților, Legea Strong a Numerelor Mari garantează că eroarea devine zero, pe măsură ce N se apropie de infinit.

În etapa următoare, am dori să calculați deviația standard a semnalului achiziționat și să o utilizați ca o estimare a deviației standard a procesului de bază. Aici se află problema. Înainte de a calcula deviația standard folosind Ec. 2-2, trebuie să știți deja media μ. Totuși, nu cunoașteți media procesului de bază, ci doar media semnalului de N puncte, care conține o eroare din cauza zgomotului statistic. Această eroare tinde să reducă valoarea calculată a deviației standard. Pentru a compensa acest lucru, N este înlocuit cu N-1. Dacă N este mare, diferența nu contează. Dacă N este mic, acest înlocuitor oferă o estimare mai precisă a deviației standard a procesului de bază. Cu alte cuvinte, Ec. 2-2 este o estimare a deviației standard a procesului de bază. Dacă am fi împărțit cu N în ecuație, ea ar furniza abaterea standard a semnalului achiziționat.

Fig. 2-3 Exemple de semnale generate din procese nestaționare. În (a) atât media cât și deviația standard se schimbă. În (b), deviația standard rămâne o valoare constantă de unu, în timp ce media se schimbă de la o valoare de zero la doi. Este o tehnică de analiză comună de a împărți aceste semnale în segmente scurte și a calcula statistic individual pentru fiecare segment.

Ca o ilustrație a acestor idei, uitați-vă la semnalele din figura 2-3 și întrebați: variațiile în aceste semnale sunt rezultatul zgomotului statistic sau se schimbă procesul de bază? Probabil că nu este greu să vă convingeți că aceste modificări sunt prea mari pentru șansa aleatoare și trebuie să fie legate de procesul de bază. Procesele care își schimbă caracteristicile în acest mod sunt numite nestaționare. În comparație, semnalele prezentate anterior în figura 2-1 au fost generate dintr-un proces staționar, iar variațiile rezultă complet din zgomotul statistic. Figura 2-3b ilustrează o problemă comună cu semnalele ne-staționare: media schimbată lent interferează cu calculul deviației standard. În acest exemplu, abaterea standard a semnalului, într-un interval scurt, este unu. Dar, abaterea standard a întregului semnal este de 1,16. Această eroare poate fi aproape eliminată prin ruperea semnalului în secțiuni scurte și prin calcularea statistică pentru fiecare secțiune în parte. Dacă este necesar, deviațiile standard pentru fiecare secțiune pot fi mediate pentru a produce o singură valoare.

Secțiunea următoare: Histograma, Pmf și Pdf