9.2 Statistică

În această secțiune, veți analiza diferite concepte și termeni utilizați în mod obișnuit în statistică și veți vedea cum se utilizează VI-urile Analysis în diferite aplicații.

Mean (medie)

Considerați un set de date X format din n eșantioane x0, x1, x2, x3 ... ,xn-1. Valoarea medie (cunoscută și ca average) este notată cu x̄ și este definită prin formula

Cu alte cuvinte, este suma tuturor valorilor eșantioanelor împărțită la numărul de eșantioane. După cum ați văzut în exemplul Michael Jordan de mai sus, setul de date a constat în 51 de eșantioane. Fiecare eșantion a fost egal cu numărul de puncte pe care Jordan le-a marcat în fiecare meci. Totalul acestor puncte a fost de 1568, împărțit la numărul de eșantioane (51) pentru a obține o valoare medie sau mean de 30,7.

Conexiunile de intrare-ieșire pentru VI-ul Mean sunt prezentate mai jos.

Median

Fie S = {s0, s1, s2, ..., sn-1} ce reprezintă secvența sortată a setului de date X. Secvența poate fi sortată fie în ordine crescătoare, fie în ordine descendentă. Mediana secvenței este notată cu xmedian și este obținută prin formula

unde i = (n-1)/2 și k = n/2

În cuvinte, mediana unei secvențe de date este valoarea punctului mediu în versiunea sortată a acelei secvențe. De exemplu, luați în considerare secvența {5, 4, 3, 2, 1} formată din cinci eșantioane (număr impar). Această secvență este deja sortată în ordinea descrescătoare. În acest caz, mediana este valoarea punctului mediu, 3. Luați în considerare o secvență diferită {1,2,3,4} formată din patru eșantioane (număr egal). Această secvență este deja sortată în ordine crescătoare. În acest caz, există două valori ale punctului mediu, 2 și 3. Conform formulei de mai sus, mediana este egală cu 0,5 × (2 + 3) = 2,5. Dacă un student X a obținut 4,5 puncte la un test și un alt elev Y a obținut 1 punct la același test, mediana este o cantitate foarte utilă pentru a face afirmații calitative, cum ar fi „X se află în jumătatea de sus a clasei” sau „Y se află în jumătatea de jos a clasei. ”

Conexiunile de intrare-ieșire pentru VI-ul Median sunt prezentate mai jos.

Varianța eșantioanelor

Varianța eșantioanelor a setului de date X constând din n eșantioane este notată cu s2 și este definită prin formula

unde x̄ semnifică media setului de date. Prin urmare, varianța eșantioanelor este egală cu suma pătratelor abaterilor valorilor eșantioanelor de la medie împărțită la n-1.

Notă: Formula de mai sus nu se aplică pentru n = 1. Dar, nu înseamnă nimic pentru a calcula varianța eșantionului dacă în setul de date există un singur eșantion.

Conexiunile de intrare-ieșire pentru VI-ul Sample Variance sunt prezentate mai jos.

Cu alte cuvinte, varianța eșantioanelor măsoară răspândirea sau dispersia valorilor eșantionului. Dacă setul de date constă din scorurile unui jucător din diferite jocuri, varianța eșantioanelor poate fi utilizată ca măsură a consistenței jucătorului. Este întotdeauna pozitivă, cu excepția cazului în care toate valorile eșantionului sunt egale între ele și, la rândul lor, egale cu media.

Există încă un tip de varianță numită varianță a populației. Formula de a calcula varianța populației este similară cu cea de mai sus pentru a calcula varianța eșantionului, cu excepția (n-1), la numitor înlocuit cu n.

Conexiunile de intrare-ieșire pentru VI-ul Variance sunt prezentate mai jos.

VI-ul Sample Variance calculează varianța eșantioanelor, în timp ce VI-ul Variance calculează varianța populației. Întrucât statisticienii și matematicienii preferă să-l folosească pe cel din urmă, inginerii preferă să-l folosească pe primul. Chiar nu contează pentru valori mari ale lui n, să zicem n ≥ 30.

Notă: Utilizați tipul de VI adecvat pentru aplicația dvs.

Deviație (abatere) standard

Rădăcina pătrată pozitivă a varianței eșantioanelor s2 este notată cu s și se numește abaterea standard a eșantionului.

Conexiunile de intrare-ieșire pentru VI-ul Standard Deviation sunt prezentate mai jos.

Mode

Mode este valoarea eșantionului care apare cel mai frecvent. De ex., dacă secvența de intrare este X = {0,1,3,3,4,4,4,5,5,7} atunci mode X este 4, deoarece aceasta este valoarea care apare mai frecvent în X.

Conexiunile de intrare-ieșire pentru VI-ul Mode sunt prezentate mai jos.

Moment apropiat de medie

Dacă X reprezintă secvența de intrare cu numărul n de elemente în ea, iar x̄ este media acestei secvențe, atunci momentul de ordinul m poate fi calculat cu ajutorul formulei

Cu alte cuvinte, momentul apropiat de medie este o măsură a abaterii elementelor din secvență de la medie. Rețineți că pentru m = 2, momentul apropiat de medie este egal cu varianța populației.

Conexiunile de intrare-ieșire pentru VI-ul Moment About Mean sunt prezentate mai jos.

Histogramă

Până în prezent, această lecție a discutat despre diferite modalități de extragere a caracteristicilor importante ale unui set de date. Datele sunt de obicei stocate într-un format tabelar, pe care mulți oameni le găsesc greu de înțeles. În general, este util să se afișeze datele într-o anumită formă. Afișarea vizuală a datelor ne ajută să obținem informații despre date. Histograma este o astfel de metodă grafică pentru afișarea datelor și rezumarea informațiilor cheie. Considerați o secvență de date X = {0,1,3,3,4,4,4,5,5,8}. Împărțiți intervalul total de valori în 8 intervale. Aceste intervale sunt 0-1, 1-2, 2-3, ..., 7-8. Histograma secvenței X descrie apoi numărul de eșantioane de date care se află în acel interval, neincluzând limita superioară.

Figura de mai sus arată că un eșantion de date se situează în intervalul 0-1 și, respectiv, 1-2. Dar, nu există niciun eșantion în intervalul 2-3. În mod similar, două eșantioane se află în intervalul 3-4, iar trei eșantioane se situează în intervalul 4-5. Examinați secvența de date X de mai sus și asigurați-vă că înțelegeți acest concept.

Există diferite modalități de a calcula date dintr-o histogramă. În continuare veți vedea cum se face în VI-ul Histogram folosind secvența X.

După cum se arată mai sus, intrările la acest VI sunt secvența de intrare X și numărul de intervale m. VI-ul obține Histogram: h(x) după cum urmează. Acesta scanează X pentru a determina intervalul de valori în ea. Apoi VI-ul stabilește lățimea intervalului, Δx, în funcție de valoarea specificată a lui m

unde max este valoarea maximă găsită în X, min este valoarea minimă găsită în X și m este numărul specificat de intervale.

Fie m = 8. Atunci ∆x = (8-0)/8 = 1

Fie χ reprezintă secvența de ieșire X Values. Histograma este o funcție de χ. Acest VI evaluează elementele lui χ utilizând

Pentru acest exemplu,

VI-ul definește apoi al i-lea interval să fie în intervalul de valori de la χi -0,5Δx până la, dar fără a include, χi +0,5Δx.

pentru i = 0, 1, 2, ..., m-1

și definește funcția yi(x) = 1 pentru x aparținând lui ∆i, și zero altfel. Funcția are valoare unitate dacă valoarea lui x se încadrează în interval specificat, neincluzând limita. În caz contrar, este zero. Observați că intervalul este centrat pe χi și lățimea sa este Δx. Dacă o valoare este egală cu maxima, aceasta este considerată ca aparținând ultimului interval.

Pentru exemplul nostru, ∆o = [0, 1), ∆1 = [1, 2), ..., 7 = [7, 8) și ca exemplu yo(0) = 1 și yo (1) = yo(3) = yo(4) = yo(5) = yo(8) = 0.

În cele din urmă, VI-ul evaluează secvența de histogramă H folosind

unde hi reprezintă elementele secvenței de ieșire Histogram:h (X) și n este numărul de elemente din secvența de intrare X. Pentru acest exemplu, ho = 1, h4 = 3, ... h7 = 1.

Biblioteca de analiză are, de asemenea, un VI General Histogram, care este mai avansat decât Histogram VI. Vă rugăm să consultați Manualul de referință al LabVIEW Analysis VI pentru informații detaliate.

Eroare medie pătrată (MSE)

Dacă X și Y reprezintă două secvențe de intrare, eroarea medie pătrată este media sumei pătratului diferenței dintre elementele corespunzătoare ale celor două secvențe de intrare. Următoarea formulă este utilizată pentru a găsi mse.

unde n este numărul de puncte de date.

Considerați un semnal digital x la intrarea unui sistem S1. Ieșirea acestui sistem este y1. Acum achiziționați un nou sistem S2, despre care teoretic se știe că generează același rezultat ca S1, dar are un timp de răspuns de două ori mai rapid. Înainte de a înlocui vechiul sistem, doriți să fiți absolut sigur că răspunsul de ieșire al ambelor sisteme este același. Dacă secvențele y1 și y2 sunt foarte mari, este dificil să se compare fiecare element din secvențe. Într-un astfel de scenariu, puteți utiliza VI-ul MSE pentru a calcula eroarea medie pătrată (mse) a celor două secvențe y1 și y2. Dacă mse este mai mic decât o toleranță acceptabilă, sistemul S1 poate fi înlocuit în mod fiabil de noul sistem S2.

Conexiunile de intrare-ieșire pentru VI-ul MSE sunt prezentate mai jos.

Rădăcina mediei pătrate (RMS)

Rădăcina mediei pătrate a unei secvențe X este rădăcina pătrată pozitivă din media pătratelor secvenței de intrare. Cu alte cuvinte, puteți lua pătratul secvenței de intrare, faceți media acestei noi secvențe pătrate și apoi luați rădăcina pătrată a acestei cantități. Formula folosită pentru calcularea valorii rms este

unde n este numărul de elemente din X. RMS este o cantitate utilizată pe scară largă în cazul semnalelor analogice. Pentru o formă de undă a tensiunii sinusoidale, dacă Vp este amplitudinea de vârf a semnalului, atunci tensiunea rădăcina mediei pătrate Vrms este dată de Vp/√2. Figura următoare arată o formă de undă a tensiunii de amplitudine la vârf = 2 V și valoarea RMS de √2 ≈ 1,41 calculată folosind VI-ul RMS din biblioteca Analysis.

Conexiunile de intrare-ieșire pentru VI-ul RMS sunt prezentate mai jos.

Exercițiul 9-1

Obiectiv: Utilizarea diferitelor VI-uri Statistics într-un exemplu folosind scorurile de baschet ale lui Michael Jordan.

În acest exercițiu, veți învăța cum să utilizați diferite VI-uri Statistics într-un exemplu interesant. Setul de date constă în numărul de puncte marcate de Michael Jordan de la Chicago Bulls în fiecare din cele 51 de partide pe care le-a jucat în cadrul unei părți din sezonul NBA din 1997. Veți folosi unele dintre conceptele discutate în secțiunea anterioară pentru a descifra aceste informații și a crea numere unice, ușor de reținut și totuși să dezvăluie toate informațiile pe care le oferă întregul set de date.

Panoul frontal

1. Deschideți VI-ul Statistics din Lvspcex.llb.

2. Deschideți panoul frontal așa cum se arată mai sus. Controlul Points este setul de date constând în numărul de puncte marcate de Jordan în fiecare meci în acest sezon. Numărul de jocuri pe care le-a jucat în acest sezon până în prezent este de 51.

Indicatorul digital Total Number of Points este suma tuturor elementelor din setul de date dat.

Indicatorul digital Points Per Game este media punctelor lui Jordan în acest sezon.

Indicatorii digitali Sample Variance, Median și Mode sunt varianța eșantioanelor, mediana și modul din setul de date.

Histogram of Points este un grafic XY care arată distribuția punctelor în diferite intervale. Numărul de intervale este setat folosind controlul digital Number of intervals. Points in Each Game este un waveform graph care trasează numărul de puncte marcate în fiecare joc.

Diagrama bloc

3. Construiți diagrama prezentată mai sus:

VI-ul Sample Variance (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează varianța eșantioanelor setului de date Points.

VI-ul Mean (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează valoarea medie din setul de date Points.

VI-ul Histogram (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează histograma setului de date Points.

VI-ul Median (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează mediana setului de date Points.

VI-ul Mode (Analysis » Probability and Statistics). În acest exercițiu, această funcție calculează modul setului de date Points.

Funcția Bundle (subpaleta Cluster). În acest exercițiu, această funcție asamblează ieşirile VI-ului Post Processing (explicat mai târziu) pentru a trasa pe graficul XY Histograma punctelor.

4. Urmați instrucțiunile de la pașii 4 până la 9 și construiți diagrama bloc așa cum se arată mai sus.

5. Veți calcula Punctele pe joc (media lui Jordan) folosind VI-ul Mean din biblioteca de analiză. Conectați controlul Points la terminalul de intrare X și ieșirea mean la indicatorul Points Per Game.

6. Veți calcula Varianța eșantioanelor folosind VI-ul Variance Sample din biblioteca de analiză. Încă o dată, conectați controlul Points la terminalul X de intrare și ieșirea sample variance la indicatorul Sample Variance.

Notă: Acest VI calculează, de asemenea, media setului de date.

7. Veți calcula Mediana folosind VI-ul Median din biblioteca de analiză. Conectați controlul Points la terminalul X de intrare și ieșirea median la indicatorul Median.

8. Veți calcula modul utilizând VI-ul Mode din biblioteca de analiză. Conectați controlul Points la terminalul de intrare X. Alegeți numărul de intervale egal cu 3. Conectați ieșirea mode la indicatorul Mode.

9. Mai întâi veți calcula datele pentru histogramă folosind VI-ul Histogram. Conectați controlul Points la terminalul de intrare X și setați numărul de intervale egal cu 3. Acest VI generează valorile histogramei și valorile X, care sunt punctele mijlocii ale diferitelor intervale, cum s-a discutat mai sus. Puteți trasa histograma folosind valorile X pentru axa X și valorile histogramei pentru axa Y. Dacă sunteți interesat, încercați să fac acest lucru și să observați histograma.

10. În general, poate doriți să vedeți histograma într-un mod diferit. Selectați PostProcessing VI din Lvspcex.llb. Conectați controlul Points la terminalul de intrare Points, ieșirea histogram a VI-ului Histogram la terminalul de intrare Histogram și setați Number of intervals egal cu 3 (aceeași valoare aleasă anterior pentru Histogram VI). Acest VI generează date pentru trasarea histogramei într-un mod mai bun. Valorile axei X sunt stocate în terminalul de ieșire Boundaries, iar valorile axei Y sunt stocate în terminalul de ieșire PlotValues. Puteți folosi ieșirea acestui VI pentru trasarea histogramei pe graficul XY Histogram of Points.

11. Reveniți la panoul frontal. Setați numărul de intervale egal cu 3 și executați VI-ul. Studiați diferitele valori de ieșire. Vedeți cum histograma (pe stânga) oferă mai multe informații decât simpla reprezentare a punctelor din fiecare joc (pe dreapta).

12. Salvați VI și închideți-l.

Sfârșitul exercițiului 9-1