9.3 Probabilitate

În orice experiment aleatoriu, există întotdeauna o șansă ca un eveniment particular să apară sau nu. Un număr între 0 și 1 este atribuit pentru a măsura această șansă, sau probabilitate, că apare un eveniment particular. Dacă sunteți absolut sigur că evenimentul va avea loc, probabilitatea este de 100% sau 1.0, dar dacă sunteți sigur că evenimentul nu va avea loc, probabilitatea sa este 0.

Considerați un exemplu simplu. Dacă rostogoliți un singur zar imparțial, pot apărea șase evenimente posibile - fie 1, 2, 3, 4, 5, fie 6. Care este probabilitatea ca să fie un 2? Această probabilitate este unu din șase sau 0,16666. Puteți defini probabilitatea în termeni simpli ca: Probabilitatea cu care un eveniment A are loc este raportul numărului de rezultate favorabile lui A la numărul total de rezultate la fel de probabile.

Variabile aleatoare

Multe experimente generează rezultate care pot fi interpretate în termeni de numere reale. Câteva exemple sunt numărul de mașini ce trec de un semn de oprire pe parcursul unei zile, numărul de voturi care favorizează candidatul A și numărul de accidente la o anumită intersecție. Valorile rezultatelor numerice ale acestor experimente se pot schimba de la experiment la experiment și sunt numite variabile aleatoare. Variabilele aleatoare pot fi discrete (dacă se pot lua pe un număr finit de valori posibile) sau continue. Ca exemplu în plus, greutățile pacienților ce vin într-o clinică pot fi oriunde, să zicem, între 35-140 de kilograme. Astfel de variabile aleatorii se pot lua pe orice valoare într-un interval de numere reale. Având în vedere o astfel de situație, să presupunem că doriți să găsiți probabilitate de cunoaștere a greutății unui pacient exact de 71,56 kilograme. Vedeți cum se poate calcula această probabilitate utilizând un exemplu.

Considerați un experiment pentru măsurarea duratei de viață x a 50 de baterii de un anumit tip. Bateriile sunt selectate dintr-o populație mai mare de astfel de baterii. Histograma pentru datele observate este prezentată mai jos.

Figura de mai sus arată că majoritatea duratelor de viață este cuprinsă între zero și 100 de ore, iar valorile histogramei scad lin în raport cu duratele de viață mai mari.

Puteți aproxima histograma de mai sus printr-o curbă scăzătoare exponențial. Puteți lua această funcție ca model matematic pentru comportamentul eșantionului de date. Poate doriți să cunoașteți probabilitatea ca o baterie selectată aleator va dura mai mult de 400 de ore, această valoare poate fi aproximată prin aria de sub curbă de la dreapta valorii 4. O astfel de funcție care modelează histograma variabilei aleatoare este numită Funcția de densitate a probabilității.

Pentru a rezuma toate informațiile de mai sus în termenii unei definiții, se spune că o variabilă aleatoare X este continuă dacă se poate lua pe un număr infinit de posibile valori asociate cu intervale de numere reale și există o funcție f(x), numită funcție de densitate a probabilității, astfel că

Rețineți din ecuația (3) mai sus pentru o valoare specifică a variabilei aleatoare continuă, care este pentru X = a,

Nu trebuie să fie surprinzător că ați atribuit o probabilitate de zero pentru orice valorică specifică, deoarece există un număr infinit de valori posibile pe care le poate lua variabila aleatoare. Prin urmare, șansa că o va lua pentru o valoare specifică X = a este extrem de mică.

Exemplul anterior a utilizat modelul funcției exponențiale pentru funcția de densitate a probabilității. Există o serie de opțiuni diferite pentru această funcție. Una dintre acestea este Distribuția Normală, discutată mai jos.

Distribuția Normală

Distribuția normală este una dintre cele mai larg utilizate distribuții de probabilitate continuă. Această funcție de distribuție are o formă simetrică

de clopot, este cum se arată mai sus. Curba este centrată pe valoarea Medie =0, iar împrăștierea ei este măsurată prin varianța s2 = 1. Acești doi parametri determină complet forma și localizarea funcției de densitate normală, a cărei formă funcțională este dată de

Să presupunem că o variabilă aleatoare Z are o distribuție normală cu media la zero și varianța egală cu unu. Se spune că această variabilă aleatorie are distribuție normală standard.

VI-ul Normal Distribution calculează probabilitatea unilaterală, p, a variabilei aleatoare x distribuită normal.

unde X este o distribuție normală standard cu valoare medie egală cu zero și varianța egală cu unu, p este probabilitatea și x este valoarea.

Să presupunem că efectuați un experiment în care măsurați greutatea oamenilor adulți. Efectuați acest experiment pe 1000 de oameni aleși aleator și obțineți un set de date S. Distribuția histogramei are multe măsurări grupate strâns aproape de o greutate medie, cu relativ puțini oameni foarte mici și foarte înalți în populație. Prin urmare, histograma poate fi foarte aproape aproximată cu distribuția normală. Să presupunem acum că, pe un set diferit de 1000 de oameni aleși aleator, doriți să găsiți probabilitatea ca înălțimea unui om să fie mai mare sau egală cu 170 cm. Puteți folosi VI-ul Normal Distribution pentru găsirea acestei probabilități. Setați intrarea x = 170. Astfel, alegerea funcției de densitate a probabilității este fundamentală pentru a obține o valoare corectă de probabilitate.

VI-ul Inverse Normal Distribution realizează exact funcția opusă VI-ului Normal Distribution. Având dată o probabilitate p, el găsește valorile x care au șansa să se afle într-un eșantion distribuit normal. De exemplu, ar fi de dorit să găsim greutățile care au o șansă de 60% să se găsească într-un set de date alese aleator.

După cum sunt menționate anterior, sunt diferite opțiuni pentru funcția de densitate a probabilității. Bine cunoscute și larg utilizate sunt distribuția Chi-pătrat, distribuția F, și distribuția-T. Biblioteca Analysis include VI-uri care calculează probabilitatea uni-laterală pentru aceste diferite tipuri de distribuții. În plus, are VI-uri care efectuează operația inversă.

Exercițiul 9-2

Obiectiv: Înțelegerea conceptelor cheie de probabilitate.

În acest exercițiu, mai întâi se generează un eșantion de date cu distribuție normală standard și apoi se utilizează VI-ul Normal Distribution pentru a verifica probabilitatea unei variabile aleatoare x.

Panoul frontal

1. Se poate construi panoul frontal cum se arată mai sus. NoisePlot este un wavewform graph, în timp ce NoiseHistogram este un XY graph.

Diagrama bloc

2. Construiți diagrama bloc cum se arată mai sus. VI-ul Gaussian White Noise generează un model distribuit-Gaussian cu valoarea medie egală cu 0 și abaterea standard setată de utilizator, folosind intrarea standard deviation. Samples este numărul de eșantioane al modelului de zgomot Gaussian. Seed este valoarea sămânță utilizată pentru a genera zgomotul aleatoriu.

VI-ul Gaussian White Noise (Analysis » Signal Generation subpalette). În acest exercițiu, generează un model de zgomot alb Gaussian.

VI-ul Histogram (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează histograma modelului de zgomot Gaussian.

VI-ul Normal Distribution (Analysis » Probability and Statistics subpalette). În acest exercițiu, această funcție calculează probabilitatea unilaterală a unei variabile aleatoare, distribuită normal, Random Variable.

Conectați modelul de zgomot Gaussian la graficul Noise Plot.

3. Veți calcula histograma modelului de zgomot Gaussian folosind VI-ul Histogram utilizat în precedentul exercițiului.

4. Așa cum este discutat anterior, se fac unele post-procesări pentru o trasa histograma într-un mod diferit. Selectați PostProcessing VI din Lvspcex.llb.

5. Plasați o Bundle la ieșirea VI-ului și conectați-o la Noise Histogram.

6. Selectați VI-ul Normal Distribution. Conectați controlul Random Variable la terminalul de intrare și conectați ieșirea la indicatorul probability.

7. Reveniți la panoul frontal. Setați controlul Number of Samples la 2048, Standard Deviation la 1, Seed la 2 și Number of intervals la 10. Rulați VI-ul.

8. Veți vedea zgomotul alb Gaussian pe graficul Noise Plot. Este dificil să spunem multe din acest grafic. Totuși, trasarea histogramei pentru același model de zgomot oferă o mulțime de informații. Ea arată că majoritatea eșantioanelor sunt centrate în jurul valorii medii de zero. Din această histogramă, puteți aproxima acest model de zgomot cu o funcție de distribuție normală (distribuție Gaussiană). Deoarece valoarea medie este zero și puteți seta abaterea standard egală cu unu, funcția de densitate a probabilității este de fapt o distribuție normală standard.

Notă: este foarte important de a alege cu atenție tipul adecvat al funcției de distribuție pentru a aproxima datele voastre. În acest exemplu, ați trasat de fapt histograma pentru decizia luată. De multe ori, puteți lua o decizie inteligentă bazată exclusiv pe cunoașterea prealabilă a comportamentului și a caracteristicilor eșantionului de date.

9. Reveniți la panoul frontal și introduceți o valoare pentru Random Variable. Acest VI va calcula probabilitatea unilaterală a acestei variabile aleatoare distribuită normal. Nu uitați, ați presupus că variabila este distribuită normal, privind la histogramă.

10. Salvați VI ca Probability.vi și închideți-l.

Sfârșitul exercițiului 9-2

9.4 Rezumat