7.4 Aproximarea unei curbe cu puncte de date Gaussian (Normal)

Datele din lumea reală sunt foarte des distribuite Gaussian. Aceasta înseamnă că multe dintre punctele de date se află aproape de o anumită valoare, cunoscută ca medie, iar numărul de puncte de date este mai mic pe măsură ce vă îndepărtați de medie. Descrierea matematică a unei distribuții Gaussiane (de asemenea, cunoscută ca Normală) este:

unde μ este media și σ este deviația standard.

Figura următoare prezintă distribuția Gaussiană cu μ = 0 și σ = 0,5, 1,0 și 2,0.

După cum se vede din figură, curba are formă de clopot și este simetrică față de media μ. Vârful curbei are loc la μ. Abaterea standard, σ, determină "răspândirea" curbei în jurul valorii mediei. Cu cât valoarea σ este mai mică, cu atât curba este mai concentrată în jurul valorii mediei, cu atât este mai înalt vârful la medie și mai abruptă panta pe ambele părți.

Dacă aveți date care sunt distribuite Normal, veți observa că abaterea standard este un parametru important în determinarea limitelor în care se așteaptă un anumit procent din valorile datelor dvs. să apară. De exemplu,

1. Aproximativ două treimi dintre valori vor fi între μ - σ și μ + σ.

2. Aproximativ 95% din valori vor fi cuprinse între μ - 2σ și μ + 2σ.

3. Aproximativ 99,75% dintre valori vor fi între μ - 3σ și μ + 3σ. Astfel, vedeți că aproape toate valorile datelor se află între μ - 3σ și μ + 3σ. Acest lucru este ilustrat în figurile de mai jos:

Observați că cei doi parametri care descriu complet datele Gaussiane sunt media și deviația standard a datelor. Dacă credeți că datele dvs. au o distribuție Gaussiană, ați putea determina media lor și deviația standard. Acest lucru are numeroase aplicații, cum ar fi determinarea dacă:

• Dimensiunile produselor fabricate (de exemplu, grosimea plăcilor) se încadrează în limitele specificate.

• Valorile componentelor (de exemplu rezistența rezistoarelor) trebuie să se încadreze într-o toleranță specificată.

Exercițiul 7-7

Obiectiv: Aproximarea unei curbe cu date gaussiene zgomotoase.

1. Deschideți Normal (Gaussian) Fit VI din biblioteca Lvspcex.llb.

2. Comutați la diagrama bloc.

Observați că parametrii a și b în VI-ul Nonlinear Lev-Mar Exponential Fit din exercițiul anterior au fost înlocuiți cu medie și sigma. Rețineți că au fost eliminate controalele pentru parametrul c și numărul de puncte. For Loop produce intervalul de date între -5,0 și +5,0. Majoritatea completărilor de pe diagrama bloc au de-a face cu ecuația de implementare (3). Un zgomot alb uniform se adaugă apoi la datele Gaussiane generate.

3. Selectați Project » Unopened SubVIs » Target Fnc & Deriv Nonlin VI.

4. Modificați diagrama bloc a Target Fnc & Deriv Nonlin VI așa cum se arată mai jos.

Diagrama bloc

5. Întoarceți-vă la Normal (Gaussian) Fit VI și introduceți următoarele valori în comenzile de pe panoul frontal:

sigma 1.0
mean 0,0
noise level 0.1

6. Ștergeți matricea Initial Coefficients apăsând pe ea cu butonul drept al mouse-ului și selectând Data Operations » Empty Array. Setați valorile din Initial Coefficients la 2.0 și 2.0. Acestea sunt estimările sigma și mean, valori reale pe care le-ați ales ca 1.0 și 0.0 în controalele corespunzătoare.

7. Rulați VI-ul de mai multe ori și observați valorile lui sigma și mean în indicatorul Best Guess Coeff. În grafic, puteți vedea și răspândirea datelor și curba de aproximare Gaussiană.

8. Modificați valoarea sigma la 1.0 și executați VI-ul de mai multe ori. De fiecare dată, observați curba de aproximare, mse-ul și valorile din Best Guess Coeff.

9. Schimbați Initial Coefficients [0] (estimarea pentru sigma) la 50.0 și executați VI-ul de mai multe ori. VI-ul obține o estimare bună a sigmei în array Best Guess Coeff?

10. Schimbați Initial Coefficients [0] (estimarea pentru sigma) la 500.0 și executați din nou VI-ul de mai multe ori. Acum, câtă acuratețe are estimarea?

11. Când ați terminat, salvați și închideți VI-ul.

În acest exercițiu și cel precedent, a trebuit să deschideți Target Fnc and Deriv NonLin VI și să introduceți ecuații în formula node. Acest lucru necesită o anumită cantitate de muncă, precum și o înțelegere a acestui formula node, din partea ta. O metodă mult mai simplă și mai ușoară este să aveți flexibilitatea de a introduce formule direct pe panoul frontal, fără a accesa diagrama bloc. După cum veți vedea într-o lecție ulterioară, acest lucru este posibil prin utilizarea G Math Toolkit, un pachet de matematică (scris în întregime în G), care este extrem de util pentru rezolvarea ecuațiilor diferențiale, optimizare și o mare varietate de alte probleme matematice obișnuite.

Sfârșitul exercițiului 7-7

Rezumat

• Aproximarea curbei este utilă pentru aproximarea unei ecuații la un set de puncte de date.

Unele dintre aplicațiile practice de aproximarea curbei sunt eliminarea zgomotului de măsurare, umplerea punctelor de date lipsă, interpolarea, extrapolarea și integrarea și diferențierea datelor digitale.

• În special, ați învățat cum să utilizați VI-urile Linear, Exponențial, Polinomial, General Linear LS Fit și Non-Linear Lev-Mar Fit pentru a efectua mai multe tipuri diferite de aproximări liniare și neliniare.

MSE este un criteriu util în determinarea acurateței de potrivire.

Întrebări de revizuire

1. Denumiți cinci aplicații pentru aproximarea curbei.

2. Care VI de aproximare a curbei ai utiliza pentru a determina parametrii (notați ai ... i întreg) din următoarele modele?

unde x și y sunt variabile diferite.