Bazele mecatronicii - 9.6 Control avansat

9.6 Control avansat

9.6.1 Control cu regulator pătratic liniar

9.6.2 Control modal

9.6.3 Controlul cu feedback neliniar

9.6.4 Control adaptiv

9.6.5 Control mod glisant

9.6.6 Control gaussian pătratic liniar

9.6.7 Control H∞ (H-Infinit)

Accentul prezentului capitol a fost pus pe controlul convențional (cunoscut și sub denumirea de control clasic) care este utilizat în mod obișnuit în aplicațiile mecatronice/industriale. Se ocupă în primul rând de sisteme de intrare-unică-ieșire-unică (SISO = single-input–single-output), atât în domeniu-timp, cât și domeniu-frecvență. Ce sunt identificate în mod obișnuit drept tehnici moderne de control sunt tehnicile multivariabile (multi-input-multi-output = MIMO) pe domeniu-timp care utilizează reprezentarea spațiu-stare pentru sistem. Prezenta secțiune va prezenta câteva dintre aceste tehnici de control avansate, în special în categoriile de control optim și control modal. O altă metodă de control care a fost destul de populară în aplicațiile mecatronice/industriale este controlul logic fuzzy, care va fi prezentat în secțiunea următoare.

(9.32)

Presupunem că toate stările x sunt măsurabile și că toate modurile de sistem pot fi controlate.

Atunci, folosim legea de control cu feedback de câștig-constant:

(9.33)

Alegerea valorilor parametrului pentru matricea câștigului de feedback K este infinită. Prin urmare, putem folosi această libertate pentru a minimiza funcția de cost:

(9.34)

Aceasta este integrala în timp a unei funcții pătratice de ambele variabile: stare, și intrare, iar obiectivul de optimizare poate fi interpretat ca aducerea lui x la zero (reglarea x la 0), dar fără a cheltui un efort de control destul de ridicat; de aici, denumirea de reglare pătratică liniară (LQR). De asemenea, Q și R sunt matrici de ponderare, prima fiind cel puțin semi-definită pozitiv, iar ultima definită pozitiv. În mod obișnuit Q și R sunt alese drept matrice diagonale cu elemente diagonale pozitive ale căror magnitudini sunt hotărâte în funcție de gradul de accent relativ care ar trebui făcut pe diverse elemente din x și u. Este bine-cunoscut faptul că K care reduce la minimum funcția de cost (9.34) este dat de

(9.35)

unde Kr este soluția definită-pozitivă a matricei Riccati din ecuația algebrică:

(9.36)

Este de asemenea cunoscut faptul că sistemul de control cu buclă-închisă rezultat este stabil. Mai mult, valoarea minimă (optimală) a funcției de cost (9.34) este dată de

(9.37)

unde x este valoarea actuală a vectorului de stare. Sarcina majoră de calcul a metodei LQR se află în soluția ecuația 9.36. Alte limitări ale tehnicii apar din cauza necesității măsurării tuturor variabilelor de stare (care pot fi relaxate într-o oarecare măsură). În plus, chiar dacă stabilitatea sistemului controlat este garantată, nivelul de stabilitate atins (adică, marja de stabilitate sau nivelul amortizării modale) nu poate fi specificat direct. De asemenea, robustețea sistemului de control, în prezența unor erori de model, perturbări necunoscute și așa mai departe, poate fi discutabilă. În plus, funcția de cost incorporează o integrală pe o durată infinită de timp, care nu reflectă în mod obișnuit cerința practică a controlului vibrațiilor rapide.

9.6.2 Control modal

Tehnica de control LQR are limitarea serioasă de a nu putea atinge direct nivelele specificate de amortizare modală, ceea ce poate fi un obiectiv important în controlul unui sistem mecatronic. Metoda controlului modal atinge acest obiectiv prin plasarea polilor, unde polii (valori proprii) sistemului controlat sunt plasați la valori specificate astfel încât modurile (adică răspunsuri naturale fundamentale libere) ale sistemului să se comporte într-o manieră dorită (în raport cu stabilitate, viteza de răspuns etc.). Mai exact, considerați instalația (9.32) și legea controlului cu feedback (9.33). Atunci, sistemul cu buclă-închisă este dat de

(9.38)

Este cunoscut faptul că dacă instalația (A, B) este controlabilă, atunci poate fi aleasă o matrice a câștigului de control K care va plasa arbitrar valorile proprii ale matricei sistemului cu buclă-închisă A+ BK. Aceasta înseamnă că, în conformitate cu presupunerile date, tehnica de control modal nu poate atribui numai amortizarea modală, ci și frecvențele naturale amortizate la valori specificate. Presupunerile date mai sus sunt destul de stricte, dar pot fi relaxate într-un anumit grad. Un neajuns al acestei metode este, însă, faptul că nu pune nicio restricție pe efortul de control, cum este de exemplu face tehnica LQR, în atingerea unui nivel specificat de control modal.

9.6.3 Control cu feedback neliniar

Se știe că controlul servo simplu și liniar este inadecvat pentru funcționarea tranzitorie și de mare-viteză a instalațiilor complexe. Experiența trecută a controlului servo în aplicațiile de proces este extinsă, însă, controlul servo este utilizat pe scară largă în multe aplicații comerciale (de exemplu, roboți). Pentru ca acest tip de control să fie eficient, totuși, neliniaritățile și cuplajul dinamic trebuie să fie compensate mai repede decât lățimea de bandă de control la nivelul servo. Un mod de a realiza acest lucru este prin implementarea unui controller de liniarizare și decuplare în interiorul servo-buclelor. Această tehnică este denumită tehnică de linearizare a feedback-ului (FLT). O astfel de tehnică utilă în controlul sistemelor dinamice neliniare și cuplate, cum ar fi roboții este prezentată aici.

Considerați un sistem dinamic mecanic (instalație) dat de

(9.39)

în care

f = [f₁ f₂ …f_r]^Teste vectorul forțelor de intrare în diferite locații ale sistemului

q = [q₁ q₂ …q_r]^Teste vectorul variabilelor de răspuns (de exemplu, poziții) la locațiile de forțare a sistemului

M(q) este matricea de inerție (neliniară)

n(q, dq/dt) este un vector al efectelor neliniare rămase în sistem (de exemplu, amortizare, reculul, efecte gravitaționale).

Să presupunem acum că putem modela M cu M̂ și n cu n̂. Apoi, să folosim controllerul de feedback neliniar (liniarizant) dat de

(9.40)

în care e = qd - q = vector de eroare (corecție) ; qd = răspunsul dorit; și K, Ti și Td sunt matrici ale parametrilor de control constant. Această schemă de control este prezentată în figura 9.17. Substituind ecuația controllerului (9.40) în ecuația instalației (9.39) obținem

(9.41)

FIGURA 9.17 Structura sistemului de control cu feedback neliniar bazat pe model

Dacă modelele noastre sunt exacte, avem M = M̂ și n = n̂. Atunci, deoarece inversa matricei M̂ există în general (deoarece matricea de inerție este definitivă pozitivă), obținem

(9.42)

Ecuația 9.42 reprezintă un sistem de parametri liniari, constanți, cu control PID. Parametrii de control proporțional sunt dați de matricea de câștig K, parametrii de control integrativ de Ti și parametrii de control derivativ de Td. Ar trebui să fie clar că suntem liberi să selectăm acești parametri pentru a obține răspunsul dorit. În special, dacă aceste trei matrici de parametri sunt alese a fi diagonale, atunci sistemul de control, astfel cum este dat de ecuația 9.42 și arătat în figura 9.17 nu va fi cuplat (adică o intrare afectează o singură ieșire) și nu va conține interacțiuni dinamice. În rezumat, acest controller are avantajele liniarizării și decuplării sistemului; dezavantajele sale sunt că vor fi necesare modele exacte și că algoritmul de control este clar și incapabil să gestioneze informații calitative sau parțial cunoscute, învățare etc.

În locul utilizării modelării analitice, parametrii în M̂ și n̂ pot fi obținuți prin măsurarea diferitelor perechi de intrare-ieșire. Aceasta este numită identificarea modelului și poate cauza complicații suplimentare în ceea ce privește instrumentarea și viteza de procesare a datelor, în special pentru că unii dintre parametrii modelului trebuie să fie estimați în timp real.

9.6.4 Control adaptiv

Un sistem de control adaptiv este un sistem de control cu feedback în care valorile unora sau ale tuturor parametrilor controllerului sunt modificate (adaptate) în timpul funcționării sistemului (în real timp) pe baza unor măsuri de performanță, când cerințele de răspuns (de ieșire) nu sunt îndeplinite. Tehnicile de control adaptiv sunt numeroase deoarece se pot utiliza multe criterii pentru modificarea valorilor parametrilor unui controller. Conform definiției de mai sus, controlul de auto-reglare se încadrează în aceeași categorie. De fapt, termenii „control adaptiv” și „control de auto-reglare” au fost folosiți în mod interschimbabil în literatura tehnică. Criteriile de performanță utilizate în controlul cu auto-reglare pot varia de la specificațiile răspuns-timp sau răspuns-frecvență, parametrii modelelor „ideale”, locațiile dorite ale polilor și zerourilor și funcții de cost. În general, însă, în controlul cu auto-reglare al unui sistem, o anumită formă de estimare sau identificare a parametrilor este efectuată online folosind măsurători de intrare-ieșire din sistem, iar parametrii controllerului sunt modificați folosind aceste valori ale parametrilor estimați. Majoritatea controllerelor de auto-reglare dezvoltate în literatură se bazează pe presupunerea că instalația (procesul) este liniară și invariabilă în timp. Această presupunere nu este valabilă în general pentru procesele industriale complexe. Din acest motiv, vom restricționa discuția noastră la un controller adaptiv care a fost dezvoltat pentru instalații neliniare și cuplate.

Estimarea online sau identificarea sistemului, care poate fi necesară pentru controlul adaptiv, poate fi considerată a fi o etapă preliminară a „învățării”. În acest context, controlul învățării și controlul adaptativ sunt legate, dar învățarea este mult mai complexă și mai sofisticată decât o estimare cantitativă a valorilor parametrilor. Într-un sistem de învățare, deciziile de control sunt luate folosind experiența acumulată și cunoștințele obținute într-o perioadă de timp. Mai mult, definiția învățării implică faptul că un controller de învățare își va „aminti” și își va îmbunătăți performanța în timp. Acesta este un proces evolutiv care este valabil pentru controllerele inteligente, dar nu, în general, pentru controllerele adaptive.

Aici, descriem pe scurt o tehnică de control adaptiv (MRAC= model-referenced adaptive control) referită la model. Abordarea generală a MRAC este ilustrată de diagrama bloc din figura 9.18. În controlul cu feedback neadaptiv, măsurătorile de răspuns sunt trimise înapoi în controllerul de acționare printr-un controller de feedback, dar valorile parametrilor controllerului (câștiguri de feedback) în sine nu sunt modificate în timpul funcționării. În controlul adaptiv, aceste valori ale parametrilor sunt modificate după un anumit criteriu. În controlul adaptiv referit la model, în special, aceeași intrare de referință care se aplică sistemului fizic este aplicată și unui model de referință. Diferența dintre răspunsul sistemului fizic și ieșirea din modelul de referință este eroarea. Obiectivul ideal este de a face această eroare zero în orice moment. Atunci, sistemul va funcționa la fel ca modelul de referință. Semnalul de eroare este utilizat de mecanismul de adaptare pentru a determina modificările necesare la valorile parametrilor controllerului pentru a atinge acest obiectiv. Rețineți că modelul de referință este un model idealizat care generează un răspuns dorit atunci când este supus la intrarea de referință, cel puțin într-o manieră asimptotică (adică eroarea converge la zero). În acest sens, este doar un mijloc de specificare a performanței și poate să nu aibă nicio asemănare sau analogie cu un model analitic al procesului în sine. De exemplu, modelul de referință poate fi ales ca un sistem liniar, necuplat cu proprietăți dorite de amortizare și lățime de bandă (adică rapoarte de amortizare și frecvențe naturale).

FIGURA 9.18 Controller adaptiv referit la model

O abordare populară pentru a obține algoritmul de control adaptiv (adică ecuațiile care exprimă modul în care ar trebui schimbați parametrii controllerului în timp real) este prin utilizarea regulii MIT. În această metodă, parametrii regulatorului sunt schimbați în direcția opusă pantei maxime a funcției de eroare pătratică. Mai exact, funcția pătratică

(9.43)

este formată, unde
e este vectorul semnalului de eroare prezentat în figura 9.18
W este o matrice de ponderare diagonală și definită-pozitivă
p este un vector al parametrilor de control care va fi schimbat (adaptat) în timpul controlului

Funcția V este redusă la minimum în raport cu p în timpul funcționării controllerului, sub rezerva unor presupuneri simplificatoare. Detaliile algoritmului se găsesc în literatura de specialitate.

Algoritmul de control adaptiv descris aici prezintă avantajul că nu necesită în mod necesar un model al instalației în sine. Modelul de referință poate fi ales pentru a specifica performanța cerută, obiectivul MRAC fiind acela de a conduce răspunsul sistemului către cel al modelului de referință. Însă, există o serie de dezavantaje. Deoarece modelul de referință este destul de independent de modelul instalației, efortul necesar de control ar putea fi excesiv și calculul în sine ar putea fi lent.

În plus, pentru fiecare model de referință trebuie obținută o nouă lege de control. De asemenea, acțiunea de control trebuie generată mult mai rapid decât viteza cu care termenii neliniari ai instalației se schimbă, deoarece mecanismul de adaptare a fost obținut prin presupunerea că unii dintre termenii neliniari rămân mai mult sau mai puțin constanți.

Multe alte scheme de control adaptive depind de un model rezonabil de exact al instalației, nu doar de un model de referință. Modelele pot fi obținute fie analitic, fie prin identificare (experimentale). Controlul adaptiv a fost aplicat cu succes în sisteme complexe, neliniare și cuplate, chiar dacă are mai multe puncte slabe, după cum am menționat anterior.

9.6.5 Control în mod glisant

Controlul în mod glisant, controlul structurii variabile și controlul aspirației se încadrează în aceeași clasă de tehnici de control și sunt oarecum sinonime. Legea de control din această clasă este în general un controller de comutare. Pot fi utilizate o varietate de criterii de comutare. Controlul în mod glisant poate fi tratat ca o tehnică de control adaptiv. Deoarece suprafața de comutare nu este fixă, variabilitatea sa este oarecum analoagă unui criteriu de adaptare. Mai exact, eroarea răspunsului instalației este zero atunci când controlul cade pe suprafața de glisare.

Considerați o instalație care este modelată prin ecuația diferențială ordinară neliniară de ordinul al n-lea:

(9.44)

unde
y = răspunsul de interes
u(t) = variabila de intrare
d(t) = intrarea perturbatoare necunoscută
f(•) = un model neliniar necunoscut al procesului care depinde de vectorul de răspuns:

O suprafață de glisare care variază în timp este definită de ecuaţia diferențială:

(9.45)

(9,46)u λ > 0. Observați eroarea de răspuns ỹ = y - yd, unde yd este răspunsul dorit. În mod similar, ỹ = y - yd poate fi definit. Ar trebui să fie clar din Ecuația 9.45 că dacă pornim de la repaus cu eroare inițială zero (ỹ (0) = 0, cu toate derivatele lui până la a n-1-a derivată fiind zero la t = 0) atunci s = 0 corespunde lui (t) = 0 pentru toți t. Acest lucru va garanta că traiectoria dorită yd(t) este urmată în permanență cu exactitate. Prin urmare, obiectivul de control ar fi să forțeze vectorul stării de eroare ỹ pe suprafața de glisare s = 0. Acest obiectiv de control va fi atins dacă legea de control satisface

s sgn(s) ≤ -η cu η > 0 (9.46)

unde sgn(s) este funcția signum.

Procesul neliniar f(y,t) este în general necunoscut. Presupunem că f(y,t) = f̂ (y,t) + Δf(y,t) unde f̂ (y,t) este o funcție complet cunoscută și Δf reprezintă incertitudinea modelării.

Mai exact, considerați ecuația de control:

(9.47)

unde K(y,t) este o limită superioară pentru incertitudinea totală a sistemului (adică perturbarea, eroarea modelului, viteza de reducere a erorii etc.). Și:

FIGURA 9.19 Funcții de comutare utilizate în controlul modului glisant:
(a) funcția signum; (b) funcția saturație

Acest controler cu mod glisant satisface ecuația 9.46, dar are dezavantaje care decurg din funcția sgn(s). Mai exact, pot apărea frecvențe de comutare foarte înalte atunci când efortul de control este semnificativ. Acesta este de obicei cazul în prezența unor erori de modelare și perturbări mari. Controlul de comutare de înaltă-frecvență poate duce la excitarea modurilor de înaltă-frecvență în instalație. De asemenea, poate duce la probleme de chattering. Această problemă poate fi redusă dacă funcția signum din Ecuația 9.47 este înlocuită cu o funcție de saturație, cu un palier de limitare ± ϕ, așa cum se arată în figura 9.19. În acest mod, orice comutare care ar fi avut loc în palierul de limitare va fi filtrată. Mai mult, tranzițiile de comutare ar fi mult mai puțin severe. În mod clar, avantajele controlului în mod glisant include robustețea împotriva factorilor cum ar fi neliniaritatea, incertitudinile modelului, perturbările, și variații ale parametrilor.

9.6.6 Control liniar pătratic gaussian

Aceasta este o tehnică de control optimală, care este destinată sistemelor destul de liniare, cu perturbări de intrare aleatorii și zgomot de ieșire (măsurare). Considerați sistemul liniar dat de setul de ecuații diferențiale de prim ordin (ecuații de stare):

(9.48)

și ecuațiile de ieșire:

(9.49)

în care
x = [x1 x2 ... xn]^T este vectorul de stare
u = [u1 u2 ... ur]^T este vectorul intrărilor sistemului
y = [y1 y2 ... ym]^T este vectorul ieșirilor sistemului

Vectorii v și w reprezintă perturbări de intrare și, respectiv, zgomot de ieșire, care se presupune a fi zgomot alb (adică semnale aleatorii cu medie zero, a căror funcție a densității spectrale de putere este plată) cu matrici de covarianță V și W. De asemenea, A se numește matrice de sistem, B matricea de distribuție a intrării și C matricea de formare a ieșirilor. În controlul liniar pătratic Gaussian (LQG), obiectivul este de a minimaliza indicele de performanță (funcția de cost):

(9.50)

în care Q și R sunt matrici diagonale de ponderare și E denumește „valoarea scontată” (sau valoarea medie) a unui proces aleator. În metoda LQG, controllerul este implementat ca proces în două etape:

1. Obțineți x̂ estimat pentru vectorul de stare x folosind un filtru Kalman (cu câștig Kf)

2. Obțineți semnalul de control ca produs al lui x̂ și o matrice de câștig K0 rezolvând o problemă de control optimal pătratic liniar fără zgomot

Această implementare este prezentată de diagrama bloc din figura 9.20. Așa cum am menționat anterior, se poate demonstra analitic că controllerul optimal pătratic fără zgomot este dat de matricea de câștig:

(9.51)

unde P0 este soluția semi-definită pozitivă a ecuației algebrice Riccati:

(9.52)

Filtrul Kalman este dat de matricea câștigului:

(9.53)

unde Pf este obținut ca înainte prin soluționarea:

(9.54)

Un avantaj al acestui controller este că stabilitatea sistemului de control cu buclă-închisă este garantată atât timp cât atât modelul instalației, cât și filtrul Kalman sunt stabilizabile și detectabile. Rețineți că, dacă modurile incontrolabile ale unui sistem sunt stabile, sistemul este stabilizabil.

FIGURA 9.20 Control liniar pătratic gaussian (LQG)

Similar, dacă modurile neobservabile ale unui sistem sunt stabile, sistemul este detectabil. Un alt avantaj este precizia controllerului atât timp cât presupunerile de bază sunt satisfăcute, dar controlul LQG este, de asemenea, o schemă „clară” bazată pe model. Erorile modelului și caracteristicile zgomotului pot afecta semnificativ performanța. De asemenea, chiar dacă stabilitatea este garantată, în această metodă nu sunt garantate marje bune de stabilitate și robustețe adecvată. Complexitatea de calcul (soluția a două ecuații Riccati) este un alt dezavantaj.

9.6.7 Control H∞ (H-Infinit)

Aceasta este o abordare relativ nouă de control optimal, care este destul de diferită de metoda LQG. Totuși, aceasta este o metodă de domeniu-frecvență. Această tehnică presupune o instalație liniară cu parametri constanți, care poate fi modelată printr-o funcție de transfer în cazul SISO sau printr-o matrice de transfer în cazul MIMO. Fără a intra în detalii analitice, prezentăm principiul din spatele controlului H∞.

Considerați sistemul de control cu feedback liniar MIMO, afișat de diagrama bloc în Figura 9.21, unde I este o matrice identitate. Acesta satisface relația: GGc [yd - y] = y, sau

(9.55)

Deoarece instalația G este fixă, problema de proiectare de bază este de a selecta un controller adecvat Gc care va duce la o performanță cerută a sistemului. Cu alte cuvinte, matricea de transfer cu buclă-închisă:

(9.56)

trebuie să fie „modelată” corespunzător printr-o alegere adecvată a Gc. Forma cerută de H(s) poate fi în concordanță cu specificațiile clasice, cum ar fi

1. |H(jω)| unitate sau |GGc(jω)| mare la frecvențe joase, pentru a obține eroare mică de stare-staționară pentru intrările treaptă

2. |H(jω)| mică sau |GGc(jω)| mică la frecvențe înalte, astfel încât zgomotul de înaltă-frecvență să nu fie amplificat și, în plus, controlerul să fie realizabil fizic

3. Marjele de câștig și faza suficient de ridicate pentru a atinge nivelele de stabilitate necesare

Desigur, în teorie există un număr „infinit” de opțiuni posibile pentru Gc(s) care vor satisface astfel de specificații. Metoda H∞ folosește un criteriu optimal pentru a selecta una dintre aceste alegeri „infinite”. Mai exact, alegerea care reduce la minimum așa-numita „normă H∞” a matricii de transfer H(s) cu buclă-închisă. Motivul este că această soluție optimală este cunoscută pentru a oferi multe caracteristici dorite (cu privire la stabilitate, robustețe în prezența incertitudinii și zgomotului de model, sensibilitate etc.) în sistemul de control.

Norma H∞ a unei matrice de transfer H este valoarea maximă a celei mai mari valori singulare a lui H(jω), maximul fiind determinat pe întregul interval de frecvență. O valoare singulară a lui H(jω) este rădăcina pătrată a unei valori proprii a matricei H(jω) H^T(jω).

Metoda de control H∞ are avantajele stabilității și robusteței. Dezavantajele sunt că este o metodă de control „clară”, care este limitată la sisteme liniare, invariante în timp și că este o tehnică bazată pe model.

FIGURA 9.21 Un sistem liniar de control cu feedback multivariabil

9.7 Control Logic Fuzzy