Questa attività si concentra sullo sviluppo di algoritmi generici per la progettazione automatica di sistemi meccatronici complessi. Tali algoritmi saranno in grado di progettare sistemi ottimi per lo svolgimento di uno o più compiti prestabiliti, ottimizzando allo stesso tempo i parametri hardware del sistema ed il suo movimento per lo svolgimento dei compiti. A tale scopo testeremo tecniche di controllo ottimo diretto, che eccellono per la loro flessibilità ed efficienza computazionale derivante dall'uso dei gradienti del modello dinamico del sistema progettato, ma che, come tutti i metodi di ottimizzazione basati su gradiente, spesso tendono a trovare soluzioni locali di bassa qualità. Per sopperire a questo problema, questa attività cercherà di sfruttare algoritmi di apprendimento per rinforzo (Reinforcement Learning). Questi ultimi infatti riescono a trovare soluzioni di alta qualità grazie ad una esplorazione massiccia dello spazio delle soluzioni, senza bisogno di alcun modello del sistema, ma al prezzo di tempi di calcolo molto più lunghi. Infine, le tecniche di controllo ottimo ed apprendimento per rinforzo saranno unite in un unico algoritmo, per cercare di ottenere un metodo che sia al tempo stesso computazionalmente efficiente (grazie all'uso dei gradienti) e capace di evitare le soluzioni locali di bassa qualità (grazie alle tecniche di esplorazione globale).
L’attività si colloca all’interno della macroattività 1, Tecnologie moderne flessibili e/o indossabili, sviluppando una metodologia per la progettazione integrata di hardware complessi, tenendo conto anche degli effetti che le scelte hardware potranno avere sulle prestazioni di controllo dei dispositivi. L'utilizzo di algoritmi di progettazione automatica diventa infatti sempre più cruciale quando si ha a che fare con sistemi hardware complessi, ad esempio composti da materiali flessibili, nei quali lo spazio delle possibili soluzioni hardware cresce a dismisura e diventa perciò difficilmente esplorabile dalla mente umana. La metodologia sviluppata sarà in grado di aiutare i progettisti umani nelle loro scelte, e sarà applicabile alla progettazione di un gran numero di sistemi hardware, sia quelli più classici e facilmente modellabili (come i bracci robotici), sia quelli più complessi e difficilmente modellabili (come i soft robots).
Referente: Andrea Del Prete
Gruppo di lavoro:
Ricercatori DII: Marco Fontana
Ricercatori esterni: Patrick Wensing e Gabriel Bravo Palacios (Notre Dame University, USA), Gabriele Fadini, Thomas Flayols e Philippe Soueres (LAAS/CNRS, France)
Studenti PhD: Gianluigi Grandesso
Studenti di LM o LT: Pasquale Romano (LM), Lorenzo Busellato (LT)
Partner esterni coinvolti
Istituzioni di ricerca straniere: University of Notre Dame, USA, LAAS-CNRS Toulouse (Francia)
Istituzioni di ricerca nazionali: Scuola Sant’Anna, Pisa
Aziende straniere: PAL Robotics (Barcelona)
Figura 1: Schema di un attuatore ridondante ottimizzato mediante controllo ottimo, formato da un Series Elastic Actuator collegato in parallelo ad un motore Quasi-Direct Drive.
PhD: Gianluigi Grandesso
Argomento: Progettazione simultanea di hardware e controllo per sistemi robotici ad alta efficienza
Data inizio dell’attività: Novembre 2019
Stato dell’attività, obiettivi e scadenze:
L’attività in esame ha già prodotto i primi risultati in termini di utilizzo di tecniche di controllo ottimo per la co-progettazione di sistemi robotici complessi. Nell'ultimo anno l'attività si è spostata sull'unione delle tecniche precedentemente sviluppate a tecniche di apprendimento per rinforzo. Ci si è posti l’obiettivo di concludere quest’ultima fase entro ottobre 2021, possibilmente con la produzione di una pubblicazione scientifica. Fino ad oggi, il lavoro ha prodotto due articoli, e una collaborazione internazionale con l’Università di Notre Dame. A causa della pandemia dovuta al Covid, il periodo all'estero dello studente all'università di Notre Dame è stato rimandato a data da definire. Alternative per un periodo all'estero in europa sono in fase di valutazione.
LT: Lorenzo Busellato
Argomento: Realizzazione di un prototipo di robot quadrupede stampato in 3d
Data inizio: Gennaio 2020
LM: Pasquale Romano
Argomento: Valutazione di algoritmi continui di apprendimento per rinforzo: analisi di strategia di campionamento ed esplorazione
Date: Luglio 2020 – Luglio 2021
Articoli scientifici:
Bravo-Palacios, G., Del Prete, A., & Wensing, P. M. (2020). One robot for many tasks: Versatile co-design through stochastic programming. IEEE Robotics and Automation Letters, 5(2), 1680–1687.
Fadini, G., Flayols, T., Del Prete, A., Mansard, N., & Souères, P. (2021). Computational design of energy-efficient legged robots : Optimizing for size and actuators. In IEEE International Conference on Robotics and Automation (ICRA).
Grandesso, G., Bravo-palacios, G., Wensing, P. M., Fontana, M., & Del Prete, A. (2021). Exploring the limits of a redundant actuation system through Co-Design. IEEE Access, 9, 56802–56811.
Bravo-Palacios, G., Grandesso, G., Del Prete, A., & Wensing, P. M. (2021). Robust Co-Design: Coupling Morphology and Feedback Design Through Stochastic Programming. Journal of Dynamic Systems, Measurement, and Control, 144(2).
Prototipi sviluppati: All’interno dell’attività è stato sviluppato il prototipo di un robot quadrupede completamente stampato in 3d. Di seguito una foto dell’apparato sperimentale.
Figura 2: prototipo realizzato.
Un gruppo di lavoro internazionale formato da Andrea Del Prete (UniTN), Gianluigi Grandesso (UniTN), Patrick Wensing (University of Notre Dame), Gabriel Bravo Palacios (University of Notre Dame), Gabriele Fadini (LAAS/CNRS), Thomas Flayols (LAAS/CNRS) e Philippe Soueres (LAAS/CNRS), si incontra ogni 2 settimane circa per condividere e discutere gli avanzamenti nel lavoro sulla co-progettazione.