Tecniche avanzate di analisi dati mediante visualizzazione immersiva e machine learning
Tecniche avanzate di analisi dati mediante visualizzazione immersiva e machine learning
CUP: C67G25000030006
P.I.: Giorgia Vitanza (INAF - Catania)
Responsabile scientifico: Fabio Roberto Vitello (INAF - Catania)
Il progetto si inserisce nell’ambito del PNRR CN00000013 – Centro Nazionale HPC, Big Data e Quantum Computing, con particolare riferimento allo Spoke 3, dedicato allo sviluppo di metodologie per l’analisi e la gestione di big data. È inoltre coerente con gli obiettivi del progetto industriale HaMMon, valorizzando competenze già maturate nello sviluppo di workflow per la creazione di modelli digitali, l’applicazione di tecniche di machine learning e l’impiego di strumenti di visualizzazione scientifica per l’analisi di dati complessi.
L’obiettivo principale del progetto è migliorare la qualità e l’usabilità dei dati provenienti dai radiotelescopi di nuova generazione, come quelli del progetto SKA, attraverso lo sviluppo di metodologie avanzate per l’incremento della risoluzione, la rimozione automatica di artefatti e la compressione intelligente dei dataset per ottimizzare l’archiviazione. Questi dataset, estremamente vasti e multidimensionali, richiedono soluzioni innovative che integrino high-performance computing, machine learning e tecnologie di visualizzazione immersiva.
Le attività si articolano in tre fasi principali:
1. Gestione e preprocessing dei dati: si procederà con l’analisi della disponibilità dei dati, la visualizzazione 2D/3D, il downsampling e l’organizzazione strutturata dei dataset per facilitarne l’utilizzo nei successivi task analitici.
2. Analisi 2D/3D e super-risoluzione: verranno esplorati modelli generativi e modelli a diffusione per la super risoluzione. Tali modelli di machine learning saranno valutati quantitativamente e confrontati con lo stato dell’arte.
3. Tecnologie immersive: gli strumenti di preprocessing e super risoluzione per i dati verranno messi a disposizione degli scienziati per un’interazione diretta ed efficace con strutture complesse nei dati osservativi e simulati. Questa modalità potrà superare i limiti delle pipeline di analisi tradizionali e stimolare nuove modalità esplorative.
Il progetto, fortemente multidisciplinare, integra competenze in data science, intelligenza artificiale, modellazione 3D, rendering avanzato e HPC, e prevede la validazione dei metodi anche su dati industriali e medicali, a testimonianza della loro generalità. I risultati attesi includono nuove soluzioni per l’analisi e la gestione dei big data astrofisici, che potranno contribuire al progresso scientifico nel campo dell’astronomia e avere ricadute in ambiti applicativi ad alta rilevanza tecnologica.