NLP per Economia e Finanza

Un esempio di AlBERTino generato da Midjourney. mimmoexe Job ID: 4f2b10d7-c0c3-4be3-a68b f5f8c850b37bCC BY-SA 4.0
Tra i task del Natural Language Processing (NLP) vi è la Sentiment Analysis, che permette di determinare uno score di polarità (sentimento) per ogni frase, periodo o documento espresso in linguaggio naturale. Questo task funziona benissimo con la lingua Inglese (poiché i principali modelli sono addestrati su corpora di tale lingua) ma un pò meno su quelli di lingue diverse, specie se le frasi appartengono ad un "gergo" particolare come può essere quello finanziario.
AlBERTino nasce per questo motivo: essere specializzato nella determinazione della polarità di frasi tipiche del mondo economico/finanziario ed espresse in italiano.È un modello linguistico BERT-based, fondato su AlBERTo, ed addestrato ulteriormente su un dataset ben noto per la polarità finanziaria, opportunamente tradotto in Italiano. La sua accuratezza su frasi di questo contesto è molto elevata rispetto al modello originario "più generico", ed è stato usato per diverse applicazioni quali: 
  • Predizione del prezzo di titoli azionari nel brevissimo periodo, sfruttando la polarità delle notizie pubblicate su quotidiani (italiani) tipicamente finanziari per "direzionare" l'andamento del prezzo;
  • Supporto nei problemi di scelta per investimenti (specie in R&D) valutati attraverso opzioni reali, utilizzando la polarità per modificare le probabilità di passare da una fase all'altra di un progetto;
  • Analisi della direzione politica, tramite i tweet dei candidati vincitori delle Elezioni Politiche Italiane del 2022 alla Camera dei Deputati.
AlBERTino nei panni di un consulente finanziario, generato da Midjourney. mimmoexe Job ID: 3c99872d-0a50-44ae 8074-1e38825651caCC BY-SA 4.0.
AlBERTino come supporto alle decisioni in un progetto di R&D, generato da Midjourney.mimmoexe Job ID: 49e3607d-86ad-46f1-966a 14b6f15bbd18CC BY-SA 4.0.
AlBERTino durante un comizio elettorale, generato da Midjourney. mimmoexe Job ID: caef1e98-a6fd-472f-9e80 8d5d58540c3eCC BY-SA 4.0.