Modulo VIII – Natural language processing

Docente: Giovanni Pilato

Il modulo presenta alcuni modelli di rappresentazione dei testi e le tecniche di base dell’elaborazione del linguaggio naturale. Particolare enfasi verrà data al modello di rappresentazione vettoriale delle parole e dei testi. Viene introdotto la libreria python NLTK (Natural Language Toolkit) per l’analisi dei testi. Viene inoltre presentato il problema dell’estrazione delle informazioni e del sentiment analysis, utile per individuare le opinioni in dati presenti sui social media o nei microblog.

L’analisi dei dati testuali può essere utile per analizzare le opinioni che gli utenti esprimono su oggetti e, in generale, prodotti di mercato. Inoltre attraverso tale analisi è possibile individuare profili di utenti mediante il contenuto semantico dei loro post, nonché realizzare dei sistemi automatici di raccomandazione dei contenuti.