Data Mining: l'intelligenza dei dati
marzo - aprile 2018: idealab.va.it/evento/data-mining
Il corso, tenuto in modalità laboratoriale in tre pomeriggi per complessive sei ore, è rivolto a persone interessate a imparare i principi fondamentali e a sperimentare le tecniche di base dell’esplorazione e analisi di grandi quantità di dati, i cosiddetti “big data”.
A partire da alcuni semplici contenuti di statistica, svilupperemo le competenze per operare su dati grezzi e ricavarne informazioni rilevanti secondo la logica del data mining: oltre la loro elaborazione mediante fogli di calcolo, i dati acquistano un valore strategico, in ambito aziendale, scientifico, ... In questo modo scoprire informazione nei dati diventa un’attività creativa.
Materiali:
- Il sito del sistema software di data mining che abbiamo usato: Orange e i manuali di Orange: per utenti e per programmatori
- Esempi di script Python per Orange (da usare con il widget Python Script): aggiungi un attributo id; crea una tabella con alcune statistiche di base; crea una tabella di numeri casuali; disegna un box plot
- Il dataset che abbiamo usato (preso da archive.ics.uci.edu/ml/datasets/student+performance e adattato) e la sua descrizione; un dataset di fotografie di facce di persone, per clustering (file di circa 70 MB, che si può prendere da www.vision.caltech.edu/html-files/archive.html)
- Appunti di un'introduzione alla statistica e alla teoria della probabilità
- Le slide e la traccia di lavoro del primo incontro (22 marzo 2018)
- Le slide e la traccia di lavoro del secondo incontro (5 aprile 2018)
- Le slide e la traccia di lavoro del terzo incontro (12 aprile 2018)