Data mining:
l'intelligenza dei dati
aprile 2019: idealab.va.it/evento/data-mining-lintelligenza-dei-dati
Il corso, tenuto in modalità laboratoriale in tre pomeriggi per complessive sei ore, è rivolto a persone interessate a imparare i principi fondamentali e a sperimentare le tecniche di base dell’esplorazione e analisi di grandi quantità di dati, i cosiddetti “big data”.
A partire da alcuni semplici contenuti di statistica, svilupperemo le competenze per operare su dati grezzi e ricavarne informazioni rilevanti secondo la logica del data mining: oltre la loro elaborazione mediante fogli di calcolo, i dati acquistano un valore strategico, in ambito aziendale, scientifico, ... In questo modo scoprire informazione nei dati diventa un’attività creativa.
Materiali:
- Il sito di Orange, il sistema software di data mining che usiamo, e i manuali di Orange: per utenti e per programmatori
- Il dataset che usiamo (preso da archive.ics.uci.edu/ml/datasets/student+performance e adattato) e la descrizione del suo contenuto
- Un dataset di fotografie di facce di persone, per clustering (file di circa 70 MB, che si può prendere da www.vision.caltech.edu/html-files/archive.html, in formato tar, oppure qui, in formato zip)
- Appunti di un'introduzione alla statistica e alla teoria della probabilità
- Le slide del primo incontro (10 aprile 2019), del secondo incontro (15 aprile 2019), e del terzo incontro (17 aprile 2019), e la traccia dei tre incontri