Nous traiterons dans ce cours des thèmes suivants :
- Choix et encodage des données
- Statistiques descriptives
- Loi des grands nombres / Théorème central limite
- Tests statistiques (en particulier, A/B testing)
- Visualisation des données
- Similarités et Distances
- Apprentissage Non Supervisé :
- algorithme des k-means
- classification ascendante hierarchique
- Apprentissage Supervisé :
- naive Bayes
- régression linéaire
- régression logistique
- arbres de décision / forêts aléatoires
- machines à vecteurs supports
- réseaux de neurones
- [Pas sûr qu'on ait le temps] Réduction de dimension (ex : analyse en composantes principales)