Après un survol des 3 catégories de l'apprentissage, nous étudierons les 3 méthodes basiques, mais robustes, pour l'apprentissage supervisé (régression, k-NN, SVM) , suivi d'autres méthodes pour la régression et pour la classification. Nous aborderons également le sujet très important de ré-échantillonnage.
Définitions et cadre mathématique
Régression et Classification
Ré-échantillonnage
Autres méthodes de régression (Ridge, Lasso, PCR, PLS)
k-Nearest Neighbours (k-NN)
Support Vector Machine (SVM)
Arbres de Décision (CART)
Autres méthodes de classification (régression logistique, LDA, naive Bayes)
Fiche de TD/TP : TD_02 (Régression) données tires
Fiche de TD/TP : TD_03 (k-NNN et SVM)
Cours : Régression linéaire
photo.html et les données photoCSV.csv
Cours : k-NN
knn_cancer.html, données Wisconsin du cancer
Cours : Bootstrap,
Cours : Ré-échantillonnage et tuning
Validation croisée avec répétitions
Validation croisée avec caret
Tuning avec caret
Cours : SVM
svm-1.html (SVM non-linéaire, courbes ROC)
Cours : CART (Classification And Regression Trees)
RF_lycee.html et son fichier de données.
Boosting sur données iris
Boosting vs. Modèles Linéaires sur données de Baseball (Hitters)
Cours : Régression Ridge, LASSO, PCR et PLS
reg-ridge-lasso (données de Baseball)
reg-PCR-PLS (données de Baseball)
reg-subset-sel (selection de sous-ensembles pour données de Baseball)
Cours : Autres méthodes de Classification: régression logistique, LDA, naive Bayes
Exemples complets et comparaison des méthodes
Classification des données de diabète avec scikit-learn (python) pima-indians-diabete-naive-bayes.html
Classification des données de vente de jus d'orange caret_OJ.html
Régression des données de l'immobilier avec caret caret_SPOT.html