Machine Learning

E.Le Pennec

Ce cours de 20h propose une introduction à l'apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning: An Introduction" de R. Sutton et A. 

Barto (disponible en ligne sur la page http://incompleteideas.net/book/the-book-2nd.html).

 

 Plan

 

1. Introduction à l'apprentissage par renforcement et processus de décision markovien

2. Le cas des bandits

3. Méthodes tabulaires: prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning 

4. Planification et apprentissage pour les méthodes tabulaires 

5.  Méthodes approchées: prédiction, planification et apprentissage