Machine Learning
E.Le Pennec
Ce cours de 20h propose une introduction à l'apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning: An Introduction" de R. Sutton et A.
Barto (disponible en ligne sur la page http://incompleteideas.net/book/the-book-2nd.html).
Plan
1. Introduction à l'apprentissage par renforcement et processus de décision markovien
2. Le cas des bandits
3. Méthodes tabulaires: prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning
4. Planification et apprentissage pour les méthodes tabulaires
5. Méthodes approchées: prédiction, planification et apprentissage