Mathématiques pour les Sciences du Vivant

Machine Learning

E.Le Pennec

Ce cours de 20h propose une introduction à l'apprentissage par renforcement. Il est basé sur la nouvelle édition du livre "Reinforcement Learning: An Introduction" de R. Sutton et A.

Barto (disponible en ligne sur la page http://incompleteideas.net/book/the-book-2nd.html).

Plan

1. Introduction à l'apprentissage par renforcement et processus de décision markovien

2. Le cas des bandits

3. Méthodes tabulaires: prédiction par programmation dynamique, méthode de Monte Carlo et TD Learning

4. Planification et apprentissage pour les méthodes tabulaires

5. Méthodes approchées: prédiction, planification et apprentissage

Google Sites

Report abuse