Cours Reinforcement Learning, M2 ISF App, 2021-2022

Responsable: Gabriel TURINICI


1/ Introduction au reinforcement learning
2/ Formalisme théorique : « Markov decision processes » (MDP), function valeur ( équation de Belman et Hamilton- Jacobi – Bellman) etc.
3/ Stratégies usuelles, sur l’exemple de “multi-armed bandit”
4/ Stratégies en deep learning: Q-learning et DQN
5/ Stratégies en deep learning: SARSA et variantes
6/ Stratégies en deep learning: Actor-Critic et variantes
7/ Implémentations Python variées
8/ Perspectives.


Document principal pour les présentations théoriques: (aucune distribution n’est autorisée sans accord ECRIT de l’auteur)

Code: MAB , MAB v2.,

Gym : entrainement avec « Frozen-Lake »

Q-Learning : avec Frozen Lake, version python ou version notebook

Deep Q Learning : jouer avec gym/Atari-Breakout: version python ou version notebook

apprendre avec gym/Atari-Breakout: version python ou version notebook

Projets : cf. Teams



Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *