Responsable: Gabriel TURINICI
1/ Introduction au reinforcement learning
2/ Formalisme théorique : « Markov decision processes » (MDP), function valeur ( équation de Belman et Hamilton- Jacobi – Bellman) etc.
3/ Stratégies usuelles, sur l’exemple de “multi-armed bandit”
4/ Stratégies en deep learning: Q-learning et DQN
5/ Stratégies en deep learning: SARSA et variantes
6/ Stratégies en deep learning: Actor-Critic et variantes
7/ Implémentations Python variées
8/ Perspectives.
Gym: jeu Frozen Lake (v2023) (version 2022)
Q-Learning : avec Frozen Lake, version python ou version notebook
-jouer avec gym/Atari-Breakout: version python ou version notebook
Deep Q Learning (DQN) : Apprendre avec gym/Atari-Breakout: version 2023 : python ou notebook
Anciennes version (2022): version python ou version notebook
Projets : cf. Teams