Intervention à la conférence :slides
Cours Reinforcement Learning, M2 ISF App, 2021+
Responsable: Gabriel TURINICI
1/ Introduction au reinforcement learning
2/ Formalisme théorique : « Markov decision processes » (MDP), function valeur ( équation de Belman et Hamilton- Jacobi – Bellman) etc.
3/ Stratégies usuelles, sur l’exemple de “multi-armed bandit”
4/ Stratégies en deep learning: Q-learning et DQN
5/ Stratégies en deep learning: SARSA et variantes
6/ Stratégies en deep learning: Actor-Critic et variantes
7/ Implémentations Python variées
8/ Perspectives.
Gym: jeu Frozen Lake (v2023) (version 2022)
Q-Learning : avec Frozen Lake, version python ou version notebook
-jouer avec gym/Atari-Breakout: version python ou version notebook
Deep Q Learning (DQN) : Apprendre avec gym/Atari-Breakout: version 2023 : python ou notebook
Anciennes version (2022): version python ou version notebook
Projets : cf. Teams
Editorial boards
I serve or have served to some editorial boards, some of which are mentionned below
NEW 2023: J. Numer. Anal. Approx. Theory,
Annals of the « Alexandru Ioan Cuza » University of Iaşi (New Series). Mathematics
Libertas Mathematica (new series)
… and some others …
Analyse numérique: évolution (M1 Math, Université Paris Dauphine – PSL, 2005-23)
Responsable de cours: Gabriel TURINICI
Contenu:
1 Introduction
2 EDO
3 Calcul de dérivée et contrôle
4 EDS
Bibliographie: poly distribué
Documents de support de cours, autres documents
NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.
Supports de cours: livre « Simulations numériques des problèmes dépendant du temps: appliquées à l’épidémiologie, l’intelligence artificielle et les finances«
POLY MIS A JOUR (dernière mise à jour: 17/04/2023). (ne pas diffuser sauf accord ECRIT de l’auteur)
- Notes manuscrites prises lors des séances de cours 2022/23 (document 1/2) , 2022/23(document 2/2) (version
2021/22 ici)
- Poly annoté 2022/23
lors des séances de cours.
Cours du 07/03/2023 (version confinement 2021!!): video Youtube chapitre 3 (motivation calcul backward) :
visioner ICI
Seances de TD: 2022/23
- Implementations TP:
- EDO: exo sur la précision, exo stabilité , SIR(EE + H), order for the EE scheme/SIR , SIR (version 1)
- SIR (version controle, adjoint / backward); (version 2023 here)
- EDS version 2023 : simulation brownien, calcul intégrale, simulation St, simulation risque neutre, calcul prix option (v1),
- EDS version 2023 :Euler-Maruyama faible pour Ornstein-Uhlenbeck, Euler-Maruyama (classique) pour Black-Scholes (log normal)
- Version précédentes: EDS (v1), EDS (v2)
VERSION 2020/21
- Poly avec les annotations pendant le cours:
ici.
- Notes manuscrites 2020/21
prises lors des séances de cours.
- Notes manuscrites
séance de TD (groupe 1): séance 1: ICI, séance 2, séance 3, séance 4, séance 5, séance 6,séance 7 (EDS).
- Séances de TP (groupe 1) : code d’exploration de la précision, (version courte ici), code stabilité Euler explicite, code SIR (début), code contrôle SIR, code génération brownien, code Euler-Maruyama et Monte Carlo,
Cours 1 du 19/1/2021: video Youtube chapitre 1 (motivation/EDO) :
visioner ICI , ensuite revenir sur la séance Teams pour commentaires et questions.; video Youtube chapitre 1 (motivation/EDS) :
visioner ICI , ensuite revenir sur la séance Teams pour commentaires et questions.; video Youtube chapitre 1 (motivation/backward) :
visioner ICI , ensuite revenir sur la séance Teams pour commentaires et questions.
Cours 2: voir le poly annoté; une video Youtube partielle chapitre 2 (EDO/existence) :
visioner ICI
Statistiques et dynamique des produits dérivés, M2 ISF App, 2020+
Responsable: Gabriel TURINICI
Contenu
- probabilité historique (gestion de portefeuille classique), portefeuilles optimaux, beta, arbitrage, APT
- Valuation de produits dérivés et probabilité risque neutre
- Trading de volatilité, volatilité locale
- Assurance du portefeuille: stop-loss, options, CPPIs, Constant Mix
- Options exotiques ou cachées: ETF short, etc.
Documents (support de cours, autres documents, …)
NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.
Note historique: nom du cours 2019/21: « Approches déterministes et stochastiques pour la valuation d’options »
4th J.P. Morgan Global Machine Learning Conference, Paris, Nov. 29, 2022

Invited joint talk « A few key issues in Finance that Machine Learning is Helping Solve » with Pierre Brugiere presented at the 4th JP Morgan Global Machine Learning conference held in Paris, Nov 29 2022
Talk materials: slides ,link to the associated paper.
Round table at the Dauphine Digital Days
Intervention at the round table « Tools, issues and current practice in media boards » at the Dauphine Digital Days held Nov 21-23 2022 at the Université Paris Dauphine – PSL, Paris, France.
Executive summary: software in general and IA is used in many repetitive tasks in media (grammar correction, translation, data search, paper writing when the format is known as ‘trading day report’ or ‘election report’. But same techniques can also be used for more creative tasks, cf. craiyon,(try with « windy day in Paris »), singer, Midjourney gallery (paper on a prize won).
This opens the way to « deep fake » creation ex. youtube deepfake, which is the creation of objects that are fake but that pretend to be true. Deep fakes can and have been used to do harm and we cannot ignore it. Note that fake objects can still impact the real world (rumors can affect people and even the stock market and bansk, etc). But how to distinguish a ‘real’ object from a ‘fake’ one ? Difficult task and not sure the technology can solve it entirely. Some regulation is necessary, see our deep fakes repport. But ultimately this is within our hands and as always can be tacked with a ounce of good will.
Conference badge 🙂
Adaptive high order stochastic descent algorithms, NANMAT 2022 conference
This is a talk presented at the Numerical Analysis, Numerical Modeling, Approximation Theory (NA-NM-AT 2022) conference, Cluj-Napoca, Romania, Oct 26-28 2022
Talk materials: the slides of the presentation.
Abstract: motivated by statistical learning applications, the stochastic descent optimization algorithms are widely used today to tackle difficult numerical problems. One of the most known among them, the Stochastic Gradient Descent (SGD), has been extended in various ways resulting in Adam, Nesterov, momentum, etc. After a brief introduction to this framework, we introduce in this talk a new approach, called SGD-G2, which is a high order Runge-Kutta stochastic descent algorithm; the procedure allows for step adaptation in order to strike a optimal balance between convergence speed and stability. Numerical tests on standard datasets in machine learning are also presented together with further theoretical extensions.
Cours Deep Learning, M2 ISF App, 2020+
Responsable: Gabriel TURINICI (voir aussi les interventions de C. Vincent)
Contenu:
1/ Deep learning : applications majeures, références, culture
2/ Types d’approches: supervisé, renforcement, non-supervisé
3/ Réseaux neuronaux: présentation des objets: neurones, opérations, fonction loss, optimisation, architecture
4/ Focus sur les algorithmes d’optimisation stochastique et preuve de convergence de SGD
5/ Réseaux convolutifs (CNN) : filtres, couches, architectures
6/ Technique: back-propagation, régularisation, hyperparamètres
7/ Réseaux particuliers: réseaux récurrents (RNN) et LSTM; réseaux génératifs (GAN, VAE)
8/ Environnements de programmation pour réseaux neuronaux: Tensorflow, Keras, PyTorch et travail sur les exemples vus en cours
9/ Si le temps permet: NLP: word2vec and Glove: exemples d’utilisation : femme-homme+roi = reine
![]() (aucune distribution n’est autorisée sans accord ECRIT de l’auteur) | ![]() |
Code approximation de fonctions par NN : version notebook, version py Resultats (approximation et convergence) ![]() ![]() ![]() ![]() Le même après 5 fois plus d’époques ![]() ![]() Référence « officielle » du code: https://doi.org/10.5281/zenodo.7220367 | Preuve convergence SGD (version francaise) SGD convergence proof (english version) |
Implementation keras/Iris | Autres implémentations: exemple « à la main » sans Keras ni tf ni pytorch : couches denses (bd=iris) – autres implementations : cf. doc. |
VERSIONS 2020/22
NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.
petit sondage (8 min) sur l’IA et médecine: répondre ICI.
Gestion de risques et portefeuille M2 ISF P20 – P22
Responsable: Gabriel TURINICI
Contenu Rappels du cadre classique: critère moyenne-variance, Markowitz, CAPM / MEDAF
- 1/ Indices, portefeuilles optimaux, beta, arbitrage, APT
- 2/ Valuation de produits dérivés et probabilité risque neutre
- 3/ Trading de volatilité (si le temps permet: volatilité locale et implicite calibration, formule de Dupire)
- 4/ Assurance du portefeuille: stop-loss, options, CPPI, Constant Mix
En fonction du temps: introduction à l’allocation tactique à travers l’analyse et les indicateurs techniques
Bibliographie
- Z. Bodie, A. Kane A.J. Marcus « Investments » McGraw Hill 7th Edition 2008
- J.C. Hull « Options, futures and other derivatives », Pearson Prentice Hall 2006, 6th edition
- R.B. Litterman « Mordern investment management: an equilibrium approach », Goldman Sachs 2003
- R. Portait, P. Poncet « Finance de marché » Dalloz 2008
- P. Wilmott « Paul Wilmott introduces quantitative finance » John Wiley & and Sons, 2007
Documents (support de cours, autres documents, …)
NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.
![]() « actions » classique (proba historique) | ![]() Brownien et évaluation d’actifs dérivés |
Autres ressources pour le cours :
- valuation de produits dérivés et probabilité risque neutre: exemple de hedge statique faible (options down&in)