Cours Reinforcement Learning, M2 ISF App, 2021-2022

Responsable: Gabriel TURINICI


1/ Introduction au reinforcement learning
2/ Formalisme théorique : « Markov decision processes » (MDP), function valeur ( équation de Belman et Hamilton- Jacobi – Bellman) etc.
3/ Stratégies usuelles, sur l’exemple de “multi-armed bandit”
4/ Stratégies en deep learning: Q-learning et DQN
5/ Stratégies en deep learning: SARSA et variantes
6/ Stratégies en deep learning: Actor-Critic et variantes
7/ Implémentations Python variées
8/ Perspectives.


Document principal pour les présentations théoriques: (aucune distribution n’est autorisée sans accord ECRIT de l’auteur)

Code: MAB , MAB v2.,

Gym : entrainement avec « Frozen-Lake »

Q-Learning : avec Frozen Lake, version python ou version notebook

Deep Q Learning : jouer avec gym/Atari-Breakout: version python ou version notebook

apprendre avec gym/Atari-Breakout: version python ou version notebook

Projets : cf. Teams



Statistiques et dynamique des produits dérivés, M2 ISF App, 2020-22

Responsable: Gabriel TURINICI

Contenu

  • probabilité historique (gestion de portefeuille classique), portefeuilles optimaux, beta, arbitrage, APT
  • Valuation de produits dérivés et probabilité risque neutre
  • Trading de volatilité, volatilité locale et calibration, formule de Dupire
  • Assurance du portefeuille: stop-loss, options, CPPIs
  • Options exotiques ou cachées: ETF short, etc.

Documents (support de cours, autres documents, …)

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

pour théorie de gestion de portefeuille
« actions » classique (proba historique)
livre du cours de M1 Mouvement
Brownien et évaluation d’actifs dérivés
Data python: CSV court ici (30/40) et CSV plus complet ICI (40/40, plus longue) Programme: tests statistiques de normalité.

Programme : portefeuille optimal portefeuilles pris au hasard

Pareil mais avec « softmax »
optimalCAC40 30_p5optimalCAC40 30_p15optimalCAC40 30_p30
Documents: rappels dérivéesCode: génération de brownien, calcul Monte Carlo d’options ; autre version

Codes: prix et delta des options vanilles (Black & Scholes)
Code delta hedging
Code: trading de volatilité (ancienne version) RésultatsExplication théorique: document pdf
Code: stop loss, code CPPI, code CPPI v2
code Constant-Mix
dataC40

Résultat stop-loss, résultat CPPI,
résultat constant-mix
Théorie
slides,
livre du cours de M1, sections 6.2 ;
Notes manuscrites
Vidéo Youtube sur le CPPI: partie 1/2, partie 2/2
Beta slippage: présentation.
Projet

Note historique: nom du cours 2019/21: « Approches déterministes et stochastiques pour la valuation d’options »

Cours Deep Learning, M2 ISF App, 2020-2022

Responsable: Gabriel TURINICI (voir aussi les interventions de C. Vincent)


Contenu:
1/ Deep learning : applications majeures, références, culture
2/ Types d’approches: supervisé, renforcement, non-supervisé
3/ Réseaux neuronaux: présentation des objets: neurones, opérations, fonction loss, optimisation, architecture
4/ Focus sur les algorithmes d’optimisation stochastique et preuve de convergence de SGD
5/ Réseaux convolutifs (CNN) : filtres, couches, architectures
6/ Technique: back-propagation, régularisation, hyperparamètres
7/ Réseaux particuliers: réseaux récurrents (RNN) et LSTM; réseaux génératifs (GAN, VAE)
8/ Environnements de programmation pour réseaux neuronaux: Tensorflow, Keras, PyTorch et travail sur les exemples vus en cours

9/ Si le temps permet: NLP: word2vec and Glove: exemples d’utilisation : femme-homme+roi = reine


Document principal pour les présentations théoriques: (aucune distribution n’est autorisée sans accord ECRIT de l’auteur)



VERSION 2020/21: Documents (support de cours, autres documents, …)

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

petit sondage (8 min) sur l’IA et médecine: répondre ICI.

Document principal de présentation: courspoly du cours de M1 – évolution (pour back-propagation)
Preuve convergence SGD (FR)Preuve convergence SGD (anglais)
Implementation keras/Iris Autres implementations: cf. doc.

Analyse numérique: évolution (M1 Math, Université Paris Dauphine – PSL, 2005-22)

Responsable de cours: Gabriel TURINICI
Contenu:
1 Introduction
2 EDO
3 Calcul de dérivée et contrôle
4 EDS
Bibliographie: poly distribué

Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

Supports de cours:   livre « Simulations numériques des problèmes dépendant du temps: appliquées à l’épidémiologie, l’intelligence artificielle et les finances« 


VERSION 2020/21

Statistique non-paramétrique (M1 Math 2019-22)

M1 mathématiques appliquées, Université Paris Dauphine -PSL

Responsable: Gabriel TURINICI

Contenu

  • 1 Introduction et rappels
  • 2 Estimation de la fonction de répartition
  • 3 Tests robustes
  • 4 Estimation de densités par estimateurs à noyau
  • 5 Régression non paramétrique  
      Bibliographie: poly distribué

Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ÉCRIT de l’auteur.


Supports de cours
poly 2021/22, (MaJ=24/01/2022).Poly annoté: à venirnotes manuscrites: à venir

A PARTIR d’ici version ancienne 2020/21

Supports de cours
poly 2020/21,
(dernière mise à jour 6 mai 2021).
Poly annoténotes manuscrites
Cours 1 : sections 1.1-1.2
« Motivation »
vidéo Youtube
Cours 1: section 1.3
« Inégalités »
vidéo Youtube
Cours 1, section 1.4
« Thm. de convergence classique »
vidéo Youtube
Cours 2 :section 1.5
« Rappels espérance conditionnelle »
vidéo Youtube
Cours 2 section 1.6
« Rappel variables symétriques »
vidéo Youtube
Cours 2 section 1.7.1
« Rappels sur les tests paramétriques (1) »
vidéo Youtube


A PARTIR d’ici version ancienne 2019/20

Notes du cours :  poly annoté cours 1et 2 , cours 3 , cours 3,4  notes manuscrites

corrigé ex 2018: regarder l’exo 3 qui démontre le fait que la convergence des cdf en tout point de continuité est pareil que celle de l’inverse généralisée.

Vidéos des séances de cours pendant confinement printemps 2020: Vidéo youtube sur le test du signe; Vidéo Youtube: test de Wilcoxon, Vidéo Youtube: propriétés des rangs.; Test de Mann-Whitney partie 1/2;    Test de Mann-Whitney partie 2/2, Estimation de densité partie 1/1, Estimation de densité par estimateurs à noyau, vidéo régression non paramétrique, vidéos: régression non paramétrique par polynomes locaux et régression: validation croisée et phénomène d’overfit,



Gestion de risques et portefeuille M2 ISF P21 – P22

Responsable: Gabriel TURINICI

Contenu Rappels du cadre classique: critère moyenne-variance, Markowitz, CAPM / MEDAF

En fonction du temps: introduction à l’allocation tactique à travers l’analyse et les indicateurs techniques

Bibliographie

  • Z. Bodie, A. Kane A.J. Marcus « Investments » McGraw Hill 7th Edition 2008
  • J.C. Hull « Options, futures and other derivatives », Pearson Prentice Hall 2006, 6th edition
  • R.B. Litterman « Mordern investment management: an equilibrium approach », Goldman Sachs 2003
  • R. Portait, P. Poncet « Finance de marché » Dalloz 2008
  • P. Wilmott « Paul Wilmott introduces quantitative finance » John Wiley & and Sons, 2007

Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

Supports de cours

1/ Théorie classique de gestion de portefeuille:

a/poly disponible ici (version historique P21 ici) ; petit code Python illustrant l’allocation optimale de type Kelly

b/ Data python: CSV ici,

c/code ici

d/ quelques résultats:

2 / Valuation de produits dérivés et probabilité risque neutre

Document de présentation (théorique) (clicker pour télécharger) ; exemple de hedge statique faible (options down&in)

Implémentation: code Python ici format texte

résultats Monte Carlo:

resultat delta-hedging

3/ Trading de volatilite

4 / Stop-Loss, CPPI: code Python stop loss (CLICK ICI), quelques notes manuscrites (promo 2020), CLICK ICI,

Vidéo Youtube décrivant le CPPI: partie 1 ici, partie 2 ici.

Code CPPI à changer, code CPPI final. Image résultat:

Vidéo Youtube décrivant le Constant Mix: ici

Code Constant Mix final, résultat:

Document de présentation CPPI, Constant Mix : ici.

Document de présentation du beta-slippage.

Modèles de taux (M2 ISF App + M2 MASEF, 2020-2021)

Responsable: Gabriel TURINICI

Contenu

  • 1 Quelques rappels de calcul stochastique
  • 2 Generalites sur les modeles de taux
  • 3 Produits de taux classiques
  • 4 Le modele LGM
  • 5 Le modele BGM
  • 6 Modele SABR  
  • 7 Modele d’Heston (en fonction du temps)  
  • Bibliographie: poly distribué

Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

Supports de cours: POLY , attention il s’agit d’une version mise à jour au fur et à mesure (dernière mise à jour: 5/3/2021).

Autres :  poly annoté, notes manuscrites

Partie introductive: poly analyse numérique, regarder chapitre « EDS » pour rappels de calcul sto.

 1_2
Livres / Books

Livres / Books


Approches déterministes et stochastique pour la valuation d’options 2019-20

M2 ISF App, 2019-2020

Responsable: Gabriel TURINICI

Contenu Rappels du cadre classique: probabilité historique (gestion de portefeuille), portefeuilles optimaux, beta, arbitrage, APT Valuation de produits dérivés et probabilité risque neutre Trading de volatilité, volatilité locale et calibration, formule de Dupire Assurance du portefeuille: stop-loss, options, CPPIs Options exotiques ou cachées: ETF short, etc.


Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

Supports de cours : poly du cours de M1 Mouvement Brownien et évaluation d’actifs dérivés

pour théorie de gestion de portefeuille « actions » classique (proba historique)

Data python: CSV ici,

optimalCAC40 30_p5
optimalCAC40 30_p15
optimalCAC40 30_p30

matrix code debut code ici. (pour charger sur google colab : code ici ). Code complet: ICI

livrevaluation et hedging des produits dérivés: document de présentation (rappels options).

Code python generation brownien

 matrix codeFonctions auxiliaires: blsprice.py blsdelta.py

Code évaluation Monte Carlo

matrix code  Code delta-hedging delta hedging

matrix code Code trading de volatilité   vol trading

Code Stop-Loss stop loss

 Code CPPI   cppi

matrix codeCode Constant-Mix: présentation du Constant Mix ici


Projet: beta-slippage, ETF short et leveraged: à rendre : code matrix code et présentation livre

 Partie de projet G. Turinici: à rendre pour le 4 juin.

Statistique non-paramétrique (M1 Math P20)

M1 mathématiques appliquées, Université Paris Dauphine -PSL, 2019-2020

Responsable: Gabriel TURINICI

Contenu

1 Introduction et rappels

2 Estimation de la fonction de répartition

3 Tests robustes

4 Estimation de densités par estimateurs à noyau

5 Régression non paramétrique  
  Bibliographie: poly distribué

Documents de support de cours, autres documents

NOTA BENE: Tous des documents sont soumis au droit d’auteur, et ne peuvent pas être distribués sauf accord préalable ECRIT de l’auteur.

Supports de cours

poly distribué, attention il s’agit d’une version mise à jour au fur et à mesure (dernière mise à jour 26/3/20).

Notes du cours :  poly annoté cours 1et 2 , cours 3 , cours 3,4  notes manuscrites

feuilles de TD: TD1,

corrigé ex 2018: regarder l’exo 3 qui demontre le fait que la convergence des cdf en tout point de continuite est pareil que celle de l’inverse généralisée.

Nouveau (6/5/2020): version poly avec les TD3,TD4


Séances de cours en non-présentiel

(confinement printemps 2020)


Cours

Séance prévue le 27 mars 2020: vidéo youtube ICI

Sinon: utiliser le poly du cours usuel, les notes manuscrites et annotations ci-dessus.


Séance prévue le 2 avril 2020: vidéos youtube ICI (2 vidéos) :

Test de Wilcoxon,

propriétés des rangs.


Séance prévue le 3 avril 2020: vidéos youtube ICI (2 vidéos) :

Test de Mann-Whitney partie 1/2

   Test de Mann-Whitney partie 2/2


Séance prévue le 24 avril 2020: vidéo youtube ICI (1 vidéo):

   Estimation de densité partie 1/1


Séance prévue le 30 avril 2020: début de séance = consultation de la vidéo:

   Estimation de densité par estimateurs à noyau

 Ensuite : questions reunion « teams ».


Séance prévue le 7 mai 2020: début de séance = consultation de la vidéo:régression non paramétrique

Ensuite : questions reunion « teams ».


Séance prévue le 15 mai 2020: début de séance = consultation des vidéos: régression non paramétrique par polynomes locaux,  ET régression: validation croisée et phénomène d’overfit,

Ensuite : questions reunion « teams ».


EXAMEN

Examen le 28/5 2020 à 14H00 (1H d’examen): conectez vous sur MYCOURSE. Il s’agit d’un QCM à remplir en ligne (PAS d’envoi par email, il ne sera pas noté).