Modèles de Diffusion
Équipe
RAMAROZATOVOMAMPIONONA Tahina Mahatoky
RAZAFINDRAINIBE Rovafifaliana Claudie
RANDRIANARISON Diarintsoa Fandresena no Herijaona
Plan
Introduction & Contexte Historique
Fondements Mathématiques
Applications
Types de Modèles de Diffusion
Avantages et Défis
Conclusion
Introduction & Contexte Historique
1) Introduction
2) Contexte Historique
Les modèles de diffusion sont des
modèles génératifs qui apprennent à
inverser un processus d’ajout 01 - Provient des processus
stochastiques
progressif de bruit aux données, - Influencés par les premiers modèles
permettant la génération de nouveaux 02 génératifs comme les VAE et les
points de données à partir du bruit. GAN
- Avancés par les modèles
score-based models et les DDPMs
03
3) Quels sont les exemples ?
- DALL-E
- Imagen
- Stable Diffusion
Fondements Mathématiques
Forward Diffusion Process
Le processus de Forward Diffusion ajoute progressivement du bruit gaussien aux données au cours d’une série d’
étapes. Soit l’échantillon de données original et la version bruyante de à l’étape t.
Le Forward Process peut être défini comme suit:
Fondements Mathématiques
Reverse Diffusion Process
Le processus de Reverse Diffusion vise à débruiter les données, inversant efficacement le Forward Process. Le
modèle apprend les probabilités de transition inverses:
Fondements Mathématiques
Training Objective
Le modèle est entraîné à prédire le bruit ajouté dans le processus direct. Cela se fait en minimisant la borne
variationnelle sur la log-vraisemblance négative des données.
Simplified Loss Function
En practice, la fonction de perte peut être simplifiée en re-paramétrant le processus inverse. Une approche
courante consiste à prédire directement le bruit ajouté ε. L’objectif simplifié est:
Applications
Les modèles de diffusion ont montré un grand potentiel dans diverses applications:
● Génération d’images
● Synthèse Audio
● Super-Résolution
● Inpainting
Types de Modèles de Diffusion
DDPM (Denoising Diffusion Probabilistic Models)
- Caractéristiques Clés:
● Utilise un schedule prédéfini de bruit
● Entraîné en utilisant une fonction de perte
simplifiée basée sur l’erreur quadratique moyenne
(MSE)
- Applications:
Génération d’images, Synthèse de données
Types de Modèles de Diffusion
Score-based Generative Models
- Caractéristiques Clés:
● Utilises un framework d’équation différentielle stochastique
(SDE)
● Emploi une fonction de score pour estimer les gradients des
données
- Applications:
Génération d’images de haute qualité
Types de Modèles de Diffusion
LDM (Latent Diffusion Models)
- Caractéristiques Clés:
● Réduit la complexité computationnelle en travaillant dans une espace latente
● Peut gérer efficacement les données de haute résolution
- Applications:
Super-résolution d’images, Tâches de génération conditionnelle comme la synthèse texte-image
Avantages et Défis
Avantages Défis
Préservation des détails Intensité computationnelle et temps
d'entraînement plus longs
Stabilité au cours de l'entraînement Interprétabilité limitée
Flexibilité et Généralité Difficulté avec les prompts complexes
Conclusion
Avancement en Deep Learning: Capacités
exceptionnelles dans la génération de données de haute
qualité.
Robustesse Mathématique: Assure un entraînement
stable et des applications polyvalentes.
Application Variées: Efficace dans la génération
d’images, la synthèse audio, la super-résolution et plus
encore.
Défis: Intensif en termes de calcul, entrainement
complexe et problèmes d'interprétabilités
Merci !