Introduction au Machine Learning
Séminaire sur le Machine Learning
K. N. Charlemagne1 D. Jerome2
1 Informatique - IA
Ecole Supérieure Africaine des TICs
2 Informatique - IA et Cybersécurité
Ecole Supérieure Africaine des TICs
LARIT, Mai 2023
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 1 / 42
PLAN
1 Généralités sur le machine learning
Définition du machine learning
Pourquoi utilise t-on le machine learning?
Les données et le machine learning
Glossaire du machine learning
2 Les différentes méthodes d’apprentissage du machine learning
Types d’apprentissage
Apprentissage Supervisé
Apprentissage non supervisé
3 Les algorithmes du machine learning
Principes de base
Algorithmes classiques
Eléments d’apprentissage
4 Cas pratique: Apprentissage supervisé
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 2 / 42
Généralités sur le machine learning Définition du machine learning
Qu’est ce qu’on entend par machine learning?
Plusieurs définitions peuvent être attribuées à la notion de machine
learning
Définition du machine learning selon Mydral ([Link])
Le Machine Learning (ou apprentissage automatique ou encore
apprentissage machine) est un domaine qui utilise les approches
mathématiques et statistiques pour donner aux ordinateurs la capacité
d’apprendre à partir de données et d’améliorer leurs performances dans
l’exécution d’une tâche spécifique, sans être explicitement programmés
pour le faire.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 3 / 42
Généralités sur le machine learning Définition du machine learning
Qu’est ce qu’on entend par machin learning?
Le ML consiste donc en la mise en place d’algorithmes ayant pour
objectif d’obtenir une analyse prédictive à partir de données, dans
un but précis.
Pour résumer, le ML est donc le fait :
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 4 / 42
Généralités sur le machine learning Définition du machine learning
Quelques domaines utilisant le machine learning
Examples
La voiture autonome de Google
Classification des emails dans Gmail
La reconnaissance vocale Siri d’Apple
La traduction en temps réel de deepl
Détection de fraude dans le monde de la banque
Reconnaissance faciale
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 5 / 42
Généralités sur le machine learning Pourquoi utilise t-on le machine learning?
Pourquoi utilise t-on le machine learning?
Le machine learning est utilisé quand :
L’expertise humaine n’existe pas (navigation sur Mars)
Les humains ne peuvent pas expliquer leur expertise (reconnaissance
vocale)
Les modèles doivent être personnalisés (médecine personnalisée)
Les modèles sont basés sur d’énormes quantités de données
(génomique)
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 6 / 42
Généralités sur le machine learning Pourquoi utilise t-on le machine learning?
Pourquoi utilise t-on le machine learning?
Quelques autres exemples de tâches qui sont mieux résolues par
l’utilisation d’un algorithme d’apprentissage
Examples
1 Reconnaissance de formes
Identités faciales ou expressions faciales
Manuscrits ou mots parlés
Images médicales
2 Générations de modèles
Générer des images ou des séquences de mouvement
3 Reconnaissance d’anomalies
Transactions inhabituelles par carte de crédit
Modèles inhabituels de relevés de capteurs dans une centrale nucléaire
4 Prédiction
Prix futurs des actions ou taux de change
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 7 / 42
Généralités sur le machine learning Les données et le machine learning
Les données pour l’apprentissage
Pour apprendre, les modèles ont besoin d’énormément de données.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 8 / 42
Généralités sur le machine learning Les données et le machine learning
Les données pour l’apprentissage
Les données seront constituées d’un ensemble de variables
qualitatives et quantitatives.
Elles pourront provenir de sources de données structurées (données
numérisées) ou non (images, signaux, vidéos, textes. . . ), lisibles par
une machine ou non, personnelles ou non...
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 9 / 42
Généralités sur le machine learning Les données et le machine learning
Comment la machine apprend des données pour prédire
des évènements?
Exemple concret: prédire si la pluie va tomber
Essayons d’enseigner à un ordinateur comment prédire si la pluie va
tomber ou non dans l’heure qui vient.
La prévision météo n’est pas fiable à 100%.
On n’a pas de formule toute faite à donner à l’ordinateur pour qu’il
nous donne cette estimation
Solution: faire appel au Machine Learning.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 10 / 42
Généralités sur le machine learning Les données et le machine learning
Comment la machine apprend des données pour prédire
des évènements?
Exemple concret: prédire si la pluie va tomber
Circonstances qui accompagnent généralement la pluie : la présence
de nuages, la force du vent, le taux d’humidité. . .
En donnant ces informations à notre modèle et en lui indiquant dans
quels cas des évènements pluvieux ont été enregistrés par le passé, on
donne de quoi construire un modèle de prévision à notre machine.
Le modèle s’entraı̂ne sur les données. À la fin de son apprentissage, si
on lui présente de nouvelles données météo, il sera capable de prédire
s’il va pleuvoir ou pas.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 11 / 42
Généralités sur le machine learning Les données et le machine learning
Comment la machine apprend des données pour prédire
des évènements?
Schématiquement, voilà comment on pourrait représenter l’exemple
évoqué plus tôt :
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 12 / 42
Généralités sur le machine learning Glossaire du machine learning
Codes et langage dans le machine learning
Le Machine Learning possède son propre langage et ses propres codes.
Pour apprendre à parler le Machine Learning, il est utile de connaitre
quelques mots clés :
Figure: [Link]
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 13 / 42
Les différentes méthodes d’apprentissage du machine learning Types d’apprentissage
Les principaux types d’apprentissage
4 types d’algorithmes d’apprentissage automatique :
1 Apprentissage supervisé ou par induction: données d’apprentissage +
résultats souhaités (étiquettes)
2 Apprentissage non supervisé: données d’apprentissage (sans les
sorties souhaitées)
3 Apprentissage par renforcement : Récompenses découlant d’une
séquence d’actions
4 Apprentissage semi-supervisé: données d’entraı̂nement + quelques
résultats souhaités
Types d’apprentissage dans cette formation
Dans la suite, nous allons nous atarder sur les deux premiers type
d’apprentissage (supervisé et non supervisé)
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 14 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Mode supervisé
à partir d’une donnée d’entrée, la tâche consiste à prédire le résultat ou
l’étiquetage correct.
Figure: [Link]
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 15 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Mode Supervisé
On cherche à construire un modèle qui explique ce que l’on veut
prédire (notre target) en fonction de plusieurs autres variables en
entrée (nos features).
Pendant la phase d’apprentissage, on donne à notre machine le
résultat attendu en fonction des données en entrée.
La machine apprend à détecter les liens qui vont lui permettre
d’associer un résultat à un certain nombre de données.
Exemples
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 16 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Les deux problématiques dans le supervisé
Nous avons deux grandes problématiques dans l’apprentissage supervisé:
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 17 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Supervisé: Régression
Régression : la variable de sortie est continue
La régression a pour but d’approcher la valeur d’une variable à partir
d’autres variables qui lui sont corrélées.
Le résultat attendu sera toujours un chiffre ou un nombre, qu’il soit
Marseille entier ou décimal. . .
Ci-dessous par exemple, il s’agit bel et bien d’une régression, car on
cherche à prédire le prix, qui est une valeur numérique continue
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 18 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Supervisé: Classification
Classification : la variable de sortie prend ses valeurs dans des classes
Prenons l’exemple de la figure ci-dessous.
Le résultat attendu ici est une catégorie d’animal: un chien ou un
chat ou un oiseau.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 19 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage Supervisé
Supervisé: Classification
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 20 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage non supervisé
Mode non supervisé
Dans cette pratique d’apprentissage, les réponses que l’on veut trouver ne
sont pas présentes dans les données fournies : l’algorithme utilise des
données non étiquetées.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 21 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage non supervisé
Mode non supervisé
En apprentissage non supervisé, le but est de construire un modèle qui
trouve par lui-même des points communs entre les données d’entrée.
Pendant la phase d’apprentissage, on donne à notre machine plusieurs
données d’entrée, sans avoir de résultat attendu.
La machine va constituer des groupes de données avec des
caractéristiques similaires (voir figure)
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 22 / 42
Les différentes méthodes d’apprentissage du machine learning Apprentissage non supervisé
Highlighting text
In this slide, some important text will be highlighted because it’s
important. Please, don’t abuse it.
Remark
Sample text
Important theorem
Sample text in red box
Examples
Sample text in green box. The title of the block is “Examples”.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 23 / 42
Les algorithmes du machine learning Principes de base
Apprentissage supervisé: principe de la régression
Soit (x1 ,y1 ), (x2 ,y2 ), · · · , (xn ,yn )
Apprendre une fonction f (x) pour prédire y en fonction des données x
y est une valeur réelle continue== régression.
l’individu n° i a pour âge xi = 44.
la tension observée est yi = 144
La tension prédite (ou estimée) par
le modèle est:
* ŷi =60, 3928 + 1, 5771 × 44
Le résidu pour l’observation i est ei
= 14, 2148.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 24 / 42
Les algorithmes du machine learning Principes de base
Apprentissage supervisé: principe de la classification
Soit (x1 ,y1 ), (x2 ,y2 ), · · · , (xn ,yn )
Apprendre une fonction f (x) pour prédire y en fonction des données x
y est une classe (ou cartégorie) == classification.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 25 / 42
Les algorithmes du machine learning Principes de base
Apprentissage non supervisé
Soit x1 , x2 , · · · ,xn (sans étiquette)
Quelle structure de sortie peut se cacher derrière les x
* un clustering
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 26 / 42
Les algorithmes du machine learning Principes de base
Apprentissage non supervisé
cas d’utilisation:
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 27 / 42
Les algorithmes du machine learning Principes de base
Apprentissage non supervisé
cas d’utilisation:
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 28 / 42
Les algorithmes du machine learning Principes de base
Apprentissage par renforcement
Étant donné une séquence d’états et d’actions avec des récompenses
(différées), produire une politique
– La politique est une correspondance entre les états et les actions qui
indique ce qu’il faut faire dans un état donné
Exemples:
– Problème d’affectation des crédits
– les Jeux
– Robot dans un labyrinthe
– Faire tenir un poteau en équilibre sur la main
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 29 / 42
Les algorithmes du machine learning Principes de base
Apprentissage par renforcement
L’agent et l’environnement interagissent à des pas de temps discrets :
t = 0, 1, 2, K
L’agent observe l’état à l’étape t : st ∈ S
produit une action à l’étape t : at ∈ A(st )
obtient la récompense résultante : rt+1 ∈ R
et l’état suivant qui en résulte : st+1
.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 30 / 42
Les algorithmes du machine learning Principes de base
Apprentissage par renforcement
Exemple
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 31 / 42
Les algorithmes du machine learning Algorithmes classiques
Apprentissage supervisé
Classification
Arbres de décision
Forêt aléatoire
SVM
Réseaux de neurones artificiels K plus proches voisins
Classification naı̈ve bayésienne
Régression
Régression linéaire
Régression multivariée
Régression logistique
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 32 / 42
Les algorithmes du machine learning Algorithmes classiques
Apprentissage non supervisé
pour le non supervisé
K-means
PCA
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 33 / 42
Les algorithmes du machine learning Algorithmes classiques
Apprentissage par renforcement
pour le renforcement
Q-learning ([Link]/apprentissage-par-renforcement)
Temporal difference learning
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 34 / 42
Les algorithmes du machine learning Eléments d’apprentissage
Conception d’un système d’apprentissage
Comment concevoir un système d’apprentissage
Choisir l’expérience de formation
Choisir exactement ce qui doit être appris
– c’est-à-dire la fonction cible
Choisir comment représenter la fonction cible
Choisir un algorithme d’apprentissage pour déduire la fonction cible à
partir de l’expérienc
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 35 / 42
Les algorithmes du machine learning Eléments d’apprentissage
Composants d’un algorithme de ML
Chaque algorithme du ML a trois composants :
Représentation (fonction de représentation)
Optimisation
Evaluation
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 36 / 42
Les algorithmes du machine learning Eléments d’apprentissage
Composants d’un algorithme de ML
Diverses fonctions de Représentation :
Fonction numérique
– Régression linéaire
– Réseaux de neurones
– SVM
Fonctions symboliques
– Arbres de décision
– Règles de la logique propositionnelle
– Règles de la logique des prédicats du premier ordre
Fonctions basées sur l’instance
– Les k- plus proches voisins
– Au cas par cas
Modèles graphiques probabilistes
– Bayes naı̈ves
– Réseaux bayésiens
– Modèles de Markov cachés
Kopoin,–Diako
Réseaux de Markov
(ESATIC) Machine Learning Mai 2023 37 / 42
Les algorithmes du machine learning Eléments d’apprentissage
Composants d’un algorithme de ML
Diverses algorithmes de Recherche / Optimisation :
Descente de Gradient
– Perceptron
– Propagation arrière
Programmation dynamique
– Apprentissage de Modèles de Markov cachés
– Apprentissage de Grammaires probabilistes sans contexte
Diviser pour mieux régner
– induction d’arbres de décisions
– apprentissage des règles
Calcul évolutif
– Algorithme génétique
– programmation génétique
– neuro-évolution
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 38 / 42
Les algorithmes du machine learning Eléments d’apprentissage
Composants d’un algorithme de ML
Diverses techniques d’évaluation :
Accuracy (justesse)
Precision et Recall (Précision et Rappel)
Squared error (erreur quadratique)
Likelihood (vraissemblance)
Margin (Marge)
Entropy (Entropie)
Etc.
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 39 / 42
Cas pratique: Apprentissage supervisé
Le machine learning en pratique
Etapes dans l’apprentissage :
Comprendre le domaine, les connaissances préalables et les objectifs
Intégration des données, sélection, nettoyage, prétraitement, etc.
Apprendre les modèles
Interprétation des résultats
Consolider et déployer les connaissances découvertes
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 40 / 42
Cas pratique: Apprentissage supervisé
Le machine learning en pratique
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 41 / 42
Cas pratique: Apprentissage supervisé
Références
1 Akka Zemmari, Intelligence Articielle pour l’Analyse de Données,
2019-2020
2 Eric Eaton, [Link]/ cis519
3 [Link]
4 Emmanuel Grolleau, Introduction à l’apprentissage automatique, 2017
Kopoin, Diako (ESATIC) Machine Learning Mai 2023 42 / 42