QCM - Analyse en Composantes Principales et Analyse Discriminante
PARTIE I : ANALYSE EN COMPOSANTES PRINCIPALES (ACP)
Question 1
L'objectif principal de l'ACP est de : a) Augmenter le nombre de variables
b) Réduire la dimensionnalité tout en conservant l'information
c) Créer des variables qualitatives
d) Éliminer toutes les corrélations
Réponse correcte : b
L'ACP vise à réduire le nombre de variables en créant des composantes principales qui conservent le
maximum d'information.
Question 2
Dans une ACP, les données doivent être : a) Seulement centrées
b) Seulement réduites
c) Centrées et réduites
d) Ni centrées ni réduites
Réponse correcte : c
Les données doivent être centrées (moyenne = 0) et réduites (écart-type = 1) pour éliminer l'effet
d'échelle.
Question 3
L'inertie totale d'un nuage de points en ACP est égale à : a) La somme des valeurs propres
b) Le nombre de variables
c) Le nombre d'individus
d) La plus grande valeur propre
Réponse correcte : a
L'inertie totale correspond à la somme de toutes les valeurs propres de la matrice de corrélation.
Question 4
Pour qu'une ACP soit considérée comme satisfaisante, l'indice KMO doit être : a) ≥ 0,5
b) ≥ 0,6
c) ≥ 0,8
d) = 1
Réponse correcte : c
Un indice KMO ≥ 0,8 indique une ACP de bonne qualité, même si on peut descendre à 0,6.
Question 5
Le test de Bartlett teste l'hypothèse : a) H₀ : La matrice de corrélation = matrice identité
b) H₀ : Toutes les variables sont corrélées
c) H₀ : L'ACP est significative
d) H₀ : Les valeurs propres sont égales
Réponse correcte : a
Le test de Bartlett vérifie si la matrice de corrélation diffère significativement de la matrice identité.
Question 6
La première composante principale explique : a) Toujours 50% de la variance
b) La plus grande partie de la variance totale
c) La plus petite partie de la variance
d) Exactement la variance d'une variable
Réponse correcte : b
La première composante principale capture le maximum de variance possible.
Question 7
Les composantes principales sont : a) Corrélées entre elles
b) Non corrélées (orthogonales)
c) Identiques aux variables originales
d) Toujours au nombre de 2
Réponse correcte : b
Les composantes principales sont orthogonales, donc non corrélées.
Question 8
La qualité de représentation d'un individu sur un plan factoriel est mesurée par : a) Sa contribution
b) Son cosinus carré
c) Sa coordonnée
d) Sa variance
Réponse correcte : b
Le cosinus carré indique la qualité de représentation d'un point sur un axe ou un plan.
Question 9
Dans l'exemple des notes scolaires, l'axe 1 représente principalement : a) Les matières littéraires
b) Les matières scientifiques (Math, Sciences)
c) La musique uniquement
d) Toutes les matières également
Réponse correcte : b
L'axe 1 est dominé par les variables Math et Sciences qui sont fortement corrélées.
Question 10
La rotation Varimax a pour objectif de : a) Réduire le nombre de facteurs
b) Augmenter les corrélations
c) Maximiser les saturations élevées et minimiser les faibles
d) Éliminer les valeurs propres
Réponse correcte : c
La rotation Varimax clarifie l'interprétation en maximisant les saturations importantes.
PARTIE II : ANALYSE DISCRIMINANTE
Question 11
L'analyse discriminante sert à : a) Créer de nouvelles variables quantitatives
b) Prédire l'appartenance à une classe
c) Réduire le nombre d'observations
d) Calculer des moyennes
Réponse correcte : b
L'analyse discriminante prédit la probabilité d'appartenir à une classe donnée.
Question 12
Dans l'analyse discriminante, la variable à expliquer est : a) Quantitative continue
b) Qualitative catégorielle
c) Binaire uniquement
d) Ordinale uniquement
Réponse correcte : b
La variable dépendante Y est qualitative (classes ou catégories).
Question 13
Dans l'exemple du vin de Bordeaux, les classes de qualité sont : a) Excellent, Bon, Moyen
b) Bon, Moyen, Médiocre
c) 1, 2, 3, 4, 5
d) A, B, C
Réponse correcte : b
Les trois classes sont : Bon (1), Moyen (2), Médiocre (3).
Question 14
Le nombre maximum de variables discriminantes dans une analyse à k classes est : a) k
b) k-1
c) k+1
d) 2k
Réponse correcte : b
On peut extraire au maximum k-1 variables discriminantes pour k classes.
Question 15
La première variable discriminante Z₀ dans l'exemple du Bordeaux combine : a) Seulement la
température
b) Température + Soleil - Chaleur - Pluie
c) Toutes les variables avec le même coefficient
d) Seulement les variables météorologiques positives
Réponse correcte : b
Z₁ = 0.750Température + 0.547Soleil - 0.198Chaleur - 0.445Pluie
Question 16
Dans le plan discriminant, les frontières entre classes sont : a) Des cercles
b) Des droites quelconques
c) Les médiatrices des segments reliant les centres des groupes
d) Des paraboles
Réponse correcte : c
Les frontières de décision sont les médiatrices des segments joignant les centres de gravité.
Question 17
Pour classer une nouvelle observation, on calcule : a) Sa corrélation avec chaque classe
b) Sa distance au centre de chaque classe
c) Sa moyenne avec chaque classe
d) Son écart-type dans chaque classe
Réponse correcte : b
On affecte l'observation à la classe dont le centre est le plus proche.
Question 18
L'analyse factorielle discriminante recherche des variables discriminantes qui : a) Sont corrélées entre
elles
b) Maximisent la variance intra-classe
c) Maximisent le F de Fisher (variance inter/intra)
d) Minimisent les différences entre groupes
Réponse correcte : c
On cherche à maximiser le rapport des variances inter-classes sur intra-classes.
Question 19
Dans l'exemple du Bordeaux 1958, avec les valeurs :
Température = 3000, Soleil = 1100, Chaleur = 20, Pluie = 300 La qualité prédite serait plutôt :
a) Bonne
b) Moyenne
c) Médiocre
d) Impossible à déterminer
Réponse correcte : b
D'après le graphique, l'observation 35 se situe près du centre "Moyen".
Question 20
La différence principale entre ACP et analyse discriminante est : a) L'ACP utilise des variables
qualitatives
b) L'analyse discriminante prédit une variable qualitative
c) L'ACP ne réduit pas la dimension
d) L'analyse discriminante n'utilise pas de variables quantitatives
Réponse correcte : b
L'ACP est descriptive (toutes variables quantitatives), l'analyse discriminante est prédictive (Y
qualitatif).
QCM - Analyse Factorielle des Correspondances et Classification Hiérarchique
Questions sur l'Analyse Factorielle des Correspondances (AFC)
Question 1 : L'AFC vise à analyser : a) L'association entre deux variables quantitatives b)
L'association entre deux variables qualitatives c) L'association entre une variable qualitative et une
quantitative d) Les corrélations entre plusieurs variables quantitatives
Question 2 : Dans une table de correspondance, la première valeur propre calculée est : a) Toujours
égale à 0 b) Toujours égale à 1 c) Variable selon les données d) Égale au chi-deux
Question 3 : Le nombre de valeurs propres en AFC est égal à : a) min(p,q) - 1 (où p = nombre de
lignes, q = nombre de colonnes) b) max(p,q) c) p × q d) p + q
Question 4 : Un taux de liaison de 0,384 signifie que : a) Le score observé est 38,4% inférieur au
score théorique d'indépendance b) Le score observé est 38,4% supérieur au score théorique
d'indépendance c) La probabilité d'association est de 38,4% d) L'erreur type est de 38,4%
Question 5 : Dans l'interprétation des cartes factorielles en AFC : a) Seuls les points-lignes peuvent
être représentés b) Seuls les points-colonnes peuvent être représentés c) Les points-lignes et points-
colonnes peuvent être représentés sur le même graphique d) Il faut toujours faire deux graphiques
séparés
Question 6 : L'angle entre deux points (ligne et colonne) par rapport à l'origine indique : a) La
distance euclidienne entre eux b) Le type d'association (attraction, répulsion ou indépendance) c) La
contribution à l'inertie d) La qualité de représentation
Questions sur la Classification Hiérarchique
Question 7 : La classification hiérarchique ascendante commence par : a) Un seul groupe contenant
tous les individus b) Chaque individu dans un groupe séparé c) Des groupes prédéfinis d) Une
partition aléatoire
Question 8 : La distance de Ward se calcule en utilisant : a) La distance minimale entre deux groupes
b) La distance maximale entre deux groupes c) La moyenne arithmétique des distances d) Une
formule spécifique impliquant les effectifs des groupes
Question 9 : Pour la classification hiérarchique, il est recommandé que : a) Le nombre d'individus soit
égal au nombre de variables b) Le nombre d'individus soit au moins deux fois supérieur au nombre de
variables c) Le nombre de variables soit supérieur au nombre d'individus d) Il n'y a pas de contrainte
particulière
Question 10 : La méthode du saut minimal consiste à : a) Prendre la distance maximale entre tous
les points de deux groupes b) Prendre la distance minimale entre tous les points de deux groupes c)
Calculer la moyenne des distances entre tous les points d) Utiliser la médiane des distances
Questions sur la Classification Non-Hiérarchique (K-means)
Question 11 : Dans la méthode des nuées dynamiques (K-means) : a) Le nombre de classes est
déterminé automatiquement b) Le nombre de classes doit être fixé à l'avance c) Le nombre de classes
est toujours égal à 3 d) Le nombre de classes est égal au nombre de variables
Question 12 : L'algorithme K-means s'arrête quand : a) Toutes les distances sont égales b) Le
nombre d'itérations maximum est atteint c) Il y a convergence (plus de changement d'affectation) d) La
variance intra-classe est nulle
Question 13 : La classification non-hiérarchique est plus adaptée quand : a) Le nombre d'individus
est faible b) Le nombre d'individus est important c) Les variables sont qualitatives d) Les données
contiennent des valeurs manquantes
CORRIGÉ
Réponses AFC
Question 1 : b) L'association entre deux variables qualitatives L'AFC analyse spécifiquement
l'association entre deux variables qualitatives à travers un tableau de contingence.
Question 2 : b) Toujours égale à 1 La première valeur propre est toujours égale à 1 et est
généralement éliminée par les logiciels d'analyse.
Question 3 : a) min(p,q) - 1 Le nombre de valeurs propres utilisables est le minimum entre le nombre
de lignes et de colonnes, moins 1 (car la première valeur propre = 1 est éliminée).
Question 4 : b) Le score observé est 38,4% supérieur au score théorique d'indépendance Un taux de
liaison positif indique que l'association observée est supérieure à ce qu'on observerait sous
l'hypothèse d'indépendance.
Question 5 : c) Les points-lignes et points-colonnes peuvent être représentés sur le même graphique
C'est une spécificité de l'AFC : contrairement à l'ACP, on peut représenter lignes et colonnes sur le
même graphique.
Question 6 : b) Le type d'association (attraction, répulsion ou indépendance) L'angle indique si les
modalités s'attirent (angle aigu), se repoussent (angle obtus) ou sont indépendantes (angle droit).
Réponses Classification Hiérarchique
Question 7 : b) Chaque individu dans un groupe séparé La méthode ascendante part de n groupes
(un par individu) et les regroupe progressivement.
Question 8 : d) Une formule spécifique impliquant les effectifs des groupes La distance de Ward
utilise une formule spécifique : d²(x̄₁,x̄₁) × (N₁×N₁)/(N₁+N₁).
Question 9 : b) Le nombre d'individus soit au moins deux fois supérieur au nombre de variables C'est
une règle empirique pour assurer la robustesse de l'analyse.
Question 10 : b) Prendre la distance minimale entre tous les points de deux groupes Le saut minimal
(single linkage) utilise la plus petite distance entre deux points de groupes différents.
Réponses Classification Non-Hiérarchique
Question 11 : b) Le nombre de classes doit être fixé à l'avance C'est la principale différence avec la
classification hiérarchique : il faut spécifier k à l'avance.
Question 12 : c) Il y a convergence (plus de changement d'affectation) L'algorithme s'arrête quand
les centres de classes se stabilisent et qu'aucun point ne change de classe.
Question 13 : b) Le nombre d'individus est important La classification non-hiérarchique est plus
efficace pour traiter de gros volumes de données.