0% ont trouvé ce document utile (0 vote)
485 vues7 pages

QCM

Transféré par

Sarah Mensi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
485 vues7 pages

QCM

Transféré par

Sarah Mensi
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

QCM - Analyse en Composantes Principales et Analyse Discriminante

PARTIE I : ANALYSE EN COMPOSANTES PRINCIPALES (ACP)

Question 1

L'objectif principal de l'ACP est de : a) Augmenter le nombre de variables


b) Réduire la dimensionnalité tout en conservant l'information
c) Créer des variables qualitatives
d) Éliminer toutes les corrélations

Réponse correcte : b
L'ACP vise à réduire le nombre de variables en créant des composantes principales qui conservent le
maximum d'information.

Question 2

Dans une ACP, les données doivent être : a) Seulement centrées


b) Seulement réduites
c) Centrées et réduites
d) Ni centrées ni réduites

Réponse correcte : c
Les données doivent être centrées (moyenne = 0) et réduites (écart-type = 1) pour éliminer l'effet
d'échelle.

Question 3

L'inertie totale d'un nuage de points en ACP est égale à : a) La somme des valeurs propres
b) Le nombre de variables
c) Le nombre d'individus
d) La plus grande valeur propre

Réponse correcte : a
L'inertie totale correspond à la somme de toutes les valeurs propres de la matrice de corrélation.

Question 4

Pour qu'une ACP soit considérée comme satisfaisante, l'indice KMO doit être : a) ≥ 0,5
b) ≥ 0,6
c) ≥ 0,8
d) = 1

Réponse correcte : c
Un indice KMO ≥ 0,8 indique une ACP de bonne qualité, même si on peut descendre à 0,6.

Question 5
Le test de Bartlett teste l'hypothèse : a) H₀ : La matrice de corrélation = matrice identité
b) H₀ : Toutes les variables sont corrélées
c) H₀ : L'ACP est significative
d) H₀ : Les valeurs propres sont égales

Réponse correcte : a
Le test de Bartlett vérifie si la matrice de corrélation diffère significativement de la matrice identité.

Question 6

La première composante principale explique : a) Toujours 50% de la variance


b) La plus grande partie de la variance totale
c) La plus petite partie de la variance
d) Exactement la variance d'une variable

Réponse correcte : b
La première composante principale capture le maximum de variance possible.

Question 7

Les composantes principales sont : a) Corrélées entre elles


b) Non corrélées (orthogonales)
c) Identiques aux variables originales
d) Toujours au nombre de 2

Réponse correcte : b
Les composantes principales sont orthogonales, donc non corrélées.

Question 8

La qualité de représentation d'un individu sur un plan factoriel est mesurée par : a) Sa contribution
b) Son cosinus carré
c) Sa coordonnée
d) Sa variance

Réponse correcte : b
Le cosinus carré indique la qualité de représentation d'un point sur un axe ou un plan.

Question 9

Dans l'exemple des notes scolaires, l'axe 1 représente principalement : a) Les matières littéraires
b) Les matières scientifiques (Math, Sciences)
c) La musique uniquement
d) Toutes les matières également

Réponse correcte : b
L'axe 1 est dominé par les variables Math et Sciences qui sont fortement corrélées.
Question 10

La rotation Varimax a pour objectif de : a) Réduire le nombre de facteurs


b) Augmenter les corrélations
c) Maximiser les saturations élevées et minimiser les faibles
d) Éliminer les valeurs propres

Réponse correcte : c
La rotation Varimax clarifie l'interprétation en maximisant les saturations importantes.

PARTIE II : ANALYSE DISCRIMINANTE

Question 11

L'analyse discriminante sert à : a) Créer de nouvelles variables quantitatives


b) Prédire l'appartenance à une classe
c) Réduire le nombre d'observations
d) Calculer des moyennes

Réponse correcte : b
L'analyse discriminante prédit la probabilité d'appartenir à une classe donnée.

Question 12

Dans l'analyse discriminante, la variable à expliquer est : a) Quantitative continue


b) Qualitative catégorielle
c) Binaire uniquement
d) Ordinale uniquement

Réponse correcte : b
La variable dépendante Y est qualitative (classes ou catégories).

Question 13

Dans l'exemple du vin de Bordeaux, les classes de qualité sont : a) Excellent, Bon, Moyen
b) Bon, Moyen, Médiocre
c) 1, 2, 3, 4, 5
d) A, B, C

Réponse correcte : b
Les trois classes sont : Bon (1), Moyen (2), Médiocre (3).

Question 14

Le nombre maximum de variables discriminantes dans une analyse à k classes est : a) k


b) k-1
c) k+1
d) 2k
Réponse correcte : b
On peut extraire au maximum k-1 variables discriminantes pour k classes.

Question 15

La première variable discriminante Z₀ dans l'exemple du Bordeaux combine : a) Seulement la


température
b) Température + Soleil - Chaleur - Pluie
c) Toutes les variables avec le même coefficient
d) Seulement les variables météorologiques positives

Réponse correcte : b
Z₁ = 0.750Température + 0.547Soleil - 0.198Chaleur - 0.445Pluie

Question 16

Dans le plan discriminant, les frontières entre classes sont : a) Des cercles
b) Des droites quelconques
c) Les médiatrices des segments reliant les centres des groupes
d) Des paraboles

Réponse correcte : c
Les frontières de décision sont les médiatrices des segments joignant les centres de gravité.

Question 17

Pour classer une nouvelle observation, on calcule : a) Sa corrélation avec chaque classe
b) Sa distance au centre de chaque classe
c) Sa moyenne avec chaque classe
d) Son écart-type dans chaque classe

Réponse correcte : b
On affecte l'observation à la classe dont le centre est le plus proche.

Question 18

L'analyse factorielle discriminante recherche des variables discriminantes qui : a) Sont corrélées entre
elles
b) Maximisent la variance intra-classe
c) Maximisent le F de Fisher (variance inter/intra)
d) Minimisent les différences entre groupes

Réponse correcte : c
On cherche à maximiser le rapport des variances inter-classes sur intra-classes.

Question 19
Dans l'exemple du Bordeaux 1958, avec les valeurs :

 Température = 3000, Soleil = 1100, Chaleur = 20, Pluie = 300 La qualité prédite serait plutôt :
a) Bonne
b) Moyenne
c) Médiocre
d) Impossible à déterminer

Réponse correcte : b
D'après le graphique, l'observation 35 se situe près du centre "Moyen".

Question 20

La différence principale entre ACP et analyse discriminante est : a) L'ACP utilise des variables
qualitatives
b) L'analyse discriminante prédit une variable qualitative
c) L'ACP ne réduit pas la dimension
d) L'analyse discriminante n'utilise pas de variables quantitatives

Réponse correcte : b
L'ACP est descriptive (toutes variables quantitatives), l'analyse discriminante est prédictive (Y
qualitatif).

QCM - Analyse Factorielle des Correspondances et Classification Hiérarchique

Questions sur l'Analyse Factorielle des Correspondances (AFC)

Question 1 : L'AFC vise à analyser : a) L'association entre deux variables quantitatives b)


L'association entre deux variables qualitatives c) L'association entre une variable qualitative et une
quantitative d) Les corrélations entre plusieurs variables quantitatives

Question 2 : Dans une table de correspondance, la première valeur propre calculée est : a) Toujours
égale à 0 b) Toujours égale à 1 c) Variable selon les données d) Égale au chi-deux

Question 3 : Le nombre de valeurs propres en AFC est égal à : a) min(p,q) - 1 (où p = nombre de
lignes, q = nombre de colonnes) b) max(p,q) c) p × q d) p + q

Question 4 : Un taux de liaison de 0,384 signifie que : a) Le score observé est 38,4% inférieur au
score théorique d'indépendance b) Le score observé est 38,4% supérieur au score théorique
d'indépendance c) La probabilité d'association est de 38,4% d) L'erreur type est de 38,4%

Question 5 : Dans l'interprétation des cartes factorielles en AFC : a) Seuls les points-lignes peuvent
être représentés b) Seuls les points-colonnes peuvent être représentés c) Les points-lignes et points-
colonnes peuvent être représentés sur le même graphique d) Il faut toujours faire deux graphiques
séparés

Question 6 : L'angle entre deux points (ligne et colonne) par rapport à l'origine indique : a) La
distance euclidienne entre eux b) Le type d'association (attraction, répulsion ou indépendance) c) La
contribution à l'inertie d) La qualité de représentation

Questions sur la Classification Hiérarchique


Question 7 : La classification hiérarchique ascendante commence par : a) Un seul groupe contenant
tous les individus b) Chaque individu dans un groupe séparé c) Des groupes prédéfinis d) Une
partition aléatoire

Question 8 : La distance de Ward se calcule en utilisant : a) La distance minimale entre deux groupes
b) La distance maximale entre deux groupes c) La moyenne arithmétique des distances d) Une
formule spécifique impliquant les effectifs des groupes

Question 9 : Pour la classification hiérarchique, il est recommandé que : a) Le nombre d'individus soit
égal au nombre de variables b) Le nombre d'individus soit au moins deux fois supérieur au nombre de
variables c) Le nombre de variables soit supérieur au nombre d'individus d) Il n'y a pas de contrainte
particulière

Question 10 : La méthode du saut minimal consiste à : a) Prendre la distance maximale entre tous
les points de deux groupes b) Prendre la distance minimale entre tous les points de deux groupes c)
Calculer la moyenne des distances entre tous les points d) Utiliser la médiane des distances

Questions sur la Classification Non-Hiérarchique (K-means)

Question 11 : Dans la méthode des nuées dynamiques (K-means) : a) Le nombre de classes est
déterminé automatiquement b) Le nombre de classes doit être fixé à l'avance c) Le nombre de classes
est toujours égal à 3 d) Le nombre de classes est égal au nombre de variables

Question 12 : L'algorithme K-means s'arrête quand : a) Toutes les distances sont égales b) Le
nombre d'itérations maximum est atteint c) Il y a convergence (plus de changement d'affectation) d) La
variance intra-classe est nulle

Question 13 : La classification non-hiérarchique est plus adaptée quand : a) Le nombre d'individus


est faible b) Le nombre d'individus est important c) Les variables sont qualitatives d) Les données
contiennent des valeurs manquantes

CORRIGÉ

Réponses AFC

Question 1 : b) L'association entre deux variables qualitatives L'AFC analyse spécifiquement


l'association entre deux variables qualitatives à travers un tableau de contingence.

Question 2 : b) Toujours égale à 1 La première valeur propre est toujours égale à 1 et est
généralement éliminée par les logiciels d'analyse.

Question 3 : a) min(p,q) - 1 Le nombre de valeurs propres utilisables est le minimum entre le nombre
de lignes et de colonnes, moins 1 (car la première valeur propre = 1 est éliminée).

Question 4 : b) Le score observé est 38,4% supérieur au score théorique d'indépendance Un taux de
liaison positif indique que l'association observée est supérieure à ce qu'on observerait sous
l'hypothèse d'indépendance.

Question 5 : c) Les points-lignes et points-colonnes peuvent être représentés sur le même graphique
C'est une spécificité de l'AFC : contrairement à l'ACP, on peut représenter lignes et colonnes sur le
même graphique.

Question 6 : b) Le type d'association (attraction, répulsion ou indépendance) L'angle indique si les


modalités s'attirent (angle aigu), se repoussent (angle obtus) ou sont indépendantes (angle droit).
Réponses Classification Hiérarchique

Question 7 : b) Chaque individu dans un groupe séparé La méthode ascendante part de n groupes
(un par individu) et les regroupe progressivement.

Question 8 : d) Une formule spécifique impliquant les effectifs des groupes La distance de Ward
utilise une formule spécifique : d²(x̄₁,x̄₁) × (N₁×N₁)/(N₁+N₁).

Question 9 : b) Le nombre d'individus soit au moins deux fois supérieur au nombre de variables C'est
une règle empirique pour assurer la robustesse de l'analyse.

Question 10 : b) Prendre la distance minimale entre tous les points de deux groupes Le saut minimal
(single linkage) utilise la plus petite distance entre deux points de groupes différents.

Réponses Classification Non-Hiérarchique

Question 11 : b) Le nombre de classes doit être fixé à l'avance C'est la principale différence avec la
classification hiérarchique : il faut spécifier k à l'avance.

Question 12 : c) Il y a convergence (plus de changement d'affectation) L'algorithme s'arrête quand


les centres de classes se stabilisent et qu'aucun point ne change de classe.

Question 13 : b) Le nombre d'individus est important La classification non-hiérarchique est plus


efficace pour traiter de gros volumes de données.

Vous aimerez peut-être aussi