Analyse Factorielle des Correspondances (AFC)
L. Bazzaoui
18 avril 2025
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 1 / 55
Plan du cours
1 Introduction à l’AFC
2 Données utilisées en AFC
3 Test d’indépendance du chi-deux
4 Approche de l’AFC
5 Application de l’AFC à l’exemple
6 Annexe : Rappel du test d’indépendance du chi-deux
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 2 / 55
1. Introduction et objectifs généraux de l’AFC
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 3 / 55
Introduction
Permet d’analyser des tableaux de contingence.
Approche factorielle adaptée aux données catégorielles.
Applications diverses : marketing, sociologie, biologie, économie.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 4 / 55
Différence entre AFC et ACP
ACP : analyse des variables quantitatives.
AFC : analyse des variables qualitatives sous forme de tableau croisé.
Lien : AFC peut être vue comme une ACP pondérée.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 5 / 55
2. Données utilisées en AFC
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 6 / 55
Exemple : réseaux sociaux, jugement vs usage
Objectif : Étudier la cohérence entre le jugement porté sur les réseaux
sociaux et le temps réellement passé dessus.
Q1 : Pensez-vous que les réseaux sociaux sont une perte de temps ?
A : Pas du tout une perte de temps
B : Moyennement une perte de temps
C : Clairement une perte de temps
Q2 : Combien de temps passez-vous en moyenne chaque jour sur les
réseaux sociaux ?
1 : Moins d’1h
2 : Entre 1h et 3h
3 : Plus de 3h
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 7 / 55
Tableau de contingence
Les réponses sont résumées dans le tableau suivant :
> 3h 1–3h < 1h Total ligne
Pas une perte de temps 80 50 30 160
Moyennement une perte de temps 60 80 50 190
Clairement une perte de temps 20 40 35 95
Total colonne 160 170 115 445
Certaines combinaisons peuvent sembler contradictoires : par exemple,
considérer que les réseaux sont ≪ une perte de temps ≫ mais y consacrer
plusieurs heures par jour.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 8 / 55
Notation générale
Notation pour un tableau de contingence :
nij : nombre d’individus dans la cellule (i,j)
P
ni· = j nij : total de la ligne i
P
n·j = i nij : total de la colonne j
P
n = i,j nij : effectif total
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 9 / 55
Fréquences du tableau de contingence
Fréquences :
xij X X X
fij = , fi· = fij , f·j = fij , fij = 1
n
j i i,j
Ce tableau fij est la base de l’AFC, qui nous permettra d’explorer les
structures sous-jacentes dans ces réponses.
Remarque : L’AFC traite lignes et colonnes de façon symétrique. Le
tableau est vu comme une relation entre deux ensembles de modalités, et
la méthode permet de représenter les deux dans le même espace
géométrique.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 10 / 55
Fréquences du tableau de contingence
Application au tableau précédent : calcul des fréquences fij .
>3h 1–3h <1h Total ligne
Pas une perte de temps 0.18 0.11 0.07 0.36
Moyennement une perte de temps 0.13 0.18 0.11 0.43
Clairement une perte de temps 0.04 0.09 0.08 0.21
Total colonne 0.36 0.38 0.26 1.00
Chaque cellule représente la proportion d’individus dans la combinaison
correspondante : attitude vis-à-vis des réseaux sociaux Ö usage réel.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 11 / 55
Lecture qualitative du tableau
Avant même l’analyse formelle, le tableau croisé met en évidence des
tensions intéressantes entre jugement et comportement :
Comportement observé :
36% des individus passent plus de 3h par jour sur les réseaux.
26% y passent moins d’1h.
Jugement déclaré :
36% pensent que les réseaux sociaux ne sont pas une perte de temps.
21% les jugent clairement comme une perte de temps.
Contradiction possible :
Certains individus passent beaucoup de temps sur les réseaux tout en
les considérant comme une perte de temps.
D’autres, au contraire, les jugent utiles mais n’y consacrent que peu de
temps.
Donc, une lecture par proportions globales peut masquer des
contradictions internes.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 12 / 55
Fréquence élevée n’est pas association réelle
Dans le tableau croisé, certaines valeurs peuvent paraı̂tre élevées. . . mais il
faut rester prudent.
Exemple : 60 individus pensent que les réseaux sociaux sont
≪ moyennement une perte de temps ≫ et y passent plus de 3 heures par
jour. Ce comportement peut sembler ambigu, voire contradictoire.
Mais : est-ce une vraie association ? Ou est-ce simplement dû au fait que
ces deux réponses sont fréquentes individuellement ? (43% des individus
ont répondu ”moyennement” et 36% ont répondu > 3h)
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 13 / 55
Valeur attendue sous hypothèse d’indépendance
Pour détecter une association réelle entre deux modalités, on compare ce
qu’on observe à ce qu’on obtiendrait si les deux variables étaient
statistiquement indépendantes.
Si les deux réponses n’étaient pas liées, la proportion conjointe serait
simplement :
fijattendu = fi· × f·j
où :
fi· est la proportion d’individus ayant choisi la modalité de la ligne i
f·j est la proportion d’individus ayant choisi la modalité de la colonne j
Ce produit donne la fréquence “attendue” dans la cellule (i, j) si les deux
variables n’interagissent pas du tout.
On va comparer les effectifs (ou fréquences) observés avec ceux attendus
sous l’hypothèse d’indépendance.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 14 / 55
Effectifs observés et attendus sous indépendance
Tableau des effectifs réels et théoriques (sous indépendance)
Effectifs observés Fréquences observées
>3h 1–3h <1h Total >3h 1–3h <1h Total
Pas une perte 80 50 30 160 Pas une perte 0.18 0.11 0.07 0.36
Moy. une perte 60 80 50 190 Moy. une perte 0.13 0.18 0.11 0.43
Clairement une perte 20 40 35 95 Clairement une perte 0.04 0.09 0.08 0.21
Total 160 170 115 445 Total 0.36 0.38 0.26 1.00
Effectifs attendus Fréquences attendues
>3h 1–3h <1h Total >3h 1–3h <1h Total
Pas une perte 57.6 61.1 41.3 160 Pas une perte 0.13 0.14 0.09 0.36
Moy. une perte 68.3 72.6 49.1 190 Moy. une perte 0.15 0.16 0.11 0.43
Clairement une perte 34.1 36.3 24.6 95 Clairement une perte 0.08 0.08 0.06 0.21
Total 160 170 115 445 Total 0.36 0.38 0.26 1.00
Fréquence attendue : fijattendue = fi· × f·j
Effectif attendu : xijattendu = fi· × f·j × n
On observe des écarts notables : par exemple, 80 observés vs 57.6 attendus
pour (> 3h, Pas une perte).
L’AFC permet d’explorer ces écarts structurels de façon rigoureuse.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 15 / 55
Que conclure ?
En revenant à l’exemple de départ : dans la cellule considérée
(moyennement une perte de temps / > 3h), on observe :
Effectif observé : 60
Effectif attendu sous indépendance : 68.3
Que conclure ? :
Cette combinaison n’est pas surreprésentée — elle est au contraire
légèrement sous-représentée.
L’impression de ”fréquence élevée” vient du fait que les deux
modalités sont fréquentes individuellement.
Pas d’attraction entre ces deux réponses. Au contraire, il y a même
un léger effet de répulsion : ceux qui répondent ”moyennement” sont
un peu moins nombreux que prévu à passer beaucoup de temps sur
les réseaux.
On conclut qu’il n’y a pas de lien structurel entre ces deux réponses
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 16 / 55
Remarque : Pourquoi étudier un tableau de contingence ?
Un tableau de contingence croise les réponses à deux questions. L’objectif
de l’étude de ce tableau est de détecter des relations entre les modalités
des deux variables :
Dans la majorité des cas, ces deux questions sont choisies précisément
parce qu’on soupçonne un lien.
Si une analyse (ex : test du χ2 ) ne révèle aucune liaison, cela remet
en cause la pertinence du croisement lui-même.
C’est donc un point de départ logique pour l’AFC : on suppose qu’il y
a une structure à explorer ⇒ L’absence totale de relation serait un
signal d’alerte, pas une information neutre.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 17 / 55
3. Test d’indépendance du chi-deux
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 18 / 55
Rappel du test du χ2
On peut exprimer le test du χ2 à partir des effectifs observés et attendus :
X nij − ni· n·j 2
D2 = ni· n·j
n
i,j n
Voir Annexe pour un rappel du test du χ2 d’indépendance
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 19 / 55
Du test du χ2 aux fréquences
La statistique du test du χ2 à partir des effectifs observés et attendus :
X nij − ni· n·j 2
2 n
D = ni· n·j
i,j n
En divisant chaque terme par n, on obtient une version en fréquences :
X (fij − fi· f·j )2
D2 = n
fi· f·j
i,j
nij
où fij =n est la fréquence observée, et fi· f·j la fréquence attendue sous
indépendance.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 20 / 55
Rappel : Effectifs observés et attendus sous indépendance
pour l’exemple
Tableau des effectifs réels et théoriques (sous indépendance)
Effectifs observés Fréquences observées
>3h 1–3h <1h Total >3h 1–3h <1h Total
Pas une perte 80 50 30 160 Pas une perte 0.18 0.11 0.07 0.36
Moy. une perte 60 80 50 190 Moy. une perte 0.13 0.18 0.11 0.43
Clairement une perte 20 40 35 95 Clairement une perte 0.04 0.09 0.08 0.21
Total 160 170 115 445 Total 0.36 0.38 0.26 1.00
Effectifs attendus Fréquences attendues
>3h 1–3h <1h Total >3h 1–3h <1h Total
Pas une perte 57.6 61.1 41.3 160 Pas une perte 0.13 0.14 0.09 0.36
Moy. une perte 68.3 72.6 49.1 190 Moy. une perte 0.15 0.16 0.11 0.43
Clairement une perte 34.1 36.3 24.6 95 Clairement une perte 0.08 0.08 0.06 0.21
Total 160 170 115 445 Total 0.36 0.38 0.26 1.00
Fréquence attendue : fijattendue = fi· × f·j
Effectif attendu : xijattendu = fi· × f·j × n
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 21 / 55
Décomposition de la statistique du χ2
Valeur du test : χ2 = 26.4
Cette statistique mesure l’écart global entre les effectifs observés et ceux
attendus sous indépendance.
χ2 = 26.4 > χ20.95, df =4 = 9.49 ⇒ Rejet de H0
Donc, les variables ne sont pas indépendantes.
Décomposition par cellule (valeurs brutes)
>3h 1–3h <1h Total
Pas une perte 8.8 2.0 3.1 13.9
Moy. une perte 1.0 0.8 0.0 1.8
Clairement une perte 5.9 0.4 4.4 10.7
Total 15.7 3.2 7.6 26.4
La cellule (> 3h, Pas une perte) contribue fortement à l’écart à l’indépendance.
Idem pour (> 3h, Clairement une perte) et (< 1h, Clairement une perte).
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 22 / 55
Décomposition de χ2 par cellule (en %)
Décomposition en pourcentages signés
Les valeurs positives signalent une surreprésentation.
Les valeurs négatives indiquent une sous-représentation.
>3h 1–3h <1h Total
Pas une perte +33.3% -7.4% -11.6% +14.3%
Moy. une perte -3.9% +2.9% 0.0% -1.0%
Clairement une perte -22.2% +1.5% +16.7% -4.0%
Total +7.2% -3.0% +5.7%
Le pourcentage est obtenu en divisant la contribution de chaque cellule par la statistique
χ2 .
Le signe dépend de la comparaison entre effectif observé et attendu :
(
+ si Oij > Eij (surreprésentation)
signé =
− si Oij < Eij (sous-représentation)
Commentaires :
La cellule (> 3h, pas une perte) explique à elle seule 33% de l’écart global.
À l’inverse, (> 3h, clairement une perte) est fortement sous-représentée.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 23 / 55
Limites du test du χ2
Le test du χ2 permet de détecter une dépendance entre deux variables
qualitatives.
Mais il ne répond pas à des questions essentielles :
Où se situe la dépendance dans le tableau ?
Quelles modalités sont liées entre elles ?
Comment visualiser cette structure ?
L’Analyse Factorielle des Correspondances (AFC) part de la même
matrice de résidus et en propose une lecture géométrique : distances,
projections, axes principaux.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 24 / 55
4. Approche de l’AFC
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 25 / 55
Profils et modèle d’indépendance
En analyse des correspondances, on étudie :
Les
n o profils-lignes :
fij
fi· (distribution conditionnelle des colonnes pour chaque ligne i)
Les
n o profils-colonnes :
fij
f·j (distribution conditionnelle des lignes pour chaque colonne j)
Sous l’hypothèse d’indépendance :
Tous les profils-lignes sont égaux au profil marginal colonne {f·j }
Tous les profils-colonnes sont égaux au profil marginal ligne {fi· }
Si les variables sont indépendantes, alors connaı̂tre la ligne i ne donne
aucune information sur la colonne j, et réciproquement.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 26 / 55
Nuage des profils-lignes
À partir du tableau des fréquences, on construit un nuage de profils-lignes
dans RJ , où chaque dimension correspond à une modalité de la variable
V2 .
Chaque ligne i devient un point de coordonnées :
fi1 fi2 fiJ
, ,...,
fi· fi· fi·
On y ajoute le centre de gravité du nuage : le profil moyen GI , de
coordonnées :
(f·1 , f·2 , . . . , f·J )
Cette construction est analogue à l’ACP (où chaque individu devient un
point).
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 27 / 55
Nuage des profils-lignes (illustration)
Visualisation géométrique du nuage des profils-lignes dans RJ
Chaque point représente une ligne du tableau de contingence, placée selon
son profil-ligne.
Le centre GI est le profil moyen (barycentre pondéré).
La distance χ2 entre deux points reflète l’écart entre leurs
distributions conditionnelles.
L’inertie correspond à l’éloignement du point par rapport à GI .
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 28 / 55
Tableau des profils-lignes
Exemple : À partir du tableau des fréquences, on construit le tableau des
profils-lignes. Chaque cellule est divisée par le total de sa ligne.
>3h 1–3h <1h
Pas une perte 0.500 0.312 0.188
Moy. une perte 0.316 0.421 0.263
Clairement une perte 0.211 0.421 0.368
Chaque ligne est un point du nuage dans R3 , dont la somme des coordonnées vaut 1.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 29 / 55
Pondération et centre du nuage
Le nuage des profils-lignes a deux caractéristiques clés :
1 Chaque point i est pondéré par fi· , la fréquence marginale de la ligne.
2 Le centre de gravité du nuage est :
X
GI = fi· · profil-lignei
i
Il correspond au profil moyen et joue le rôle de l’origine.
La pondération donne plus d’influence aux lignes plus fréquentes.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 30 / 55
Distance du χ2 et inertie
La distance entre deux profils-lignes i et l est donnée par la distance du
χ2 :
J
flj 2
X 1 fij
dχ22 (i, l) = −
f·j fi· fl·
j=1
L’inertie d’un point i autour du centre GI est alors :
J 2
X 1 fij
Inertie(i/GI ) = fi· · dχ22 (i, GI ) = fi· − f·j
f·j fi·
j=1
J
X (fij − fi· f·j )2
Inertie(i/GI ) =
fi· f·j
j=1
Cette expression reflète l’écart entre les fréquences observées et celles
attendues sous indépendance.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 31 / 55
Inertie totale du nuage des lignes
L’inertie totale du nuage des profils-lignes NI autour de GI est liée à la
statistique du test χ2 :
χ2
Inertie totale = Φ2 =
n
Cette inertie mesure l’écart entre les données observées et le modèle
d’indépendance.
Elle résume la force de la liaison entre les deux variables de la table.
Plus elle est grande, plus les profils-lignes s’éloignent du centre GI .
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 32 / 55
Nuage des profils-colonnes
En AFC, lignes et colonnes jouent un rôle symétrique.
On peut construire un nuage de profils-colonnes dans RI , où chaque
dimension correspond à une modalité de la variable V1 .
Chaque colonne j devient un point de coordonnées :
f1j f2j fIj
, ,...,
f·j f·j f·j
Ce nuage est appelé NJ , le nuage des profils-colonnes.
Cette symétrie est une différence majeure avec l’ACP.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 33 / 55
Nuage des profils-colonnes (illustration)
Représentation géométrique du nuage des profils-colonnes dans RI
Chaque point-colonne j est une distribution conditionnelle sur les lignes i,
f
de coordonnées f·jij .
Le centre GJ est le profil moyen, de coordonnées {fi· }.
Chaque colonne est pondérée par f·j .
L’analyse mesure les écarts aux attentes sous indépendance.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 34 / 55
Tableau des profils-colonnes
Exemple :
Chaque colonne représente un profil conditionnel : proportion d’individus
dans chaque ligne, sachant la colonne.
>3h 1–3h <1h
Pas une perte 0.500 0.294 0.261
Moy. une perte 0.375 0.471 0.435
Clairement une perte 0.125 0.235 0.304
Chaque colonne définit un point dans l’espace RI (3 dimensions ici).
Ces points forment le nuage des profils-colonnes
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 35 / 55
Poids et origine dans le nuage des colonnes
Le nuage des profils-colonnes NJ possède les propriétés suivantes :
1 Chaque point j est pondéré par f·j , la fréquence marginale de la
colonne.
2 Le centre de gravité GJ du nuage est :
X
GJ = f·j · profil-colonnej = {fi· }
j
3 Ce point GJ est pris comme origine du repère dans RI .
Chaque colonne est donc analysée comme une distribution conditionnelle
sur les lignes.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 36 / 55
Distance et inertie dans le nuage des colonnes
Distance entre deux colonnes j et k (profils-colonnes) dans RI :
I
fik 2
X 1 fij
dχ22 (j, k) = −
fi· f·j f·k
i=1
Inertie d’une colonne j autour du centre GJ :
I I
2 X
(fij − fi· f·j )2
X 1 fij
Inertie(j/GJ ) = f·j − fi· =
fi· f·j fi· f·j
i=1 i=1
L’inertie totale du nuage NJ est égale à celle de NI , soit :
χ2
Inertie totale = Φ2 =
n
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 37 / 55
Projection des nuages NI et NJ
Comme en ACP, l’AFC construit des axes factoriels. Ces axes résument les
écarts à l’indépendance avec un maximum d’information sur les premiers
axes.
Démarche :
On va projeter les profils-lignes sur un espace de faible dimension, en
maximisant l’inertie projetée.
On travaille dans l’espace RJ , centré au barycentre GI .
On cherche un axe us qui maximise la projection pondérée des points :
I
X
fi· · (OHis )2 maximum
i=1
His : projection du point i sur l’axe us , et fi· est le poids de i.
Le premier axe u1 capte la plus grande inertie. Les suivants sont
orthogonaux.
⇒ La même approche peut-être suivie pour le nuage des profils colonnes
également.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 38 / 55
5. Application de l’AFC à l’exemple
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 39 / 55
Tableau des fréquences
Étape 1 : On commence par normaliser le tableau de contingence en
divisant chaque cellule par le total des observations. On obtient le tableau
des fréquences :
Plus de 3 Entre 1 et 3 Moins de 1 Total
Non 0.18 0.11 0.07 0.36
Moyennement 0.13 0.18 0.11 0.43
Oui 0.04 0.09 0.08 0.21
Total 0.36 0.38 0.26 1.00
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 40 / 55
Matrice des fréquences P
Les fréquences fij à l’intérieur du tableau de fréquences nous donnent la
matrice P.
0.18 0.11 0.07
P = 0.13 0.18 0.11
0.04 0.09 0.08
Chaque cellule représente la proportion d’individus dans une combinaison
de modalités.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 41 / 55
Vecteurs de masses de lignes r et colonnes c
Les totaux sur le tableau des fréquences nous donnent :
Vecteur de masses de lignes
0.360
r = 0.427
0.213
Vecteur de masses de colonnes
0.360
c = 0.382
0.258
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 42 / 55
Matrice des écarts à l’indépendance P − rc ′
Étape 2 : on compare les fréquences observées avec les fréquences
attendues sous hypothèse d’indépendance.
0.0505 −0.0250 −0.0255
P − rc ′ = −0.0187 0.0167 0.0020
−0.0318 0.0083 0.0235
Les valeurs positives indiquent une association plus forte qu’attendue, les
valeurs négatives une absence ou opposition entre modalités.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 43 / 55
Matrice centrée et réduite Z
Étape 3 : on corrige les écarts précédents en tenant compte de
l’importance (masse) de chaque ligne et colonne.
0.140 −0.067 −0.084
−1/2 −1/2
Z = Dr (P − rc T )Dc = −0.048 0.041 0.006
−0.115 0.029 0.100
Cette matrice Z est celle que l’on va décomposer via la SVD pour révéler
les structures principales de l’AFC.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 44 / 55
Décomposition en valeurs singulières (SVD)
Étape 4 : on applique la décomposition SVD à la matrice Z .
Z = UΣV T
U Σ V
-0.7369 0.3121 0.5996 0.2392 0.0000 0.0000 -0.7836 0.1625 -0.5996
0.2257 -0.7226 0.6534 0.0000 0.0459 0.0000 0.3245 -0.7160 -0.6181
0.6372 0.6168 0.4620 0.0000 0.0000 0.0000 0.5298 0.6789 -0.5083
A partir de Σ, on peut déduire les valeurs propres :
Axe Valeur propre λk Pourcentage d’inertie
1 0.0572 96.5%
2 0.0021 3.5%
3 0.0000 0.0%
Le premier axe capte l’essentiel de l’information.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 45 / 55
Coordonnées factorielles (résultats numériques)
Coordonnées des lignes (jugement sur les réseaux) :
Modalité Dim 1 Dim 2
Pas une perte -0.29396 0.02389
Moyennement 0.08261 -0.05076
Clairement 0.32987 0.06128
Coordonnées des colonnes (temps passé) :
Modalité Dim 1 Dim 2
Plus de 3h -0.31258 0.01244
Entre 1 et 3h 0.12556 -0.05318
Moins de 1h 0.24929 0.06130
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 46 / 55
Lecture du plan factoriel (Dim 1 = 96.5%, Dim 2 = 3.5%)
Axe 1 distingue fortement les comportements opposés :
À gauche : les répondants qui ne pensent pas que les réseaux sont une
perte de temps (≪ Non ≫), associés à un usage intensif (> 3h).
À droite : les répondants qui les jugent clairement une perte de temps
(≪ Oui ≫), associés à un usage plus faible (< 1h).
Axe 2 (faible inertie, 3.5%) :
Il distingue les réponses modérées, comme ≪ Moyennement ≫ ou
≪ Entre 1h et 3h ≫, sans structure très forte.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 47 / 55
Annexe : Rappel du test d’indépendance du chi-deux
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 48 / 55
Le test d’indépendance du khi-deux
Définition
Le test d’indépendance du khi-deux permet de tester si deux variables
aléatoires X et Y sont indépendantes. Les hypothèses nulle et alter-
native de ce test s’écrivent respectivement sous la forme :
H0 : X et Y sont indépendantes
H1 : X et Y sont dépendantes
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 49 / 55
Le test d’indépendance du khi-deux
Définition
Soient X et Y deux variables aléatoires. On distingue entre deux cas
X et Y sont des variables discrètes. Elles sont indépendantes si
∀i, j P(X = ai , Y = bj ) = P(X = ai ) × P(Y = bj )
X et Y sont des variables continues. Elles sont indépendantes
si
∀I ∈ R, ∀J ∈ R P(X ∈ I , Y ∈ J) = P(X ∈ I ) × P(Y ∈ J)
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 50 / 55
Le test d’indépendance du khi-deux : cas des variables
discrètes
On a des observations (xi , yj ) associées aux variables X et Y .
Soient {a1 , . . . , aK } les valeurs possibles de X et {b1 , . . . , bM } les
valeurs possibles de Y
On peut les représenter à l’aide d’un tableau de contingence
b1 b2 ... bM Total
a1 n11 n12 ... n1M n1.
a2 n21 n22 ... n2M n2.
... ... ... ... ... ...
aK nK 1 nK 2 ... nKM nK .
Total n.1 n.2 ... n.M n
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 51 / 55
Le test d’indépendance du khi-deux : cas des variables
discrètes
b1 b2 ... bM Total
a1 n11 n12 ... n1M n1·
a2 n21 n22 ... n2M n2·
... ... ... ... ... ...
aK nK 1 nK 2 ... nKM nK ·
Total n·1 n·2 ... n·M n
Où nij représente le nombre d’observations (xi , yj ) telles que xi = ai et
yj = bPj , avec i = 1, . . . , K et j = 1, . . . , M.
On a i,j nij = n
De plus :
P P
Le total des observations pour X = ai : ni· = j nij , avec ni· = n.
P Pi
Le total des observations pour Y = bj : n·j = i nij , avec j n·j = n.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 52 / 55
Le test d’indépendance du khi-deux : cas des variables
discrètes
Si on considère que X et Y sont indépendantes (on note X ⊥⊥ Y ) :
∀i, j P(X = ai , Y = bj ) = P(X = ai ) × P(Y = bj )
Ces probabilités étant inconnues, on utilise des estimateurs, sur la
base des relations suivantes :
nP(X = ai , Y = bj ) ≈ nij
nP(X = ai ) ≈ ni.
nP(Y = bj ) ≈ n.j
Donc, on devrait avoir
ni. × n.j
nij ≈
n
n ×n
Sur la base des effectifs théoriques estimés i. n .j , on peut construire
un tableau de contingence théorique. Les sommes des lignes et des
colonnes devraient être les mêmes que celles du tableau de
contingence empirique.
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 53 / 55
Le test d’indépendance du khi-deux : cas des variables
discrètes
Le principe du test d’indépendance est de créer une mesure de la
n ×n
distance entre nij et i. n .j
Distance
Ni. ×N.j 2
X Nij − n
D2 = N ×N i. .j
i,j n
D 2 correspond à la statistique du test
Si les valeurs observées de D 2 sont trop larges, on décide que X et Y
ne sont pas indépendantes.
Si les valeurs observées de D 2 sont assez petites, on décide que X et
Y sont indépendantes.
Sous l’hypothèse d’indépendance, on a
D 2 ∼ χ2 ((K − 1)(M − 1))
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 54 / 55
Le test d’indépendance du khi-deux : cas des variables
discrètes
On décide H1 quand D 2 > s avec s tel que
PH0 (D 2 > s) ≤ α
Avec s = c1−α;(K −1)(M−1) quantile d’ordre 1 − α pour une
distribution χ2 ((K − 1)(M − 1))
En pratique, le plus souvent la décision est prise sur la base de la
p-value
p-value = PH0 (D 2 > Dobs2
)
Si la p-value ≤ α, on décide H1
Si la p-value > α, on décide H0
L. Bazzaoui Analyse Factorielle des Correspondances (AFC) 18 avril 2025 55 / 55