0% ont trouvé ce document utile (0 vote)
168 vues90 pages

Statistique A Une Variable - Cours

Le document présente un cours sur la statistique descriptive, couvrant des concepts tels que la définition de la statistique, la description des populations statistiques, et les représentations graphiques. Il aborde également les caractéristiques de position, de dispersion, et de concentration, ainsi que les indices statistiques. Les graphiques sont essentiels pour visualiser les données, avec des exemples de diagrammes pour les variables qualitatives et quantitatives.

Transféré par

yeoetienne80
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
168 vues90 pages

Statistique A Une Variable - Cours

Le document présente un cours sur la statistique descriptive, couvrant des concepts tels que la définition de la statistique, la description des populations statistiques, et les représentations graphiques. Il aborde également les caractéristiques de position, de dispersion, et de concentration, ainsi que les indices statistiques. Les graphiques sont essentiels pour visualiser les données, avec des exemples de diagrammes pour les variables qualitatives et quantitatives.

Transféré par

yeoetienne80
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PPTX, PDF, TXT ou lisez en ligne sur Scribd

Statistique descriptive à une

variable
Dr. YOUAN BI
Maitre-Assistant Université Alassane Ouattara
Chercheur Centre Suisse de Recherches Scientifiques

1
Plan du cours
Chapitre 1: Vocabulaire et représentation graphique
1 Définitions
2 Description d’une population statistique
3 Représentations graphiques
4 Taux de croissance
Chapitre 2: Caractéristiques de position
1 Moyennes
2 Médiane
3 Mode
4 Quantiles

2
Plan du cours
Chapitre 3: Caractéristiques de dispersion
1 Variance
2 Ecart-type
3 Coefficient de variation
4 Etendue et Intervalles interquantiles
Chapitre 4: Caractéristiques de concentration
1 Médiale
2 Courbe de Lorenz
3 Indice de Gini
Chapitre 5: Indice
1 Indices élémentaires
2 Indices synthétiques
3 Indices de Laspeyres et de Paasche
3
Chapitre I: Vocabulaire et représentation graphique
•I- Définitions
La statistique c’est la science des grands nombres regroupant
l'ensemble de méthodes mathématiques qui, à partir du recueil
et de l'analyse de données réelles, permettent l'élaboration
de modèles probabilistes autorisant les prévisions. (Larousse)
On voit se dessiner ici les deux principales branches de la
statistique : la statistique descriptive et la statistique
mathématique ou inférentielle.
- La statistique mathématique ou inférentielle
Cette branche de la statistique s’intéresse davantage à extrapoler
des résultats issus d’échantillons en vue de caractériser une
population mère inconnue, de faire des prévisions de
comportements basées sur le calcul de probabilités.

4
Chapitre I: Vocabulaire et représentation graphique
-La statistique Descriptive
La statistique descriptive est un ensemble de méthodes permettant de
décrire et d'analyser, de façon quantifiée, des phénomènes repérés par
des éléments nombreux, de même nature, susceptibles d'être
dénombrés et classés.
Le lien de complémentarité entre statistique inférentielle et statistique
descriptive est évident : la première collecte et fournit à la seconde la «
matière première » à décrire et à analyser qui, retournée à la première
est extrapolée.
II- Description d’une population statistique
A – Unités statistiques, population, échantillons
Les éléments nombreux dont s'occupe la statistique descriptive sont
appelés des unités statistiques. Ces unités sont regroupées dans une
population. Lorsque la population est trop importante pour être
connue entièrement, on prélève un échantillon.
5
Chapitre I: Vocabulaire et représentation graphique

B – Caractères et variables
Dans une population, par exemple celle des étudiants d’une
UFR, les unités sont repérées par le nom et le prénom des
étudiants (on a donc une liste). Si l'on souhaite étudier cette
population, on va retenir certains critères d’étude comme le
sexe, la filière, l’âge, le poids, la taille, etc.
Parmi ces critères, certains sont quantitatifs, comme l’âge, le
poids, la taille. On peut en effet effectuer des calculs
numériques sur ces critères : poids moyen, taille maximale,
taille minimale, etc. D’autres critères ne sont pas
quantifiables, car on ne peut pas effectuer de calculs dessus.
Ils sont qualitatifs. C’est le cas du sexe par exemple.

6
Chapitre I: Vocabulaire et représentation graphique

L’effectif total, n, va se répartir entre l’effectif masculin et l’effectif


féminin, ce qui nous permet d’écrire que n = nF + nM. Cette égalité,
nous pouvons l’écrire parce que les différentes modalités d’un
caractère sont à la fois exhaustives et incompatibles. Exhaustives, car
elles décrivent toutes les valeurs ou états possibles d’un caractère.
Incompatibles, car un individu ne peut pas avoir plus d’une modalité.

7
Chapitre I: Vocabulaire et représentation graphique

C – Valeurs discrètes, valeurs continues


Une variable quantitative peut-être discrète ou continue. Lorsque le
nombre de valeurs possibles est fini (exemple : le nombre
d’enfants, le nombre de pièces d’un logement, etc.), la variable
est discrète. Lorsque le nombre de valeurs possibles de la
variable est infini (exemple : la taille, le poids ou le revenu des
ménages), la variable est continue.
D – Unités individuelles et unités groupées
Les unités d’une population, que le critère soit qualitatif ou
quantitatif (discret ou continu), peuvent être présentées
individuellement (c’est généralement le cas lorsque les données
sont saisies) ou regroupées. Le regroupement peut être effectué
par modalités, par valeurs ou par classes de modalités ou de
valeurs.
8
Chapitre I: Vocabulaire et représentation graphique
Exemple 2 : On a mesuré 20 personnes et les résultats sont (en cm) :
{148, 165, 145, 173, 148, 145, 152, 180, 135, 170, 170, 170, 142,
148, 165, 175, 180, 180, 180, 180}.
Il s'agit d’une variable continue (la taille), mais dont les valeurs sont
ici connues individuellement. On peut aussi effectuer un
regroupement par taille car certaines tailles, comme 170 ou 180,
apparaissent plusieurs fois .

Il est également possible d'effectuer un regroupement par classes


de valeurs. On choisira, à titre d'exemple, un regroupement par
classes d'amplitudes égales (tableau 7), puis un regroupement par
classes d'amplitudes inégales (tableau 8).
9
Chapitre I: Vocabulaire et représentation graphique
On désigne par ai, l’amplitude d’une classe. Dans le tableau 7,
l’amplitude de classe est la même pour toutes les classes (10 cm)
alors qu’elle est de 20 cm, 20 cm et 10 cm dans le tableau 8.

10
Chapitre I: Vocabulaire et représentation graphique

Lorsque les unités statistiques sont groupées par classes, on


calcule un centre de classe, désigné par ci, qui est égal à la
moyenne des extrémités de classes (voir le tableau 9 pour le
calcul des centres de classe du tableau 8).

11
Chapitre I: Vocabulaire et représentation graphique

F – Effectifs, fréquences, pourcentages,


Une fois les unités statistiques d’une population répertoriées, celles-ci
sont présentées dans des tableaux, de diverses manières : effectifs
ou fréquences absolues, fréquences relatives, pourcentages, ratios,
indices et taux.
1) Effectifs ou fréquences absolues
Il s’agit de la répartition brute des données. Lorsque les données sont
présentées individuellement, chaque donnée a la même fréquence
unitaire d’apparition, leur effectif ou fréquence absolue est égal à 1.
Lorsque les données sont regroupées par valeurs ou modalités, les
effectifs ou fréquences absolues correspondent au nombre de
données qui ont la valeur ou modalité, ou encore qui sont groupées
dans une classe donnée.

12
Chapitre I: Vocabulaire et représentation graphique

Symboliquement, les effectifs ou fréquences absolues s’écrivent


ni. Et la somme des effectifs est égale à n. Ainsi, dans le cas du
tableau 11, les effectifs ou fréquences absolues sont
respectivement égaux à n1=21, n2=63 et n3=16. De plus, on a

2) Fréquences relatives et pourcentages


La fréquence relative est égale à la fréquence absolue divisée par
l’effectif total :

On a donc :

13
Chapitre I: Vocabulaire et représentation graphique
Le pourcentage des données qui correspondent à une modalité, à une
valeur ou à une classe s’obtient en multipliant la fréquence relative
correspondante par 100. C’est-à-dire:
Pourcentage de la valeur (modalité ou classe) i = fi x 100
Le tableau suivant reprend l’exemple de la répartition des ménages en
fonction du nombre d’ampoules utilisées à leur domicile, en ajoutant la
colonne des fréquences relatives à côté de celle des fréquence
absolues. La dernière ligne correspond aux totaux.

14
Chapitre I: Vocabulaire et représentation graphique

III- Graphiques des séries à une variable


L’apparition des graphiques statistiques, liée à l’utilisation des
coordonnées, doit essentiellement son origine au philosophe et
mathématicien René Descartes. Ces graphiques constituent une
synthèse visuelle indispensable de l’information contenue dans le
tableau statistique. Les graphiques utilisés dépendent de la nature
de la variable. Nous utiliserons, pour représenter les distributions
d’effectifs (ou de fréquences), les diagrammes circulaires (ou
secteurs), les diagrammes en tuyaux d’orgue, les diagrammes en
bâtons, les histogrammes et le polygone des effectifs. Pour les
distributions cumulées, nous utiliserons les polygones des effectifs
(ou des fréquences) cumulés croissants et décroissants.

15
Chapitre I: Vocabulaire et représentation graphique
A- Graphiques pour variables qualitatives
Les variables qualitatives – nominales ou ordinales – peuvent être
représentées au choix à l’aide d’un diagramme circulaire ou à l’aide
d’un diagramme en tuyaux d’orgue.
Diagramme circulaire
Le diagramme circulaire, également appelé « camembert », permet
une représentation de la distribution d’une variable dans un cercle
qui représente 100 % des modalités. C’est un graphique constitué
d’un cercle divisé en secteurs dont les angles au centre sont
proportionnels aux effectifs (ou aux fréquences). De fait, les aires
des secteurs sont proportionnelles aux effectifs. L’angle αi d’une
modalité d’effectif ni est donné en degrés par:
αi = ni/N × 360 = f i × 360 .

16
Bac Fréquence (%) Angle correspondant
(αi)
Bac général 34 121,3
Bac technologique 17 62,3
Bac professionnelle 12 41,4
Non bachelier 37 135

Figure: Diagramme circulaire :


proportion (en pourcentage) de
bacheliers et non-bacheliers dans
une génération dans le
Département de Daloa, 2015.

17
Chapitre I: Vocabulaire et représentation graphique

Diagramme en tuyaux d’orgue (en barres)


Le diagramme en tuyaux d’orgue est une représentation de la
distribution d’une variable selon des rectangles horizontaux ou
verticaux ayant tous une même base, de largeur arbitraire.
C’est un graphique qui à chaque modalité d’une variable
qualitative associe un rectangle de base constante dont la
hauteur est proportionnelle à l’effectif (ou à la fréquence). De
fait, les aires des secteurs sont proportionnelles aux effectifs. Les
rectangles sont en général disjoints, verticaux ou horizontaux.

18
Bac Fréquence (%)
Bac général 34
Bac technologique 17
Bac professionnelle 12
Non bachelier 37

Diagramme en tuyaux d’orgue :


proportion (en pourcentage)
de bacheliers et non-bacheliers
dans une génération dans le
Département de Daloa, 2015.

19
Chapitre I: Vocabulaire et représentation graphique

B- Graphiques pour variables quantitatives


La représentation graphique d’une variable quantitative dépend
de sa nature : discrète ou continue.
Variables discrètes : diagramme en bâtons
La distribution d’une variable quantitative discrète peut être
représentée par un diagramme en bâtons.
On appelle diagramme en bâtons un graphique qui à chaque
modalité d’une variable quantitative discrète associe un segment
(bâton) dont la hauteur est proportionnelle à l’effectif (ou à la
fréquence).

20
Diagramme en bâtons et
polygone des effectifs : nombre
de personnes par ménage,
Côte d’Ivoire, 1998.

Variables continues : histogramme


Un histogramme est un diagramme composé de rectangles contigus
dont les aires sont proportionnelles aux effectifs (ou aux fréquences) et
dont les bases sont déterminées par les intervalles de classes. Dans le
cas d’une variable quantitative continue, on définit la densité d’effectif
di d’une classe d’effectif ni et d’amplitude Ai par : di = ni / Ai (ou, dans le
cas des fréquences, fi / Ai ).
21
Chapitre I: Vocabulaire et représentation graphique
Lors de la réalisation d’un histogramme, il est indispensable de distinguer
deux cas.
1. Si les amplitudes de classes sont égales, la hauteur des rectangles
correspondra aux effectifs (ou aux fréquences) des classes.
2. Si les amplitudes sont différentes, afin de constituer l’histogramme, il
est nécessaire de :
– calculer, pour chaque classe, l’amplitude Ai ;
– calculer la densité di=ni/Ai pour un histogramme des effectifs, et di=fi/Ai
pour un histogramme des fréquences ;
– affecter à chaque rectangle une hauteur proportionnelle à la densité di
de la classe correspondante.

22
Exemple 1: Le responsable des ressources humaines d’une entreprise a
relevé la distribution statistique suivante correspondant à l’ancienneté
du personnel cadre dans l’entreprise, exprimée en années:

L’histogramme des effectifs est présenté avec, sur le même graphique, le


polygone des effectifs tracé en courbe pleine. Ce polygone permet de
représenter la distribution sous la forme d’une courbe ; quand les
amplitudes de classes sont égales, on l’obtient en joignant les milieux
des bases supérieures de chaque rectangle de l’histogramme par des
segments de droite.
23
On adjoint généralement une classe d’effectif nul, de part et d’autre de
l’histogramme, afin de respecter la règle de compensation des aires : l’aire
totale du domaine situé entre l’axe des x et le polygone est égale à la
somme des aires des rectangles de l’histogramme. Elle représente l’effectif
total.

Histogramme et
polygone des effectifs,
classes de même
amplitude : ancienneté
du personnel cadre de
l’entreprise.

24
Chapitre I: Vocabulaire et représentation graphique
Modifions légèrement cet exemple en regroupant les deux dernières
classes en une seule. Ce regroupement permet de traiter le cas de
classes d’amplitudes différentes, puisque ainsi la dernière classe est
d’amplitude 3 contre 1,5 pour toutes les autres classes.

Les classes étant


d’amplitudes inégales, il
est nécessaire de calculer
les amplitudes (Ai), les
densités (di), puis les
effectifs corrigés (nic)
pour chaque classe. Les
résultats de ces calculs
sont présentés dans le
tableau suivant.
25
26
Chapitre I: Vocabulaire et représentation graphique

Diagrammes cumulatifs
Les notions d’effectifs et de fréquences cumulés nous ont donné
l’occasion d’introduire la notion de fonction de répartition, que nous
définissons ci-après avant d’évoquer sa représentation graphique.
Définition
Si X est une variable quantitative, on introduit la fonction de répartition,
qui à tout nombre réel x associe la proportion des individus de la
population pour lesquels X est inférieur ou égal à x.
Pour tout x réel, 0 ≤ F(x)≤1 (les valeurs de F peuvent également être
exprimées en pourcentage).
La première étape de la construction d’une fonction de répartition
consiste donc à calculer les fréquences cumulées croissantes, en
distinguant deux cas : le discret et le continu.

27
Chapitre I: Vocabulaire et représentation graphique

28
Chapitre I: Vocabulaire et représentation graphique

29
Chapitre I: Vocabulaire et représentation graphique
Polygones des fréquences cumulées croissantes et décroissantes
Dans le cas d’une variable continue, on définit les polygones des
fréquences (ou des effectifs) cumulées croissantes et décroissantes; ils
seront utilisés notamment pour déterminer la médiane de la série (voir
chapitre 2).
Le polygone des fréquences cumulées croissantes commence au point
de coordonnées (a1; 0), car la proportion de valeurs inférieures à a1
est nulle. Il est obtenu en joignant les points de coordonnées (bi; ficc) –
il correspond à la restriction de la fonction de répartition aux valeurs
de x inférieures ou égales à la borne supérieure de la dernière classe.
Le polygone des fréquences cumulées décroissantes s’obtient de la
même façon, en adjoignant le point de coordonnées (br ; 0), car, br
désignant la borne supérieure de la dernière classe, la proportion de
valeurs supérieures à br est nulle.

30
Le tableau suivant donne la structure de la population ivoirienne suivant l’âge :

Les fréquences cumulées croissantes et décroissantes sont calculées


puis organisées pour correspondre aux bornes des classes.

À partir de ces données, il est possible de tracer les polygones des


fréquences cumulées croissantes et décroissantes

31
Polygones des fréquences cumulées croissantes et
décroissantes de l’âge de la population ivoirienne.

32
Chapitre I: Vocabulaire et représentation graphique

IV- TAUX DE CROISSANCE


A – Définition
Le taux de croissance est très utilisé en statistique et, plus
généralement, en économie. Il se définit ainsi :

Le rapport Vt/V0 est appelé multiplicateur. Dès lors, on peut


écrire : g = multiplicateur – 1 Ou multiplicateur = 1 + g

33
Chapitre I: Vocabulaire de la statistique descriptive

Le taux de croissance, exprimé en pourcentage, est égal à 0,5 x


100 = 50%.
Remarque : Ne pas confondre le taux de croissance, qui est une
variation relative, et la variation absolue qui est Vt – V0 . Ici, la
variation absolue est égale à 150-100 = 50.
En d'autres termes :

34
Chapitre I: Vocabulaire de la statistique descriptive
B – Évolutions successives
Soient g1, g2,…, gt des taux de croissance successifs. Le taux de
croissance global sur la période 1,…,t est :

Exemple : soit une hausse de 5% suivie d’une hausse de 2%, puis


d’une baisse de 3%. Quel est le taux de croissance global (sur
les 3 périodes) ?

35
Chapitre I: Vocabulaire de la statistique descriptive
C – Taux de croissance moyen
Soient g1, g2,…, gt des taux de croissance successifs. Le taux de
croissance moyen sur la période 1,…,t est :
C'est-à-dire :

Exemple : soit une hausse de 10% suivie d’une hausse de 20%, puis
d’une hausse de 40%. Quel est le taux de croissance global (sur les 3
périodes) ?

Et son taux de croissance moyen sur les trois périodes :

36
Chapitre II: caractéristiques de position

L’objectif du recueil et du traitement de données est


toujours de fournir des informations utiles à la prise de
décision. Cependant, la présentation des données brutes
sous forme de tableaux et de graphiques, comme nous
l’avons faite au deuxième chapitre, ne suffit pas toujours
à alimenter de manière pertinente le processus de
décision.
Bien souvent, les données sont à la fois nombreuses et
variées et leur synthèse s’impose. Dans cette situation, la
distribution statistique est résumée en calculant des
indicateurs, paramètres ou caractéristiques.
37
Chapitre II: caractéristiques de position

Selon leur fonction, les caractéristiques se répartissent en trois grandes


familles:
- Les paramètres de position, comme les moyennes, indiquent où se
situe (se positionne) la série de données.
- Les paramètres de dispersion caractérisent numériquement la
manière dont les observations s’écartent les unes des autres, ou
montrent comment elles s’écartent d’un nombre de référence (ex:
moyenne)
- Les indices de concentration mesurent le degré d’inégalité dans la
répartition de la somme des observation lorsque cette somme à un
sens.
Dans ce chapitre, nous allons étudier les moyennes, le mode, la
médiane

38
Chapitre II: caractéristiques de position

1- LES MOYENNES
A – La moyenne arithmétique
1) La moyenne arithmétique simple
Exemple : Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne
arithmétique de cette série de chiffres se calcule ainsi :

Formule générale de la moyenne arithmétique simple : Soit {x 1,


x 2, ….,xn} une série de chiffres. La formule de la moyenne
arithmétique de cette série est donnée par :

39
Chapitre II: caractéristiques de position
2) La moyenne arithmétique pondérée
Exemple 1 : Soit la série de chiffres {8, 13, 5, 8, 5, 9, 13, 25, 13, 9}.
Certains chiffres, comme le 8, le 9 ou le 13 sont répétés. On peut
simplifier la présentation en regroupant les données par valeurs
(voir le tableau 2). La troisième ligne est le produit des deux
premières. On a donc:

40
Chapitre II: caractéristiques de position

La moyenne pondérée se calcule alors en faisant la somme


pondérée c’est-à-dire la somme des ni xi et en divisant par n.
Elle est égale à :

Formule générale de la moyenne arithmétique pondérée : Soit {x


1, x 2, ….,xh} une série de chiffres et {n1, n2, ….,nh} les effectifs
correspondants. La formule de la moyenne arithmétique
pondérée de cette série est donnée par :

41
Chapitre II: caractéristiques de position

Exemple 2 : Soit la série de chiffres


{8,13,5,8,5,9,13,53,13,9,35,44,29,28}. Supposons que l’on
regroupe les valeurs en 3 catégories comme dans le tableau 3
ci-dessous. Dans ce cas, il faut calculer le centre de chaque
classe, ci, c’est-à-dire la somme des extrémités de classe
divisée par 2 et appliquer la formule de la moyenne pondérée.

42
Chapitre II: caractéristiques de position
En remplaçant xi par ci, nous avons :

Dans notre exemple, on a donc :

La moyenne arithmétique possède la propriété de linéarité, c'est-


à-dire que si deux variables sont en correspondance linéaire, leur
moyenne arithmétique sont dans la même correspondance.
Si

Alors

43
Chapitre II: caractéristiques de position
B- moyenne quadratique
1) La moyenne quadratique simple
Exemple : Soit la série de chiffres {-4, -2, 0, 2, 4}. Si l’on calcule la
moyenne arithmétique simple on obtient zéro.
Parfois, on souhaite obtenir une caractéristique de tendance
centrale ayant une valeur positive là où le calcul de la moyenne
arithmétique simple aurait donné zéro. On calcule alors la
moyenne quadratique simple en additionnant le carré de toutes
les valeurs de la série et en prenant la racine carrée du total.

44
Chapitre II: caractéristiques de position

Formule générale de la moyenne quadratique simple : Soient


{x1, x2, ….,xn} une série de chiffres. La formule de la moyenne
quadratique simple de cette série est donnée par :

2) La moyenne quadratique pondérée


Soit {x1, x2, ….,xh} une série de chiffres et {n1, n2, ….,nh} les
effectifs correspondants. La formule de la moyenne
quadratique pondérée de cette série est donnée par :

45
Chapitre II: caractéristiques de position

En appliquant la formule on obtient :

Lorsque les valeurs sont regroupées en classes, il faut calculer les


centres de classes et appliquer ensuite la formule en
remplaçant xi par ci.

46
Chapitre II: caractéristiques de position
C – La moyenne géométrique
1) La moyenne géométrique simple
La moyenne géométrique est un instrument permettant de calculer
des taux moyens, notamment des taux moyens annuels. Son
utilisation n'a un sens que si les valeurs ont un caractère
multiplicatif.
Soit {x 1, x2, ….,xn} une série de chiffres. La formule de la moyenne
géométrique simple de cette série est donnée par :

Exemple : Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne


géométrique de cette série est égale à :

47
Chapitre II: caractéristiques de position
2) La moyenne géométrique pondérée
Soit {x1, x2, ….,xh} une série de chiffres et {n1, n2, ….,nh} les effectifs
correspondants. La formule de la moyenne géométrique pondérée de
cette série est donnée par :

D – La moyenne harmonique
1) La moyenne harmonique simple
Soit {x 1, x2, …., xn} une série de chiffres. La formule de la moyenne
harmonique simple de cette série est donnée par :

48
Chapitre II: caractéristiques de position
2) La moyenne harmonique pondérée
Soit {x1, x2, ….,xh} une série de chiffres et {n1, n2, ….,nh} les
effectifs correspondants. La formule de la moyenne harmonique
pondérée de cette série est donnée par :

On utilise la moyenne harmonique lorsqu’on veut déterminer un


rapport moyen dans des domaines ou ils existent des liens de
proportionnalité inverse
Exemple : Soit les chiffres du tableau précédent. Pour calculer la
moyenne harmonique pondérée, on applique la formule et on
obtient:

49
Chapitre II: caractéristiques de position
2- Le mode (noté Mo)
c’est la valeur de la variable la plus fréquente.
Dans le cas d’une série discrète, le mode est la valeur de la variable xi
correspondant à l'effectif le plus élevé.
Graphiquement, c’est la valeur de xi pour laquelle le bâton est le plus
grand.
Dans le cas d’une série continue, le mode s’identifie à l’intervalle de
valeurs x (appelé alors classe modale) correspondant à l'effectif par unité
d'amplitude le plus élevé.
Graphiquement, il s’agit de la classe pour laquelle on a le sommet de
l'histogramme.
3- la médiane et les quantiles
La médiane se définit comme la valeur de la variable qui partage la série
en deux sous-ensembles d'effectifs égaux, les individus étant au préalable
rangés par valeur croissante de la variable.
50
Chapitre II: caractéristiques de position
n
Soit Me, la médiane, elle est telle que : N ( Me)  ou F ( Me) 
1
2 2
N(x) représente la fonction de répartition des effectifs; 50% des
individus ont une valeur inférieure à la médiane.
De même, F(x) représente la fonction de répartition des
fréquences.
Il s’agit de préciser le rang de la médiane afin de déterminer, selon
les cas, la valeur que prend la médiane. Deux cas sont à envisager :
- Si le nombre d'observations (effectif total) est impair, c'est-à-dire
n 2 palors
 1 le rang de la médiane est égal à , qui
n 1
correspond à la p+1ième observation.
2

51
Chapitre II: caractéristiques de position
Ex : 50,55,58,60,64. n=5, rang=3ième. Cela signifie que deux
individus ont un poids inférieur, et deux autres ont un poids
supérieur donc Me=58.
Si le nombre d'observations est pair, c'est-à-dire , n 2 p alors il
n’y a pas d'individu médian au sens strict. Dans ce cas, on convient
n
de garder pour rang  1  p  1ièmeobservation.
2
Par exemple, avec la série simple suivante 50,55,58,60,64,66. on a
n=6, rang=4ième, et Me=60.
La détermination de la médiane dans le cas de séries pondérées,
présente quelques particularités selon qu’il s’agit d’une série
discrète ou d’une série continue.

52
En présence d’une série discrète, le problème se ramène à la
détermination de la valeur de la variable pour le p+1ième individu.

53
Chapitre II: caractéristiques de position

Pour déterminer la médiane, on repère 0,5 dans la colonne des


fréquences cumulées F(x) ou bien n/2 dans la colonne des effectifs
cumulés N(x). On choisit ensuite la valeur F(x) égale ou immédiatement
supérieure à 0,5 (ou la valeur N(x) égale ou immédiatement supérieure
à n/2) et l’on suit le sens des flèches comme indiqué sur le tableau 6.
Dans notre exemple, il n’y a pas de valeur F(x) égale à 0,5, la valeur
immédiatement supérieure à 0,5 est 0,6 (et la valeur immédiatement
supérieure à n/2=30/2=15 est 18). Par conséquent, en suivant les
flèches, on remonte à la valeur qui correspond à la médiane, soit 11.

54
Chapitre II: caractéristiques de position
Pour une série continue, il devient impossible d'attribuer à un
individu particulier, une valeur exacte du caractère (puisque il
s’agit d’intervalles de classes). On va par contre pouvoir utiliser
la définition de la médiane d'après la fonction de répartition.

F
(
x
),
N(x
)
1
0
0%
,N
n
5
0
%,
2

M
e x

55
Chapitre III: caractéristiques de position
Sachant que Me  ei  1 , ei  , car par définition de la médiane,
n
N (ei  1 )   N (ei )
2

n
on a alors:  N (ei  1 )
Me ei  1  (ei  ei  1 ) 2
N (ei )  N (ei  1 )

1
 F (ei  1 )
ou Me ei  1  (ei  ei  1 ) 2
F (ei )  F (ei  1 )

56
Exemple

Remarque
La comparaison de la moyenne arithmétique, de la médiane et du
mode permet de caractériser la forme d’une distribution. 3 cas sont
possibles :
– Distribution parfaitement symétrique : Moyenne=Médiane=Mode
– Distribution étalée vers la droite : Moyenne > Médiane> Mode
– Distribution étalée vers la gauche : Moyenne<Médiane< Mode

57
Chapitre II: caractéristiques de position
3.2 Les quantiles
Les quantiles sont une généralisation de la médiane.
On note Q̂ le quantile d'ordre α%, qui se définit comme la valeur
du caractère telle que α % des individus présentent une valeur
inférieure. Par conséquent, on a
ˆ  ˆ n
F (Q )  ou N (Q ) 
100 100
En particulier, la médiane est le quartile d’ordre 50%, .
Les principales familles de quantiles rencontrées dans la pratique sont
de trois types.
- Les quartiles, au nombre de 3 : Q1, Q2, Q3.
Ils partagent les observations rangées, en 4 sous-ensembles d'effectifs
égaux.

58
Chapitre II: Caractéristiques de position
Ce sont les valeurs de la variable statistique telles que, les
observations étant rangées par ordre croissant, un quart des
observations soient inférieures à Q1, un quart comprises entre Q1
et Q2, un quart comprises entre Q2 et Q3, un quart supérieures à
Q3. On a: ˆ ˆ ˆ
Q1 Q25 Q 2 Q50 Me Q 3 Q75
-Les déciles au nombre de 9 : D1, D2,...,D9. Ils partagent les
observations rangées en 10 sous-ensembles d'effectifs égaux. On a
ˆ ; D Q
D1 Q ˆ ...D Q
ˆ
10 2 20 9 90

- Les centiles au nombre de 99 : C1,C2,...,C99. Ils partagent les


observations rangées en 100 sous-ensembles d'effectifs égaux.

59
Chapitre III: Caractéristiques de dispersion

1- Variance et écart-type
Considérons une distribution : xi, ni, avec i=1,2,...,k et
- Pour une série discrète, xi est la valeur de la variable;
- pour une série continue, xi est le centre de la classe [ei-1;ei[.
La variance de x est :
1 k k
ni
V ( x)   ni xi  x  =  f i ( xi  x ) avec f i 
2 2

N i 1 i =1 N
La variance est la moyenne arithmétique des carrés des écarts à la
moyenne arithmétique de x.

60
Chapitre III: Caractéristiques de dispersion

En faisant la moyenne des ( xi  x ) 2 , elle mesure la façon dont


les xi sont dispersés autour de la valeur centrale x. C'est un
paramètre de dispersion. Dans la pratique, on utilise pour le
calcul de la variance, la formule développée qui s’écrit :

1
V ( x) 
N
 i i
n
i
x 2
 x 2

L'écart-type de x :
1 k k
 ( x)   ni xi  x  
2
 f x  x 
i i
2

N i 1 i 1

61
Chapitre III: Caractéristiques de dispersion
2- Coefficient de variation
L'unité de mesure influence la variance et l'écart-type. De plus l’écart-
type, comme la moyenne, s’exprime dans la même unité que la variable
statistique. Or, on peut avoir à comparer les dispersions de distributions
qui ne sont pas exprimées dans la même unité (distributions de
revenus dans des pays différents, par exemple) ou de distributions dont
les moyennes sont notablement différentes. On doit alors avoir recours
à un caractéristique de dispersion relative. Le coefficient de variation
est défini comme le rapport de l’écart-type à la moyenne :
CV  100
x
Le coefficient de variation est une mesure de la répartition qui décrit la
variabilité par rapport à la moyenne. Dans la mesure où le coefficient
de variation n'a pas d'unité, vous pouvez l'utiliser à la place de l'écart
type pour comparer la répartition des données d'ensembles présentant
des unités ou des moyennes différentes.
62
Chapitre III: Caractéristiques de dispersion
3- Etendue et Intervalles interquantiles
- L'étendue (intervalle de variation)
C’est la différence entre la valeur la plus forte et la valeur la plus
faible de la série. Donc, dans une série rangée par valeur croissante
de la variable, cela correspond à la différence entre la dernière et la
première valeur de la variable. Pour une série continue, il s'agit de
la différence entre la borne supérieure de la dernière classe et la
borne inférieure de la première classe :

w x  x max min

- Les écarts interquantiles (ou intervalles interquantiles)


Ils sont de trois sortes :

63
Chapitre III: Caractéristiques de dispersion

L’écart interquartiles : Q3  Q1 , il contient 50% de l'effectif.

L’écart interdéciles : D9  D1 , il contient 80% de l'effectif.

L’écart intercentiles : C99  C1 , il contient 98% de l'effectif.

Les avantages de l’intervalle interquartile sont la rapidité de son calcul


et la simplicité de sa signification. Par contre, il ne tient compte que
de l’ordre des observations et non de leurs valeurs, et des écarts qui
existent entre elles. En outre, sa détermination n’est pas très précise ;
il ne se prête pas au calcul algébrique : c’est une caractéristique de
dispersion encore très imparfaite qui ne convient qu’à des mesures de
dispersion élémentaires.

64
Chapitre IV: Caractéristiques de concentration
L’étude de la concentration consiste alors à mesurer comment la
valeur globale de la série se répartit entre les individus de la
population.
On appelle valeur globale (ou masse) de la classe i, la quantité nixi,
avec ni effectif de la classe i, et xi centre de la classe i (i=1,2,…,k).
La valeur globale (ou masse) de la série désigne la quantité:
k

n x
i 1
i i

Deux cas extrêmes se présentent :


- Une concentration nulle : tous les individus ont la même part, et
la répartition est parfaitement égalitaire. Cela implique que tous
les individus aient la même valeur de variable.
Une concentration maximale : un seul individu accapare toute la
valeur globale et la répartition est totalement inégalitaire. 65
Chapitre IV: Caractéristiques de concentration
Les principaux paramètres de concentration sont la médiale et
l’indice de Gini.
1- La médiale (Mle)
La médiale est une médiane calculée par rapport aux valeurs
globales relatives, au lieu des fréquences pour la médiane. Il
nous faut calculer les quantités suivantes : la valeur
nx fx
globale relative de la classe i q  
i i i i

n x fx
i k k

i 1 i i

i 1 i i

et
La valeur globale relative cumulée jusqu’à la classe i incluse.
Q  q
i

i j 1 j
66
Moitié de la somme des nix i = 1590/2 = 795
Classe médiale [20-50]

67
Chapitre IV: Caractéristiques de concentration

Si Q (e ) Q ( Mle)  Q (e ) alors la médiale appartient à


i 1 i

l’intervalle e , e  , et elle s’obtient en calculant l’égalité ci-


i 1 i

après :
0.5  Q(e )
Mle e  (e  e ) i 1

Q (e )  Q (e )
i 1 i i 1

i i 1 OU

68
Classei Ci ni fi Fi nici fmi Fmi

0 0

[9,15[ 12 15508,2 59,27 59,27 186098,4 43,41 43,41

[15,19[ 17 6568,5 25,10 84,37 111664,5 26,05 69,46

[19,45[ 32 4090,6 15,63 100 130899,2 30,54 100

Total 0 26167,3 100 0 428662,1 100 0

Ici, xi : salaire horaire représentatif de la classe i


ni : nb d’heures salariées de la classe i
Fi: fréquence cumulative des heures salariées
ni xi = masse salariale distribuée aux salariés de la classe i
fmi: fréquence de la masse salariale
Fmi: Fréquences cumulative des masses salariales
69
Chapitre IV: Caractéristiques de concentration
La médiale est le niveau du salaire horaire qui partage en deux la masse
salariale (c’est à dire que FM(x) = 0,5).
Classe médiale = [15, 19[. Par interpolation linéaire,
Médiale = 15 + (19 – 15)x(50 - 43,4)/26,1 = 16
Remarque : On peut également déterminer la médiale graphiquement, à
partir de la courbe cumulative des masses.
2- La courbe de Lorenz et L’indice de Gini
L’indice de Gini mesure la concentration d'une distribution sur la base
d'une courbe cumulative particulière appelée courbe de concentration.
2-1: La courbe de concentration (courbe de Lorenz)
En abscisses : fréquences cumulées de la variable, i.e. les Fi
⇒ L’axe des abscisses va de 0 à 1 (ou 0 à 100 en %).
En ordonnées : fréquences cumulées de la masse, i.e. les FMi
⇒ L’axe des ordonnées va de 0 à 1 (ou 0 à 100 en %).
La courbe de concentration relie les points (F1, FM1), (F2, FM2), …, (Fk,
FMk).
70
Courbe de Lorenz
Classe Fi Fmi
1.2
0 0 0

Fmi
1
[9,15[ 59,27 43,41 0.8
[15,19[ 84,37 69,46 0.6
0.4
[19,45[ 100 100
0.2
Total 0 0
0
0 0.2 0.4 0.6 0.8 1 1.2

Fi

Diagonale du carré = droite d’équirépartition. Plus la courbe de


Lorenz est éloignée de la diagonale, plus la concentration est forte.
Surface comprise entre la diagonale et la courbe de Lorenz =
indicateur de la concentration de la distribution = surface de
concentration

71
Chapitre IV: Caractéristiques de concentration

L’indice de concentration est une mesure de la dispersion relative utilisée

pour la description de certaines distributions statistiques : distributions

de salaires ou de revenus, distribution d’entreprises suivant leur taille, le

nombre de salariés, etc. Cette caractéristique ne s’applique qu’aux

variables statistiques continues à valeurs positives, ordonnées par valeur

croissante de la variable. Son calcul exige la connaissance, pour chaque

classe, du nombre d’observations (nombre d’individus par exemple) et de

la somme des valeurs correspondantes (masse des salaires par exemple).

72
Chapitre IV: Caractéristiques de concentration
Par ailleurs, l'indice (ou coefficient) de Gini est un indicateur
synthétique d'inégalités de salaire (de revenus, de niveaux de
vie...). Il varie entre 0 et 1. Il est égal à 0 dans une situation
d'égalité parfaite où tous les salaires, les revenus, les niveaux
de vie... seraient égaux. A l'autre extrême, il est égal à 1 dans
une situation la plus inégalitaire possible, celle où tous les
salaires (les revenus, les niveaux de vie...) sauf un seraient nuls.
Entre 0 et 1, l'inégalité est d'autant plus forte que l'indice de
Gini est élevé.

73
Formule de calcul de l’indice de Gini (formule de Brown) :
G = 1−∑ (Fi − Fi-1) (Fmi + Fmi-1)

Classe Fi Fmi Fi-Fi-1 Fmi+Fmi-1 (Fi-Fi-1)(Fmi+Fmi-1)


0 0
[9,15[ 0,59 0,43 0,59 0,43 0,26
[15,19[ 0,84 0,69 0,25 1,13 0,28
[19,45[ 1 1 0,16 1,69 0,26
Total 0 0 0,81
IG 0,19

74
Exemple 2

Tableau 1 : Données financières des industries agro-


alimentaires
Chiffre d'affaires (CA)
Taille (en nombre Nombre
d'employés) d'entreprises
(en millions d’€)
Hors tranche 108 3237,4
[20 ; 50[ 1366 11533,5
[50 ; 100[ 597 11358,6
[100 ; 250[ 510 23525
[250 ; 500[ 208 22038,8
[500 ; 1000[ 161 66035,3
Ensemble 2950 137728,4
75
Taille en nbre Nbre Fréquence Fréquence
employés d'entreprises relative cumulée

ci ni fi Fi
-
10,00 108,00 0,04 0,04
35,00 1 366,00 0,46 0,50
75,00 597,00 0,20 0,70
175,00 510,00 0,17 0,87
375,00 208,00 0,07 0,95
750,00 161,00 0,05 1,00
2 950,00

76
Taille en nbre Nbre Chiffre d'affaires
employés d'entreprises (M€)

ci ni CA niCA niCA cumulé F(niCA)cumulé

-
108,00 349 639,20 349 639,20
10,00 3 237,40 0,01
35,00 1 366,00 11 533,50 15 754 761,00 16 104 400,20 0,32
597,00
75,00 11 358,60 6 781 084,20 22 885 484,40 0,46
175,00 510,00 23 525,00 11 997 750,00 34 883 234,40 0,70
208,00
375,00 22 038,80 4 584 070,40 39 467 304,80 0,79
750,00 161,00 66 035,30 10 631 683,30 50 098 988,10 1,00
2 950,00 137 728,60 50 098 988,10

77
Courbes de Lorenz
1.00

0.90

0.80

0.70
Fréquence cumulée du CA

0.60

Egalitaire
0.50 Lorenz_CA

0.40

0.30

0.20

0.10

-
- 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

Fréquence cumulée du nbre d'entreprises

78
CHAPITRE V: INDICES
Les séries statistiques que I'on a appris à examiner dans les chapitres
précédents sont a priori des séries d'observations simultanées (les
notes de statistique des étudiants d'un groupe, la dépense mensuelle
des étudiants L1, etc.).
Un autre type de données mesure la même grandeur observée à
différentes périodes (le salaire d'un individu, la production d'un
paysan, le PNB d'un pays, etc.).
On peut dès lors étudier l'évolution dans le temps de cette grandeur à
I'aide d'un indice. Les indices synthétiques permettront de donner une
mesure globale de l'évolution simultanée de plusieurs grandeurs, en
particulier dans le cas des prix.
I- Indices élémentaires
A- Définition
On appelle indice élémentaire de la grandeur simple x à la date (ou
période) t, dite date courante, par rapport à la date 0, dite date de
référence, le rapport:
79
CHAPITRE V: INDICES

ll est la plupart du temps exprimé en pourcentage et énoncé en terme de


hausse ou de baisse.
On donnera deux exemple:
- Si le nombre d'abonnés d'un journal passe de 285 000 à 319 200, I'indice
élémentaire du nombre des abonnés vaut :
i = 319 200/285000 = 1,12. Le nombre d'abonnés a été multiplié
par 1,12. On dit, d'une manière équivalente, que le nombre d'abonnés est
en augmentation (ou en hausse) de [(1,12 - 1)x 100], soit 12 %.
- Si le prix du litre d'essence passe de 560 F à 532 F, l'indice du prix de
I'essence vaut: i = 532/560 =0,95
Le prix du litre a été multiplié par 0,95. On dit aussi que le prix est en
baisse (ou diminution) de 5 % car (0,95 - 1) x 100 = - 5

80
CHAPITRE IV: INDICES
B- Propriétés des indices élémentaires
1- circularité (ou transitivité ou transférabilité)

Cette formule permet de changer de base en passant de la date de


référence 0 à la date de référence :

L’utilisateur a en effet souvent besoin de mesurer l’évolution d’une


grandeur entre deux dates différentes de la date de référence.
De cette propriété, résulte la propriété d’enchainement:

81
2) Réversibilité

Cette propriété est intéressante dans le cas de comparaison


géographique, car le choix du lieu de référence est arbitraire.
3) Multiplication
Si une grandeur simple z est le produit de deux grandeurs x et y,
l’indice élémentaire de la grandeur produit est égal au produit des
indices des grandeurs facteurs:
Quel que soit t:
Cas particulier fondamental:

Cette égalité entraine:


Indice élémentaire de valeur = Indice élémentaire de prix x Indice
élémentaire de quantité

82
CHAPITRE IV: INDICES
II-Les indices synthétiques
Un indice synthétique rend compte de l’évolution simultanée de
plusieurs variables par un nombre unique. Ces variables
correspondent aux différents composants de l’indice.
Soit n séries chronologiques x0i , x1i , x2i ,..., xti :
avec i=1,2,…,n, et l’on cherche à représenter ces n séries par
un indice unique. La méthode de construction d’un indice
synthétique revient à effectuer le calcul en deux étapes qui
consistent, dans un premier temps, à calculer pour chaque
variable un indice élémentaire i
x
avec i=1,2,…,n
i
I  .100
t

x
t /0 i

83
CHAPITRE IV: INDICES
puis dans un second temps, à faire une moyenne pondérée des
indices élémentaires. On note wi la pondération du
composant i, et en retenant une moyenne arithmétique pour
le calcul de l’indice, on obtient :
wI 
i

I S i i t /0

w
t /0

i i

84
CHAPITRE IV: INDICES
Indices de Laspeyres , de Paasche et de Fisher
Considérons n biens i, avec i=1,2,…,n, on notera : p : le prix
i

du bien i à la date t ; q : la quantité (fabriquée, vendue,


i

achetée) du bien i à la date t ; v  p q i

t
i

t
la valeur du
i

bien i à la date t.
On remarque que la somme ,  v  p q est la valeur
i i i

t i t t

globale à la date t. Dans le cas où on a affaire à des


consommations, v i

t
s’appelle le coefficient budgétaire

i
v i

du bien i à la date t.

85
-Indice de Laspeyres
La définition générale d’un indice de Laspeyres le présente comme une
moyenne arithmétique pondérée d’indices élémentaires. Les
pondérations sont invariables dans le temps et calculées à l’époque de
base. En général, on pondère par les valeurs à l’époque de base.
 pti 
Indice des prix de Laspeyres : i p q  p i
i
0
i
0
  pti q0i
LPt/ 0   0   i
 0 q0
p i i

i
 0 q0
p i i

 pq
en notation allégée  t 0

 pq
0 0

q  i

 pq   i i t

q   pq
i


0 0 i

Indice des quantités de Laspeyres : L 


Q
 0 i 0 t

 pq  pq
t /0 i i

i 0 0 i 0 0
86
•Indice de Paasche
Il se définit comme une moyenne harmonique pondérée d’indices
élémentaires. Les pondérations sont variables dans le temps et
calculées à l’époque courante. En général, on pondère par les valeurs à
l’époque courante.  pq  pq
i i

Indice des prix de Paasche : P  P


 i t t t t

p pq
t /0 i

 pq  i i 0 0 t

p
i t t i

pq  pq 
i i

P Q
 i t t t t

Indice des quantités de Paasche : t /0

 q  q p i

 pq   i i 0 0 t

q 
i t t i

En pratique, les indices L et P sont exprimés en base 100 donc on


multiplie par le facteur 100 les résultats des différentes formules.

87
CHAPITRE 3: LES INDICES
- Indice de Fisher
C’est une moyenne géométrique simple des indices de Laspeyres
et de Paasche.
• Indice de Fisher pour les prix :
F  L P
P

t /0
P

t /0
P

t /0

• Indice de Fisher pour les quantités :


F  L P
Q

t /0
Q

t /0
Q

t /0

88
k produit p0 q0 p1 q1 p0 q0 p1 q1 p1 q0 p0 q1
1 Pain 100 50 125 55 5000 6875 6250 5500
2 Huile 50 40 75 30 2000 2250 3000 1500
3 Beure 60 25 66 25 1500 1650 1650 1500
4 Sucre 20 300 21 310 6000 6510 6300 6200
Total 14500 17285 17200 14700

Indice de LASPEYRES PRIX p1 q0 k k


k1
17200 1,186
4
14500

k1
p0k q0k
4

Indice de  p1k q1k


PAASCHE
k 1
17285 1,176 Indice de
k 14700
4
FISCHER PRIX
PRIX  p0k q1
k 1
118,6 * 117 ,6 = 1,181
89
JE VOUS REMERCIE

90

Vous aimerez peut-être aussi