Statistique descriptive
&
Probabilité
Chapitre III.
Statistique
à une variable
Prof. A. Bassir
Sommaire du chapitre III.
I. Historique
II. Généralités
III. Objet de la statistique
IV. Vocabulaire statistique
V. Représentation Graphique
VI. Valeurs typiques des séries statistiques
I. Historique
Depuis les temps, les plus anciens chez les grecs et les
égyptiens, on faisait des statistiques qui consistaient à faire un
dénombrement, ou un inventaire des personnes et de biens
Les statistiques dans le sens actuel, n’ont pu être
développé qu’à partir des calculs de probabilité mis aux points
par Pascal, Bernouilli et Laplace-Gauss. Ces calculs ont
donné une base théorique aux statistiques.
I. Historique
Actuellement, dans tous les domaines, aussi bien
économique, industriel,…. que biologique et médical, il devient
nécessaire d’utiliser les Statistiques
II. Généralités
Lorsqu’on cherche à évaluer un ou plusieurs
caractères d’une population relativement nombreuse, on
doit se contenter d’observer ou de mesurer ces caractères
sur un échantillon de cette population,
c'est-à-dire sur un sous ensemble de la population de taille
réduite en sorte que l’on puisse effectivement faire les relevés
que l’on désire.
II. Généralités
Pour étudier statistiquement un phénomène, il faut
faire un certain nombre d’observations.
La liste de ces renseignements s’appelle une série
statistique.
III. Objet de la statistique
1. Le but de la statistique
Les Statistiques consiste à recueillir des informations ou
des données numériques qui nous permettent de suivre un
phénomène et de voir son évolution dans le temps, dans le but
de prévoir l’avenir
III. Objet de la statistique
Exemples
Nombres de naissances par an dans un pays
Nombres de véhicules mis en circulation par an
III. Objet de la statistique
La Statistique est une méthode de calculs qui, appliquée à
des données obtenus à partir d’enquêtes ou de mesures
effectuées sur un petit groupe permet de :
prévoir des comportements globaux
établir des lois sur des phénomènes qui ne sont pas
identiquement reproductibles
chercher des relations ou des corrélations entre des
phénomènes
III. Objet de la statistique
Pour cela, il faut:
i. Présenter les données statistiques sous forme de tableaux ou
de graphiques : Diagramme en bâton, Histogramme, Courbes
cumulatives.
ii. Analyser ces données qui consiste à résumer un tableau à
l’aide d’un petit nombre de valeurs caractéristiques :
Les valeurs caractéristiques de position (de tendance centrale) :
mode, médiane, moyenne
Les valeurs caractéristiques de dispersion : variance, écart-type,
moments, moments centrés
Paramètres de forme : coefficients de dissymétries et
d’aplatissements
III. Objet de la statistique
Cette statistique utilise des repères de référence qui sont
les modèles théoriques (lois de probabilités)
Cette statistique nécessite la recherche d'échantillons qui
représentent le mieux possible la diversité de la population entière
il est nécessaire qu'ils soient constitués au hasard
on dit qu'ils résultent d'un tirage non exhaustif.
IV. Vocabulaire statistique
1. Population
a. Définition
Ensemble sur lequel va porter l’étude statistique.
b. Exemples
Les salariés d'une entreprise
L’ensemble des malades atteints d’une maladie
Les véhicules automobiles immatriculés au Maroc
IV. Vocabulaire statistique
2. Individu
Définition:
un « Objet » ou « Unité » statistique, pris dans une population
donnée.
Il ne faut pas prendre population et individus au sens biologique
de ce mots
IV. Vocabulaire statistique
3. Echantillon
a. Définition
Un groupe d’individus qui appartiennent à la même
population.
Un sous-ensemble de la population.
IV. Vocabulaire statistique
b. Intérêt de travailler sur un échantillon
Temps d’exécution rapide
Le travail serait plus long si l’on veut étudier tous les individus de
la poulation
Coût de l’opération peu élevé
Efficacité dans la prise des décisions
IV. Vocabulaire statistique
Exemple : En cas d’épidémie :
Si on ne prend pas des décisions rapidement :
vaccination,
approvisionnement en médicaments des centres de
santé,
…
les conséquences de l’épidémie peuvent être graves
IV. Vocabulaire statistique
c. Inconvénient d’un échantillon
Les résultats sont peu précis car la masse
de renseignements est peu importante
Les résultats seront d’autant moins précis
que l’échantillon est petit
IV. Vocabulaire statistique
d. Représentativité
Il est indispensable que l’échantillon soit représentatif de
la population
Pour cela, il faut utiliser la méthode du hasard, ou tirage au
sort pour le choix des individus de l’échantillon
chaque individu doit avoir les mêmes chances
d’appartenir à l’échantillon
IV. Vocabulaire statistique
Un échantillon représentatif de la population
étudiée est une partie de cette population qui
reflète en mieux la structure de la population
Si dans la population étudiée il y a 60%
de femmes et 40% d’hommes, alors l’échantillon
doit comprendre les mêmes proportions
IV. Vocabulaire statistique
4. Caractère
La particularité à laquelle on s’intéresse pour effectuer une étude statistique
a. Un caractère est dit quantitatif s’il est mesurable :
taille,
poids,
âge,
taux de glucose,
…
b. Un caractère est dit qualitatif s’il est repérable sans être mesurable:
sexe,
nationalité,
profession,
couleur de cheveux,
IV. Vocabulaire statistique
5. Modalités
Ce sont les différentes situations possibles du caractère.
Tout individu doit présenter une et une seule modalité.
IV. Vocabulaire statistique
• Les modalités d'un caractère qualitatif sont les différentes
rubriques d'une nomenclature
• celles d'un caractère quantitatif sont les mesures de ce
caractère (un nombre entier discret pris parmi un ensemble
limité)
Exemple : Le nombre d'enfants d'une famille (fratrie)
V. Représentation Graphique
1. Données brutes
2. Fréquence
3. Représentation Graphique
V. Représentation Graphique
1. Données brutes
On appelle données brutes des données que l’on a
rassemblées sans se soucier de la notion d’ordre
Lorsqu’on veut résumer une grande quantité de
données brutes, il est commode de les distribuer
en classes ou catégories et de déterminer le
nombre d’individus appartenant à chaque classe,
que l’on appelle fréquence ou effectif de la
classe.
V. Représentation Graphique
2. Fréquence
On appelle fréquence, l’effectif partiel dans une
catégorie divisé par l’effectif total
𝑛𝑖 𝑛𝑖
𝑓𝑖 = =
𝑛𝑖 𝑁
𝑁= 𝑛𝑖 effectif total
𝑛𝑖 effectif partiel
𝑓𝑖 fréquence relative de modalité
V. Représentation Graphique
𝑛𝑖
𝑓𝑖 = =1
𝑁
et
0 ≤ 𝑓𝑖 ≤ 1
V. Représentation Graphique
Exemple :
Nombre d’enfants par 0 1 2 3 4
famille (𝑥𝑖 )
Nombre de familles (𝑛𝑖 ) 5 10 30 35 20
𝑵= 𝑛𝑖 = 𝟏𝟎𝟎
Fréquence (𝑓𝑖 ) 0,05 0,1 0,3 0,35 0,2
𝒇𝑖 = 𝟏
V. Représentation Graphique
3. Représentation Graphique
a. Définition
La représentation graphique des données relatives à
un caractère unique repose sur la proportionnalité
des longueurs, ou des aires, des graphiques, aux
effectifs, ou aux fréquences, des différentes
modalités du caractère
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
Se dit d’une variable :
aléatoire ou statistique (ou caractère) dont les valeurs
possibles, souvent appelées dans ce cas « modalités »,
sont des éléments d’un ensemble sur lequel on ne peut
pas effectuer d’opération mathématique (addition
notamment).
Il arrive néanmoins qu’un codage d’une variable
qualitative donne à ses modalités l’apparence de
nombres
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
C’est un caractère non mesurable et par conséquent
il ne peut pas être traduit graphiquement
Exemples :
Couleur de cheveux
Sexe (Masculin – Féminin), c’est un caractère
dichotomique (2 catégories ou 2 modalités).
Situation familiale (célibataire – Marié – Veuf – divorcé),
caractère qualitatif à plusieurs modalités (4 catégories).
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
Pour des variables qualitatives discrètes, la
représentation se fait par une surface rectangulaire
ou circulaire
Chaque portion de la surface est proportionnelle à
un des effectifs partiels
c’est le graphique à secteurs
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
Chaque modalité 𝑥𝑖 est représentée par un secteur dont
𝑛𝑖
l’angle vaut 2 π .
𝑛
𝒏𝟏
𝒏𝟐
𝒏𝟑
𝒏𝟒
𝒏𝟓
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
Les diagrammes circulaires, ou semi-circulaires,
consistent à partager un disque ou un demi-disque,
en tranches, ou secteurs, correspondant aux
modalités observées et dont la surface est
proportionnelle à l'effectif, ou à la fréquence, de la
modalité
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret
Un caractère discontinu
Ses modalités sont des valeurs isolées
Et on peut le traduire graphiquement par un
diagramme en bâton.
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret
Nous portons en abscisse les modalités, de façon
arbitraire.
Nous portons en ordonnée des segments dont la
longueur est proportionnelle aux effectifs (ou aux
fréquences) de chaque modalité.
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret
Nous appelons polygone statistique, ou
diagramme polygonal, la ligne obtenue en
joignant les sommets des bâtons.
Exemples :
nombre d’enfants d’une famille
nombre d’appartement d’une copropriété
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret
Exemple :
Nombre d’enfants par
famille Variable (𝒙𝒊 ) 1 2 3 4 5 6
Nombre de familles ou
20 40 30 10 5 1
effectif (𝒏𝒊 )
Effectif cumulé croissant
20 60 90 100 105 106
𝒏𝒊
Fréquence cumulée 20/106 60/106 90/106 100/106 105/106 106/106
croissante 𝒇𝒊
0,189 0,566 0,85 0,94 0,99 1
Effectif cumulé
106 86 46 16 6 1
décroissant 𝒏𝒊
Fréquence cumulée 106/106 86/106 460/106 16/106 6/106 1/106
décroissante 𝒇𝒊
1 0,811 0,434 0,151 0,056 0,009
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue
Un caractère est dit continu : si ses modalités sont
a priori n’importe quel élément d’un intervalle de 𝐼𝑅
Pour étudier un caractère quantitatif continu, on
effectue un regroupement par classes.
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue
Pour cela il faut définir :
L’intervalle de la classe : tous les intervalles sont
égaux
Les limites de la classe : 𝑋𝑖 ≤ 𝑡 ≤ 𝑋𝑖+1
(𝑋𝑖 + 𝑋𝑖+1 )
Le centre de la classe : 𝐶𝑖 =
2
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif discret
Exemple :
Intervalle de Centre de Effectif Fréquence Fréquence
la classe la classe 𝑪𝒊 partiel 𝒏𝒊 𝒇𝒊 cumulée
croissante
1,40 – 1,50 1,45 2 0,1 0.1
1,50 - 1,60 1,55 3 0,15 0,1+0,15=0,25
1,60 - 1,70 1,65 7 0,35 0,25+0,35=0,60
1,70 - 1,80 1,75 5 0,25 0,6+0,25=0,85
1,80 - 1,90 1,85 3 0,15 0,85+0,15=1
𝑁 = 𝑛𝑖 = 20 Effectif total
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue
Le diagramme représentatif s’appelle un
Histogramme
Il peut être représenté en effectifs ou en
fréquences
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue
Remarques :
Si l’intervalle de classe est grand, les calculs
seront réduits mais on perd les informations
et les résultats risquent d’être grossiers
Si l’intervalle de classe est trop petit, les
calculs seront nombreux mais les résultats
seront plus précis
VI. Valeurs typiques des séries statistiques
1. Moyenne, médiane, mode et d’autres
mesures de tendance centrale
Objectif
Les paramètres de position (mode, médiane,
moyenne) permettent de savoir autour de
quelles valeurs se situent les valeurs d'une
variable statistique
VI. Valeurs typiques des séries statistiques
1. Moyenne
La moyenne arithmétique d’un ensemble de 𝑁 nombres 𝑥1 ,
𝑥2 , …, 𝑥𝑛 (données non groupées) est définie par:
N
x
j 1
j
x1 x 2 ...... x N
MA X
N N
Cas général : On calcule la moyenne arithmétique pondérée par les
effectifs partiels (données groupées) N
n x j j N
f jxj
j 1
X N
n j 1
j
j 1
Cas d’une variable continue : n C j j N
f jC j
j 1
X N
n j 1
j
j 1
VI. Valeurs typiques des séries statistiques
Remarque :
Un grand inconvénient de la moyenne arithmétique
est d’être très sensible aux valeurs extrêmes.
VI. Valeurs typiques des séries statistiques
Moyenne quadratique
Moyenne géométrique
Moyenne harmonique
VI. Valeurs typiques des séries statistiques
Remarque
est la moyenne arithmétique des 𝑥𝑗2
est la moyenne arithmétique des 𝐿𝑛(𝑥𝑗)
1
est la moyenne arithmétique des
𝑥𝑗
VI. Valeurs typiques des séries statistiques
Remarque :
Pour une variable statistique X, les différentes moyennes, harmonique sont
liées par la relation :
𝐻≤𝐺≤ 𝑋≤𝑄
Il y a égalité si, et seulement si, toutes les valeurs de X sont égales
La moyenne géométrique est bien adaptée à l'étude des
phénomènes de croissance.
La moyenne harmonique est utilisée pour les calculs d'indices
économiques
VI. Valeurs typiques des séries statistiques
Exemple:
L’ensemble 2,4,8 a pour moyennes :
Arithmétique 𝑋=4,67
Géométrique 𝐺=4
Harmonique 𝐻 = 3,43
Quadratique 𝑄 = 5,29
𝐻 = 3,43 ≤ 𝐺 = 4 ≤ 𝑋 = 4,67 ≤ 𝑄 = 5,29
VI. Valeurs typiques des séries statistiques
Exercice 1:
Les salaires annuels de quatre employés sont
respectivement de 5000, 6000, 6500 et 30000 DH.
a) Quelle est la moyenne arithmétique de leurs salaires ?
b) Peut-on dire que cette moyenne est représentative des
salaires ?
VI. Valeurs typiques des séries statistiques
Solution 1:
a) La moyenne arithmétique :
5000 + 6000 + 6500 + 30000
𝑋= = 11875
4
b) La moyenne de 11875 DH n’est certainement pas
représentative des salaires
Présenter ce résultat comme un salaire moyen serait une
erreur grossière
Ainsi, un grand inconvénient de la moyenne arithmétique est
d’être très sensible aux valeurs extrêmes
VI. Valeurs typiques des séries statistiques
2. Médiane - Placée au milieu
Pour éliminer le rôle des valeurs aberrantes (trop petites ou
trop grandes) : un autre paramètre de position la médiane
En statistique : valeur qui sépare une série statistique en deux
groupes égaux
VI. Valeurs typiques des séries statistiques
Cas d’une variable discrète :
Supposons les 𝑛 observations ordonnées :
Si 𝑛 est impair, 𝑛 = 2𝑝 + 1 alors 𝑀𝑒 = 𝑥𝑝+1
C’est la valeur du milieu
𝑥𝑝 +𝑥𝑝+1
Si 𝑛 est pair, 𝑛 = 2𝑝 alors 𝑀𝑒 =
2
C’est la moyenne arithmétique des valeurs centrales
VI. Valeurs typiques des séries statistiques
Exemple :
L’ensemble des nombres : 3, 4, 4, 5, 6, 8, 8, 8, 1 a pour médiane 6
L’ensemble des nombres : 5, 5, 7, 9, 11, 12, 15, 18 a pour médiane
𝟏
𝟗 + 𝟏𝟏 = 𝟏𝟎
𝟐
VI. Valeurs typiques des séries statistiques
Cas d’une variable continue :
Pour des données groupées, la médiane obtenue par l’interpolation
est :
𝑁
− 𝑓 1
𝑀é𝑑𝑖𝑎𝑛𝑒 = 𝐿1 + 2 .𝑐
𝑓𝑚é𝑑𝑖𝑎𝑛𝑒
𝐿1 : borne inférieur de la classe médiane
𝑁 : effectif total
𝑓 1 : somme des effectifs relatifs à toutes les classes inférieures à la
classe médiane
𝑓𝑚é𝑑𝑖𝑎𝑛𝑒 : effectif de la classe médiane
𝑐 : dimension de l’intervalle contenant la classe médiane
VI. Valeurs typiques des séries statistiques
3. Mode
Est la valeur correspondant quantitativement à la population la plus
dense (plus grande fréquence)
Est noté Mo
Pour une variable quantitative continue, nous parlons de classe
modale : c'est la classe dont la densité de fréquence est
maximum
VI. Valeurs typiques des séries statistiques
A partir d’une distribution d’effectifs ou d’un histogramme, on peut
obtenir le mode par la formule suivante :
∆1
𝑀𝑜𝑑𝑒 = 𝐿1 + .𝑐
∆1 + ∆2
𝐿1 : borne inférieur de la classe modale (classe contenant le mode)
∆1 : excédent d’effectif de la classe modale par rapport à l’effectif de la
classe inférieure la plus proche
∆2 : excédent d’effectif de la classe modale par rapport à l’effectif de la
classe supérieure la plus proche
𝑐 : taille de l’intervalle contenant la classe modale
VI. Valeurs typiques des séries statistiques
Remarques :
Lorsque les classes adjacentes à la classe modale ont des
densités de fréquences égales, le mode coïncide avec le centre
de la classe modale
Une variable statistique peut présenter plusieurs modes locaux :
on dit alors qu'elle est plurimodale.
Cette situation est intéressante : elle met en évidence l'existence de
plusieurs sous-populations, donc l'hétérogénéité de la population
étudiée.
VI. Valeurs typiques des séries statistiques
4. Relation empirique entre la moyenne,
la médiane et le mode
Pour des courbes de densité unimodale modérément asymétrique,
on a la relation empirique suivante :
Moyenne – Mode = 3 (Moyenne – Médiane)
Les figures (a) et (b) montrent les positions relatives de la moyenne,
la médiane et du mode pour des courbes de densité qui
s’aplatissent légèrement soit à droite, soit à gauche.
Dans le cas de courbes symétriques la moyenne, le mode et la
médiane coïncident.
VI. Valeurs typiques des séries statistiques
5. Quartiles, Déciles, Centiles
Concrètement le quantile d’ordre 𝛼 est la valeur qui partage la
série des valeurs en deux parties de fraction 𝛼 et 1 − 𝛼 de
l’effectif total
Certains quantiles portent des noms spécifiques :
quartiles
déciles
centiles
VI. Valeurs typiques des séries statistiques
5. Quartiles, Déciles, Centiles
a. Si un ensemble de nombre est rangé par ordre de grandeur
croissant, le nombre du milieu (ou la moyenne des nombres
centraux) divisant l’ensemble en deux parties égales est la
médiane
b. Par extension, on peut penser aux valeurs qui divisent
l’ensemble en quatre???? parties égales: 𝑸𝟏 , 𝑸𝟐 et 𝑸𝟑
VI. Valeurs typiques des séries statistiques
5. Quartiles, Déciles, Centiles
Le premier quartile (ou quartile inférieur) 𝑸𝟏 :
est la valeur de la variable qui correspond à 25% des effectifs
cumulés croissants
Le troisième quartile (ou quartile supérieur) 𝑸𝟐 :
est la valeur de la variable qui correspond à 75% des effectifs
cumulés croissants
Le deuxième quartile 𝑸𝟑 :
n’est autre que la médiane
VI. Valeurs typiques des séries statistiques
5. Quartiles, Déciles, Centiles
On appelle Déciles les valeurs qui divisent les données en 10
parties égales
Ils sont notés 𝐷1 , 𝐷2 , ..., 𝐷9 et correspondent à 10% , 20%, ...,
90% des effectifs cumulés croissants
On appelle quartiles d’ordre 100 ou Centiles les valeurs
divisant les données en 100 parties égales
Ils sont notés 𝑃1 , 𝑃2 , ..., 𝑃99 et correspondent à 1% , 2%, ..., 99%
des effectifs cumulés croissants
VI. Valeurs typiques des séries statistiques
6. L’écart-type et les autres mesures de
dispersion
Définition
Outre la tendance centrale, il est intéressant de
connaître à propos d’une distribution, dans quelle mesure les
diverses valeurs sont groupées autour de la moyenne
On peut rendre compte de cette dispersion de plusieurs
façons dont la plus courante est le calcul de l’écart-type
VI. Valeurs typiques des séries statistiques
Un ensemble de données numériques tend généralement à
s’étaler autour d’une valeur centrale, que l’on appelle dispersion
ou variabilité des données
Il existe plusieurs mesures de dispersion. Les plus courantes
sont:
a. l’étendue
b. l’écart moyen
c. la demi distance inter- quartile
d. la distance entre le 10ème et le 90ème Centile appelée
écart inter centiles
e. Moments et moments centrés
f. l’écart – type
VI. Valeurs typiques des séries statistiques
6. L’écart-type et les autres mesures de
dispersion
a. L’étendue
Est l’écart entre ses valeurs extrêmes
Est une caractéristique de dispersion médiocre car elle est
trop sensible aux valeurs aberrantes (erronées ou
exceptionnelles)
VI. Valeurs typiques des séries statistiques
b. L’écart moyen où l’écart à la moyenne
L’écart moyen (EM) d’un ensemble de nombres
𝑥1 , 𝑥2 , …, 𝑥𝑛 est définie par :
𝟏 𝑵
𝑬𝑴 = 𝒋=𝟏 |𝒙𝒋 − 𝑿|
𝑵
où 𝑋 est la moyenne arithmétique des nombres
VI. Valeurs typiques des séries statistiques
b. L’écart moyen où l’écart à la moyenne
Si 𝑥1 , 𝑥2 , …, 𝑥𝑛 ont les fréquences respectives
𝑓1 , 𝑓2 , …, 𝑓𝑛 d’apparition, l’écart moyen s’écrit :
𝟏 𝑵
𝑬𝑴 = 𝒇𝒋 |𝒙𝒋 − 𝑿|
𝑵 𝒋=𝟏
où 𝑁 = 𝑓𝑗
Cette formule est utile pour des données groupées, les
𝑥𝑗 représentant les centres des classes et 𝑓𝑗 les effectifs de
la 𝑗 è𝑚𝑒 classe
VI. Valeurs typiques des séries statistiques
c. Intervalle interquartile ou écart des quartiles
L’intervalle interquartile 𝑄 d’un ensemble des
données est défini par :
𝑸 = 𝑸𝟑 − 𝑸𝟏
où 𝑸𝟏 et 𝑸𝟑 sont le premier et le troisième quartile des données
il englobe donc une partie médiane de la
distribution de probabilité 0,5 ou (en statistique) de
50% de l’effectif total
VI. Valeurs typiques des séries statistiques
c. Intervalle interquartile ou écart des quartiles
Si, pour un ensemble de données, 𝑸𝟏 et 𝑸𝟑 sont
données :
1
(𝑸𝟑 + 𝑸𝟏 ) est une mesure de la tendance centrale
2
ou de la moyenne de ces données
1
(𝑸𝟑 − 𝑸𝟏 ) , qui est l’intervalle semi-interquartile, est une
2
mesure de leur dispersion.
VI. Valeurs typiques des séries statistiques
Par suite, on peut définir une mesure de la
dispersion relative par :
𝑸𝟑 − 𝑸 𝟏
𝑉𝑄 =
𝑸𝟑 + 𝑸 𝟏
Que l’on peut appeler :
le coefficient de variation interquartile OU
le coefficient de dispersion interquartile relative
VI. Valeurs typiques des séries statistiques
d. Ecart interdécile et intercentile
Ecart interdécile
Est un indicateur de dispersion attaché à une variable
aléatoire réelle
Est Utilisé essentiellement en statistique
Est l’écart entre le premier décile et le dernier décile
Englobe donc une partie médiane de la distribution de
80% de l’effectif total
𝑫𝟗 − 𝑫𝟏
VI. Valeurs typiques des séries statistiques
Ecart intercentile
Est l’écart entre le premier centile et le dernier centile
Englobe donc une partie médiane de la distribution de
98% de l’effectif total
𝑷𝟗𝟗 − 𝑷𝟏
VI. Valeurs typiques des séries statistiques
e. Moments, moments centrés
Moment
Les moments sont une autre caractéristique de
dispersion
On appelle moment d’ordre 𝑟 du caractère 𝑋 :
𝑵
𝟏
𝒎𝒓 𝑿 = 𝑬 𝑿 𝒓
= 𝒙𝒓𝒊
𝑵
𝒊=𝟏
VI. Valeurs typiques des séries statistiques
Moment centré
Les moments sont une autre caractéristique de
dispersion
On appelle moment centré d’ordre 𝑟 du caractère 𝑋 :
𝑵
𝟏
𝝁𝒓 𝑿 = 𝑬 (𝑿 − 𝑿)𝒓 = (𝒙𝒊 − 𝑿)𝒓
𝑵
𝒊=𝟏
C’est la généralisation de la variance où 𝑟 est un
entier positif
VI. Valeurs typiques des séries statistiques
e. Moments, moments centrés
Moment centré
On a :
𝒎𝟎 = 𝟏 et 𝝁𝟎 = 𝟏
𝒎𝟏 = 𝑿 et 𝝁𝟏 = 𝟎
𝒎𝟐 = 𝝈𝟐 + 𝑿𝟐 et 𝝁𝟐 = 𝝈𝟐
Si la distribution est symétrique, les moments centrés
d’ordre impair sont nuls
VI. Valeurs typiques des séries statistiques
f. Ecart type
Si un caractère numérique 𝑋 défini sur un ensemble
fini Ω = 𝑥1 , 𝑥2 , …, 𝑥𝑛
Les valeurs prises par 𝑋 peuvent être plus ou moins
dispersées, c'est-à-dire plus ou moins éloignées les
unes des autres
On se propose de mesurer cette dispersion au moyen
d’un paramètre de dispersion
VI. Valeurs typiques des séries statistiques
f. Ecart type
Un tel paramètre peut être choisi de bien des façons
Le plus utilisé est la variance du caractère 𝑋
Ce nombre, que nous noterons V(𝑋) , est la moyenne
du caractère 𝑋 − 𝑚 2
On a donc :
𝐕 𝑿 = 𝑬| 𝑿 − 𝒎 𝟐 |
VI. Valeurs typiques des séries statistiques
f. Ecart type
Et, en vertu de la linéarité de l’opérateur :
𝐕 𝑿 = 𝑬 𝑿 𝟐 − 𝟐𝒎𝑬 𝑿 + 𝑴𝟐 = 𝑬 𝑿𝟐 − 𝒎𝟐
Théorème de Konig
Ce résultat s’écrit encore :
𝐕 𝑿 = 𝑬 𝑿𝟐 − 𝑬𝟐 𝑿
VI. Valeurs typiques des séries statistiques
f. Ecart type
On appelle aussi variance le moment centré d’ordre 2:
𝐕 𝑿 = 𝝁𝟐
Il est l’analogue du théorème de mécanique sur les
moments d’inertie :
Le moment d’inertie par rapport à l’origine (ie
𝑬(𝑿𝟐 )) est égal à la somme du moment d’inertie autour
du centre de gravité (𝐕 𝑿 ) et du moment d’inertie de la
masse total (c’est à dire 1) placé au centre de gravité, par
rapport à l’origine (c’est à dire 𝑬𝟐 𝑿 )
VI. Valeurs typiques des séries statistiques
On remarquera que, si 𝑋 est la mesure d’une
grandeur physique exprimée dans un système
d’unités, la moyenne 𝑚 mesure encore la même
grandeur physique dans le même système d’unités
2
Il n’en est pas de même de 𝑋 − 𝑚 et, par suite, de
V(𝑋)
si 𝑋 est une grandeur exprimée en mètres, V(𝑋) est une
surface exprimée en mètres carrés
VI. Valeurs typiques des séries statistiques
Pour avoir un paramètre de dispersion qui mesure la
même grandeur physique que 𝑋 , on introduit alors la
racine carrée (𝑉(𝑋) que l’on appelle l’écart-type
(ou écart quadratique moyen) du caractère 𝑋
On appelle écart-type d’une variable aléatoire 𝑋
l’écart moyen quadratique par rapport à
l’espérance mathématique
VI. Valeurs typiques des séries statistiques
On définit l’écart-type 𝜎 d’un ensemble de 𝑁 nombres 𝑥1 ,
𝑥2 , …, 𝑥𝑁 par :
𝑵 𝟐
𝝈= 𝒋=𝟏 𝒙𝒋 − 𝑿 /𝑵
L’écart-type 𝜎 est la racine carré des écarts à la moyenne,
où comme on l’appelle quelque fois, la racine carré de la
variance 𝝈 = 𝑽(𝑿)
Plus 𝜎 est petit, plus les observations sont groupées
Plus 𝜎 est grand, plus la dispersion est grande
VI. Valeurs typiques des séries statistiques
7. Paramètres de forme
a. Coefficients de dissymétrie
Une fois la tendance et la dispersion déterminées, on
peut se proposer d’étudier l’asymétrie et l’aplatissement
d’une distribution statistique
Pour des distributions dissymétriques, la moyenne a
tendance à se trouver du même côté du mode que l’extrémité
la plus allongée de la courbe de fréquence
(voir figures a et b)
VI. Valeurs typiques des séries statistiques
a. Coefficients de dissymétrie
On peut ainsi mesurer la dissymétrie au moyen de la
différence (moyenne - mode)
Celle-ci peut être prise sans dimension en divisant par une
mesure de la dispersion telle que l’écart-type
𝒎𝒐𝒚𝒆𝒏𝒏𝒆−𝒎𝒐𝒅𝒆 𝑿−𝑴𝟎
Ce qui conduit à la définition : 𝑷𝟏 = =
é𝒄𝒂𝒓𝒕 −𝒕𝒚𝒑𝒆 𝝈
1er coefficient de dissymétries de Pearson
VI. Valeurs typiques des séries statistiques
a. Coefficients de dissymétrie
Pour éviter d’utiliser le mode, on peut employer la formule
empirique :
𝒎𝒐𝒚𝒆𝒏𝒏𝒆 − 𝒎𝒐𝒅𝒆 = 𝟑. (𝒎𝒐𝒚𝒆𝒏𝒏𝒆 − 𝒎é𝒅𝒊𝒂𝒏𝒆)
𝟑.(𝒎𝒐𝒚𝒆𝒏𝒏𝒆−𝒎𝒐𝒅𝒆) 𝟑.(𝑿−𝑴𝒆 )
et définir : 𝑷𝟐 = =
é𝒄𝒂𝒓𝒕 −𝒕𝒚𝒑𝒆 𝝈
2ème coefficient de dissymétries de Pearson
VI. Valeurs typiques des séries statistiques
a. Coefficients de dissymétrie
Il existe d’autres mesures de la dissymétrie que l’on définit en
fonction des quartiles et des centiles de la manière suivante :
Coefficient quartile de dissymétrie :
𝑄3 − 𝑄2 − 𝑄2 − 𝑄1 𝑄1 + 𝑄3 − 2𝑀𝑒
𝑌= =
𝑄3 − 𝑄1 𝑄3 − 𝑄1
Coefficient de dissymétries de Yule
Coefficient centile 10-90 de dissymétrie :
𝑃90 − 𝑃50 − 𝑃50 − 𝑃10 𝑃90 − 2𝑃50 + 𝑃10
=
𝑃90 − 𝑃10 𝑃90 − 𝑃10
VI. Valeurs typiques des séries statistiques
a. Coefficients de dissymétrie
Si les moments centrés d’ordre impairs (𝜇𝑟 ) sont nuls, alors
la distribution est dite symétrique
Sir Ronald FISHER a donc proposé un coefficient
d’asymétrie, en s’en tenant au premier moment impair
puisque 𝜇1 est toujours nul
VI. Valeurs typiques des séries statistiques
a. Coefficients de dissymétrie
Une mesure de la dissymétrie très fréquente utilise le
troisième moment autour de la moyenne (moment centré
d’ordre 3)
𝝁𝟑
Elle est donnée par : 𝑭𝟏 = 𝒂 𝟑 =
𝝈𝟑
Coefficient de dissymétrie de Fischer
Fig
VI. Valeurs typiques des séries statistiques
Remarques
Tous ces coefficients sont :
Nuls si la distribution est parfaitement symétrique comme la
loi normale
Positifs, si la distribution statistique présente un élément
plus net à droite
Négatifs, si l’étalement est plus net vers la gauche
VI. Valeurs typiques des séries statistiques
b. Coefficients d’aplatissement
La notion d’aplatissement concerne la concentration de
la masse de fréquence autour du mode, la distribution normale
étant habituellement prise comme référence
Quand une courbe de fréquence a un maximum
relativement grand, figure, on dit qu’elle a une très forte
concentration.
Par contre, fig qui est aplatie, a une faible
concentration. La distribution normale que l’on voit sur la fig
N’est ni aigue, ni plate
On dit qu’elle a une concentration normale
VI. Valeurs typiques des séries statistiques
b. Coefficients d’aplatissement
De même, Fischer a proposé un autre coefficient
déterminant l’aplatissement d’une distribution
𝝁𝟒
C’est le coefficient d’aplatissement : 𝑭𝟐 = −𝟑
𝝈𝟒
Où la constante 3 est introduite pour que le coefficient 𝑭𝟐 soit nul quand la
distribution est normale
Si la distribution est plus aplatie que la distribution normale
de même moyenne et de variance, alors 𝑭𝟐 < 𝟎 et
inversement si la distribution est moins aplatie, 𝑭𝟐 > 𝟎
VI. Valeurs typiques des séries statistiques
b. Coefficients d’aplatissement
On peut mesurer l’aplatissement à partir du quatrième
𝝁
moment centré et de l’écart-type par 𝒂𝟒 = 𝟒𝟒 que l’on
𝝈
désigne souvent par 𝒃𝟐
Pour la distribution normale𝒃𝟐 = 𝒂𝟒 = 𝟑. Pour cette raison,
on définit parfois l’aplatissement par 𝒇𝟐 = 𝒃𝟐 − 𝟑 qui est
positif pour une distribution à forte concentration
négatif pour une distribution à faible concentration
nul pour la distribution normale
VI. Valeurs typiques des séries statistiques
c. Exemples & Exercices
Exemple :
Pour une distribution continue uniforme sur [0,1] , on a :
𝟏 𝟏
𝝁𝟐 = 𝝈𝟐 = 𝝈𝟒 =
𝟏𝟐 𝟖𝟎
d’où 𝑭𝟐 = 𝟏, 𝟐
On aurait bien entendu la même valeur pour une distribution
continue uniforme sur un intervalle [a,b] quelconque
VI. Valeurs typiques des séries statistiques
c. Exemples & Exercices
Exercice 1 : Caractère discret
Les notes attribuées, au cours d’une épreuve orale, à 200 candidats se
distribuent selon les données suivantes :
Note (𝒙𝒊 ) 5 6 7 8 9 10 11 12 13
Nombres d’observations (𝒏𝒊 ) 8 15 28 35 45 36 20 11 2
1) Construire le diagramme en batôns et la courbe cumulative associée
à cette distribution.
2) Déterminer le mode, la moyenne arithmétique, l’écart-type.
3) Déterminer les moyennes harmonique, géométrique et quadratique.
4) Déterminer la médiane, l’écart inter-quartile.
5) Déterminer les valeurs des cœfficients de dissymétrie et
d’aplatissement de Fischer relatifs à cette distribution.
VI. Valeurs typiques des séries statistiques
c. Exemples & Exercices
Exercice 1 : Caractère continu
Les 148 étudiants d’une promotion ont subi un contrôle médical au
cours duquel, ont été relevées les tailles suivantes :
Classes Nombres d’observations
] 140, 150] 18
] 150, 160] 22
] 160, 170] 36
] 170, 180] 45
] 180, 190] 22
] 190, 200] 5
VI. Valeurs typiques des séries statistiques
c. Exemples & Exercices
Exercice 2 : Caractère continu
On souhaite comparer ces résultats à une hypothétique distribution
normale.
1) Construire l’histogramme et la courbe cumulative.
2) Déterminer : mode, moyenne, médiane.
3) Déterminer : écart inter-quartile, étendue, écart-type.
4) Déterminer les coefficients de dissymétrie et d’aplatissement
de Fischer associés à cette distribution de tailles. Quelles remarques
qualitatives en déduit-on ?
5) Déterminer la valeur du coefficient de dissymétrie de Yule
relatif à cette distribution statistique.
VI. Valeurs typiques des séries statistiques
7. Paramètres de forme
c. Exemples & Exercices
Exercice 2 : Caractère continu
Tailles 𝒏𝒊 Centres 𝒖𝒊 𝒏𝒊 𝒖𝒊 𝒏𝒊 𝒖𝟐𝒊 𝒏𝒊 𝒖𝟑𝒊 𝒏𝒊 𝒖𝟒𝒊 F
𝒄𝒊
(en cm) cumulés (en %)
] 140, 150] 18 145 -2 -36 72 -144 188 18 0
] 150, 160] 22 155 -1 -22 22 -22 22 40 12,16
] 160, 170] 36 165 0 0 0 0 0 76 27,03
] 170, 180] 45 175 1 45 45 45 45 121 51,35
] 180, 190] 22 185 2 22 44 88 176 143 81,76
] 190, 200] 5 195 3 15 45 135 405 148 96,62
145 14 228 102 936 100