0% ont trouvé ce document utile (0 vote)
123 vues98 pages

Statistiques Univariées et Probabilité

Ce document présente les concepts fondamentaux de la statistique descriptive à une variable, notamment le vocabulaire statistique, les méthodes de représentation graphique des données et les valeurs typiques des séries statistiques.

Transféré par

mohamed el hamani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
123 vues98 pages

Statistiques Univariées et Probabilité

Ce document présente les concepts fondamentaux de la statistique descriptive à une variable, notamment le vocabulaire statistique, les méthodes de représentation graphique des données et les valeurs typiques des séries statistiques.

Transféré par

mohamed el hamani
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Statistique descriptive

&
Probabilité

Chapitre III.

Statistique
à une variable

Prof. A. Bassir
Sommaire du chapitre III.

I. Historique

II. Généralités

III. Objet de la statistique

IV. Vocabulaire statistique

V. Représentation Graphique

VI. Valeurs typiques des séries statistiques


I. Historique

Depuis les temps, les plus anciens chez les grecs et les
égyptiens, on faisait des statistiques qui consistaient à faire un
dénombrement, ou un inventaire des personnes et de biens

Les statistiques dans le sens actuel, n’ont pu être


développé qu’à partir des calculs de probabilité mis aux points
par Pascal, Bernouilli et Laplace-Gauss. Ces calculs ont
donné une base théorique aux statistiques.
I. Historique

Actuellement, dans tous les domaines, aussi bien


économique, industriel,…. que biologique et médical, il devient
nécessaire d’utiliser les Statistiques
II. Généralités

Lorsqu’on cherche à évaluer un ou plusieurs


caractères d’une population relativement nombreuse, on
doit se contenter d’observer ou de mesurer ces caractères
sur un échantillon de cette population,

c'est-à-dire sur un sous ensemble de la population de taille


réduite en sorte que l’on puisse effectivement faire les relevés
que l’on désire.
II. Généralités

Pour étudier statistiquement un phénomène, il faut


faire un certain nombre d’observations.

La liste de ces renseignements s’appelle une série


statistique.
III. Objet de la statistique

1. Le but de la statistique

Les Statistiques consiste à recueillir des informations ou


des données numériques qui nous permettent de suivre un
phénomène et de voir son évolution dans le temps, dans le but
de prévoir l’avenir
III. Objet de la statistique

Exemples

 Nombres de naissances par an dans un pays

 Nombres de véhicules mis en circulation par an


III. Objet de la statistique
La Statistique est une méthode de calculs qui, appliquée à
des données obtenus à partir d’enquêtes ou de mesures
effectuées sur un petit groupe permet de :

 prévoir des comportements globaux

 établir des lois sur des phénomènes qui ne sont pas


identiquement reproductibles

 chercher des relations ou des corrélations entre des


phénomènes
III. Objet de la statistique
Pour cela, il faut:
i. Présenter les données statistiques sous forme de tableaux ou
de graphiques : Diagramme en bâton, Histogramme, Courbes
cumulatives.

ii. Analyser ces données qui consiste à résumer un tableau à


l’aide d’un petit nombre de valeurs caractéristiques :
 Les valeurs caractéristiques de position (de tendance centrale) :
mode, médiane, moyenne
 Les valeurs caractéristiques de dispersion : variance, écart-type,
moments, moments centrés
 Paramètres de forme : coefficients de dissymétries et
d’aplatissements
III. Objet de la statistique

Cette statistique utilise des repères de référence qui sont


les modèles théoriques (lois de probabilités)

Cette statistique nécessite la recherche d'échantillons qui


représentent le mieux possible la diversité de la population entière

il est nécessaire qu'ils soient constitués au hasard


on dit qu'ils résultent d'un tirage non exhaustif.
IV. Vocabulaire statistique

1. Population
a. Définition
Ensemble sur lequel va porter l’étude statistique.

b. Exemples
 Les salariés d'une entreprise

 L’ensemble des malades atteints d’une maladie

 Les véhicules automobiles immatriculés au Maroc


IV. Vocabulaire statistique

2. Individu
Définition:

un « Objet » ou « Unité » statistique, pris dans une population


donnée.

 Il ne faut pas prendre population et individus au sens biologique


de ce mots
IV. Vocabulaire statistique

3. Echantillon
a. Définition

Un groupe d’individus qui appartiennent à la même


population.

 Un sous-ensemble de la population.
IV. Vocabulaire statistique

b. Intérêt de travailler sur un échantillon

 Temps d’exécution rapide

Le travail serait plus long si l’on veut étudier tous les individus de
la poulation

 Coût de l’opération peu élevé

 Efficacité dans la prise des décisions


IV. Vocabulaire statistique

Exemple : En cas d’épidémie :

Si on ne prend pas des décisions rapidement :


 vaccination,
 approvisionnement en médicaments des centres de
santé,
…
les conséquences de l’épidémie peuvent être graves
IV. Vocabulaire statistique

c. Inconvénient d’un échantillon

Les résultats sont peu précis car la masse


de renseignements est peu importante

Les résultats seront d’autant moins précis


que l’échantillon est petit
IV. Vocabulaire statistique

d. Représentativité
Il est indispensable que l’échantillon soit représentatif de
la population

Pour cela, il faut utiliser la méthode du hasard, ou tirage au


sort pour le choix des individus de l’échantillon

 chaque individu doit avoir les mêmes chances


d’appartenir à l’échantillon
IV. Vocabulaire statistique

Un échantillon représentatif de la population


étudiée est une partie de cette population qui
reflète en mieux la structure de la population

Si dans la population étudiée il y a 60%


de femmes et 40% d’hommes, alors l’échantillon
doit comprendre les mêmes proportions
IV. Vocabulaire statistique
4. Caractère
La particularité à laquelle on s’intéresse pour effectuer une étude statistique
a. Un caractère est dit quantitatif s’il est mesurable :
 taille,
 poids,
 âge,
 taux de glucose,
 …
b. Un caractère est dit qualitatif s’il est repérable sans être mesurable:
 sexe,
 nationalité,
 profession,
 couleur de cheveux,
IV. Vocabulaire statistique
5. Modalités

Ce sont les différentes situations possibles du caractère.

Tout individu doit présenter une et une seule modalité.


IV. Vocabulaire statistique

• Les modalités d'un caractère qualitatif sont les différentes


rubriques d'une nomenclature

• celles d'un caractère quantitatif sont les mesures de ce


caractère (un nombre entier discret pris parmi un ensemble
limité)

Exemple : Le nombre d'enfants d'une famille (fratrie)


V. Représentation Graphique

1. Données brutes

2. Fréquence

3. Représentation Graphique
V. Représentation Graphique
1. Données brutes

 On appelle données brutes des données que l’on a


rassemblées sans se soucier de la notion d’ordre

 Lorsqu’on veut résumer une grande quantité de


données brutes, il est commode de les distribuer
en classes ou catégories et de déterminer le
nombre d’individus appartenant à chaque classe,
que l’on appelle fréquence ou effectif de la
classe.
V. Représentation Graphique
2. Fréquence

 On appelle fréquence, l’effectif partiel dans une


catégorie divisé par l’effectif total

𝑛𝑖 𝑛𝑖
𝑓𝑖 = =
𝑛𝑖 𝑁

𝑁= 𝑛𝑖  effectif total


 𝑛𝑖  effectif partiel
 𝑓𝑖  fréquence relative de modalité
V. Représentation Graphique

𝑛𝑖
𝑓𝑖 = =1
𝑁

et

0 ≤ 𝑓𝑖 ≤ 1
V. Représentation Graphique

 Exemple :

Nombre d’enfants par 0 1 2 3 4


famille (𝑥𝑖 )
Nombre de familles (𝑛𝑖 ) 5 10 30 35 20
𝑵= 𝑛𝑖 = 𝟏𝟎𝟎

Fréquence (𝑓𝑖 ) 0,05 0,1 0,3 0,35 0,2


𝒇𝑖 = 𝟏
V. Représentation Graphique
3. Représentation Graphique
a. Définition

La représentation graphique des données relatives à


un caractère unique repose sur la proportionnalité
des longueurs, ou des aires, des graphiques, aux
effectifs, ou aux fréquences, des différentes
modalités du caractère
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
Se dit d’une variable :
aléatoire ou statistique (ou caractère) dont les valeurs
possibles, souvent appelées dans ce cas « modalités »,
sont des éléments d’un ensemble sur lequel on ne peut
pas effectuer d’opération mathématique (addition
notamment).
 Il arrive néanmoins qu’un codage d’une variable
qualitative donne à ses modalités l’apparence de
nombres
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
 C’est un caractère non mesurable et par conséquent
il ne peut pas être traduit graphiquement

 Exemples :
 Couleur de cheveux
 Sexe (Masculin – Féminin), c’est un caractère
dichotomique (2 catégories ou 2 modalités).
 Situation familiale (célibataire – Marié – Veuf – divorcé),
caractère qualitatif à plusieurs modalités (4 catégories).
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif

 Pour des variables qualitatives discrètes, la


représentation se fait par une surface rectangulaire
ou circulaire

 Chaque portion de la surface est proportionnelle à


un des effectifs partiels
c’est le graphique à secteurs
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif
 Chaque modalité 𝑥𝑖 est représentée par un secteur dont
𝑛𝑖
l’angle vaut 2 π .
𝑛

𝒏𝟏
𝒏𝟐
𝒏𝟑
𝒏𝟒
𝒏𝟓
V. Représentation Graphique
3. Représentation Graphique
b. Caractère qualitatif

 Les diagrammes circulaires, ou semi-circulaires,


consistent à partager un disque ou un demi-disque,
en tranches, ou secteurs, correspondant aux
modalités observées et dont la surface est
proportionnelle à l'effectif, ou à la fréquence, de la
modalité
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret

 Un caractère discontinu

 Ses modalités sont des valeurs isolées

 Et on peut le traduire graphiquement par un


diagramme en bâton.
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret

 Nous portons en abscisse les modalités, de façon


arbitraire.

 Nous portons en ordonnée des segments dont la


longueur est proportionnelle aux effectifs (ou aux
fréquences) de chaque modalité.
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret

 Nous appelons polygone statistique, ou


diagramme polygonal, la ligne obtenue en
joignant les sommets des bâtons.

 Exemples :
 nombre d’enfants d’une famille
 nombre d’appartement d’une copropriété
V. Représentation Graphique
3. Représentation Graphique
c. Caractère quantitatif discret
 Exemple :
Nombre d’enfants par
famille Variable (𝒙𝒊 ) 1 2 3 4 5 6

Nombre de familles ou
20 40 30 10 5 1
effectif (𝒏𝒊 )
Effectif cumulé croissant
20 60 90 100 105 106
𝒏𝒊
Fréquence cumulée 20/106 60/106 90/106 100/106 105/106 106/106
croissante 𝒇𝒊
0,189 0,566 0,85 0,94 0,99 1
Effectif cumulé
106 86 46 16 6 1
décroissant 𝒏𝒊
Fréquence cumulée 106/106 86/106 460/106 16/106 6/106 1/106
décroissante 𝒇𝒊
1 0,811 0,434 0,151 0,056 0,009
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue

 Un caractère est dit continu : si ses modalités sont


a priori n’importe quel élément d’un intervalle de 𝐼𝑅

 Pour étudier un caractère quantitatif continu, on


effectue un regroupement par classes.
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue

Pour cela il faut définir :


L’intervalle de la classe : tous les intervalles sont
égaux

Les limites de la classe : 𝑋𝑖 ≤ 𝑡 ≤ 𝑋𝑖+1

(𝑋𝑖 + 𝑋𝑖+1 )
Le centre de la classe : 𝐶𝑖 =
2
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif discret
 Exemple :
Intervalle de Centre de Effectif Fréquence Fréquence
la classe la classe 𝑪𝒊 partiel 𝒏𝒊 𝒇𝒊 cumulée
croissante
1,40 – 1,50 1,45 2 0,1 0.1
1,50 - 1,60 1,55 3 0,15 0,1+0,15=0,25
1,60 - 1,70 1,65 7 0,35 0,25+0,35=0,60
1,70 - 1,80 1,75 5 0,25 0,6+0,25=0,85
1,80 - 1,90 1,85 3 0,15 0,85+0,15=1

𝑁 = 𝑛𝑖 = 20  Effectif total
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue

 Le diagramme représentatif s’appelle un


Histogramme

 Il peut être représenté en effectifs ou en


fréquences
V. Représentation Graphique
3. Représentation Graphique
d. Caractère quantitatif continue
Remarques :
Si l’intervalle de classe est grand, les calculs
seront réduits mais on perd les informations
et les résultats risquent d’être grossiers

Si l’intervalle de classe est trop petit, les


calculs seront nombreux mais les résultats
seront plus précis
VI. Valeurs typiques des séries statistiques

1. Moyenne, médiane, mode et d’autres


mesures de tendance centrale

Objectif

Les paramètres de position (mode, médiane,


moyenne) permettent de savoir autour de
quelles valeurs se situent les valeurs d'une
variable statistique
VI. Valeurs typiques des séries statistiques

1. Moyenne
La moyenne arithmétique d’un ensemble de 𝑁 nombres 𝑥1 ,
𝑥2 , …, 𝑥𝑛 (données non groupées) est définie par:
N

x
j 1
j
x1  x 2  ......  x N
MA  X  
N N

Cas général : On calcule la moyenne arithmétique pondérée par les


effectifs partiels (données groupées) N

n x j j N
  f jxj
j 1
X  N

n j 1
j
j 1

Cas d’une variable continue : n C j j N


  f jC j
j 1
X  N

n j 1
j
j 1
VI. Valeurs typiques des séries statistiques

Remarque :

Un grand inconvénient de la moyenne arithmétique


est d’être très sensible aux valeurs extrêmes.
VI. Valeurs typiques des séries statistiques

Moyenne quadratique

Moyenne géométrique

Moyenne harmonique
VI. Valeurs typiques des séries statistiques

Remarque

est la moyenne arithmétique des 𝑥𝑗2

est la moyenne arithmétique des 𝐿𝑛(𝑥𝑗)

1
est la moyenne arithmétique des
𝑥𝑗
VI. Valeurs typiques des séries statistiques

Remarque :
Pour une variable statistique X, les différentes moyennes, harmonique sont
liées par la relation :
𝐻≤𝐺≤ 𝑋≤𝑄

 Il y a égalité si, et seulement si, toutes les valeurs de X sont égales

 La moyenne géométrique est bien adaptée à l'étude des


phénomènes de croissance.

 La moyenne harmonique est utilisée pour les calculs d'indices


économiques
VI. Valeurs typiques des séries statistiques

Exemple:
L’ensemble 2,4,8 a pour moyennes :
Arithmétique 𝑋=4,67
Géométrique 𝐺=4
Harmonique 𝐻 = 3,43
 Quadratique 𝑄 = 5,29

𝐻 = 3,43 ≤ 𝐺 = 4 ≤ 𝑋 = 4,67 ≤ 𝑄 = 5,29


VI. Valeurs typiques des séries statistiques

Exercice 1:
Les salaires annuels de quatre employés sont
respectivement de 5000, 6000, 6500 et 30000 DH.

a) Quelle est la moyenne arithmétique de leurs salaires ?

b) Peut-on dire que cette moyenne est représentative des


salaires ?
VI. Valeurs typiques des séries statistiques

Solution 1:
a) La moyenne arithmétique :
5000 + 6000 + 6500 + 30000
𝑋= = 11875
4

b) La moyenne de 11875 DH n’est certainement pas


représentative des salaires
Présenter ce résultat comme un salaire moyen serait une
erreur grossière

Ainsi, un grand inconvénient de la moyenne arithmétique est


d’être très sensible aux valeurs extrêmes
VI. Valeurs typiques des séries statistiques

2. Médiane - Placée au milieu

Pour éliminer le rôle des valeurs aberrantes (trop petites ou


trop grandes) : un autre paramètre de position la médiane

En statistique : valeur qui sépare une série statistique en deux


groupes égaux
VI. Valeurs typiques des séries statistiques

 Cas d’une variable discrète :

Supposons les 𝑛 observations ordonnées :

 Si 𝑛 est impair, 𝑛 = 2𝑝 + 1 alors 𝑀𝑒 = 𝑥𝑝+1

C’est la valeur du milieu

𝑥𝑝 +𝑥𝑝+1
 Si 𝑛 est pair, 𝑛 = 2𝑝 alors 𝑀𝑒 =
2

C’est la moyenne arithmétique des valeurs centrales


VI. Valeurs typiques des séries statistiques

Exemple :

L’ensemble des nombres : 3, 4, 4, 5, 6, 8, 8, 8, 1 a pour médiane 6

L’ensemble des nombres : 5, 5, 7, 9, 11, 12, 15, 18 a pour médiane


𝟏
𝟗 + 𝟏𝟏 = 𝟏𝟎
𝟐
VI. Valeurs typiques des séries statistiques

Cas d’une variable continue :


Pour des données groupées, la médiane obtenue par l’interpolation
est :
𝑁
− 𝑓 1
𝑀é𝑑𝑖𝑎𝑛𝑒 = 𝐿1 + 2 .𝑐
𝑓𝑚é𝑑𝑖𝑎𝑛𝑒

 𝐿1 : borne inférieur de la classe médiane


 𝑁 : effectif total
 𝑓 1 : somme des effectifs relatifs à toutes les classes inférieures à la
classe médiane
 𝑓𝑚é𝑑𝑖𝑎𝑛𝑒 : effectif de la classe médiane
 𝑐 : dimension de l’intervalle contenant la classe médiane
VI. Valeurs typiques des séries statistiques

3. Mode

Est la valeur correspondant quantitativement à la population la plus


dense (plus grande fréquence)

Est noté Mo

Pour une variable quantitative continue, nous parlons de classe


modale : c'est la classe dont la densité de fréquence est
maximum
VI. Valeurs typiques des séries statistiques

A partir d’une distribution d’effectifs ou d’un histogramme, on peut


obtenir le mode par la formule suivante :
∆1
𝑀𝑜𝑑𝑒 = 𝐿1 + .𝑐
∆1 + ∆2

 𝐿1 : borne inférieur de la classe modale (classe contenant le mode)


 ∆1 : excédent d’effectif de la classe modale par rapport à l’effectif de la
classe inférieure la plus proche
 ∆2 : excédent d’effectif de la classe modale par rapport à l’effectif de la
classe supérieure la plus proche
 𝑐 : taille de l’intervalle contenant la classe modale
VI. Valeurs typiques des séries statistiques

Remarques :

 Lorsque les classes adjacentes à la classe modale ont des


densités de fréquences égales, le mode coïncide avec le centre
de la classe modale

 Une variable statistique peut présenter plusieurs modes locaux :


on dit alors qu'elle est plurimodale.

Cette situation est intéressante : elle met en évidence l'existence de


plusieurs sous-populations, donc l'hétérogénéité de la population
étudiée.
VI. Valeurs typiques des séries statistiques

4. Relation empirique entre la moyenne,


la médiane et le mode

Pour des courbes de densité unimodale modérément asymétrique,


on a la relation empirique suivante :

Moyenne – Mode = 3 (Moyenne – Médiane)

Les figures (a) et (b) montrent les positions relatives de la moyenne,


la médiane et du mode pour des courbes de densité qui
s’aplatissent légèrement soit à droite, soit à gauche.
Dans le cas de courbes symétriques la moyenne, le mode et la
médiane coïncident.
VI. Valeurs typiques des séries statistiques

5. Quartiles, Déciles, Centiles

 Concrètement le quantile d’ordre 𝛼 est la valeur qui partage la


série des valeurs en deux parties de fraction 𝛼 et 1 − 𝛼 de
l’effectif total

 Certains quantiles portent des noms spécifiques :


 quartiles
 déciles
 centiles
VI. Valeurs typiques des séries statistiques

5. Quartiles, Déciles, Centiles

 a. Si un ensemble de nombre est rangé par ordre de grandeur


croissant, le nombre du milieu (ou la moyenne des nombres
centraux) divisant l’ensemble en deux parties égales est la
médiane

 b. Par extension, on peut penser aux valeurs qui divisent


l’ensemble en quatre???? parties égales: 𝑸𝟏 , 𝑸𝟐 et 𝑸𝟑
VI. Valeurs typiques des séries statistiques

5. Quartiles, Déciles, Centiles

 Le premier quartile (ou quartile inférieur) 𝑸𝟏 :


est la valeur de la variable qui correspond à 25% des effectifs
cumulés croissants

 Le troisième quartile (ou quartile supérieur) 𝑸𝟐 :


est la valeur de la variable qui correspond à 75% des effectifs
cumulés croissants

 Le deuxième quartile 𝑸𝟑 :
n’est autre que la médiane
VI. Valeurs typiques des séries statistiques

5. Quartiles, Déciles, Centiles

 On appelle Déciles les valeurs qui divisent les données en 10


parties égales
 Ils sont notés 𝐷1 , 𝐷2 , ..., 𝐷9 et correspondent à 10% , 20%, ...,
90% des effectifs cumulés croissants

 On appelle quartiles d’ordre 100 ou Centiles les valeurs


divisant les données en 100 parties égales
 Ils sont notés 𝑃1 , 𝑃2 , ..., 𝑃99 et correspondent à 1% , 2%, ..., 99%
des effectifs cumulés croissants
VI. Valeurs typiques des séries statistiques

6. L’écart-type et les autres mesures de


dispersion
Définition
Outre la tendance centrale, il est intéressant de
connaître à propos d’une distribution, dans quelle mesure les
diverses valeurs sont groupées autour de la moyenne

On peut rendre compte de cette dispersion de plusieurs


façons dont la plus courante est le calcul de l’écart-type
VI. Valeurs typiques des séries statistiques

 Un ensemble de données numériques tend généralement à


s’étaler autour d’une valeur centrale, que l’on appelle dispersion
ou variabilité des données
 Il existe plusieurs mesures de dispersion. Les plus courantes
sont:
a. l’étendue
b. l’écart moyen
c. la demi distance inter- quartile
d. la distance entre le 10ème et le 90ème Centile appelée
écart inter centiles
e. Moments et moments centrés
f. l’écart – type
VI. Valeurs typiques des séries statistiques

6. L’écart-type et les autres mesures de


dispersion
a. L’étendue

 Est l’écart entre ses valeurs extrêmes

 Est une caractéristique de dispersion médiocre car elle est


trop sensible aux valeurs aberrantes (erronées ou
exceptionnelles)
VI. Valeurs typiques des séries statistiques

b. L’écart moyen où l’écart à la moyenne

 L’écart moyen (EM) d’un ensemble de nombres


𝑥1 , 𝑥2 , …, 𝑥𝑛 est définie par :

𝟏 𝑵
𝑬𝑴 = 𝒋=𝟏 |𝒙𝒋 − 𝑿|
𝑵

où 𝑋 est la moyenne arithmétique des nombres


VI. Valeurs typiques des séries statistiques

b. L’écart moyen où l’écart à la moyenne


 Si 𝑥1 , 𝑥2 , …, 𝑥𝑛 ont les fréquences respectives
𝑓1 , 𝑓2 , …, 𝑓𝑛 d’apparition, l’écart moyen s’écrit :

𝟏 𝑵
𝑬𝑴 = 𝒇𝒋 |𝒙𝒋 − 𝑿|
𝑵 𝒋=𝟏
où 𝑁 = 𝑓𝑗

 Cette formule est utile pour des données groupées, les


𝑥𝑗 représentant les centres des classes et 𝑓𝑗 les effectifs de
la 𝑗 è𝑚𝑒 classe
VI. Valeurs typiques des séries statistiques

c. Intervalle interquartile ou écart des quartiles

 L’intervalle interquartile 𝑄 d’un ensemble des


données est défini par :
𝑸 = 𝑸𝟑 − 𝑸𝟏
où 𝑸𝟏 et 𝑸𝟑 sont le premier et le troisième quartile des données

 il englobe donc une partie médiane de la


distribution de probabilité 0,5 ou (en statistique) de
50% de l’effectif total
VI. Valeurs typiques des séries statistiques

c. Intervalle interquartile ou écart des quartiles

Si, pour un ensemble de données, 𝑸𝟏 et 𝑸𝟑 sont


données :
1
 (𝑸𝟑 + 𝑸𝟏 ) est une mesure de la tendance centrale
2
ou de la moyenne de ces données

1
 (𝑸𝟑 − 𝑸𝟏 ) , qui est l’intervalle semi-interquartile, est une
2
mesure de leur dispersion.
VI. Valeurs typiques des séries statistiques

Par suite, on peut définir une mesure de la


dispersion relative par :
𝑸𝟑 − 𝑸 𝟏
𝑉𝑄 =
𝑸𝟑 + 𝑸 𝟏
Que l’on peut appeler :
le coefficient de variation interquartile OU
le coefficient de dispersion interquartile relative
VI. Valeurs typiques des séries statistiques

d. Ecart interdécile et intercentile

Ecart interdécile
Est un indicateur de dispersion attaché à une variable
aléatoire réelle
Est Utilisé essentiellement en statistique
 Est l’écart entre le premier décile et le dernier décile
 Englobe donc une partie médiane de la distribution de
80% de l’effectif total
𝑫𝟗 − 𝑫𝟏
VI. Valeurs typiques des séries statistiques

Ecart intercentile
 Est l’écart entre le premier centile et le dernier centile

 Englobe donc une partie médiane de la distribution de


98% de l’effectif total
𝑷𝟗𝟗 − 𝑷𝟏
VI. Valeurs typiques des séries statistiques

e. Moments, moments centrés


Moment
 Les moments sont une autre caractéristique de
dispersion

 On appelle moment d’ordre 𝑟 du caractère 𝑋 :


𝑵
𝟏
𝒎𝒓 𝑿 = 𝑬 𝑿 𝒓
= 𝒙𝒓𝒊
𝑵
𝒊=𝟏
VI. Valeurs typiques des séries statistiques

Moment centré
 Les moments sont une autre caractéristique de
dispersion
 On appelle moment centré d’ordre 𝑟 du caractère 𝑋 :
𝑵
𝟏
𝝁𝒓 𝑿 = 𝑬 (𝑿 − 𝑿)𝒓 = (𝒙𝒊 − 𝑿)𝒓
𝑵
𝒊=𝟏
 C’est la généralisation de la variance où 𝑟 est un
entier positif
VI. Valeurs typiques des séries statistiques

e. Moments, moments centrés


Moment centré
On a :
 𝒎𝟎 = 𝟏 et 𝝁𝟎 = 𝟏
 𝒎𝟏 = 𝑿 et 𝝁𝟏 = 𝟎
 𝒎𝟐 = 𝝈𝟐 + 𝑿𝟐 et 𝝁𝟐 = 𝝈𝟐

Si la distribution est symétrique, les moments centrés


d’ordre impair sont nuls
VI. Valeurs typiques des séries statistiques

f. Ecart type
 Si un caractère numérique 𝑋 défini sur un ensemble
fini Ω = 𝑥1 , 𝑥2 , …, 𝑥𝑛
 Les valeurs prises par 𝑋 peuvent être plus ou moins
dispersées, c'est-à-dire plus ou moins éloignées les
unes des autres

 On se propose de mesurer cette dispersion au moyen


d’un paramètre de dispersion
VI. Valeurs typiques des séries statistiques

 f. Ecart type
 Un tel paramètre peut être choisi de bien des façons
 Le plus utilisé est la variance du caractère 𝑋
 Ce nombre, que nous noterons V(𝑋) , est la moyenne
du caractère 𝑋 − 𝑚 2

 On a donc :
𝐕 𝑿 = 𝑬| 𝑿 − 𝒎 𝟐 |
VI. Valeurs typiques des séries statistiques

 f. Ecart type
 Et, en vertu de la linéarité de l’opérateur :
𝐕 𝑿 = 𝑬 𝑿 𝟐 − 𝟐𝒎𝑬 𝑿 + 𝑴𝟐 = 𝑬 𝑿𝟐 − 𝒎𝟐
Théorème de Konig

 Ce résultat s’écrit encore :


𝐕 𝑿 = 𝑬 𝑿𝟐 − 𝑬𝟐 𝑿
VI. Valeurs typiques des séries statistiques

f. Ecart type
 On appelle aussi variance le moment centré d’ordre 2:
𝐕 𝑿 = 𝝁𝟐

Il est l’analogue du théorème de mécanique sur les


moments d’inertie :
Le moment d’inertie par rapport à l’origine (ie
𝑬(𝑿𝟐 )) est égal à la somme du moment d’inertie autour
du centre de gravité (𝐕 𝑿 ) et du moment d’inertie de la
masse total (c’est à dire 1) placé au centre de gravité, par
rapport à l’origine (c’est à dire 𝑬𝟐 𝑿 )
VI. Valeurs typiques des séries statistiques

 On remarquera que, si 𝑋 est la mesure d’une


grandeur physique exprimée dans un système
d’unités, la moyenne 𝑚 mesure encore la même
grandeur physique dans le même système d’unités

2
 Il n’en est pas de même de 𝑋 − 𝑚 et, par suite, de
V(𝑋)
si 𝑋 est une grandeur exprimée en mètres, V(𝑋) est une
surface exprimée en mètres carrés
VI. Valeurs typiques des séries statistiques

 Pour avoir un paramètre de dispersion qui mesure la


même grandeur physique que 𝑋 , on introduit alors la
racine carrée (𝑉(𝑋) que l’on appelle l’écart-type
(ou écart quadratique moyen) du caractère 𝑋

 On appelle écart-type d’une variable aléatoire 𝑋


l’écart moyen quadratique par rapport à
l’espérance mathématique
VI. Valeurs typiques des séries statistiques

 On définit l’écart-type 𝜎 d’un ensemble de 𝑁 nombres 𝑥1 ,


𝑥2 , …, 𝑥𝑁 par :

𝑵 𝟐
𝝈= 𝒋=𝟏 𝒙𝒋 − 𝑿 /𝑵
 L’écart-type 𝜎 est la racine carré des écarts à la moyenne,
où comme on l’appelle quelque fois, la racine carré de la
variance 𝝈 = 𝑽(𝑿)
Plus 𝜎 est petit, plus les observations sont groupées
Plus 𝜎 est grand, plus la dispersion est grande
VI. Valeurs typiques des séries statistiques

7. Paramètres de forme
 a. Coefficients de dissymétrie

Une fois la tendance et la dispersion déterminées, on


peut se proposer d’étudier l’asymétrie et l’aplatissement
d’une distribution statistique

Pour des distributions dissymétriques, la moyenne a


tendance à se trouver du même côté du mode que l’extrémité
la plus allongée de la courbe de fréquence

(voir figures a et b)
VI. Valeurs typiques des séries statistiques

 a. Coefficients de dissymétrie
 On peut ainsi mesurer la dissymétrie au moyen de la
différence (moyenne - mode)

 Celle-ci peut être prise sans dimension en divisant par une


mesure de la dispersion telle que l’écart-type
𝒎𝒐𝒚𝒆𝒏𝒏𝒆−𝒎𝒐𝒅𝒆 𝑿−𝑴𝟎
 Ce qui conduit à la définition : 𝑷𝟏 = =
é𝒄𝒂𝒓𝒕 −𝒕𝒚𝒑𝒆 𝝈

 1er coefficient de dissymétries de Pearson


VI. Valeurs typiques des séries statistiques

 a. Coefficients de dissymétrie
 Pour éviter d’utiliser le mode, on peut employer la formule
empirique :

𝒎𝒐𝒚𝒆𝒏𝒏𝒆 − 𝒎𝒐𝒅𝒆 = 𝟑. (𝒎𝒐𝒚𝒆𝒏𝒏𝒆 − 𝒎é𝒅𝒊𝒂𝒏𝒆)

𝟑.(𝒎𝒐𝒚𝒆𝒏𝒏𝒆−𝒎𝒐𝒅𝒆) 𝟑.(𝑿−𝑴𝒆 )
 et définir : 𝑷𝟐 = =
é𝒄𝒂𝒓𝒕 −𝒕𝒚𝒑𝒆 𝝈

 2ème coefficient de dissymétries de Pearson


VI. Valeurs typiques des séries statistiques

 a. Coefficients de dissymétrie
Il existe d’autres mesures de la dissymétrie que l’on définit en
fonction des quartiles et des centiles de la manière suivante :
 Coefficient quartile de dissymétrie :
𝑄3 − 𝑄2 − 𝑄2 − 𝑄1 𝑄1 + 𝑄3 − 2𝑀𝑒
𝑌= =
𝑄3 − 𝑄1 𝑄3 − 𝑄1
 Coefficient de dissymétries de Yule

 Coefficient centile 10-90 de dissymétrie :


𝑃90 − 𝑃50 − 𝑃50 − 𝑃10 𝑃90 − 2𝑃50 + 𝑃10
=
𝑃90 − 𝑃10 𝑃90 − 𝑃10
VI. Valeurs typiques des séries statistiques

 a. Coefficients de dissymétrie
 Si les moments centrés d’ordre impairs (𝜇𝑟 ) sont nuls, alors
la distribution est dite symétrique

 Sir Ronald FISHER a donc proposé un coefficient


d’asymétrie, en s’en tenant au premier moment impair
puisque 𝜇1 est toujours nul
VI. Valeurs typiques des séries statistiques

 a. Coefficients de dissymétrie

Une mesure de la dissymétrie très fréquente utilise le


troisième moment autour de la moyenne (moment centré
d’ordre 3)
𝝁𝟑
Elle est donnée par : 𝑭𝟏 = 𝒂 𝟑 =
𝝈𝟑

 Coefficient de dissymétrie de Fischer

Fig
VI. Valeurs typiques des séries statistiques

Remarques

Tous ces coefficients sont :


 Nuls si la distribution est parfaitement symétrique comme la
loi normale

 Positifs, si la distribution statistique présente un élément


plus net à droite

 Négatifs, si l’étalement est plus net vers la gauche


VI. Valeurs typiques des séries statistiques

 b. Coefficients d’aplatissement

La notion d’aplatissement concerne la concentration de


la masse de fréquence autour du mode, la distribution normale
étant habituellement prise comme référence
Quand une courbe de fréquence a un maximum
relativement grand, figure, on dit qu’elle a une très forte
concentration.
Par contre, fig qui est aplatie, a une faible
concentration. La distribution normale que l’on voit sur la fig
N’est ni aigue, ni plate
 On dit qu’elle a une concentration normale
VI. Valeurs typiques des séries statistiques

 b. Coefficients d’aplatissement
 De même, Fischer a proposé un autre coefficient
déterminant l’aplatissement d’une distribution

𝝁𝟒
C’est le coefficient d’aplatissement : 𝑭𝟐 = −𝟑
𝝈𝟒
Où la constante 3 est introduite pour que le coefficient 𝑭𝟐 soit nul quand la
distribution est normale

 Si la distribution est plus aplatie que la distribution normale


de même moyenne et de variance, alors 𝑭𝟐 < 𝟎 et
inversement si la distribution est moins aplatie, 𝑭𝟐 > 𝟎
VI. Valeurs typiques des séries statistiques

 b. Coefficients d’aplatissement
 On peut mesurer l’aplatissement à partir du quatrième
𝝁
moment centré et de l’écart-type par 𝒂𝟒 = 𝟒𝟒 que l’on
𝝈
désigne souvent par 𝒃𝟐

 Pour la distribution normale𝒃𝟐 = 𝒂𝟒 = 𝟑. Pour cette raison,


on définit parfois l’aplatissement par 𝒇𝟐 = 𝒃𝟐 − 𝟑 qui est
 positif pour une distribution à forte concentration
 négatif pour une distribution à faible concentration
 nul pour la distribution normale
VI. Valeurs typiques des séries statistiques

 c. Exemples & Exercices


Exemple :
 Pour une distribution continue uniforme sur [0,1] , on a :
𝟏 𝟏
𝝁𝟐 = 𝝈𝟐 = 𝝈𝟒 =
𝟏𝟐 𝟖𝟎

d’où 𝑭𝟐 = 𝟏, 𝟐

 On aurait bien entendu la même valeur pour une distribution


continue uniforme sur un intervalle [a,b] quelconque
VI. Valeurs typiques des séries statistiques

 c. Exemples & Exercices


Exercice 1 : Caractère discret
 Les notes attribuées, au cours d’une épreuve orale, à 200 candidats se
distribuent selon les données suivantes :
Note (𝒙𝒊 ) 5 6 7 8 9 10 11 12 13
Nombres d’observations (𝒏𝒊 ) 8 15 28 35 45 36 20 11 2
1) Construire le diagramme en batôns et la courbe cumulative associée
à cette distribution.
2) Déterminer le mode, la moyenne arithmétique, l’écart-type.
3) Déterminer les moyennes harmonique, géométrique et quadratique.
4) Déterminer la médiane, l’écart inter-quartile.
5) Déterminer les valeurs des cœfficients de dissymétrie et
d’aplatissement de Fischer relatifs à cette distribution.
VI. Valeurs typiques des séries statistiques

 c. Exemples & Exercices


Exercice 1 : Caractère continu
 Les 148 étudiants d’une promotion ont subi un contrôle médical au
cours duquel, ont été relevées les tailles suivantes :

Classes Nombres d’observations


] 140, 150] 18
] 150, 160] 22
] 160, 170] 36
] 170, 180] 45
] 180, 190] 22
] 190, 200] 5
VI. Valeurs typiques des séries statistiques

 c. Exemples & Exercices


Exercice 2 : Caractère continu
On souhaite comparer ces résultats à une hypothétique distribution
normale.
1) Construire l’histogramme et la courbe cumulative.
2) Déterminer : mode, moyenne, médiane.
3) Déterminer : écart inter-quartile, étendue, écart-type.
4) Déterminer les coefficients de dissymétrie et d’aplatissement
de Fischer associés à cette distribution de tailles. Quelles remarques
qualitatives en déduit-on ?
5) Déterminer la valeur du coefficient de dissymétrie de Yule
relatif à cette distribution statistique.
VI. Valeurs typiques des séries statistiques

7. Paramètres de forme
 c. Exemples & Exercices
Exercice 2 : Caractère continu

Tailles 𝒏𝒊 Centres 𝒖𝒊 𝒏𝒊 𝒖𝒊 𝒏𝒊 𝒖𝟐𝒊 𝒏𝒊 𝒖𝟑𝒊 𝒏𝒊 𝒖𝟒𝒊 F


𝒄𝒊
(en cm) cumulés (en %)
] 140, 150] 18 145 -2 -36 72 -144 188 18 0
] 150, 160] 22 155 -1 -22 22 -22 22 40 12,16
] 160, 170] 36 165 0 0 0 0 0 76 27,03
] 170, 180] 45 175 1 45 45 45 45 121 51,35
] 180, 190] 22 185 2 22 44 88 176 143 81,76
] 190, 200] 5 195 3 15 45 135 405 148 96,62
145 14 228 102 936 100

Vous aimerez peut-être aussi