0% ont trouvé ce document utile (0 vote)
27 vues18 pages

Statistique Descriptive: Références Bibliographiques

Transféré par

nimportnawak83
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
27 vues18 pages

Statistique Descriptive: Références Bibliographiques

Transféré par

nimportnawak83
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

STATISTIQUE DESCRIPTIVE

Références bibliographiques:




B. Py:

Statistique Descriptive (cours) ECONOMICA






Exercices corrigés

ECONOMICA



G. Calot:
Cours de Statistique Descriptive DUNOD






• I. INTRODUCTION
Généralités.

• Origine de la statistique descriptive ~ 1660 (John Graunt)
avec l'étude de la mortalité des habitants de Londres.

• Plus d'une centaine de définitions de cette théorie…

• La statistique est devenue un des éléments de la culture
générale (niveau de l’indice des prix de détail, croissance de
la population mondiale, sondages électoraux, …)

• Indispensable à l’ingénieur, au chercheur, aux politiques…
elle permet d’analyser une situation ou une expérience
pour prévoir ou esquisser le futur.

• Hormis en physique ou en mathématiques, elle n’est
introduite que récemment dans les cursus d'enseignement
(ENSAE, CERSA, … ~ années 50).

• Aujourd’hui elle est présente dans les cursus d’histoire, de
géographie, médecine, biologie, sociologie, psychologie, …

Les trois étapes de l'enseignement de la statistique.


• La statistique descriptive (ce cours…),




c’est l’étude quantitative de l’information issue d’une expérience concrète


Son but n’est pas d’expliquer mais de décrire des résultats, de réaliser


des synthèses au moyen d’outils numériques (très souvent…) .

• Le calcul des probabilités,


étude théorique abstraite des mécanismes aléatoires et de ses propriétés.


Théorie fortement imprégnée de l'étude des ensembles statistiques, but


de la statistique descriptive. Les notions de population, caractère, fréquence


de la statistique descriptive (que l'on va étudier) mènent à celles d'ensemble


fondamental, d'évènement, de probabilité de la théorie des probabilités.



variable statistique
<–>
variable aléatoire



moyenne statistique
<–>
espérance mathématique

• La statistique mathématique. Elle réalise le pont entre la statistique
descriptive et la théorie des probabilités, son but est de caractériser de
manière théorique les propriétés des populations étudiées.

La progression historique de la connaissance a suivit ces trois étapes.

I.1 DEFINITION.

La statistique descriptive est une méthode d'analyse

numérique et mathématique d'ensembles comportant un

grand nombre d'éléments.


exemples:

– étude des informations chiffrées utilisables d'un ensemble
d'observations (en physique, sociologie, démographie, …),

– analyse des ventes effectuées par une entreprise durant
une période donnée (étude d'informations économiques).


buts de la statistique descriptive :



– organiser et classer les données,

– les représenter de façon claire,

– les analyser.

TERMINOLOGIE



Déf. 1: POPULATION

On appelle population, l'ensemble des données (ou éléments) étudiés.

exemples:
— les étudiants de l’Université de Toulon en 2006/2007,




— la production d'une usine sur une période donnée,




— les entreprises françaises du secteur automobile.

Déf. 2: INDIVIDUS

Ce sont les éléments qui composent la population.

Déf. 3: ECHANTILLON

C'est une partie de la population.

remarque:
si l'étude porte sur toute la population, on parle



d’étude exhaustive sinon on parle d'étude sur un



échantillon de la population.


exemple:
le sondage d'opinion dans une élection porte sur un

échantillon représentatif de la population des votants.


I.2 LES CARACTÈRES.




Déf. 4: un caractère est un critère d'analyse des individus de la population étudiée.


Chaque individu de la population peut être décrit selon un ou plusieurs caractères.


exemples:



— pour décrire la population française, on peut envisager les


caractères suivants: le sexe, l'age, l'état matrimonial, le lieu de résidence,


la catégorie socioprofessionnelle, le salaire, etc ...



— dans une production en série de sacs plastiques, on peut retenir


les caractères: dimension du sac, épaisseur du film plastique,

résistance à l'étirement, résistance à l'abrasion, etc...



Déf. 5: MODALITÉS


C’est l’ensemble des différentes valeurs possibles d'un caractère.



exemples:

!— le caractère: SEXE comporte 2 modalités : MASCULIN et FEMININ.



— le caractère: CATÉGORIE SOCIOPROFESSIONELLE comporte plusieurs
modalités: enseignant, ingénieur, agriculteur, ouvrier, commerçant, cadre, etc...



— le caractère: ETAT MATRIMONIAL comporte 5 modalités: célibataire, marié,
pacsé, divorcé, veuf.

!
On distingue 2 types de caractères :



— les caractères QUALITATIFS

— les caractères QUANTITATIFS

Déf.6: un caractère est dit QUALITATIF si ses modalités ne sont pas numériques.

exemple: les caractères : sexe, état matrimonial, couleur.

Déf.7: un caractère est dit QUANTITATIF lorsque ses modalités sont numériques
(on appelle un caractère quantitatif, une VARIABLE STATISTIQUE).

Si le caractère est quantitatif :


— à chaque individu est associé un nombre qui est la valeur numérique du



caractère qui le décrit (ex: la taille de l'individu),

— les modalités sont alors toutes les valeurs possibles du caractère quantitatif ou

des groupements de valeurs de ce caractère (classes de modalités).


Exemples de caractères quantitatifs:




— le nombre de salariés d'une entreprise


— le nombre d'enfants à charge d'une famille


— le nombre de ventes d'un certain type d'appareils.


Exemple de modalités d'un caractère quantitatif:

Population étudiée: ensemble F de familles.


Caractère étudié: nombre d'enfants à charge d'une famille F F

1) 0 enfant, 1, 2, 3, 4, 5, 6 enfants ou plus.

2) les modalités peuvent aussi être regroupées en classes


(intervalles semi-ouverts, fermés à gauche) :

— moins de 3 enfants (3 exclu) : [0,3[


— de 3 à 5 enfants (5 exclu) : [3,5[
— de 5 à 9 enfants (9 exclu) : [5,9[
Déf.8: VARIABLES DISCRETES et VARIABLES CONTINUES

• Une variable est dite DISCRETE si elle ne peut prendre que des valeurs isolées
dans un intervalle de variation (comme les nombres entiers ou rationnels).

exemples:
— le nombre de salariés d'une entreprise,



— le nombre d'enfants d'une famille…

• Une variable CONTINUE peut prendre une infinité de valeurs dans son
intervalle de variation (comme les nombres réels).

exemples:
— la taille, le poids d'une personne,



— le débit d'une canalisation…

Remarque: En fait, toute mesure fournit, en pratique, un nombre discret.

Cependant, on considèrera comme continue, une variable susceptible de prendre
un très grand nombre de valeurs dans un intervalle de variation donné.

exemples: l'age, le poids, la taille…


Pour étudier une variable statistique continue, on est ainsi amené à définir des
classes de valeurs possibles (intervalles semi-ouverts).

Ces classes constituent les modalités du caractère continu.

exemple: la variable salaire mensuel (en €) des ouvriers d'une entreprise possède
les modalités classées suivantes : [0,1000[, [1000,1200[, [1200,1400[,…

I.3 EFFECTIF – FREQUENCE.


Déf.9:
— Soit une population P constituée de N individus,

— Soit le caractère quantitatif K choisi pour étudier les individus,

— Soient (x1, x2, ..., xn) les modalités du caractère K.


A chaque modalité: xi on fait correspondre son effectif: ni qui est le nombre


d'éléments de P possédant la modalité xi du caractère K. 


exemple:
— population :
les 85 salariés d'une entreprise, 


— caractère :
l'age des salariés de l'entreprise, 


— modalités :
x1: nombre de salariés de moins de 20 ans,




x2: …. de plus de 20 ans et moins de 50 ans, 




x3: …. de plus de 50 ans.

modalités (xi) effectifs (ni)

x1 ( age < 20 ) 12!


x2 ( age ≥ 20, < 50 ) 63!
x3 ( age ≥ 50 ) 10!

remarque: du point de vue du caractère K, tous les individus présentant la


modalité xi (les classes d'âges dans l'exemple) sont équivalents.

On ne retient donc que leur nombre ni (l'effectif correspondant à la classe).

Déf.10:
la FREQUENCE fi d'une modalité est le rapport de l'effectif ni de cette

modalité xi à l'effectif total N : fi = n i N



exemple. Population: salariés d'une entreprise. Effectif total N = 12 + 63 + 10 = 85



modalités (xi) effectifs (ni) fréquences (fi = ni /N)
!
x1 ( age < 20 ) 12! 12/85 = 0.141!
x2 ( age ≥ 20, < 50 ) 63! 63/85 = 0.741!
x3 ( age ≥ 50 ) 10! 10/85 = 0.118!

propriété: la somme des fréquences de chaque modalité du caractère est égale à 1




En effet, si on a une population de N individus et m modalités, alors :




m

m m "ni
n i i=1 N
" fi = " = = =1
i=1 i=1 N N N
remarque: il est très important de toujours bien préciser la population étudiée et le
caractère d'étude des individus de cette population !

3

(ici la distribution
! des salariés suivant leur age) On vérifie bien que:
" fi = 1
i=1
Déf.11: l'EFFECTIF CUMULÉ (de la modalité xj ou d'indice j) d'un caractère est


le nombre Nj d'individus pour lequel le caractère prend une valeur


au plus égale à la modalité xj :
N j = # ni

i"j

Déf.12: la FREQUENCE CUMULÉE (de la modalité xj ) d'un caractère est la


fréquence Fj correspondant à l'effectif cumulé Nj :
Fj = N j / N


exemple
Population!: ensemble de N = 64 familles,



caractère K : nombre d'enfants
! par famille (quantitatif).

nombre d'enfants 0 1 2 3 4 5 total
(modalités)
nombre de familles 16 18 14 11 3 2 64
(effectifs)
Fréquences 0.250 0.281 0.219 0.172 0.047 0.031 1
Effectifs cumulés 16 34 48 59 62 64 1
fréquences cumulées 0.250 0,531 0.75 0.922 0.969 1 1

remarque: l'effectif cumulé d'indice 5 est égal à l'effectif total N = 64 et la



fréquence cumulée d'indice 5 est égale à la somme des fréquences : 1

Déf.13:
COURBE CUMULATIVE.


FONCTION CUMULATIVE (ou FONCTION DE RÉPARTITION).


a) La courbe cumulative est la courbe représentative des fréquences cumulées.



C'est le graphe de la fonction réelle F(t) donnant la proportion des individus dont

le caractère prend une valeur au plus égale à t.

b) F(t) est appelée fonction cumulative ou FONCTION DE RÉPARTITION.

c) propriétés:
— F(t) est définie pour tout t réel,



— F(t) est croissante,



— F(t) = 0 si t < min i xi



— F(t) = 1 si t ≥ max i xi

exemple: dans l'exemple précédent d'une population de 64 familles, on a:

t! F(t)!
F(t)

1



[

[[
[0,1[! 16/64 = 0.25! 0.92
[
[

[1,2[! 34/64 = 0.53!


0.75
[
[

F: fonction croissante,

[2,3[! 48/64 = 0.75! 0.53
[
[
en escalier et

continue à droite:

[4,5[! 59/64 = 0.92! lim F(t + " ) = F(t)
0.25 [

[
"#0
[5,6[! 62/64 = 0.97!
t > 6! 1! [

0
1
2
3
4
5
6
t

I.4 REPRÉSENTATIONS GRAPHIQUES


I.4.1 Représentations de caractères qualitatifs





exemple: caractère : nombre de disques vendus par un disquaire.



modalités : (les 4 catégories de disques à vendre):


VF
: variété française,

J
: jazz,

VE
: variété étrangère,

C
: classique.
Catégorie (modalités)
Pourcentage de vente



VF
31



J
8

Représentation en tableau:


VE
38


C
23














Diagramme à secteurs:
les angles au centre des secteurs

doivent être proportionnels à la fréquence

(pourcentage des ventes) des modalités:



= f (en %) 360°






La surface des rectangles doit
Diagramme à bandes:
être proportionnelle à l'effectif

(ou en tuyaux d'orgue).
(pourcentage des ventes) des
modalités



I.4.2 Représentations de caractères quantitatifs




Diagramme en bâtons:


ni
(c'est la représentation typique de caractères quantitatifs discrets)


18

exemple: (c. f. l'exemple des 64 familles)


16

14
dans le diagramme en bâtons on porte:



11
• en abscisse, les valeurs discrètes du caractère,

• en ordonnée, les effectifs correspondants,

• à partir de chaque valeur du caractère, on
xi
trace un trait épais de longueur égale à l'effectif
0 1 2 3 4 5
(ou à la fréquence) de la modalité.

HISTOGRAMME:


l'utilisation classique de l'histogramme concerne le cas de variables à caractère


CONTINU prenant leurs valeurs dans un ensemble d'intervalles (CLASSES),
fermés à gauche et ouverts à droite : [bi , bi+1[



L'effectif de la classe n°i est le nombre ni d'individus dont le caractère prend


une valeur supérieure ou égale à bi et strictement inférieure à bi+1.


• Le centre ci d'une classe [bi , bi+1[ est donné par :


ci = ( bi+1 + bi ) / 2

• L'amplitude ai d'une classe [bi , bi+1[ est donnée par :
ai = ( bi+1 - bi )

• La densité di d'une classe [bi , bi+1[ est donnée par :
di = ni / ai

ex: population: ensemble des candidats à un examen E.

caractère K: notes obtenues regroupées par classes.

ni fi

histogramme de la

répartition des notes

Notes(classées)
[0,4[
[4,8[
[8,12[
[12,16[
[16,20[


250 46%
centres (xi)
2
6
10
14
18

amplitudes (ai)
4
4
4
4
4

140 25.8%
effectifs (ni)
20
140
250
110
22
110 20.2%

fréquences (%)
3.7
25.8
46
20.2
4

5
35
62.5
27.5
5.5
20
densités (di)

0 4 8 12 16 20 xi
— si les classes sont d'amplitudes égales (comme dans l'exemple précédent), il
suffit que la hauteur de chaque rectangle de l'histogramme soit égale à l'effectif
(ou à la fréquence) de la classe correspondante.


— si les classes sont d'amplitude inégales, il faut alors que la surface de chaque
rectangle soit égale à l'effectif (ou à la fréquence) de la classe.


— le polygone des fréquences (courbe en vert) relie l'ensemble des points de


coordonnées (ci, fi) (i = 1, 2, …, n)
ni fi

n





f2





f1

xi
c1 c
2


— il est facile de démontrer que l'aire sous le polygone des fréquences est égale à
l'aire sous l'histogramme.


remarque: dans le cas d'un diagramme en bâtons, le polygone des fréquences


relie simplement les sommets des bâtons.

HISTOGRAMME et COURBE CUMULATIVE dans le cas de variables continues


La fonction de répartition F(x) (appelée aussi courbe cumulative) est calculée en


chaque point x = b0, b1, …, bk, extrémités des classes [bi , bi+1[.


i
En ces points: F(x) = F(bi ) = " f j .


j=1






!


















Sur la figure, l'ordonnée F(x) représente la surface sous l'histogramme à gauche de x.

Ici aussi, F(x) est monotone croissante. F(x)=0 si x est inférieur à la plus petite valeur
du caractère. F(x)=1 si x est supérieur à la plus grande valeur du caractère.

L’intérêt de F(x) est qu’elle peut être définie pour des variables discrètes ou continues!

Vous aimerez peut-être aussi