0% ont trouvé ce document utile (0 vote)
210 vues4 pages

Analyse statistique des logements et salaires

Ce document contient des exercices statistiques portant sur des variables quantitatives discrètes et continues. Il présente des calculs de moyenne, écart-type, quartiles et analyse de distributions pour caractériser des populations.

Transféré par

ham Macuisine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
210 vues4 pages

Analyse statistique des logements et salaires

Ce document contient des exercices statistiques portant sur des variables quantitatives discrètes et continues. Il présente des calculs de moyenne, écart-type, quartiles et analyse de distributions pour caractériser des populations.

Transféré par

ham Macuisine
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Corrigé TD 4

Exercice 1

1) Population statistique : 120 logements décrits au cours d'une enquête. Individu statistique : l'un de
ces 120 logements. Caractère : le nombre de pièces des logements. Type du caractère : quantitatif
discret.

2)
Nombre de pièces Nombre de logements
N(x) ni xi ni xi²
(xi) (ni)
1 11 11 11 11
2 22 33 44 88
3 31 64 93 279
4 25 89 100 400
5 17 106 85 425
6 8 114 48 288
7 3 117 21 147
8 2 119 16 128
9 1 120 9 81
Totaux 120 427 1 847

Étendue = valeur de la modalité la plus élevée - valeur de la modalité la moins élevée = 9 - 1 = 8

Moyenne =427/120= 3,56 =>3.6 pièces / logement

Ecart-type :

2
1 k
1847  427 
x 
n

i 1
n i x i2 - x 2     1,6
120  120 


Coefficient de variation = CV   0,43
= (dispersion moyenne car 0,3≤CV≤0,6).
x

Ici, on a : Mo = 3 pièces / logement et Me = 3 pièces / logement (n est pair et les 60° et 61°
observations correspondent à 3). Ces valeurs sont inférieures à la moyenne : la distribution est très
légèrement étalée à droite.
On a donc : Mode=Mediane<Moyenne

(Les quartiles sont peu utilisés dans le cas de variables discrètes). La colonne des effectifs cumulés
permet de déterminer des valeurs entières des 3 quartiles :
- La valeur de la modalité qui correspond au quartile Q 1 est donnée par les (n/4,n/4+1)èmes
observations (n est pair) soit ici les 30 et 31ièmes observations ce qui correspond à la modalité
2. Donc Q1=2 pièces par logement
- Q2=médiane=3.
- Pour Q3 on regarde les (3n/4,3n/4+1)èmes observations soit 90 et 91ièmes donc Q3=5.
Exercice 2

f'i
Intervalle fi Fi ai (freq. Corr.) ci fi ci fi ci²
[0-5[ 26.9% 26.9% 5 161.4% 2.5 0,6725 1.68125
[5-20[ 34.9% 61.8% 15 69.8% 12,5 4,3625 54.53125
[20-50[ 27.5% 89.3% 30 27.5% 35 9.625 336.875
[50-80[ 10.7% 100% 30 10.7% 65 6.955 452.075
100,0% 21.615 845.1625

Calcul des fréquences corrigées : f'i = fi/ai x 30

1) Par interpolation linéaire, on obtient (utilisation des formules du cours) :

Q1=4,6468 : 25 % des exploitations font moins de 4,6468 ha et 75 % font plus de 4,6468 ha.
Q2= 14,93 : 50 % des exploitations font moins de 14,93 ha et 50 % font plus de 14,93 ha.
Q3=34,4 : 75 % des exploitations font moins de 34.4 ha et 25 % font plus de 34.4 ha.

50% des exploitations sont comprises entre 4,6468 ha (Q1) et 34.4 ha (Q3).

2) L'écart interquartile Q3 - Q1 (caractéristique de dispersion autour de la médiane) est de 29,753 ha.

Le rapport interquartile Q3 / Q1 (nombre sans dimension) est de 7.4.

3°) On utilise ici la méthode algébrique, en procédant par interpolation linéaire. On a :

Ici : F(27) = 61,8 + (89.3 - 61,8) x (27 - 20) / (50 - 20). Il vient : F (27) = 68.22 %. Ce pourcentage
correspond à la proportion d'exploitations dont la superficie est inférieure ou égale à 27 ha.

Ainsi, pour obtenir le pourcentage d'exploitations dont la superficie est supérieure à 27 ha, on pose :
100 - F (27) = 31.78 %. Donc 31.78 % des exploitations ont une superficie supérieure à 27 ha.

4°) La moyenne est de 21.615 ha, l'écart-type est égal à 19.44 ha et CV = 0.9. Il s'agit d'une dispersion
des superficies des exploitations très élevée par rapport à la surface d'exploitation moyenne.

5°) On a : classe modale = [ 0 - 5 [ ha. Selon l'hypothèse d'équirépartition des effectifs dans la classe
modale Mo = 2.5 ha. On a donc Mo < Me < moyenne. L'étalement à droite de la distribution est très
important.

Par ailleurs, ici, on a : s Y = 0,31 >0 donc étalement à droite.


Exercice 3

f' i = (fi/ai) x 1,4

f' i corr.
Intervalle ci fi Fi ai fici fici ²
(*1000)

[4,5-12,1[ 8,30 0,10 0,1 7,6 18,4 0,83 6,89


[12,1-13,5[ 12,80 0,10 0,2 1,4 100,0 1,28 16,38
[13,5-14,8[ 14,15 0,10 0,3 1,3 107,7 1,42 20,02
[14,8-16,2[ 15,50 0,10 0,4 1,4 100,0 1,55 24,03
[16,2-17,8[ 17,00 0,10 0,5 1,6 87,5 1,70 28,90
[17,8-19,8[ 18,80 0,10 0,6 2,0 70,0 1,88 35,34
[19,8-22,5[ 21,15 0,10 0,7 2,7 51,9 2,12 44,73
[22,5-26,8[ 24,65 0,10 0,8 4,3 32,6 2,47 60,76
[26,8-35,5[ 31,15 0,10 0,9 8,7 16,1 3,12 97,03
[35,5-55[ 45,25 0,10 1,0 19,5 7,2 4,53 204,76
1,0 20,88 538,85
1)
Répartition des salaires nets annuels

100%

90%

80%
Fréquences cumulées Fi

70%

60%

50%

40%

30%

20%

10%

0%
0 5 10 15 20 25 30 35 40 45 50 55 60
Q1 Me Q3 Extrémités des classes de salaires

1°) Le quartile Q1 est la valeur de la modalité telle qu'on trouve 25 % de l'effectif au-dessous de cette
valeur et 75 % au-dessus. La médiane (ou quartile Q2) (caractéristique de tendance centrale) est la
valeur de la modalité telle qu'on trouve 50 % de l'effectif au-dessous de cette valeur et 50 % au-dessus.
C'est la valeur de la modalité qui partage l'effectif en 2 sous-ensembles égaux. Le quartile Q3 est la
valeur de la modalité telle qu'on trouve 75 % de l'effectif au-dessous de cette valeur et 25 % au-dessus.

Ici (lecture graphique) :


25 % des revenus sont inférieurs à 14 K€ et 75 % des revenus supérieurs à 14 K€.
50 % des revenus sont inférieurs à 18 K€ et 50 % des revenus supérieurs à 18 K€ (donc
médiane=18 K€).
75 % des revenus sont inférieurs à 24,5 K€ et 25 % des revenus supérieurs à 24,5 K€.
Valeur exacte de Q1 :

𝑄1 ∈ [13,5 − 14,8[
(0,25 − 0,2)
𝑄1 = 13,5 + (14,8 − 13,5) × = 14,15
0,1

2°) 50 % des revenus annuels ont une valeur comprise entre 14 K€ et 24,5 K€ et l'écart interquartile Q3
- Q1 (caractéristique de dispersion autour de la médiane) est de 10,5 K€.

Le rapport interquartile Q3 / Q1 (nombre sans dimension) est de 1,75.

3°) La moyenne est de 20,88 K€, l'écart-type est égal à 10,15 K€ et CV = 0,49. 0,3≤CV≤0,6 : il existe
une dispersion moyenne des salaires autour du salaire annuel moyen.

4°) On a : sY = (Q3 - 2Me + Q1) / (Q3 - Q1). Ici, on a : sY = 0,24 Étalement à droite assez important.

5°) La colonne des fréquences corrigées figure dans le tableau ci-dessus. Constat : la fréquence
corrigée max est celle dont l’amplitude de classe est la plus petite (car ici les fréquences sont
identiques).

6°) Ici, on a : classe modale = [ 13,5 - 14,8 [ K€ (utilisation des fréquences corrigées). Selon l'hypothèse
d'équirépartition des effectifs dans la classe modale ---> centre de la classe et Mo = 14,15 K€. On a
donc Mo < Me < moyenne. L'étalement à droite de la distribution est important.

Vous aimerez peut-être aussi