0% ont trouvé ce document utile (0 vote)
67 vues130 pages

Estimation et Échantillonnage Statistique

Cours de mathématiques

Transféré par

biangavan
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
67 vues130 pages

Estimation et Échantillonnage Statistique

Cours de mathématiques

Transféré par

biangavan
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Estimation, Échantillonnage et Tests

H. Hocquard

HSE 2016-2017

Hervé Hocquard Estimation, Échantillonnage et Tests 1/60


Introduction : les 3 grandes lignes

Les statistiques peuvent permettre :

Hervé Hocquard Estimation, Échantillonnage et Tests 2/60


Introduction : les 3 grandes lignes

Les statistiques peuvent permettre :


d’estimer un paramètre inconnu,

Hervé Hocquard Estimation, Échantillonnage et Tests 2/60


Introduction : les 3 grandes lignes

Les statistiques peuvent permettre :


d’estimer un paramètre inconnu,
de donner une zone dans laquelle un paramètre, a de grandes
chances de se trouver,

Hervé Hocquard Estimation, Échantillonnage et Tests 2/60


Introduction : les 3 grandes lignes

Les statistiques peuvent permettre :


d’estimer un paramètre inconnu,
de donner une zone dans laquelle un paramètre, a de grandes
chances de se trouver,
de prendre des décisions.

Hervé Hocquard Estimation, Échantillonnage et Tests 2/60


Introduction : les 3 grandes lignes

Les statistiques peuvent permettre :


d’estimer un paramètre inconnu,
de donner une zone dans laquelle un paramètre, a de grandes
chances de se trouver,
de prendre des décisions.
Chacune de ses questions correspond à une thématique en
statistiques.

Hervé Hocquard Estimation, Échantillonnage et Tests 2/60


Échantillonnage
L’échantillonnage permet de passer (de la loi connue d’un
paramètre θ dans une population de taille N ) à une estimée d’une
quantité θn fabriquée à partir seulement d’une population de taille
n plus petite (échantillon).

Hervé Hocquard Estimation, Échantillonnage et Tests 3/60


Échantillonnage
L’échantillonnage permet de passer (de la loi connue d’un
paramètre θ dans une population de taille N ) à une estimée d’une
quantité θn fabriquée à partir seulement d’une population de taille
n plus petite (échantillon).

Population mère, effectif N

Echantillon, effectif n

θn inconnu θ connu

Figure: Principe de l’échantillonnage.

Hervé Hocquard Estimation, Échantillonnage et Tests 3/60


Exemple : échantillonnage

Exemple
Dans une entreprise qui compte 659 employés, on sait que 0, 03%
des employés sont mécontents. On pioche un échantillon de 15
employés. Quel est l’ordre de grandeur des employés mécontents
dans cet échantillon ?

Hervé Hocquard Estimation, Échantillonnage et Tests 4/60


Estimation
L’estimation permet d’induire, à partir des résulats observés sur un
échantillon, des informations sur la population totale.

Hervé Hocquard Estimation, Échantillonnage et Tests 5/60


Estimation
L’estimation permet d’induire, à partir des résulats observés sur un
échantillon, des informations sur la population totale.

Population mère, effectif N

Echantillon, effectif n

θn connu θ inconnu

Figure: Principe de l’estimation.

Hervé Hocquard Estimation, Échantillonnage et Tests 5/60


Exemple : estimation

Exemple
Dans un échantillon de 15 employés d’une entreprise, 7%
s’estiment sous pression. Quel est l’ordre de grandeur des employés
sous pression parmi tout le personnel de l’entreprise ?

Hervé Hocquard Estimation, Échantillonnage et Tests 6/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.
Test sur un paramètre. Est-ce qu’une moyenne µ est inférieure
à une valeur µ0 ?

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.
Test sur un paramètre. Est-ce qu’une moyenne µ est inférieure
à une valeur µ0 ?
Test de comparaison. Peut on considérer que la moyenne du
chiffre d’affaire d’entreprises issues d’un réseau A, est la
même que celle d’un réseau B ?

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.
Test sur un paramètre. Est-ce qu’une moyenne µ est inférieure
à une valeur µ0 ?
Test de comparaison. Peut on considérer que la moyenne du
chiffre d’affaire d’entreprises issues d’un réseau A, est la
même que celle d’un réseau B ?

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.
Test sur un paramètre. Est-ce qu’une moyenne µ est inférieure
à une valeur µ0 ?
Test de comparaison. Peut on considérer que la moyenne du
chiffre d’affaire d’entreprises issues d’un réseau A, est la
même que celle d’un réseau B ?
Étant donnée une marge d’erreur α, on rejettera ou ne rejettera
pas une hypothèse au risque α% de se tromper.

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Tests statistiques

Tests de validité d’une hypothèse, prise de décision, contrôle


qualité.
Test sur un paramètre. Est-ce qu’une moyenne µ est inférieure
à une valeur µ0 ?
Test de comparaison. Peut on considérer que la moyenne du
chiffre d’affaire d’entreprises issues d’un réseau A, est la
même que celle d’un réseau B ?
Étant donnée une marge d’erreur α, on rejettera ou ne rejettera
pas une hypothèse au risque α% de se tromper.
Remarque
On ne dira pas ”qu’on valide une hypothèse” mais on dira ”qu’on
ne rejette pas une hypothèse”. En effet, les théories probabilistes
permettent de dire que sous une certaine hypothèse, il n’y a pas de
contradictions...

Hervé Hocquard Estimation, Échantillonnage et Tests 7/60


Exemple : test d’un paramètre

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est intéressée au temps de sommeil
d’un échantillon des employés de l’ entreprise.

Hervé Hocquard Estimation, Échantillonnage et Tests 8/60


Exemple : test d’un paramètre

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est intéressée au temps de sommeil
d’un échantillon des employés de l’ entreprise.
L’étude donne une moyenne du temps de sommeil de 6, 56 h
et un écart-type de 1, 35 h.

Hervé Hocquard Estimation, Échantillonnage et Tests 8/60


Exemple : test d’un paramètre

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est intéressée au temps de sommeil
d’un échantillon des employés de l’ entreprise.
L’étude donne une moyenne du temps de sommeil de 6, 56 h
et un écart-type de 1, 35 h.
Peut-on considérer que le temps de sommeil des employés de
cette entreprise est significativement inférieur au temps de
sommeil moyen des individus qui est de 7h30 ?

Hervé Hocquard Estimation, Échantillonnage et Tests 8/60


Principe général commun

Dans chacun des cas, par les théorèmes probabilistes, on sait que :
une quantité θn converge en loi vers une loi connue (loi
normale, loi du χ2 , loi de Student, loi de Fisher, etc...en
fonction des situations)

Hervé Hocquard Estimation, Échantillonnage et Tests 9/60


Principe général commun

Dans chacun des cas, par les théorèmes probabilistes, on sait que :
une quantité θn converge en loi vers une loi connue (loi
normale, loi du χ2 , loi de Student, loi de Fisher, etc...en
fonction des situations)
Par l’allure des densités de chacune de ces lois, on sait donc
où la variable θn doit de trouver avec grosse probabilité...

Hervé Hocquard Estimation, Échantillonnage et Tests 9/60


Prérequis : lois classiques et convergence en loi

Lois limites classiques (que l’on obtiendra).


Connaı̂tre et savoir lire dans les tables les lois suivante :
Loi normale N (0; 1) et passage à N (µ; σ),
Loi du χ2 ,
Loi de Student,
Loi de Fischer.

Hervé Hocquard Estimation, Échantillonnage et Tests 10/60


Prérequis : lois classiques et convergence en loi

Rappel : convergence en loi.


On dit que la suite de v.a (θn )n converge en loi vers la loi d’une v.a
θ si,
pour tout intervalle [a; b], on a :

lim P(θn ∈ [a; b]) = P(θ ∈ [a; b]).


n→+∞

Hervé Hocquard Estimation, Échantillonnage et Tests 11/60


Prérequis : lois classiques et convergence en loi

Rappel : convergence en loi.


On dit que la suite de v.a (θn )n converge en loi vers la loi d’une v.a
θ si,
pour tout intervalle [a; b], on a :

lim P(θn ∈ [a; b]) = P(θ ∈ [a; b]).


n→+∞

L
Notation : On écrit θn → θ

Hervé Hocquard Estimation, Échantillonnage et Tests 11/60


Prérequis : lois classiques et convergence en loi

Rappel : convergence en loi.


On dit que la suite de v.a (θn )n converge en loi vers la loi d’une v.a
θ si,
pour tout intervalle [a; b], on a :

lim P(θn ∈ [a; b]) = P(θ ∈ [a; b]).


n→+∞

L
Notation : On écrit θn → θ

Exemple
Dans le Théorème central limite, on a vu que si les (Xi )i étaient iid
et
√ d’espérance finie µ et d’écart-type σ, alors la variable
n ¯
σ (Xn − µ) convergeait en loi vers une loi N (0; 1).

Hervé Hocquard Estimation, Échantillonnage et Tests 11/60


Décor, notations valables pour toute la suite du cours

Soit un échantillon de taille n.


Pour 1 ≤ i ≤ n, notons Xi les valeurs d’un paramètre que prennent
les n individus de l’échantillon.
Les Xi sont donc des v.a supposées i.i.d. (indépendantes et
identiquement distribuées), de moyenne µ et d’écart-type σ
(connus ou pas).

Hervé Hocquard Estimation, Échantillonnage et Tests 12/60


La moyenne empirique X¯n

On pose,
P
Xi
X¯n = i=1...n
n
Moyenne empirique des Xi .

Hervé Hocquard Estimation, Échantillonnage et Tests 13/60


Propriétés de X¯n

1
σ2
E(X¯n ) = µ et Var (X¯n ) = .
n

Hervé Hocquard Estimation, Échantillonnage et Tests 14/60


Propriétés de X¯n

1
σ2
E(X¯n ) = µ et Var (X¯n ) = .
n

(conséquences des propriétés de linéarité de l’espérance et de


pseudo linéarité de la variance)

Hervé Hocquard Estimation, Échantillonnage et Tests 14/60


Propriétés de X¯n

1
σ2
E(X¯n ) = µ et Var (X¯n ) = .
n

(conséquences des propriétés de linéarité de l’espérance et de


pseudo linéarité de la variance)
2

lim X¯n = µ
n

(Loi des grands nombres)

Hervé Hocquard Estimation, Échantillonnage et Tests 14/60


Propriétés de X¯n

1
σ2
E(X¯n ) = µ et Var (X¯n ) = .
n

(conséquences des propriétés de linéarité de l’espérance et de


pseudo linéarité de la variance)
2

lim X¯n = µ
n

(Loi des grands nombres)


3

n ¯ L
(Xn − µ) → N (0; 1).
σ
(Théorème central limite)

Hervé Hocquard Estimation, Échantillonnage et Tests 14/60


Justification de l’intérêt de la quantité X¯n

Ainsi, la statistique X¯n converge (en un certain sens) quand n


tend vers l’infini vers µ = E(Xi ). On dit que c’est un
estimateur de µ.

Hervé Hocquard Estimation, Échantillonnage et Tests 15/60


Justification de l’intérêt de la quantité X¯n

Ainsi, la statistique X¯n converge (en un certain sens) quand n


tend vers l’infini vers µ = E(Xi ). On dit que c’est un
estimateur de µ.
On dit qu’il est sans biais car, E(X¯n ) = µ (l’espérance de
l’estimateur est égale à la valeur que l’on cherche à estimer).

Hervé Hocquard Estimation, Échantillonnage et Tests 15/60


Exemple d’application

Exemple
Parmi le personnel d’une entreprise, il y a 300 femmes et 600
hommes. On réalise une enquête sur un échantillon de 55
personnes. Donnez une fourchette du nombres d’hommes et de
femmes de l’échantillon, avec proba 0,95.

Hervé Hocquard Estimation, Échantillonnage et Tests 16/60


Variance empirique

Au regard de la définition de la variance et de la loi des grands


nombres, il est naturel d’introduire :
1 X 1 X 2 2
Sn2 = (Xi − X¯n )2 = [ Xi ] − X¯n
n i=1...n n i=1...n
la variance empirique des Xi .

Hervé Hocquard Estimation, Échantillonnage et Tests 17/60


Variance empirique

Au regard de la définition de la variance et de la loi des grands


nombres, il est naturel d’introduire :
1 X 1 X 2 2
Sn2 = (Xi − X¯n )2 = [ Xi ] − X¯n
n i=1...n n i=1...n
la variance empirique des Xi .
Avantage de cet estimateur, on n’a pas besoin de connaı̂tre
l’espérance µ.

Hervé Hocquard Estimation, Échantillonnage et Tests 17/60


Propriétés

lim Sn2 = E(Xi2 ) − E(Xi )2 = σ 2


n

Hervé Hocquard Estimation, Échantillonnage et Tests 18/60


Propriétés

lim Sn2 = E(Xi2 ) − E(Xi )2 = σ 2


n

(loi des grands nombres aux Xi2 et Xi )

Hervé Hocquard Estimation, Échantillonnage et Tests 18/60


Propriétés

lim Sn2 = E(Xi2 ) − E(Xi )2 = σ 2


n

(loi des grands nombres aux Xi2 et Xi )


2
n−1 2
E(Sn2 ) = σ
n

Hervé Hocquard Estimation, Échantillonnage et Tests 18/60


Propriétés

lim Sn2 = E(Xi2 ) − E(Xi )2 = σ 2


n

(loi des grands nombres aux Xi2 et Xi )


2
n−1 2
E(Sn2 ) = σ
n
(petit calcul) On dit que Sn2 a un biais, E(Sn2 ) 6= σ 2 .
3 On admet que,

Sn2 − n−1
n σ L
2
→ N (0; 1).
Var (Sn2 )

Hervé Hocquard Estimation, Échantillonnage et Tests 18/60


Variance empirique corrigée

Au regard de la définition de la variance et de la loi des grands


nombres, il est naturel d’introduire :
1
(Xi − X¯n )2
X
2
Ŝn−1 =
n − 1 i=1...n
l’estimateur sans biais de la variance.

Hervé Hocquard Estimation, Échantillonnage et Tests 19/60


Variance empirique corrigée

Au regard de la définition de la variance et de la loi des grands


nombres, il est naturel d’introduire :
1
(Xi − X¯n )2
X
2
Ŝn−1 =
n − 1 i=1...n
l’estimateur sans biais de la variance.
2
Avantage de cet estimateur : Ŝn−1 est sans biais, puisque
2 2
E(Ŝn−1 ) = σ .

Hervé Hocquard Estimation, Échantillonnage et Tests 19/60


Outil : estimateur

Pour estimer une quantité, on fabrique une fonction des


observations, (une statistique/une v.a) qui tend vers la
quantité souhaitée, à l’aide des théorémes limites (type Loi
des grands nombres). On préfèrera une statistique sans biais.

Hervé Hocquard Estimation, Échantillonnage et Tests 20/60


Outil : estimateur

Pour estimer une quantité, on fabrique une fonction des


observations, (une statistique/une v.a) qui tend vers la
quantité souhaitée, à l’aide des théorémes limites (type Loi
des grands nombres). On préfèrera une statistique sans biais.
On essaie de connaı̂tre la loi limite de cette statistique.

Hervé Hocquard Estimation, Échantillonnage et Tests 20/60


Outil : estimateur

Pour estimer une quantité, on fabrique une fonction des


observations, (une statistique/une v.a) qui tend vers la
quantité souhaitée, à l’aide des théorémes limites (type Loi
des grands nombres). On préfèrera une statistique sans biais.
On essaie de connaı̂tre la loi limite de cette statistique.
On est alors capable, de donner les fluctuations les plus
probables de la statistique, et de donner par exemple un
intervalle de confiance.

Hervé Hocquard Estimation, Échantillonnage et Tests 20/60


Estimation d’une moyenne, lorsque σ
connu

Hervé Hocquard Estimation, Échantillonnage et Tests 21/60


Estimation d’une moyenne, dans le cas où la variance σ 2
est connue
On estime la moyenne µ par X¯n .

Hervé Hocquard Estimation, Échantillonnage et Tests 22/60


Estimation d’une moyenne, dans le cas où la variance σ 2
est connue
On estime la moyenne µ par X¯n .

L
Par le TCL, on sait que n (X¯n − µ) → N (0; 1).
σ

Hervé Hocquard Estimation, Échantillonnage et Tests 22/60


Estimation d’une moyenne, dans le cas où la variance σ 2
est connue
On estime la moyenne µ par X¯n .

L
Par le TCL, on sait que n (X¯n − µ) → N (0; 1).
σ
Étant donnée une marge d’erreur α, (par ex 5%), on
détermine alors un certain uα à l’aide de la table de la
N (0; 1), tel que
P(|Z | ≤ uα ) ≥ 1 − α, où Z ∼ N (0; 1).

Hervé Hocquard Estimation, Échantillonnage et Tests 22/60


Estimation d’une moyenne, dans le cas où la variance σ 2
est connue
On estime la moyenne µ par X¯n .

L
Par le TCL, on sait que n (X¯n − µ) → N (0; 1).
σ
Étant donnée une marge d’erreur α, (par ex 5%), on
détermine alors un certain uα à l’aide de la table de la
N (0; 1), tel que
P(|Z | ≤ uα ) ≥ 1 − α, où Z ∼ N (0; 1).

On pourra remarquer que uα = z1− α2 = Π−1 (1 − α2 ).



Ainsi avec proba ≥ 1 − α, on a :| n (X¯n − µ)| ≤ z1− α ,
σ 2

Hervé Hocquard Estimation, Échantillonnage et Tests 22/60


Estimation d’une moyenne, dans le cas où la variance σ 2
est connue
On estime la moyenne µ par X¯n .

L
Par le TCL, on sait que n (X¯n − µ) → N (0; 1).
σ
Étant donnée une marge d’erreur α, (par ex 5%), on
détermine alors un certain uα à l’aide de la table de la
N (0; 1), tel que
P(|Z | ≤ uα ) ≥ 1 − α, où Z ∼ N (0; 1).

On pourra remarquer que uα = z1− α2 = Π−1 (1 − α2 ).



Ainsi avec proba ≥ 1 − α, on a :| σn (X¯n − µ)| ≤ z1− α2 , i.e. :

σ σ
X¯n − z1− α2 √ ≤ µ ≤ X¯n + z1− α2 √
n n

Hervé Hocquard Estimation, Échantillonnage et Tests 22/60


Exemple

Exemple
Une machine produit en grande série des objets de masse théorique
180g. On admet que la variable aléatoire qui associe à un objet sa
masse a pour écart-type 0,92g. On prélève un échantillon de 100
objets et on mesure la masse de chacun, on obtient une moyenne
de 179,93g. Déterminer un intervalle de confiance au seuil de
risque de 1%, de la masse µ d’un objet.

Hervé Hocquard Estimation, Échantillonnage et Tests 23/60


Exemple
Soit Xi , la v.a qui renvoit la masse de l’objet i de l’échantillon.
On cherche un intervalle de confiance de µ = E(Xi ).

Hervé Hocquard Estimation, Échantillonnage et Tests 24/60


Exemple
Soit Xi , la v.a qui renvoit la masse de l’objet i de l’échantillon.
On cherche un intervalle de confiance de µ = E(Xi ).
On sait qu’avec proba 1 − α,
σ σ
X¯n − z1− α2 √ ≤ µ ≤ X¯n + z1− α2 √
n n
α = 0, 01 donne un z1− α2 = 2, 58 (table de la loi normale
centrée réduite).

Hervé Hocquard Estimation, Échantillonnage et Tests 24/60


Exemple
Soit Xi , la v.a qui renvoit la masse de l’objet i de l’échantillon.
On cherche un intervalle de confiance de µ = E(Xi ).
On sait qu’avec proba 1 − α,
σ σ
X¯n − z1− α2 √ ≤ µ ≤ X¯n + z1− α2 √
n n
α = 0, 01 donne un z1− α2 = 2, 58 (table de la loi normale
centrée réduite).
D’où,
0, 92 0, 92
179, 93 − 2, 58 × √ ≤ µ ≤ 179, 93 + 2, 58 × √
100 100
i.e. :

Avec proba 0, 99 on a, µ ∈ [179, 69; 180, 17].

Hervé Hocquard Estimation, Échantillonnage et Tests 24/60


Estimation d’une moyenne, lorsque σ
inconnu

Hervé Hocquard Estimation, Échantillonnage et Tests 25/60


Estimation de la moyenne, dans le cas où la variance σ 2 est
inconnue.

On suppose dans ce cas que les Xi suivent des lois


normales N (µ, σ).

Hervé Hocquard Estimation, Échantillonnage et Tests 26/60


Estimation de la moyenne, dans le cas où la variance σ 2 est
inconnue.

n ¯
On utilise le fait que T = Ŝn−1
(Xn − µ) suit une loi de
Student(n − 1).

Hervé Hocquard Estimation, Échantillonnage et Tests 27/60


Estimation de la moyenne, dans le cas où la variance σ 2 est
inconnue.

n ¯
On utilise le fait que T = Ŝn−1
(Xn − µ) suit une loi de
Student(n − 1).
Étant donnée une marge d’erreur α, on détermine alors un
certain tα à l’aide de la table de la loi de student, tel que
P(|T | ≤ tα ) ≥ 1 − α, où T ∼ Student(n − 1).

Hervé Hocquard Estimation, Échantillonnage et Tests 27/60


Estimation de la moyenne, dans le cas où la variance σ 2 est
inconnue.

n ¯
On utilise le fait que T = Ŝn−1
(Xn − µ) suit une loi de
Student(n − 1).
Étant donnée une marge d’erreur α, on détermine alors un
certain tα à l’aide de la table de la loi de student, tel que
P(|T | ≤ tα ) ≥ 1 − α, où T ∼ Student(n − 1).

On conclut, qu’avec proba au moins 1 − α, on a :



n ¯
(Xn − µ) ≤ tα .
Ŝn−1
Ainsi,

Hervé Hocquard Estimation, Échantillonnage et Tests 27/60


Estimation de la moyenne, dans le cas où la variance σ 2 est
inconnue.

n ¯
On utilise le fait que T = Ŝn−1
(Xn − µ) suit une loi de
Student(n − 1).
Étant donnée une marge d’erreur α, on détermine alors un
certain tα à l’aide de la table de la loi de student, tel que
P(|T | ≤ tα ) ≥ 1 − α, où T ∼ Student(n − 1).

On conclut, qu’avec proba au moins 1 − α, on a :



n ¯
(Xn − µ) ≤ tα .
Ŝn−1
Ainsi,
Ŝn−1 Ŝn−1
X¯n − tα √ ≤ µ ≤ X¯n + tα √
n n

Hervé Hocquard Estimation, Échantillonnage et Tests 27/60


Exemple

Exemple
Le chiffre d’affaire mensuel d’une entreprise suit une loi normale de
moyenne µ et d’écart-type σ inconnus. Sur les 12 derniers mois, on
a observé une moyenne des chiffres d’affaires égale à 10 000 euros
avec un écart-type de 2000 euros. Donner une estimation de µ par
intervalle de confiance au niveau 0, 98.

Hervé Hocquard Estimation, Échantillonnage et Tests 28/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.



11 ¯
On sait que T = S12 (X12 − µ) suit une loi de Student(11).

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.



11 ¯
On sait que T = S12 (X12 − µ) suit une loi de Student(11).
À l’aide de la table de la loi de Student, on trouve
tα = t0,02 ' 2, 718 tel que P(|T | ≤ 2, 718) ≥ 0, 98.

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.



11 ¯
On sait que T = S12 (X12 − µ) suit une loi de Student(11).
À l’aide de la table de la loi de Student, on trouve
tα = t0,02 ' 2, 718 tel que P(|T | ≤ 2, 718) ≥ 0, 98.

Donc, | 11 (X¯12 − µ)| ≤ 2, 718 avec proba ≥ 0, 98.
S12

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.



11 ¯
On sait que T = S12 (X12 − µ) suit une loi de Student(11).
À l’aide de la table de la loi de Student, on trouve
tα = t0,02 ' 2, 718 tel que P(|T | ≤ 2, 718) ≥ 0, 98.

Donc, | 11 (X¯12 − µ)| ≤ 2, 718 avec proba ≥ 0, 98.
S12

S12 S12
i.e. : µ ∈ [X¯12 − 2, 718 × √ ; X¯12 + 2, 718 × √ ].
11 11

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Exemple

Soit Xi le chiffre d’affaire de l’entreprise le mois i.



11 ¯
On sait que T = S12 (X12 − µ) suit une loi de Student(11).
À l’aide de la table de la loi de Student, on trouve
tα = t0,02 ' 2, 718 tel que P(|T | ≤ 2, 718) ≥ 0, 98.

Donc, | 11 (X¯12 − µ)| ≤ 2, 718 avec proba ≥ 0, 98.
S12

S12 S12
i.e. : µ ∈ [X¯12 − 2, 718 × √ ; X¯12 + 2, 718 × √ ].
11 11

Avec X¯12 = 10000 et S12 = 2000, on obtient

µ ∈ [8360, 9; 11639, 02], avec proba 0, 98.

Hervé Hocquard Estimation, Échantillonnage et Tests 29/60


Intervalle de confiance d’une
proportion

Hervé Hocquard Estimation, Échantillonnage et Tests 30/60


Intervalle de confiance d’une proportion

Soit A un évènement aléatoire de proba p.


On appelle p̂ = n1 × nombre de fois où Xi réalise A.
p̂ est un estimateur sans biais de p.
On peut alors en déduire :

s s
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z1− α2 ≤ p ≤ p̂ + z1− α2
n n

Hervé Hocquard Estimation, Échantillonnage et Tests 31/60


Exemple

Exemple
Dans un échantillon de 197 pommes, on constate que 19 d’entre
elles sont abimées. Déterminer un intervalle de confiance au risque
5% de la proportion de pommes abimées dans la production.

Hervé Hocquard Estimation, Échantillonnage et Tests 32/60


Exemple

On sait qu’avec proba 1 − α,


s s
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z1− α2 ≤ p ≤ p̂ + z1− α2
n n

α = 0, 05 donne un z1− α2 = 1, 96 (table de la loi normale


centrée réduite).

Hervé Hocquard Estimation, Échantillonnage et Tests 33/60


Exemple

On sait qu’avec proba 1 − α,


s s
p̂(1 − p̂) p̂(1 − p̂)
p̂ − z1− α2 ≤ p ≤ p̂ + z1− α2
n n

α = 0, 05 donne un z1− α2 = 1, 96 (table de la loi normale


centrée réduite).
D’où,
19 19
− 1, 96 × 0, 021 ≤ p ≤ + 1, 96 × 0, 021
197 197
i.e. :

Avec proba 0, 95 on a, p ∈ [0, 055; 0, 137].

Hervé Hocquard Estimation, Échantillonnage et Tests 33/60


Tests paramétriques

Hervé Hocquard Estimation, Échantillonnage et Tests 34/60


Point de vue global

C’est une stratégie analogue à celles des estimations. On


utilise la même technologie.

Hervé Hocquard Estimation, Échantillonnage et Tests 35/60


Point de vue global

C’est une stratégie analogue à celles des estimations. On


utilise la même technologie.
On fait une hypothèse sur un paramètre. On sait alors que,
sous cette hypothèse, une certaine v.a (une statistique) doit
être distribuée suivant une certaine loi (Théorème limites,
distribution d’échantillonage).

Hervé Hocquard Estimation, Échantillonnage et Tests 35/60


Point de vue global

C’est une stratégie analogue à celles des estimations. On


utilise la même technologie.
On fait une hypothèse sur un paramètre. On sait alors que,
sous cette hypothèse, une certaine v.a (une statistique) doit
être distribuée suivant une certaine loi (Théorème limites,
distribution d’échantillonage).
On vérifie alors, avec un taux α, ”l’adéquation” des 2 lois. Il
existe des tests unilatéraux et bilatéraux.

Hervé Hocquard Estimation, Échantillonnage et Tests 35/60


Test bilatéral d’une moyenne, σ
connu

Hervé Hocquard Estimation, Échantillonnage et Tests 36/60


Test bilatéral d’une moyenne, cas où σ connu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 37/60


Test bilatéral d’une moyenne, cas où σ connu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que pour n grand, la v.a

n ¯
(Xn − µ0 ) doit suivre une N (0; 1).
σ

Hervé Hocquard Estimation, Échantillonnage et Tests 37/60


Test bilatéral d’une moyenne, cas où σ connu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que pour n grand, la v.a

n ¯
(Xn − µ0 ) doit suivre une N (0; 1).
σ

Étant donnée une marge d’erreur α, on détermine alors un


certain uα à l’aide de la table de la N (0; 1), tel que

P(|Z | ≤ uα ) ≥ 1 − α, où Z ∼ N (0; 1).

Hervé Hocquard Estimation, Échantillonnage et Tests 37/60


Test bilatéral d’une moyenne, cas où σ connu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que pour n grand, la v.a

n ¯
(Xn − µ0 ) doit suivre une N (0; 1).
σ

Étant donnée une marge d’erreur α, on détermine alors un


certain uα à l’aide de la table de la N (0; 1), tel que

P(|Z | ≤ uα ) ≥ 1 − α, où Z ∼ N (0; 1).

En fait, uα = z1− α2 .

La position du nombre σn (X¯n − µ0 ) par rapport à
[−z1− α2 ; z1− α2 ], permet de rejeter ou de ne pas rejeter H0 .
Hervé Hocquard Estimation, Échantillonnage et Tests 37/60
Test bilatéral d’une moyenne, cas où σ connu

Ainsi,

n ¯
Si σ (Xn − µ0 ) ∈ [−z1− α2 ; z1− α2 ], on ne rejette pas H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 38/60


Test bilatéral d’une moyenne, cas où σ connu

Ainsi,

n ¯
Si σ (Xn − µ0 ) ∈ [−z1− α2 ; z1− α2 ], on ne rejette pas H0 .
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 38/60


Test bilatéral d’une moyenne, cas où σ connu

Figure: Zones de rejet et de non rejet de H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 39/60


Test bilatéral d’une moyenne, σ
inconnu mais échantillon Gaussien

Hervé Hocquard Estimation, Échantillonnage et Tests 40/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

Dans le cas où σ est inconnu, c’est le même principe mais on


raisonne cette fois avec la variable de décision Tn−1 et on suppose
que les Xi suivent une loi Normale N (µ; σ).

Hervé Hocquard Estimation, Échantillonnage et Tests 41/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 42/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que la v.a,

n ¯
Tn−1 = (Xn − µ0 ) doit suit une loi de Student(n − 1)
Ŝn−1

Hervé Hocquard Estimation, Échantillonnage et Tests 42/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que la v.a,

n ¯
Tn−1 = (Xn − µ0 ) doit suit une loi de Student(n − 1)
Ŝn−1

Étant donnée une marge d’erreur α, on détermine alors un


certain tα à l’aide de la table de Student(n − 1), tel que

P(|Tn−1 | ≤ tα ) ≥ 1 − α.

Hervé Hocquard Estimation, Échantillonnage et Tests 42/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ = µ0 contre H1 : µ 6= µ0 .


Sous H0 , on sait que la v.a,

n ¯
Tn−1 = (Xn − µ0 ) doit suit une loi de Student(n − 1)
Ŝn−1

Étant donnée une marge d’erreur α, on détermine alors un


certain tα à l’aide de la table de Student(n − 1), tel que

P(|Tn−1 | ≤ tα ) ≥ 1 − α.


n ¯
Étude de la position de Ŝn−1
(Xn − µ0 ) par rapport à [−tα ; tα ].

Hervé Hocquard Estimation, Échantillonnage et Tests 42/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

Ainsi, on a la même discussion,


Si Tn−1 ∈ [−tα ; tα ], on ne rejette pas H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 43/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

Ainsi, on a la même discussion,


Si Tn−1 ∈ [−tα ; tα ], on ne rejette pas H0 .
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 43/60


Test bilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

Figure: Zones de rejet et de non rejet de H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 44/60


Exemple : Effet sur le temps de sommeil des
aménagements d’horaires dans une entreprise

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est interessée au temps de sommeil
d’un échantillon de 30 employés de l’entreprise.

Hervé Hocquard Estimation, Échantillonnage et Tests 45/60


Exemple : Effet sur le temps de sommeil des
aménagements d’horaires dans une entreprise

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est interessée au temps de sommeil
d’un échantillon de 30 employés de l’entreprise.
L’étude donne une moyenne du temps de sommeil de 6, 56 h
et un écart-type de 1, 35 h.

Hervé Hocquard Estimation, Échantillonnage et Tests 45/60


Exemple : Effet sur le temps de sommeil des
aménagements d’horaires dans une entreprise

En vue d’aménager les heures de travail du personnel d’une


entreprise, une étude s’est interessée au temps de sommeil
d’un échantillon de 30 employés de l’entreprise.
L’étude donne une moyenne du temps de sommeil de 6, 56 h
et un écart-type de 1, 35 h.
En supposant que le temps de sommeil d’un employé suit une
loi normale, peut on considérer que le temps de sommeil des
employés de cette entreprise est inférieur au temps de sommeil
moyen des individus qui est de 7h30 au seuil 5% ?

Hervé Hocquard Estimation, Échantillonnage et Tests 45/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).
Soit H0 : µ = 7, 5.

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).
Soit H0 : µ = 7, 5.

29 ¯
Sous H0 , on a T29 = S30 (X30 − 7, 5) ∼ Student(29).

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).
Soit H0 : µ = 7, 5.

29 ¯
Sous H0 , on a T29 = S30 (X30 − 7, 5) ∼ Student(29).
La table de Student donne P(|T | ≤ 2, 045) ≥ 0, 95.

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).
Soit H0 : µ = 7, 5.

29 ¯
Sous H0 , on a T29 = S30 (X30 − 7, 5) ∼ Student(29).
La table de Student donne P(|T | ≤ 2, 045) ≥ 0, 95.

29
Ici T29 = 1,35 (6, 56 − 7, 5) = −3, 74.

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Exemple : Effet sur le temps de sommeil des
aménagements d’ horaire dans une entreprise

Soit Xi le temps de sommeil de la personne i de l’échantillon,


on suppose que Xi ∼ N (µ, σ).
Soit H0 : µ = 7, 5.

29 ¯
Sous H0 , on a T29 = S30 (X30 − 7, 5) ∼ Student(29).
La table de Student donne P(|T | ≤ 2, 045) ≥ 0, 95.

29
Ici T29 = 1,35 (6, 56 − 7, 5) = −3, 74.
Donc T29 ∈
/ [−2, 045 : 2, 045], et on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 46/60


Test unilatéral d’une moyenne, cas
d’un échantillon Gaussien et σ connu

Hervé Hocquard Estimation, Échantillonnage et Tests 47/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ connu

Ainsi, on a la même discussion,


On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 48/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ connu

Ainsi, on a la même discussion,


On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .

Si n (X¯n − µ0 ) ∈ [−z1− α ; z1− α ], on ne rejette pas H0 .
σ 2 2

Hervé Hocquard Estimation, Échantillonnage et Tests 48/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ connu

Ainsi, on a la même discussion,


On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .

Si n (X¯n − µ0 ) ∈ [−z1− α ; z1− α ], on ne rejette pas H0 .
σ 2 2
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 48/60


Test unilatéral d’une moyenne, cas
d’un échantillon Gaussien et σ
inconnu

Hervé Hocquard Estimation, Échantillonnage et Tests 49/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 50/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .



Si Tn−1 = n (X¯n − µ0 ) ∈ [−t2α ; t2α ], on ne rejette pas H0 .
Ŝn−1

Hervé Hocquard Estimation, Échantillonnage et Tests 50/60


Test unilatéral d’une moyenne, cas d’un échantillon
Gaussien et σ inconnu

On veut tester l’hypothèse H0 : µ < µ0 contre H1 : µ ≥ µ0 .



Si Tn−1 = n (X¯n − µ0 ) ∈ [−t2α ; t2α ], on ne rejette pas H0 .
Ŝn−1
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 50/60


Test d’une proportion

Hervé Hocquard Estimation, Échantillonnage et Tests 51/60


Test d’une proportion

On suppose dans ce cas que les Xi suivent des lois de


Bernouilli B(p). On souhaite comparer la valeur inconnue de p à
une valeur de référence p0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 52/60


Test bilatéral d’une proportion

On veut tester l’hypothèse H0 : p = p0 contre H1 : p 6= p0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 53/60


Test bilatéral d’une proportion

On veut tester l’hypothèse H0 : p = p0 contre H1 : p 6= p0 .


p̂ − p0
Si Z = q ∈ [−z1− α2 ; z1− α2 ], on ne rejette pas H0 .
p0 (1−p0 )
n

Hervé Hocquard Estimation, Échantillonnage et Tests 53/60


Test bilatéral d’une proportion

On veut tester l’hypothèse H0 : p = p0 contre H1 : p 6= p0 .


p̂ − p0
Si Z = q ∈ [−z1− α2 ; z1− α2 ], on ne rejette pas H0 .
p0 (1−p0 )
n
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 53/60


Test unilatéral d’une proportion

On veut tester l’hypothèse H0 : p < p0 contre H1 : p ≥ p0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 54/60


Test unilatéral d’une proportion

On veut tester l’hypothèse H0 : p < p0 contre H1 : p ≥ p0 .


p̂ − p0
Si Z = q ≤ z1−α , on ne rejette pas H0 .
p0 (1−p0 )
n

Hervé Hocquard Estimation, Échantillonnage et Tests 54/60


Test unilatéral d’une proportion

On veut tester l’hypothèse H0 : p < p0 contre H1 : p ≥ p0 .


p̂ − p0
Si Z = q ≤ z1−α , on ne rejette pas H0 .
p0 (1−p0 )
n
Sinon on rejette H0 .

Hervé Hocquard Estimation, Échantillonnage et Tests 54/60


Statistique bidimensionnelle

Hervé Hocquard Estimation, Échantillonnage et Tests 55/60


Covariance et coefficient de corrélation

• Covariance empirique :
Pn Pn
i=1 (xi − µX )(yi − µY ) i=1 xi yi
σXY = = − µX µY .
n n

Hervé Hocquard Estimation, Échantillonnage et Tests 56/60


Covariance et coefficient de corrélation

• Covariance empirique :
Pn Pn
i=1 (xi − µX )(yi − µY ) i=1 xi yi
σXY = = − µX µY .
n n

• Coefficient de corrélation empirique :


σXY
ρXY = .
σX σY

Hervé Hocquard Estimation, Échantillonnage et Tests 56/60


Test de linéarité

• −1 ≤ ρXY ≤ 1.

Hervé Hocquard Estimation, Échantillonnage et Tests 57/60


Test de linéarité

• −1 ≤ ρXY ≤ 1.
• |ρXY | = 1 si et seulement si tous les points (xi , yi ) sont
parfaitement alignés.

Hervé Hocquard Estimation, Échantillonnage et Tests 57/60


Test de linéarité

• −1 ≤ ρXY ≤ 1.
• |ρXY | = 1 si et seulement si tous les points (xi , yi ) sont
parfaitement alignés.
• si le coefficient de corrélation est proche de 1 en valeur
absolue on pourra espérer une relation linéaire entre X et Y ;
on pourra rejeter cette hypothèse dans le cas contraire.

Hervé Hocquard Estimation, Échantillonnage et Tests 57/60


Droite d’ajustement
On cherche donc la droite Y = aX + b “la plus proche possible”
de notre nuage de points par la méthode des moindres carrés,
c’est-à-dire celle qui minimise la quantité suivante :
n
X
D(a, b) = (yi − axi − b)2
i=1

Théorème
Il existe une et une seule droite qui minimise l’expression D(a, b),
cette droite d’équation y = ax + b passe par le point moyen
(X̄ , Ȳ ) et a pour pente
σXY σY
a= 2 = ρXY
σX σX

Il s’agit de la droite de régression de Y par rapport à X.


Hervé Hocquard Estimation, Échantillonnage et Tests 58/60
Exemple
Exemple
On cherche à savoir s’il y a une corrélation linéaire entre le nombre
de machines à laver et le nombre de déficients visuels dans une
population. Pour cela, on a relevé les échantillons suivants dans un
pays d’Europe :

Année 70 71 72 73 74 75
machines (en centaine de milliers) 13 20 23 25 27 31
déficients visuels / 1000 habitants 8 8 9 10 11 11
Année 76 77 78 79 80 81 82 83
machines (en c. de m.) 36 46 55 63 70 76 81 85
déficients visuels · · · 12 16 18 19 20 21 22 23
1 Calculer le coefficient de corrélation de ces échantillons.
2 Que ce coefficient semble-t-il indiquer ?
Cela vous semble-t-il cohérent ?
Hervé Hocquard Estimation, Échantillonnage et Tests 59/60
Références

Walter Apple
Probabilités pour les non-probabilistes
H&K, édition, 2013
Clément Rau
http ://www.math.univ-toulouse.fr/ rau/
Communication privée, 2015

Hervé Hocquard Estimation, Échantillonnage et Tests 60/60

Vous aimerez peut-être aussi