0% ont trouvé ce document utile (0 vote)
115 vues16 pages

Econometrie Des Donnees de Panel

Le document traite de l'économétrie des données de panel, définissant ces données comme ayant une dimension individuelle et temporelle. Il justifie l'utilisation de modèles à données de panel en soulignant leurs avantages, tels que le contrôle de l'hétérogénéité individuelle et l'analyse des dynamiques temporelles. Un exemple illustratif est fourni pour démontrer l'application de ces modèles dans l'estimation des relations entre variables économiques.

Transféré par

reallejuste22
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
115 vues16 pages

Econometrie Des Donnees de Panel

Le document traite de l'économétrie des données de panel, définissant ces données comme ayant une dimension individuelle et temporelle. Il justifie l'utilisation de modèles à données de panel en soulignant leurs avantages, tels que le contrôle de l'hétérogénéité individuelle et l'analyse des dynamiques temporelles. Un exemple illustratif est fourni pour démontrer l'application de ces modèles dans l'estimation des relations entre variables économiques.

Transféré par

reallejuste22
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Table des matières

ECONOMETRIE DES DONNEES DE PANEL ........................................................... 2

Chapitre I : Définitions, justification des modèles de données de panel et exemple


illustratif ................................................................................................................................. 2

1. Définitions..................................................................................................... 2

2. Justification des modèles à données de panel ............................................... 2

3. Exemple illustratif ......................................................................................... 4

4. Choix entre une spécification homogène ou hétérogène : test d’homogénéité


8

A. Présentation des différents cas ................................................................. 8

B. Construction des tests ............................................................................. 10

Chapitre II : Estimation des modèles de régression à partir de données de panel.... 12

1. Le modèle à effets fixes individuels ........................................................... 12

A. La méthode des moindres carrés à variables muettes (LSDV) (modèle de


covariance) 12

B. Estimateur within ...................................................................................... 13

2. Le modèle à effets aléatoires....................................................................... 14

A. Présentation du modèle à effets aléatoires ................................................ 14

B. Estimation ................................................................................................. 15

3. Choix entre effets individuels fixes et effets individuels aléatoires : le test


d’Hausman 15

1
ECONOMETRIE DES DONNEES DE PANEL

Chapitre I : Définitions, justification des modèles a données de


panel et exemple illustratif

1. Définitions
Les données de panel (ou données longitudinales) sont représentatives d’une double
dimension : dimension individuelle et dimension temporelle. Il existe deux types de panel : le
panel cylindré ou équilibré (balanced panel en anglais) et le panel non cylindré ou non équilibré
(unbalanced panel en anglais). Un panel cylindré a le même nombre d’observations pour tous
les individus alors qu’un panel non cylindré est un panel où il manque des observations pour
certains individus.

2. Justification des modèles à données de panel


 Les données de panel offrent plusieurs avantages par rapport aux autres types de
données, notamment les données en coupe instantanée (cross-section) et les séries
chronologiques ou séries temporelles.

Voici quelques-uns des principaux avantages des données de panel :

**Contrôle de l'hétérogénéité individuelle non observée : les données de panel permettent


de contrôler les effets non observés qui sont constants dans le temps pour chaque unité
d'observation (comme les individus, les entreprises ou les pays). Par exemple, des
caractéristiques individuelles telles que les compétences, la motivation, ou les préférences qui
ne changent pas dans le temps peuvent être contrôlées, réduisant ainsi le biais d'omission.

**Analyse des dynamiques temporelles : les données de panel permettent d'étudier l'évolution
des variables dans le temps, ce qui est crucial pour comprendre les dynamiques de changement
et pour analyser les relations de cause à effet. Cela permet d'examiner comment une variable
d'intérêt évolue suite à une modification d'une autre variable.

2
**Efficacité statistique accrue : en combinant les variations temporelles et interindividuelles,
les données de panel offrent une plus grande quantité d'information, ce qui peut augmenter
l'efficacité statistique des estimations. Cela se traduit souvent par des estimations plus précises
et robustes.

**Étude des effets fixes et variables : les données de panel permettent de séparer les effets
fixes (qui ne varient pas dans le temps) des effets variables (qui changent dans le temps). Cette
distinction est particulièrement utile pour identifier les facteurs qui influencent les résultats
d'intérêt.

**Réduction du problème de colinéarité : en utilisant des variations sur plusieurs périodes,


les données de panel peuvent aider à réduire les problèmes de colinéarité entre les variables
explicatives, ce qui améliore la précision des estimations des coefficients dans les modèles
économétriques.

**Détection des changements et des transitions : les données de panel permettent d'analyser
les transitions d'un état à un autre (par exemple, le passage de l'emploi au chômage) et d'étudier
les facteurs qui influencent ces transitions, offrant ainsi une perspective plus riche que les
données en coupe instantanée.

**Étude de la causalité : grâce à la capacité de suivre les mêmes unités au fil du temps, les
données de panel sont particulièrement bien adaptées pour l'analyse des relations causales, en
exploitant les variations temporelles pour identifier les effets de causalité potentiels.

**Flexibilité des modèles économétriques : les données de panel permettent d'utiliser une
variété de modèles économétriques spécifiques (tels que les modèles à effets fixes, les modèles
à effets aléatoires, et les modèles de différence en différences) qui sont conçus pour traiter les
particularités de ces données.

En somme, les données de panel sont un outil puissant pour l'analyse empirique, offrant
une richesse d'information et des possibilités d'analyse approfondies qui ne sont pas
disponibles avec d'autres types de données.

3
3. Exemple illustratif
Dans cet exemple, l’on cherche à mesurer l’effet de la valeur réelle de l’entreprise (𝑋2)
et du stock de capital réel (𝑋3) sur l’investissement brut réel (𝑌).

Pour cela, quatre (4) firmes américaines ont été choisies : General Electric (GE),
General Motor (GM), US Steel (US) et Westinghouse (WEST). Pour chaque firme, l’on a des
données en séries temporelles et la période d’étude part de 1935 à 1954. Les données peuvent
être présentées comme suit :

GE (Firme 1) US (Firme 2)
Années Y 𝑋2 𝑋3 Années Y 𝑋2 𝑋3

1935 … … … 1935 … … …

1936 … … … 1936 … … …

1937 … … … 1937 … … …

… …

1954 1954

GM (Firme 3) WEST (Firme 4)


Années Y 𝑋2 𝑋3 Années Y 𝑋2 𝑋3

1935 … … … 1935 … … …

1936 … … … 1936 … … …

1937 … … … 1937 … … …

… …

1954 1954

Avec ces données, différentes possibilités d’estimation peuvent être réalisées :

 Régression de Y sur X2 et X3 pour chaque firme ; ce qui conduite à faire 4 régressions


(séries temporelles)
 Régression de Y sur X2 et X3 pour les 4 firmes par année (coupes instantanées) ; cela
conduit à 20 régressions (car de 1935 à 1954 il y a 20 observations)

4
 Régression de Y sur X2 et X3 sur les 80 observations (20x4) groupées ; cela conduit à
une seule régression sur les 80 observations groupées.

Le modèle général s’écrit :

𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2𝑖 𝑋2𝑖𝑡 + 𝛽3𝑖 𝑋3𝑖𝑡 + 𝑢𝑖𝑡

𝑌𝑖𝑡 : Variable endogène observée pour l’individu i à la période t

𝑋2𝑖𝑡 𝑒𝑡 𝑋3𝑖𝑡 : Variable exogènes observées pour l’individu i à la date t

𝛽1𝑖 : Terme constant pour l’individu i

𝛽2𝑖 , 𝛽3𝑖 : Coefficients des 2 variables exogènes pour l’individu i

𝑢𝑖𝑡 : Terme d’erreur pour l’individu i à la période t

En l’écrivant pour l’ensemble des 80 observations (4 firmes X 20 périodes) l’on a:

𝑌1 1 = 𝛽11 + 𝛽21 𝑋2 1 1 + 𝛽31 𝑋311 + 𝑢11


𝑌 = 𝛽11 + 𝛽21 𝑋2 1 2 + 𝛽31 𝑋312 + 𝑢12
𝐹𝑖𝑟𝑚𝑒 1 (𝐺𝐸) { 1 2
⋮ ⋮ ⋮
𝑌1 20 = 𝛽11 + 𝛽21 𝑋2 1 20 + 𝛽31 𝑋31 20 + 𝑢1 20

𝑌2 1 = 𝛽12 + 𝛽22 𝑋2 2 1 + 𝛽32 𝑋321 + 𝑢21


𝑌 = 𝛽12 + 𝛽22 𝑋2 2 2 + 𝛽32 𝑋322 + 𝑢22
𝐹𝑖𝑟𝑚𝑒 2 (𝑈𝑆) { 2 2
⋮ ⋮ ⋮
𝑌2 20 = 𝛽12 + 𝛽22 𝑋2 2 20 + 𝛽32 𝑋32 20 + 𝑢2 20

𝑌3 1 = 𝛽13 + 𝛽23 𝑋2 3 1 + 𝛽33 𝑋331 + 𝑢31


𝑌 = 𝛽13 + 𝛽23 𝑋2 3 2 + 𝛽33 𝑋332 + 𝑢32
𝐹𝑖𝑟𝑚𝑒 3 (𝐺𝑀) { 3 2
⋮ ⋮ ⋮
𝑌3 20 = 𝛽13 + 𝛽23 𝑋2 3 20 + 𝛽33 𝑋33 20 + 𝑢3 20

𝑌4 1 = 𝛽14 + 𝛽24 𝑋2 4 1 + 𝛽34 𝑋341 + 𝑢41


𝑌 = 𝛽14 + 𝛽24 𝑋2 4 2 + 𝛽34 𝑋342 + 𝑢42
𝐹𝑖𝑟𝑚𝑒 4 (𝑊𝐸𝑆𝑇) { 4 2
⋮ ⋮ ⋮
𝑌4 20 = 𝛽14 + 𝛽24 𝑋2 4 20 + 𝛽34 𝑋34 20 + 𝑢420

Sous forme matricielle le modèle s’écrit :

5
𝑌11 1 𝑋211 𝑋311 𝛽 𝑢11
11
𝑌 1 𝑋212 𝑋312 𝛽 𝑢
Firme1 : [ 12 ] = [ ] [ 21 ] + [ 12 ]
⋮ ⋮ ⋮ ⋮ ⋮
𝑌120 1 𝑋2120 𝑋3120 𝛽31 𝑢120

𝑌21 1 𝑋221 𝑋321 𝛽 𝑢21


12
𝑌 1 𝑋222 𝑋322 𝛽 𝑢
Firme 2 : [ 22 ] = [ ] [ 22 ] + [ 22 ]
⋮ ⋮ ⋮ ⋮ ⋮
𝑌220 1 𝑋2220 𝑋3220 𝛽32 𝑢220

𝑌31 1 𝑋231 𝑋331 𝛽 𝑢31


13
𝑌 1 𝑋232 𝑋332 𝑢
Firme 3 :[ 32 ] = [ ] [𝛽23 ] + [ 32 ]
⋮ ⋮ ⋮ ⋮ ⋮
𝑌320 1 𝑋2320 𝑋3320 𝛽33 𝑢320

𝑌41 1 𝑋241 𝑋341 𝛽 𝑢41


14
𝑌 1 𝑋242 𝑋342 𝛽 𝑢
Firme 4 :[ 42 ] = [ ] [ 24 ] + [ 42 ]
⋮ ⋮ ⋮ ⋮ ⋮
𝑌420 1 𝑋2420 𝑋3420 𝛽34 𝑢420

𝑌11
𝑌12 𝑢11
1 0 0 0 𝑋211 0 0 0 𝑋311 0 0 0 𝛽11 𝑢12

𝑌120 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝛽12 ⋮
0 𝑋2120 0 0 0 𝑋3120 0 𝛽13 𝑢120
𝑌21 1 0 0 0 0 𝑢21
𝑌22 0 1 0 0 0 𝑋221 0 0 0 𝑋321 0 0 𝛽14 𝑢22
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝛽21 ⋮
𝑌220 0 1 0 0 0 𝑋2220 0 0 0 𝑋3220 0 0 𝛽22 𝑢220
= 𝑋331 0 𝛽23 + 𝑢31
𝑌31 0 0 1 0 0 0 𝑋231 0 0 0
𝑌32 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝛽24 𝑢32
⋮ 0 0 1 0 0 0 𝑋2320 0 0 0 𝑋3320 0 𝛽31 ⋮
𝑢320
𝑌320 0 0 0 1 0 0 0 𝑋241 0 0 0 𝑋341 𝛽32 𝑢41
𝑌41 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 𝛽33 𝑢42
𝑌42 [0 0 0 1 0 0 0 𝑋2420 0 0 0 𝑋3420 ] [𝛽34 ] ⋮
⋮ [𝑢420 ]
[𝑌420 ]

Si les hypothèses classiques sur les erreurs sont respectées (homoscédasticité et


indépendance temporelle) et que celles-ci (les erreurs) sont indépendantes d’un individu
à l’autre (𝒄𝒐𝒗 (𝜺𝒊𝒕 , 𝜺𝒋𝒕 ) = 𝟎 ∀ 𝒊 ≠ 𝒋) l’on peut appliquer la méthode des moindres carrés

6
ordinaires pour chacune des 𝑵 équations relatives aux individus. Dans le cas où
l’hypothèse d’indépendance entre les individus n’est plus vérifiée (𝒄𝒐𝒗 (𝜺𝒊𝒕 , 𝜺𝒋𝒕 ) = 𝝈𝟐𝒊𝒋 ≠
𝟎 ∀ 𝒊 ≠ 𝒋), l’estimateur des MCO n’est plus BLUE ; dans ces conditions l’on applique la
méthode SUR (Seemingly Unrelated Regression) de Zellner.

 Les données de panel présentent plusieurs avantages, mais elles ont aussi des limites et
des défis spécifiques. Voici quelques-unes des principales limites des données de panel
:

**Problèmes de biais de sélection : Les panels peuvent souffrir de biais de sélection si les
unités qui restent dans l'étude au fil du temps diffèrent systématiquement de celles qui sortent
de l'échantillon. Par exemple, certains participants peuvent abandonner l'étude, ce qui peut
entraîner un échantillon non représentatif.

**Problèmes de mesure : Le suivi des mêmes unités sur de longues périodes peut introduire
des erreurs de mesure, notamment des erreurs dues à des réponses inexactes ou à des
changements dans la façon dont les variables sont mesurées au fil du temps.

**Coût et complexité : Collecter des données de panel est souvent coûteux et complexe, car il
nécessite le suivi des mêmes unités sur de longues périodes, ce qui peut être logistiquement et
financièrement contraignant.

**Effets de panel (ou effets fixes) : Bien que les données de panel permettent de contrôler les
effets non observés qui sont constants dans le temps pour chaque unité, cela peut également
limiter la variation explorable et rendre difficile l'identification des effets causaux pour les
variables qui ne varient pas beaucoup dans le temps.

**Manque de données ou données manquantes : Les données de panel peuvent souffrir de


données manquantes, que ce soit parce que les unités ne sont pas observées à certains moments
ou en raison de la non-réponse des participants, ce qui peut biaiser les résultats.

**Problèmes de dépendance temporelle : Les observations dans les données de panel sont
corrélées dans le temps, ce qui peut poser des défis pour l'analyse statistique. Les méthodes
traditionnelles d'analyse des données peuvent ne pas être appropriées, et des techniques

7
spécifiques aux données de panel, telles que les modèles à effets fixes ou aléatoires, sont
nécessaires.

**Hétérogénéité non observée : Bien que les données de panel permettent de contrôler pour
l'hétérogénéité non observée qui est constante dans le temps, elles ne permettent pas de
contrôler l'hétérogénéité non observée qui varie au fil du temps, ce qui peut introduire des biais
si elle est corrélée avec les variables explicatives.

Ces limites nécessitent souvent des ajustements méthodologiques spécifiques pour


maximiser la validité des conclusions tirées des analyses de données de panel.

4. Choix entre une spécification homogène ou hétérogène : test


d’homogénéité
Lorsque l’on considère des données de panel, la toute première chose qu’il convient de
vérifier est la spécification homogène ou hétérogène du processus générateur des données.

Sur le plan économétrique, cela revient à tester l’égalité des coefficients du modèle
étudié dans la dimension individuelle

Sur le plan économique, les tests de spécifications reviennent à déterminer si l’on est en
droit de supposer que le modèle théorique étudié est parfaitement identique pour tous les pays
(ou toutes les unités individuelles) ou au contraire s’il existe des spécificités propres à chaque
pays (ou à chaque unité individuelle).

Le choix propose une procédure séquentielle de tests permettant de définir le cas dans
lequel nous nous situons.

A. Présentation des différents cas

Soit le modèle suivant :

𝑌𝑖𝑡 = 𝛽0𝑖 + 𝛽𝑖′ 𝑋𝑖𝑡 + 𝜀𝑖𝑡

𝑌𝑖𝑡 : Variable endogène observée pour l’individu i à la période t

8
𝑋𝑖𝑡 : Vecteurs des 𝑘 variables exogènes

𝑋𝑖𝑡′ = (𝑋1𝑖𝑡 , 𝑋2𝑖𝑡 , … , 𝑋𝑘𝑖𝑡 )

𝛽0𝑖 : Terme constant pour l’individu i

𝛽𝑖′ : Vecteur des k variables exogènes 𝛽𝑖′ = (𝛽1𝑖 , 𝛽2𝑖 , … , 𝛽𝑘𝑖 )

𝜀𝑖𝑡 : Terme d’erreur

A partir de l’équation ci-dessus, quatre possibilités peuvent être envisagées

1er cas : 𝛽0𝑖 = 𝛽0 𝑒𝑡 𝛽𝑖′ = 𝛽 ′ ∀𝑖 ∈ [1, 𝑁]

(𝑁 désigne le nombre d’individus)

Ici les 𝑁 constants 𝛽0𝑖 et les 𝑁 vecteurs de paramètre 𝛽𝑖 sont identiques.

On qualifie alors le panel de panel homogène. On dit aussi qu’il y a homogénéité totale
(on peut donc appliquer les MCO ou MCG sur données empilées)

2éme cas : les N constantes 𝛽0𝑖 et les N vecteurs de paramètre 𝛽𝑖 sont différents selon
les individus. On a donc N modèles différents. On rejette donc la structure de panel.

On parle alors d’hétérogénéité totale. Ici le modèle doit être estimé individu par individu
par les MCO (ou les MCG selon la structure de la matrice des variances-covariances des
erreurs).

3éme cas : 𝛽0𝑖 = 𝛽0 ∀𝑖 tandis que les 𝛽𝑖 diffèrent selon les individus. Dans ce cas, tous
les coefficients du modèle, à l’exception des constantes, sont différents selon les individus. Ici
également les N modèles doivent être estimés individu par individu.

4éme cas : les N vecteurs de paramètres 𝛽𝑖 sont identiques (𝛽𝑖 = 𝛽 ∀𝑖 ∈ [1, 𝑁]) tandis
que les constantes 𝛽0𝑖 différent selon les individus. On obtient un modèle à effets individuels.

Pour discriminer ces différentes configurations et pour s’assurer du bien-fondé de la


structure de panel, il convient d’adopter une procédure de tests d’homogénéité emboîtés comme

9
décrit précédemment. La procédure générale de test présenté dans HSIAO (1986) est décrite
comme suit :

Test 𝐻01 : 𝛽0𝑖 = 𝛽0 𝑒𝑡 𝛽𝑖′ = 𝛽 , ∀𝑖 ∈ [1, 𝑁]

𝐻01 Vraie
𝐻01 Rejetée

Cas n°1 : Homogénéité totale


Test 𝐻02 : 𝛽𝑖′ = 𝛽′ , ∀𝑖 ∈ [1, 𝑁]

𝑌𝑖𝑡 = 𝛽0 + 𝛽⬚ 𝑋𝑖𝑡 + 𝜀𝑖𝑡

𝐻02 Rejetée 𝐻02 Vraie

Cas n°2 : Hétérogénéité totale


Test 𝐻03 : 𝛽0𝑖 = 𝛽0 ∀𝑖 ∈ [1, 𝑁]
𝑌𝑖𝑡 = 𝛽0𝑖 + 𝛽𝑖 𝑋𝑖𝑡 + 𝜀𝑖𝑡

𝐻03 Rejetée 𝐻03 Vraie

Cas n°4 : Modèle


B. Construction desatests
effets individuels
Cas n°1 : Homogénéité totale
𝑌𝑖𝑡 = 𝛽0𝑖 + 𝛽′𝑋𝑖𝑡 + 𝜀𝑖𝑡 ′
𝑌𝑖𝑡 = 𝛽0 + 𝛽⬚ 𝑋𝑖𝑡 + 𝜀𝑖𝑡
1er test: 𝐻01 ∶ 𝛽0𝑖 = 𝛽0 𝑒𝑡 𝛽𝑖′ ′
= 𝛽 ∀𝑖 ∈ [1, 𝑁]

(𝑆𝐶𝑅𝐶1 − 𝑆𝐶𝑅)⁄(𝑁 − 1)(𝐾 + 1)


𝐹1 =
𝑆𝐶𝑅/[𝑁𝑇 − 𝑁(𝐾 + 1)]

𝑆𝐶𝑅𝐶1 : Somme des carrés des résidus du modèle contraint sous 𝐻01

10
SCR : somme des carrés des résidus du modèle non contraint

NT : nombre d’observations

K+1 : nombre de coefficients à estimer

SCR1,𝑐 s’obtient après les MCO sur les données empilées

𝑆𝐶𝑅 = ∑ 𝑆𝐶𝑅𝑖
𝑖=1

Si 𝐹1 > 𝐹𝛼 ((𝑁 − 1)(𝐾 + 1); 𝑁𝑇 − 𝑁(𝐾 + 1)), on rejette 𝐻01 au seuil de 𝛼

2éme test : 𝐻02 : 𝛽𝑖′ = 𝛽′ , ∀𝑖 ∈ [1, 𝑁]

(𝑆𝐶𝑅𝐶2 − 𝑆𝐶𝑅)⁄((𝑁 − 1)𝐾)


𝐹2 =
𝑆𝐶𝑅/[𝑁𝑇 − 𝑁(𝐾 + 1)]

𝑆𝐶𝑅𝐶2 : Somme des carrés des residus du modele contraint sous 𝐻02

𝑆𝐶𝑅 : Somme des carrés des résidus du modele non contraint

Si 𝐹2 > 𝐹𝛼 , on rejette 𝐻02 au seuil de 𝛼

3éme test : 𝐻03 : 𝛽0𝑖 = 𝛽0 ∀𝑖 ∈ [1, 𝑁]

(𝑆𝐶𝑅𝐶1 − 𝑆𝐶𝑅𝐶2 )⁄(𝑁 − 1)


𝐹3 =
𝑆𝐶𝑅𝐶2 /[𝑁(𝑇 − 1) − 𝐾]

𝑆𝐶𝑅𝐶2 : Somme des carrés des résidus du modèle contraint sous 𝐻02

𝑆𝐶𝑅𝐶1 : Somme des carrés des résidus du modèle contraint sous 𝐻01

Si 𝐹3 > 𝐹𝛼 , on rejette 𝐻03 au seuil de 𝛼

11
Chapitre II : Estimation des modèles de régression à partir de
données de panel

1. Le modèle à effets fixes individuels


Soit le modèle a effets fixes individuels suivants :

𝑌𝑖𝑡 = 𝛽0𝑖 + 𝛽′𝑋𝑖𝑡 + 𝜀𝑖𝑡

L’estimation d’un tel modèle dépend de la structure des termes d’erreurs :

 Si les erreurs sont homoscédastiques, non autocorrélées dans la dimension


temporelle (𝑐𝑜𝑣 (𝜀𝑖𝑡 , 𝜀𝑖𝓈 ) = 0 ∀ 𝑡 ≠ 𝓈) et dans la dimension individuelle (𝑐𝑜𝑣 (𝜀𝑖𝑡 , 𝜀𝑗𝑡 ) =
0 ∀ 𝑖 ≠ 𝑗) ; la méthode des moindre carrés ordinaires (MCO) sur les variables muettes ou
indicatrices ou sur les estimateurs 𝑤𝑖𝑡ℎ𝑖𝑛 est appropriée.
 Par contre si les erreurs sont hétéroscédastiques et/ou autocorrélées dans la
dimension temporelle (𝑐𝑜𝑣 (𝜀𝑖𝑡 , 𝜀𝑖𝓈 ) ≠ 0 ∀ 𝑡 ≠ 𝓈) mais indépendantes dans la dimension
individuelle (𝑐𝑜𝑣 (𝜀𝑖𝑡 , 𝜀𝑗𝑡 ) = 0 ∀ 𝑖 ≠ 𝑗) la méthode des moindre carrés généralisées (MCG) est
plus appropriée sur les variables muettes ou sur les estimateurs within

A. La méthode des moindres carrés à variables muettes (LSDV) (modèle de


covariance)

Reprenons notre exemple sur les quatre firmes.

Ici on prend en compte l’individualité de chaque firme en permettant à chaque intercepte


d’être différent pour chaque entreprise mais les coefficients de pente restent identiques.

𝑌𝑖𝑡 = 𝛽1𝑖 + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + 𝜀𝑖𝑡

La différence dans les interceptes peut provenir de traits spécifiques à chaque firme,
comme par exemple le style de direction ou la philosophie des relations sociales.

NB : on parle de modèle à effets fixes car les interceptes peuvent varier entre individus ;
ils ne varient pas dans le temps (invariabilité temporelle).

12
En pratique, en utilisant des variables muettes on a :

𝑌𝑖𝑡 = 𝛼1 + 𝛼2 𝐷2𝑖 + 𝛼3 𝐷3𝑖 + 𝛼4 𝐷4𝑖 + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + 𝜀𝑖𝑡

1 𝑠𝑖 𝑙 ′ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 ∈ 𝐺𝑀
Où 𝐷2𝑖 = {
0 𝑠𝑖𝑛𝑜𝑛
(La firme GE est la
1 𝑠𝑖 𝑙 ′ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 ∈ 𝑈𝑆
𝐷3𝑖 = { catégorie de référence)
0 𝑠𝑖𝑛𝑜𝑛

1 𝑠𝑖 𝑙 ′ 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑡𝑖𝑜𝑛 ∈ 𝑊𝐸𝑆𝑇
𝐷4𝑖 = {
0 𝑠𝑖𝑛𝑜𝑛

Supposons qu’après régression l’on ait :

̂
𝑌𝑖𝑡 = 𝛼
̂1 + 𝛼
̂𝐷2 2𝑖 + 𝛼
̂𝐷3 3𝑖 + 𝛼
̂𝐷 ̂ ̂
4 4𝑖 + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡

Si tous les 4 interceptes sont statistiquement significatifs alors on a :

𝛼
̂1 pour GE (catégorie de référence)

(𝛼̂1 + 𝛼̂2 ) pour GM

(𝛼̂1 + 𝛼̂3 ) pour US

(𝛼̂1 + 𝛼̂4 ) pour WEST

Ces différences dans les interceptes peuvent être dues aux spécificités de chaque firme
telles que les différences dans le style managérial ou le talent de management.

B. Estimateur within

L’estimateur within (ou estimateur intra-individuel) consiste à centrer préalablement


toutes les variables dépendantes et exogènes sur leurs moyennes individuelles et à appliquer les
MCO (ou MCG si les erreurs sont hétéroscédastiques et / ou autocorrélées) sur le modèle
transformé :

𝑌𝑖𝑡 − 𝑌̅𝑖 = 𝛽 ′ (𝑋𝑖𝑡 − 𝑋̅𝑖 ) + 𝜀𝑖𝑡 ∀ 𝑖 = 1, … , 𝑁 𝑒𝑡 𝑡 = 1, … , 𝑇

13
Après l’estimation des coefficients 𝛽 ′ , les coefficients fixes individuels 𝛽0𝑖 s’obtiennent
par les relations 𝛽̂01 = 𝑌̅1 − 𝛽̂ ′ 𝑋̅1 ; 𝛽̂02 = 𝑌̅2 − 𝛽̂ ′ 𝑋̅2 ; … ; 𝛽̂0𝑁 = 𝑌̅𝑁 − 𝛽̂ ′ 𝑋̅𝑁

NB : Cette méthode d’estimation conduit exactement aux mêmes résultats que la


méthode LSDV.

2. Le modèle à effets aléatoires


A. Présentation du modèle à effets aléatoires

Ici l’effet individuel n’est plus fixe mais une variable aléatoire i.e. 𝛽0𝑖 est une variable
aléatoire.

Le terme d’erreur se décompose de la manière suivant : 𝜀𝑖𝑡 = 𝛽0𝑖 + 𝜆𝑡 + 𝑣𝑖𝑡 d’où le


nom donné aussi à ce type de modèle : modèle à erreur composée (Error components model).

𝛽0𝑖 : Effets individuels aléatoires

𝜆𝑡 : Effets temporels (identique pour tous les individus)

𝑣𝑖𝑡 ∶ Terme d’erreur qui est tel que :

𝐸(𝑣𝑖𝑡 ) = 0 ; 𝑉𝑎𝑟 (𝑣𝑖𝑡 ) = 𝜎 2

𝛽0𝑖 𝑒𝑡 𝜆𝑡 Vérifient les hypothèses suivantes :

 Espérances mathématiques nulles ;


 Homoscédasticité ;
 Indépendance temporelle

Si l’effet temporel n’existe pas (𝜆𝑡 = 0) alors le modèle à effets aléatoires individuels
s’écrit :

𝑌𝑖𝑡 = 𝛽0 + 𝛽 ′ 𝑋𝑖𝑡 + 𝜀𝑖𝑡 𝑎𝑣𝑒𝑐 𝜀𝑖𝑡 = 𝛽0𝑖 + 𝑣𝑖𝑡

𝑌𝑖𝑡 = 𝛽0 + 𝛽0𝑖 + 𝛽 ′ 𝑋𝑖𝑡 + 𝑣𝑖𝑡

𝛽0 désigne un coefficient fixe identique pour tous les individus.

14
B. Estimation

La méthode d’estimation appropriée est celle des moindres carrés généralisés


(MCG) car la composante aléatoire 𝛽0𝑖 est une variable de 𝜀𝑖𝑡 et 𝜀𝑖𝑡′ (𝜀𝑖𝑡 = 𝛽0𝑖 + 𝑣𝑖𝑡 )

On a donc une autocorrélation des erreurs (cf. Sevestre 2002).

On démontre que l’estimateur obtenu par les MCG est une moyenne pondérée des
estimateurs within et between (ou estimateur interindividuel noté 𝛽̂𝐵𝑒𝑡 ) est l’estimateur des
MCO appliquée sur le modèle dont les données sont les N moyennes individuelles des variables
explicatives et à expliquer.

𝛽̂𝑀𝐶𝐺 = ∆𝛽̂𝑏𝑒𝑡 + (1 − ∆)𝛽̂𝐿 𝑆𝐷𝑉

∆ est la valeur de poids ; c’est une matrice de dimension (𝑘) et est inversement
proportionnel à la matrice des variances-covariance de 𝛽̂𝐵𝑒𝑡

NB :

 On démontre que l’estimateur des MCO sur les données empilées se ramène aussi à une
moyenne pondérée des estimateurs within et between
 L’introduction d’effets individuels aléatoires permet donc de combiner une
spécification intermédiaire entre le modèle avec effets fixes. La structure du panel n’est ni
totalement homogène, ni totalement hétérogène.

3. Choix entre effets individuels fixes et effets individuels


aléatoires : le test d’Hausman
Le test d’Hausman permet d’arrêter de manière définitive la nature de l’effet fixe et ceux
à effets aléatoires sont statistiquement différents.

Le test se présente comme suit :

𝐻0 : 𝛽̂𝐿𝑆𝐷𝑉 − 𝛽̂𝑀𝐶𝐺 = 0 𝑉𝑆 𝐻1 : 𝛽̂𝐿𝑆𝐷𝑉 − 𝛽̂𝑀𝐶𝐺 ≠ 0

(Le modèle est effets aléatoires) (Le modèle est à effets fixes)

15
La statistique du test est donnée par :

−1
𝐻 = (𝛽̂𝐿𝑆𝐷𝑉 − 𝛽̂𝑀𝐶𝐺 )′ [𝑉𝑎𝑟(𝛽̂𝐿𝑆𝐷𝑉 ) − 𝑉𝑎𝑟(𝛽̂𝑀𝐶𝐺 )] (𝛽̂𝐿𝑆𝐷𝑉− 𝛽̂𝑀𝐶𝐺 ) ↝ 𝜒 2 (𝑘)

Si H > 𝜒 2 (𝑘) alors on rejette 𝐻0 et on conclut que l’estimateur LSDV (within) est non
biaisé ; l’on rejette alors la spécification à effets aléatoires et on choisit un modèle à effets fixes
individuels.

16

Vous aimerez peut-être aussi