Variables instrumentales/Sources d'endogénéité

Début de la boite de navigation du chapitre

Ce chapitre explique l'endogénéité et expose les différentes sources d'endogénéité.

Sources d'endogénéité
Icône de la faculté
Chapitre no 1
Leçon : Variables instrumentales
Retour auSommaire
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Variables instrumentales : Sources d'endogénéité
Variables instrumentales/Sources d'endogénéité
 », n'a pu être restituée correctement ci-dessus.

Introduction

modifier

La technique des variables instrumentales découle des modèles de régressions. Dans les modèles de régressions on veut estimer les paramètres associés à plusieurs variables dont on suppose qu’elles ont un effet sur une tierce variable.

La technique des variables instrumentales permet, lorsque l'information est disponible, d'estimer un paramètre qui aurait été biaisé s'il avait été estimé par la méthode des moindres carrés ordinaire .

Soit le modèle de régression linéaire :

 .

L'hypothèse la plus importante pour l'estimation par MCO est l'absence de corrélation entre les variables explicatives et le terme d'erreur. Cette hypothèse est l'hypothèse d'exogénéité. Dans le modèle ci-dessus, les deux variables explicatives sont supposées exogènes. Dans un modèle de régression, une variable est considéré comme exogène lorsque :

 .

Biais de l'estimateur

modifier

Soit le modèle vu en introduction. Dans ce modèle, on va tout d’abord supposer que la variable   est endogène, c'est-à-dire que l’on a la relation suivante entre   :

  ,

ce qui implique que l'hypothèse   n'est plus vérifiée.

Nous savons que l'estimation par MCO des paramètres   donne le résultat suivant :

 

où X est la matrice des variables explicatives, y compris la colonne de la constante et y le vecteur de la variable expliquée.

En remplaçant y par son expression suivant le modèle de régression on obtient

 .


Si nous avions pu poser l'hypothèse  , alors nous aurions pu montrer que   n’est pas biaisé :

 .

Mais comme cette hypothèse n’est pas vérifiée, nous montrons que l'estimateur de   est biaisé

 .

Sources d'endogénéité

modifier

On considère généralement trois sources d'endogénéité d'une variable explicative. La première, qui est celle qui est traitée dans l'exo 1, est la variable omise.

Imaginons que, dans l'équation 1, la variable   est corrélée avec une variable   que l’on n'a pas à notre disposition. De fait, la variable   est comprise dans le terme d'erreur  . Ainsi,   ce qui implique que   n'est plus vérifiée.