Couverture de ECOP_180

Article de revue

Une synthèse des tests de cointégration sur données de Panel

Pages 241 à 265

Notes

  • (*)
    LEO, Université d'Orléans. Faculté de Droit, d'Economie et de Gestion. E-mail : cchristophe. hurlin@ univ-orleans. fr
  • (**)
    EconomiX, Université Paris X - Nanterre et Cepii. E-mail : Valerie. MMignon@ u-paris10. fr
  • (1)
    On rappelle que des séries intégrées d'ordre d (où d est un entier positif), ce que l'on note I(d), sont cointégrées d'ordre (d, b)CI(d, b) • s'il existe une combinaison linéaire de ces séries intégrée d'ordre d-b, avec 0< ?b d.
  • (2)
    Pour une revue de la littérature, voir notamment Banerjee (1999), Phillips et Moon (2000), Baltagi et Kao (2000) ou encore Hurlin et Mignon (2005).
  • (3)
    Rappelons que tester la forme relative de la PPA revient à effectuer un test de cointégration entre le change nominal et les indices de prix.
  • (4)
    Notons que, même si la très grande majorité des études sur données de panel porte sur l'analyse des taux de change, il existe cependant des travaux dans d'autres domaines. À titre d'exemple, McCoskey et Selden (1998) et Gerdtham et Löthgren (1998) se sont attachés à l'étude des dépenses de santé et Breitung et Mayer (1994) à l'analyse des salaires. Islam (1995), Evans et Karas (1996), Sala-i-Martin (1996), Lee, Pesaran et Smith (1997), Pedroni (1998), Cechetti et alii (1999) et McCoskey et Kao (1999b) ont étudié les problèmes de croissance et de convergence. La dynamique de l'épargne et de l'investissement a fait l'objet de travaux de Coakley, Kulasi et Smith (1996) et Moon et Phillips (1998) ou encore Banerjee et Zanghieri (2003) sur le paradoxe de Feldstein-Horioka. Mentionnons également les travaux de Funk (1998), McCoskey et Kao (1999a) et Kao, Chiang et Chen (1999) sur les activités de R&D au niveau international.
  • (5)
    Augmenter le nombre de données en ajoutant la dimension individuelle et non en augmentant la dimension temporelle réduit en outre le risque de faire face à des ruptures structurelles.
  • (6)
    On peut étendre l'analyse à un vecteur xit incluant à la fois des variables I(0) et I(1) dèslors qu'au moins deux variables sont intégrées d'ordre 1.
  • (7)
    Une exception notable est le modèle VECM proposé par Groen et Kleibergen (2003). Cette approche semble toutefois difficile à mettre en oeuvre dans la mesure où elle nécessite des panels de taille très importante.
  • (8)
    Rien ne justifie a priori que tous les pays tendent vers la même relation technologique à long terme. Cette hypothèse mériterait à tout le moins d'être testée.
  • (9)
    Par abus de langage, nous parlons ici de modèle de cointégration homogène, mais rappelons que l'homogénéité des relations de cointégration n'implique pas l'homogénéité de la représentation VECM et donc du panel.
  • (10)
    L'absence de dépendances inter-individuelles dans la dynamique de court terme se traduit par l'hypothèse ?ij =0, ? ?i j.
  • (11)
    À noter que les effets individuels ?i et les trends ?i t appartiennent à l'espace de cointégration s'il existe et doivent donc être distingués des effets individuels et des trends de l'équation (1).
  • (12)
    « Communes » à la fois au sens usuel du terme en séries temporelles, i.e. communes à l'ensemble des m variables non stationnaires st, mais aussi « communes » au sens spécifique au panel, i.e. communes à l'ensemble des N individus.
  • (13)
    On exclut ici à la fois la cointégration intra et inter-individuelles.
  • (14)
    Phillips et Moon (1999) démontrent que ces résultats demeurent valides dans le cas d'une convergence simultanée.
  • (15)
    Ce test peut être vu comme un analogue du test de racine unitaire de Levin et Lin (voir Levin et Lin, 1992,1993, et Levin et alii, 2002) sur les résidus estimés de la relation de long terme.
  • (16)
    Ce test peut être vu comme un analogue du test de racine unitaire t-bar de Im, Pesaran et Shin (2003) sur les résidus estimés de la relation de long terme.
  • (17)
    Notons que pour les tests reposant sur la dimension between, les étapes 2 et 3 ne sont pas nécessaires, dans la mesure où ceux-ci ne nécessitent pas le calcul du paramètre de nuisance Li112.
  • (18)
    Notons que Kao (1999) a également considéré le cas où une tendance déterministe est présente.
  • (19)
    Pour un exposé détaillé de ce test, voir Hurlin et Mignon (2005).
  • (20)
    Cette procédure est dénommée PANIC (Panel Analysis of Nonstationarity in the Idiosyncratic and Common components) par les auteurs.
  • (21)
    Ce point est très important dans l'application des tests de racine unitaire et de cointégration sur données de panel (voir Hurlin et Mignon, 2005, pour des explications détaillées). En effet, à l'exception du test de Bai et Ng (2001), les tests de racine unitaire supposent l'absence de corrélation (et donc de relation de cointégration) entre les individus du panel : yit et yjt ne sont pas cointégrés pour i j?. Dansun tel contexte, les tests exhibent une taille et une puissance satisfaisantes. Cependant, en présence de cointégration entre les individus, la taille des tests devient très importante, surtout quand T augmente. En d'autres termes, les tests rejettent trop souvent l'hypothèse nulle d'absence de cointégration (voir les simulations effectuées par Banerjee et alii, 2000,2003).
  • (22)
    Il convient de noter que Larsson et alii (2001) ont proposé un test du rang de cointégration dans des panels hétérogènes basé sur la moyenne des statistiques de la trace introduites par Johansen (1991,1995). Ce test souffre néanmoins d'importants problèmes de taille et nécessite une valeur très élevée de T.
  • (23)
    Le test peut alors s'effectuer de manière séquentielle, partant de r = 0 jusqu'à r = k • 1.
  • (24)
    Il est également possible d'introduire une tendance spécifique dans la relation de long terme (voir McCoskey et Kao, 1998).
  • (25)
    Voir infra.
  • (26)
    Cesconstantes peuvent être obtenues par simulations de Monte Carlo. Elles dépendent uniquement du nombre de régresseurs M et de la présence ou non de termes constants et/ou de tendances dans la relation de cointégration. Elles prennent les valeurs suivantes : µ? =0,1162 et ??2 = 0,0109 (voir McCoskey et Kao, 1998).
  • (27)
    Dansle cas général, xi peut désigner un vecteur de M régresseurs qui ne sont pas cointégrés entre eux. À des fins de simplication, on considère ici que xi est univarié, les résultats pouvant être étendus sans difficulté au cas multivarié.
Nous tenons à remercier un rapporteur anonyme dont les remarques ont permis d'améliorer la version initiale de l'article.

1Depuis les travaux pionniers de Levin et Lin (1992), la littérature relative à l'économétrie des données de panel non stationnaires • et, en particulier, aux tests de cointégration • connaît un développement considérable. Comment expliquer un tel succès des études sur données de panel ? En d'autres termes, quel est l'apport lié à l'ajout de la dimension individuelle à la dimension temporelle usuelle ? Susceptible de répondre à l'argument classique relatif à la faible puissance des tests de cointégration sur séries temporelles en petit échantillon, l'ajout de la dimension individuelle permet d'accroître le nombre de données en incluant l'information relative à des pays différents et mener ainsi une analyse multi-pays. Il est en effet naturel de penser que les propriétés de long terme des séries ont une forte probabilité d'être communes à plusieurs pays. Par ailleurs, un autre avantage issu de l'ajout de la dimension individuelle à la dimension temporelle provient du fait que les distributions asymptotiques des tests de racine unitaire sur données de panel sont asymptotiquement normales, alors qu'elles sont non standard lorsque seule la dimension temporelle est considérée. Enfin, les nouvelles générations de tests de racine unitaire et de cointégration en panel permettent de prendre en compte les éventuelles interdépendances entre les individus du panel sous différentes formes. Le panel n'est plus alors une simple collection d'individus indépendants, mais une structure qui peut être soumise par exemple à l'influence de facteurs communs observables ou non observables. Dès lors, dans ce contexte, le fait d'utiliser un modèle de panel en lieu et place de séries temporelles ne relève plus d'un choix, mais relève d'avantage d'une nécessité liée à la prise en compte et à la modélisation de ces facteurs communs.

2Dans cet article, notre objectif est de rendre compte des développements relatifs aux tests de cointégration sur données de panel. Comme dans le cas des séries temporelles, les tests de cointégration en panel peuvent tout d'abord être classés en deux catégories : d'une part, les tests de cointégration à la Engle et Granger (1987) dans lesquels le rang de l'espace de cointégration et la forme de la relation de cointégration sont connus (Pedroni, 1995,1997; Kao, 1999; Bai et Ng, 2004). Ces tests reviennent alors à tester l'hypothèse de racine unitaire des résidus de cointégration et sont donc par conséquent extrêmement proches dans leur structure des tests de racine unitaire en panel de première et de deuxième générations. D'autre part, sont aujourd'hui développés des tests de cointégration multiples à la Johansen (1991) dans lesquels le rang de cointégration est a priori inconnu (Larsson et alii 2001 ; Groen et Kleibergen, 2003; Breitung, 2005). Il existe en outre dans cette littérature un deuxième clivage similaire à celui que l'on avait pu observer en séries temporelles entre les tests admettant pour hypothèse nulle l'absence de relation de cointégration et les tests à la Shin (1994) reposant au contraire sur l'hypothèse nulle de cointégration (McCoskey et Kao, 1998).

3Mais, à ces deux oppositions méthodologiques « traditionnelles », s'ajoutent à l'analyse de la cointégration de nouvelles dimensions propres au panel. Premièrement, émerge ainsi une opposition entre les notions de cointégration inter-individuelle et de cointégration intra-individuelle n'impliquant que des variables propres à un individu donné. Deuxièmement, se pose en panel la question de l'homogénéité / hétérogénéité de la relation de cointégration, ce qui revient à poser la question de l'homogénéité de la situation de long terme des pays ou des individus du panel. Plus généralement, cette problématique s'inscrit dans le cadre de la spécification homogène / hétérogène de la représentation à correction d'erreur (dynamique de court terme, vitesse d'ajustement à la relation de cointégration, etc.). On distinguera ainsi les tests en panel suivant la forme hétérogène ou homogène retenue de la représentation à correction d'erreur (VECM). Troisièmement, l'analyse de la cointégration en panel soulève le problème de la prise en compte et de la spécification des dépendances inter-individuelles que nous avions déjà évoqué dans le cadre des tests de racine unitaire de seconde génération (Hurlin et Mignon, 2005).

4Enfin, la dimension de panel apporte non seulement un enrichissement à l'analyse de la cointégration, mais aussi une modification des conséquences statistiques de la situation de non cointégration entre variables non stationnaires, c'est-à-dire la situation de régression fallacieuse (Phillips et Moon, 1999).

5Depuis les travaux pionniers de Levin et Lin (1992), la littérature relative à l'économétrie des données de panel non stationnaires • et, en particulier, aux tests de cointégration [1] • connaît un développement considérable [2]. Outre l'abondance des développements théoriques, on recense également de très nombreux travaux empiriques sur données de panel ayant recours aux tests de racine unitaire, dans un contexte univarié, et/ou aux tests de cointégration dans un contexte multivarié. Un exemple flagrant est sans conteste celui des travaux empiriques portant sur la vérification de l'hypothèse de parité des pouvoirs d'achat [3] (PPA) dans le domaine des changes (voir notamment McDonald, 1996; Oh, 1996; ou encore Rogoff, 1996) [4].

6Comment expliquer un tel succès des études sur données de panel ? En d'autres termes, quel est l'apport lié à l'ajout de la dimension individuelle à la dimension temporelle usuelle ? Répondant à l'argument classique relatif à la faible puissance des tests de cointégration sur séries temporelles en petit échantillon, l'ajout de la dimension individuelle permet d'accroître le nombre de données en incluant l'information relative à des pays différents et mener ainsi une analyse multi-pays [5]. Il est en effet naturel de penser que les propriétés de long terme des séries • telle que l'existence de la PPA• ont une forte probabilité d'être communes à plusieurs pays. Par ailleurs, un autre avantage issu de l'ajout de la dimension individuelle à la dimension temporelle provient du fait que les distributions asymptotiques des tests de racine unitaire sur données de panel sont asymptotiquement normales, alors qu'elles sont non standard lorsque seule la dimension temporelle est considérée. Enfin, les nouvelles générations de tests de racine unitaire et de cointégration en panel permettent de prendre en compte les éventuelles interdépendances entre les individus du panel sous différentes formes. Le panel n'est plus alors une simple collection d'individus indépendants, mais une structure qui peut être soumise par exemple à l'influence de facteurs communs observables ou non observables. Dès lors, dans ce contexte, le fait d'utiliser un modèle de panel en lieu et place de séries temporelles ne relève plus d'un choix, mais relève d'avantage d'une nécessité liée à la prise en compte et à la modélisation de ces facteurs communs.

7Dans cet article, notre objectif est de rendre compte des développements relatifs aux tests de cointégration sur données de panel. Comme dans le cas des séries temporelles, les tests de cointégration en panel peuvent tout d'abord être classés en deux catégories : d'une part, les tests de cointégration à la Engle et Granger (1987) dans lesquels le rang de l'espace de cointégration et la forme de la relation de cointégration sont connus (Pedroni, 1995,1997; Kao, 1999; Bai et Ng, 2004). Ces tests reviennent alors à tester l'hypothèse de racine unitaire des résidus de cointégration et sont donc par conséquent extrêmement proches dans leur structure des tests de racine unitaire en panel de première et de deuxième générations. D'autre part, sont aujourd'hui développés des tests de cointégration multiples à la Johansen (1991) dans lesquels le rang de cointégration est a priori inconnu (Larsson et alii, 2001; Groen et Kleibergen, 2003; Breitung, 2005). Il existe en outre dans cette littérature un deuxième clivage similaire à celui que l'on avait pu observer en séries temporelles entre les tests admettant pour hypothèse nulle l'absence de relation de cointégration et les tests à la Shin (1994) reposant au contraire sur l'hypothèse nulle de cointégration (McCoskey et Kao, 1998).

8Mais, à ces deux oppositions méthodologiques « traditionnelles », s'ajoutent à l'analyse de la cointégration de nouvelles dimensions propres au panel. Premièrement, émerge ainsi une opposition entre les notions de cointégration inter-individuelle et de cointégration intra-individuelle n'impliquant que des variables propres à un individu donné. Deuxièmement, se pose en panel la question de l'homogénéité / hétérogénéité de la relation de cointégration, ce qui revient à poser la question de l'homogénéité de la situation de long terme des pays ou des individus du panel. Plus généralement, cette problématique s'inscrit dans le cadrede la spécification homogène / hétérogène de la représentation à correction d'erreur (dynamique de court terme, vitesse d'ajustement à la relation de cointégration, etc.). On distinguera ainsi les tests en panel suivant la forme hétérogène ou homogène retenue de la représentation à correction d'erreur (VECM). Troisièmement, l'analyse de la cointégration en panel soulève le problème de la prise en compte et de la spécification des dépendances inter-individuelles que nous avions déjà évoqué dans le cadre des tests de racine unitaire de seconde génération (Hurlin et Mignon, 2005).

9Enfin, la dimension de panel apporte non seulement un enrichissement à l'analyse de la cointégration, mais aussi une modification des conséquences statistiques de la situation de non cointégration entre variables non stationnaires, c'est-à-dire la situation de régression fallacieuse (Phillips et Moon, 1999).

10Ainsi, cet enrichissement de l'analyse lié au passage en panel nécessite que soit posé un certain nombre de définitions, de notions ou de concepts propres à la cointégration et la régression fallacieuse en panel. Ce sera précisément l'objet des deux premières parties de cet article. Les deux parties suivantes visent à présenter de façon détaillée les tests existants. La quatrième partie est ainsi consacrée aux tests reposant sur l'hypothèse nulle d'absence de cointégration, alors que la cinquième partie traite du cas de l'hypothèse nulle de cointégration. Quelques éléments relatifs à la comparaison des tests, l'inférence et à l'estimation de systèmes cointégrés sont donnés dans la sixième partie. Enfin, la dernière partie conclut l'article.

Notions de cointégration en panel

11Avant de présenter les tests de l'hypothèse de cointégration, il convient de préciser un certain nombre de notions spécifiques à la cointégration en panel. Parmi celles-ci figurent les notions de (i) cointégration intra et inter-individuelles, (ii) d'hétérogénéité ou d'homogénéité des paramètres des relations de cointégration et de la représentation à correction d'erreur (VECM, Vector Error Correction Model), (iii) de dépendances inter-individuelles et (iv) de convergence.

12Pour cela, considérons une représentation VECM dans un système complet. Une telle représentation autorise l'existence de dynamiques inter-individuelles : le taux de croissance d'une variable endogène observée pour un individu donné peut dépendre des autres variables endogènes du système observées pour ce même individu (que ce soit au travers des relations de cointégration et/ou de la dynamique de court terme) mais aussi de l'ensemble des variables endogènes observées pour les autres individus du panel.

13Formellement, soit x x it it it =( )'un vecteur de k variables [6] I(1) observées pour un individu i N=1,..., à la x k ,..., ( ) ( )1 période t T=1,...,. On note x x x t t Nt =( ,..., )' '1 le vecteur empilé de dimension (Nk,1) des variables individuelles. On appelle représentation VECM dans un système complet (full system VECM) le système suivant (Groen et Kleibergen, 2003) :

equation im1

Commentons brièvement les différents termes de ce modèle. Les deux premiers éléments correspondent aux composantes déterministes de la représentation VECM. Le vecteur ? ? ?= ( ,..., )' '1 N regroupe les Nk effets individuels (supposés fixes) associés à chaque individu et à chaque variable endogène. De la même façon, le vecteur? regroupe les coefficients des tendances déterministes que l'on suppose a priori différents pour chaque variable considérée et pour chaque individu. Le troisième terme du modèle (1) correspond bien évidemment au terme définissant à la fois les forces de rappel et les éventuelles relations de cointégration sur lesquelles nous reviendrons en détail. On suppose que la matrice ? peut être partitionnée de la façon suivante :
equation im2

où les matrices ? sont de dimension ( , )k k. Le quatrième terme?Wt de la relation (1) regroupe l'ensemble des ij éléments liés à la dynamique d'ajustement de court terme. Pour simplifier, on suppose que pour purger toute l'autocorrélation des résidus du modèle (1), il est nécessaire d'introduire le même nombre p d'éléments différenciés retardés pour tous les individus du panel. Ainsi, on pose :
equation im3

où les matrices? sont de dimension( , )k kp et où les vecteurs individuels ?x de dimension ( , )k 1 contiennent iji t p,? les différences premières retardées des k variables endogènes pour l'individu i. Enfin, le vecteur ? ? t t Nt =( ,..., )' '1 comporte les N vecteurs de résidus individuels ? ? ? it it itk = ( ,..., )'( ) ( )1 associés aux k résidus de chaque VECM individuel.

14On suppose que les résidus ?t sont i i d.. .( , )0 ?. L'éventuelle dépendance inter-individuelle de ces résidus implique que la matrice ? peut être non bloc diagonale :

equation im4

où les matrices ? sontde dimension( , )k k. Rappelonsque, pourun individu i, sila matrice? estnondiagonale, ijii cela traduit l'existence de corrélations instantanées des chocs de la forme réduite, identiques à celles que l'on considère dans un VECM en séries temporelles.

15Dans ce cadre, évoquons à présent la première dimension spécifique de l'analyse de panel, à savoir la distinction entre relations de cointégration intra et inter-individuelles.

Relations de cointégration intra et inter-individuelles

16Dans une telle représentation, on peut envisager deux types de relations de cointégration. On peut tout d'abord envisager l'existence de relations de cointégration parmi les variables du vecteur x, que l'on pourrait qualifier it de relations de cointégration intra-individuelles. Tout comme en séries temporelles, on dit qu'il existe une ou plusieurs relations de cointégration dans le vecteur x si et seulement si il existe une ou plusieurs combinaisons it linéaires des variables xitj( ) qui soient stationnaires. Formellement, pour l'individu i, il existe ri relations de cointégration intra-individuelles si et seulement si :

equation im5

où ? désigne la matrice contenant les vecteurs de cointégration pour l'individu i. Ces r relations de ii cointégration ne font intervenir que des variables propres à l'individu i de référence. Par exemple, l'existence d'une telle relation de cointégration intra-individuelle entre le PIB et la consommation dans un panel international implique que pour un pays donné, il existe une combinaison linéaire du PIB et de la consommation qui soit stationnaire. Comme nous le verrons, la question se pose ensuite de l'homogénéité ou au contraire de l'hétérogénéité des paramètres de cette relation de cointégration pour tous les pays de l'échantillon, i.e. la question de savoir si ? ? i N= ? =, ,...,1. Mais, on peut parallèlement supposer qu'il existe une ou plusieurs i relations de cointégration faisant intervenir les PIB ou les consommations de différents pays. On parle alors de relations de cointégration entre individus ou de relations de cointégration inter-individuelles (cross unit cointegration).

17Formellement, si l'on souhaite tester (ou estimer) à la fois des relations de cointégration entre des variables différentes observées pour un même individu et des relations de cointégration faisant intervenir des variables observées sur plusieurs individus, la solution consiste à considérer le vecteur empilé xt des variables individuelles. Pour simplifier, supposons que l'on considère le même nombre de variables endogènes pour tous les individus, i.e. k k i =. On dit qu'il existe au total r relations de cointégration intra et/ou inter individuelles si et seulement si :

equation im6

La matrice ? de la représentation VECM (équation 1) se décompose alors sous la forme usuelle :
equation im7

où la matrice ? désigne la matrice des coefficients d'ajustement aux relations de long terme. L'existence d'au moins une relation de cointégration inter-individuelle implique qu'une des colonnes de la matrice ?possède des éléments non nuls associés à des éléments xitk( ) et xjtk( ') pour i j?.

18Naturellement, l'approche qui consiste à tester la cointégration en prenant en compte les éventuelles relations inter-individuelles apparaît comme la plus séduisante dans de nombreuses problématiques économiques. Une telle approche permettrait en effet par exemple de définir des tendances stochastiques au niveau international, régional, etc., suivant le panel considéré. Malheureusement, une telle approche en système « complet » n'est possible sur le plan technique que pour des panels de dimension individuelle relativement modérée. Par exemple, l'estimation d'un simple modèle Var d'ordre 1 en système complet implique d'estimer k N 2 2 paramètres à partir de NT observations. Dès lors, une telle approche n'est techniquement possible que si l'on considère un panel où la dimension temporelle T est largement supérieure à la dimension individuelle N, ce qui n'est généralement pas le cas dans les panels macroéconomiques. Ainsi, pour ces raisons, rares sont les modèles proposés qui considèrent un système complet (full system representation) autorisant d'éventuelles relations de cointégration inter-individuelles [7].

Hétérogénéité / homogénéité des relations de cointégration

19Une autre problématique spécifique à la cointégration en panel est celle de l'homogénéité ou de l'hétérogénéité des paramètres de la relation de long terme et plus généralement de la représentation VECM. Commençons par nous intéresser à la question de l'homogénéité de la relation de long terme avant, dans un second temps, de nous intéresser à la question de l'homogéneité de la représentation VECM dans son ensemble.

La relation de long terme

20Admettons que l'on exclut l'existence de relations linéaires entre les variables I(1) appartenant à des individus différents, et que, par conséquent, l'on exclut l'existence de relations de cointégration inter-individuelles. Formellement, cela revient à imposer la nullité des matrices ? pour i j?. Supposons également que pour ij chaque individu parmi les k variables endogènes I(1) il existe r relations de cointégration intra-individuelles.

21i La matrice ? de la représentation VECM est alors bloc diagonale et peut s'écrire sous la forme :

equation im8

où ? désigne la matrice des vecteurs de cointégration de l'individu i et ? est la matrice des coefficients ii d'ajustement à ces relations de long terme pour l'individu i. Si ? ? i N= ? =, ,...,1 on parle alors de relations de i cointégration homogènes, dans le cas contraire on parle de relations de cointégration hétérogènes (Phillips et Moon, 1999). L'hypothèse d'homogénéité de la relation de cointégration est parfois l'expression d'une contrainte théorique, comme par exemple dans le cas de la parité des pouvoirs d'achat. Dans ce cas, la relation de long terme est la même pour tous les pays, tandis que les forces de rappel à cette relation de long terme, i.e. les ? i peuvent être différentes d'un pays à l'autre. En revanche, dans d'autres cas, cette hypothèse peut être plus discutable comme par exemple lors de l'estimation d'une fonction de production de long terme sur un panel international [8] (Canning et Pedroni, 1999) et cela même si les ajustements à cette structure productive homogène de long terme sont eux supposés hétérogènes.

22Plusieurs remarques s'imposent ici. Tout d'abord, l'hypothèse de relation de cointégration homogène implique naturellement que les vecteurs de cointégration aient la même dimension pour tous les individus, i.e. dim( ) ( , ), ,...,? k r i N= ? =1. Autrement dit, un modèle de cointégration homogène [9] implique que les rangs de i cointégration soient les mêmes pour tous les individus, i.e. r r i N= ? =, ,...,1. Enrevanche, dans un modèle de i cointégration hétérogène, rien n'impose a priori que le rang de cointégration pour l'individu i soit identique à celui de l'individu j. On peut donc avoir par exemple des individus pour lesquels il existe des relations de cointégration parmi les k variables endogènes et d'autres pour lesquels il n'en existe pas. À l'extrême limite, on pourrait concevoir un modèle de panel de cointégration hétérogène où n'existeraient des relations de cointégration parmi les k variables que pour un seul individu. Toutefois, en l'état actuel de la recherche, les tests de cointégration et les représentations VECM autorisant des relations de cointégration hétérogènes (Groen et Kleibergen, 2003) imposent généralement, eux aussi, une contrainte d'homogénéité sur le rang de cointégration. Ainsi, dans le cas d'un panel à relation de cointégration hétérogène, on suppose que tous les individus ont le même nombre de relations de cointégration mais que les paramètres des vecteurs de cointégration peuvent être différents d'un individu à l'autre, i.e. r r i = et ? ?( , ) /i ji j ? ?.

23La deuxième remarque porte sur l'estimation des paramètres d'une relation de cointégration hétérogène. Phillips et Moon (1999) montrent que dans ce cas, l'estimateur pooled obtenu en estimant (à tort) un modèle totalement homogène converge à la vitesse N vers une quantité définie comme un coefficient moyen de long terme (long run average coefficient). Les propriétés asymptotiques de l'estimateur pooled dans le cas d'une cointégration hétérogène (tant dans la vitesse de convergence que la forme du coefficient moyen de long terme) sont donc similaires à celles que l'on obtient dans le cas d'une régression fallacieuse. Notons que ce coefficient moyen de long terme vers lequel converge l'estimateur pooled ne correspond pas (sauf cas particulier) à la moyenne des N vecteurs individuels de cointégration ? ?== ? ( / )11 ?iiN.

La représentation VECM

24Au-delà de cette discussion sur l'homogénéité et/ou l'hétérogénéité des paramètres des relations de long terme, se pose naturellement le problème de l'hétérogénéité des autres éléments de la représentation VECM (équation 1). Comme nous l'avons évoqué, il est généralement opportun dans un modèle de cointégration homogène de supposer que les forces de rappel sont elles hétérogènes, i.e. ? ? i j? ? ?, : si tous les individus présentent la i j ou les mêmes relations de long terme, la dynamique d'ajustement à ces relations communes peut être différente suivant les individus. De la même façon, les paramètres ? associés aux termes de la dynamique de court terme ii peuventêtre hétérogènes [10], i.e.? ??. Dèslors qu'au moins larelation decointégration est homogène, onpeut ii jj en effet supposer à la fois que les paramètres ? et ? sont hétérogènes. Il existe ainsi toute une palette de iii spécifications possibles de l'hétérogénéité allant du VECM totalement homogène comme l'avaient proposé Holtz-Eakin, Newey et Rosen (1988) au modèle VECM où seules les relations de long terme sont homogènes (Groen et Kleibergen, 2003). Enfin, les mêmes choix s'offrent quant à la spécification des composantes déterministes : effets individuels ? et coefficients ? associés aux tendances déterministes. Naturellement, non i seulement la prise en compte de ces composantes (ou leur exclusion) modifie la distribution asymptotique des statistiques de test de l'hypothèse de cointégration (comme en séries temporelles dans le cas des tests de Johansen, 1991), mais en outre l'hypothèse d'homogénéité ou d'hétérogénéité de ces composantes importe.

Dépendances inter-individuelles

25Tout comme dans le cas des tests de racine unitaire, les premiers tests de cointégration proposés en panel (en particulier les tests de Pedroni, 1995,1997; voir infra) excluaient a priori non seulement l'existence de relations decointégration inter-individuelles, mais plus généralement l'existence detoute dépendance entre lesindividus. Naturellement cette hypothèse d'indépendance entre les individus est peu crédible dans de très nombreuses applications empiriques, et notamment dans le cas de panels de variables macroéconomiques. La question se pose alors de savoir comment spécifier l'existence de dépendances entre les individus dans une représentation VECM.

26La première façon évidente de spécifier ces dépendances serait d'envisager explicitement des relations de cointégration inter-individuelles dans un système complet. Si l'on exclut cette solution qui pose plusieurs problèmestechniques, lesdépendances entrelesindividus du panelpeuvent êtrespécifiéesde différentesfaçons. Groen et Kleibergen (2003) envisagent ainsi la possibilité d'une corrélation des résidus des relations de cointégration pour différents individus sans spécifier de forme particulière pour cette relation. Dans ce cas, cette dépendance se traduit par une matrice de variance-covariance? dans la représentation VECM (équation 1) non diagonale. Une telle spécification correspond alors à une notion de dépendance contemporaine ou de causalité instantanée inter-individuelle.

27Une autre spécification possible des liens entre individus dans les relations de cointégration consiste à utiliser des représentations à facteurs communs (Bai et Ng, 2001; Dees, di Mauro, Pesaran et Smith, 2005). Afin de mieux comprendre les enjeux associés à cette question de la spécification des dépendances inter-individuelles, considérons la représentation à facteurs communs du vecteur de variables endogènes x x x it it itk =( ,..., )'( ) ( )1 proposée par Dees, di Mauro, Pesaran et Smith (2005) et Breitung et Pesaran (2005). On admet que xit peut s'écrire sous la forme suivante :

equation im9

L désigne l'opérateur retard, ? ?( )L j ==? ?0 i ij= ?0pouri N=1,...,. Pourunindividu i L j jet? ? j j L L( ) =? donné, les k variables non stationnaires du vecteur x dépendent ( )i d'une composante déterministe [11] (effet it individuel et tendance déterministe), (ii) d'un ensemble de s facteurs communs observables dt (variables macroéconomiques, autres composantes déterministes comme des variables indicatrices parexemple, etc.), (iii) d'un ensemble de m facteurs communs inobservables ft et (iv) de k composantes stochastiques propres à l'individu de référence, notées wit.

28Admettons que les facteurs communs inobservables ft et les composantes individuelles wit sont intégrés d'ordre un. Si l'on suppose en particulier que w f i0 0 0= = et que ?0 0 0= =vi, on obtient alors :

equation im10

où les polynômes matriciels ? ? ? * ( ) [ ( ) ( )]/( )L L L= ? ?1 1 et ? ? ? i L L L * ( ) [ ( ) ( )]/( )= ? ?1 1 sont tels que les racines de det[ ( )] * ? L et de det[ ( )] * ?i L sont toutes supérieures à l'unité en module. Dès lors, le vecteur des k variables endogènes x peut être exprimé comme la somme de six composantes : (i) une composante it déterministe, (ii) un ensemble de facteurs communs observables, (iii) m tendances stochastiques st communes à l'ensemble des individus du panel, (iv) k tendances stochastiques s spécifiques à l'individu i, (v) les it composantes stationnaires communes ?* ( )Lt ? et (vi) les composantes stationnaires spécifiques ?* ( )Lt ? :
equation im11

Dès lors, dans une telle représentation VECM, il convient de bien préciser la notion de tendances « communes ». On doit en effet distinguer, d'une part, les tendances stochastiques communes aux différents individus du panel et, d'autrepart, lestendancesstochastiquescommunesobservées parmilesvariables endogènesdusystèmepour un même individu (qui correspondent aux tendances communes d'une représentation VECM en séries temporelles). En effet, dans la représentation (15), il existe tout d'abord m tendances stochastiques « communes » (aux N individus) qui correspondent aux composantes tendancielles ?( )1 st des m facteurs communs non stationnaires.

29De plus, en l'absence de tendances stochastiques communes aux N individus, i.e. ? ( )1 0=, les k variables endogènes observées pour l'individu de référence i sont cointégrées si la matrice propre à cet individu, ? ( )1, est i non nulle et admet un rang strictement inférieur à k. Dans ce cas, il existe rang [ ( )]? 1 tendances stochastiques i « communes » aux k variables mais spécifiques à l'individu i du panel. Dit autrement, parmi les k tendances stochastiques s spécifiquesàl'individu i, il existe rang [ ( )]? 1 tendancesstochastiques indépendantes. Chaque iti individu peut dans ce cas avoir un nombre de tendances communes différent suivant le rang de ?i ( )1.

30Dans une telle spécification, le lien entre deux individus i et j i? du panel peut provenir de trois sources. Premièrement, cette dépendance peut provenir d'un ensemble de facteurs communs observables dt et/ou de la composante déterministe du modèle. Bien évidemment, en pratique, cela pose le problème de l'identification ex ante de ces facteurs communs. Dans leur application, Dees, di Mauro, Pesaran et Smith (2005) considèrent ainsi un ensemble de variables macroéconomiques comme le revenu et l'inflation des pays n'appartenant pas à l'ensemble géographique figurant dans le panel, le prix du pétrole, etc.

31Deuxièmement, la dépendance inter-individuelle peut être spécifiée sous la forme d'un ensemble de tendances stochastiques communes à l'ensemble des N individus du panel. Plus précisément, le lien entre les variables endogènes x et x peut provenir d'un ensemble de n m? tendances stochastiques communes [12] parmi les m itjt composantes non stationnaires ? ( )1 st des facteurs communs inobservables, où n rang= [ ( )]? 1. Par exemple, ces n tendances stochastiques communes peuvent s'interpréter comme des tendances stochastiques internationales ou régionales indépendantes dans le cas d'un panel macroéconomique.

32Enfin, troisièmement, la dépendance entre individus peut être spécifiée tout simplement au travers d'une corrélation des composantes stationnaires des facteurs communs, i.e. ?* ( )Lt ?. Chaque vecteur de variables xit dépendant d'un ensemble de m composantes stationnaires communes, on retrouve une dépendance entre les individus du panel.

33Naturellement, c'est le choix du test de cointégration qui conditionne le schéma de dépendance (ou d'indépendance) inter-individuelle retenu même si peu de tests de cointégration, encore aujourd'hui, intègrent les dépendances inter-individuelles.

Notions de convergence

34Comme nous l'avions déjà mentionné dans le cas de la littérature sur les tests de racine unitaire (Hurlin et Mignon, 2005), l'étude des propriétés asymptotiques des estimateurs des paramètres d'une relation de cointégration (ou d'une régression fallacieuse) en panel pose le problème de la notion de convergence utilisée. Rappelons qu'en économétrie de panel, il existe plusieurs concepts de distribution asymptotique (Phillips et Moon, 1999). On distingue tout d'abord la convergence dite séquentielle, pour laquelle on suppose que les dimensionsconvergent dansuncertainordre. On raisonnedans un premiertemps à N fixe(ou T) etl'on faittendre T (ou N) vers l'infini, puis l'on fait tendre N (ou T) vers l'infini. C'est souvent l'approche la plus simple pour dériver les lois asymptotiques, mais ilconvient d'être prudentavec ce typede résultats car ils peuvent parfois être différents lorsque l'on renverse l'ordre de convergence ou lorsque les deux dimensions tendent simultanément vers l'infini. Dans la seconde approche, dite convergence le long d'une diagonale, on fait tendre N et T vers l'infini simultanément sous l'hypothèse que T = T(N) est une fonction monotone de N. Par exemple, on peut supposer que le ratio T/N converge vers une constante c non nulle. Bien évidemment, l'inconvénient de cette approche réside, d'unepart, dans lecaractère spécifique dela fonction T(N) quipeut conditionner les résultatset, d'autre part, dans le fait que les dimensions ( / )N T d'un panel peuvent ne pas correspondre, et de loin, à la relation T = T(N) postulée. Latroisième approche, la plus généralemaisaussila plus difficileà utiliser, consisteà supposer que N et T tendent vers l'infini sans supposer une quelconque relation entre T et N. Dans les tests que nous présenteronspar la suite, laconvergenceséquentielleconsidérée estla suivante :T ? ? suivi de N ? ?.

35La prise en compte de ces différentes notions spécifiques aux panels nous permet à présent de décrire les conséquences de l'absence de cointégration, i.e. de la régression fallacieuse.

Régressions fallacieuses en panel

36Une desquestions essentielles qui se pose enpanel, tout comme en séries temporelles, est celle des conséquences d'une régression impliquant des variables non stationnaires et non cointégrées. En d'autres termes, que devient le phénomène de régression fallacieuse dans un modèle de régression de panel ?

37Il convient tout d'abord de faire un bref rappel des conséquences de ce phénomène particulier qu'est la régression fallacieuse dans le cadre standard des séries temporelles (pour plus de détails, voir Hamilton, 1994). La régression fallacieuse, initialement mise en avant par Yule (1926) au travers du concept de « corrélations dénuées de sens », a été illustrée à partir d'expériences de Monte Carlo par Granger et Newbold (1974), et plus tard expliquée théoriquement par Phillips (1986). Elle apparaît lorsque l'on régresse par les moindres carrés ordinaires (MCO) une variable non stationnaire sur un ensemble de variables non stationnaires et que ces variables sont non cointégrées. La première conséquence est que l'estimateur MCO converge vers une variable aléatoire et non vers une constante (qui devrait logiquement être nulle si les variables sont indépendantes). La seconde conséquence principale est que la distribution de la statistique de Student associée au test de nullité du paramètre dumodèlede régressionest divergente avecla dimension T. C'est précisément cette secondepropriété qui implique que l'on ait trop souvent tendance, dans une régression fallacieuse, à rejeter à tort la nullité du paramètre liant deux marches aléatoires indépendantes et non cointégrées (Granger et Newbold, 1974). Or, la régression fallacieuse en panel n'implique pas exactement les mêmes conséquences que celles que l'on connaît en séries temporelles.

38Afin de bien comprendre ces différences, considérons deux marches aléatoires yit et xit non cointégrées [13] telles que :

equation im12

avec y x 0= = et où w i i d.. . ( , ),0 ? ? désignant la matrice de variance-covariance des innovations. Pour i i0 0 it0 0 simplifier, on suppose qu'il n'existe pas de dépendance temporelle entre l'innovation du processus xit et les valeurs passées de l'innovation du processus yit.
equation im13

39Le paramètre de covariance ?µ? traduit la dépendance instantanée qui peut exister, pour un individu donné, entre les innovations des marches aléatoires x et y. Si ?µ? =0, les innovations des deux marches aléatoires sont itit indépendantes (comme dans le cas des expériences de Granger et Newbold, 1974). On suppose en outre que les processus d'innovation wit sont indépendants dans la dimension inter-individuelle.

40Admettons qu'un économètre souhaite à présent régresser la variable yit sur la variable xit dans un modèle de panel à effets individuels fixes :

equation im14

L'estimateur MCO duparamètre ?(estimateur within ouLSDV, Least SquaresDummy Variables) estalors défini par la quantité :
equation im15

Étudions toutd'abord la convergence de ?. Kao(1999) et Phillips etMoon (1999) montrent que dans le cas d'une convergence séquentielle [14], l'estimateur ? possède les propriétés asymptotiques suivantes :
equation im16

où ? ? ? ? µ ? / 2 2 2 2 5= et où ( , )T Nseq ? ? désigne un mode de convergence séquentiel où T puis N convergent successivement vers l'infini. On observe que ces deux résultats sont très différents de ceux obtenus en séries temporelles dans le cas d'une régression fallacieuse et appellent ainsi plusieurs commentaires.

41La première différence de taille avec le cas des séries temporelles réside dans le fait que l'estimateur ? en panel converge vers sa vraie valeur ? ? µ? ? /2. Dans le cas où l'on régresse en panel deux marches aléatoires totalement indépendantes ( )?µ? =0, l'estimateur within du paramètre liant yit et xit converge ainsi en probabilité vers 0 :

equation im17

Deplus, dans ce cas, ? est
equation im18
Ainsi, tout leparadoxe résidedans le fait que, dansle casd'une régression fallacieuse en panel, on retrouve un résultat de convergence similaire à celui que l'on obtiendrait en séries temporelles en régressant deux séries stationnaires : si les deux séries sont indépendantes, l'estimateur converge en probabilité vers 0.

42La deuxième remarque porte sur le fait que l'on retrouve à nouveau (comme dans la littérature sur les tests de racine unitaire) une distribution asymptotique normale en lieu et place des distributions asymptotiques non standard mises en évidence dans le cas des séries temporelles (Phillips, 1986). Ce résultat s'explique par le fait que l'estimateur within peut s'écrire comme le rapport de deux moyennes. Ces moyennes sont elles-mêmes des moyennes de N éléments indépendants qui convergent, lorsque T tend vers l'infini, vers des variables aléatoires admettant des moments d'ordre deux finis et identiques. Dès lors, l'utilisation d'un théorème central limite permet de démontrer que cette statistique converge vers une loi normale lorsque N tend à son tour vers l'infini (voir encadré).

43Pour autant, s'il existe de grandes différences quant aux propriétés asymptotiques de l'estimateur ? entre la régression fallacieuse en panel et sur séries temporelles, le comportement asymptotique des principales statistiques de test usuelles est en revanche relativement similaire. Kao (1999) retrouve le résultat selon lequel la statistique de Student associée à la nullité du paramètre de la régression fallacieuse diverge avec la dimension temporelle, montrant que considérer un modèle de régression de panel ne change rien aux conséquences de la régression fallacieuse quant à l'inférence. Ainsi, plus la dimension T augmente, plus l'on risque de rejeter à tort l'hypothèse nulle d'une nullité du coefficient liant deux variables, indépendantes, non stationnaires et non cointégrées, dès lors que l'on se base à tort sur la statistique de Student usuelle t?.

Encadré : régression fallacieuse en pane

Considérons le cas d'une régression fallacieuse en panel sans constante ( )?i =0 de deux marches aléatoires totalement indépendantes ( )?µ? =0. Lorsque T tend vers l'infini pour une dimension N fixée, on montre que :
equation im19

Ce qui peut se réécrire sous la forme :
equation im20

W r i, ( ) 1 et W r i, ( ) 2 désignent des mouvements Browniens standards indépendants, ? =i N1,....,. Par application de la loi forte des grands nombres :
equation im21

Dès lors, sachant que les éléments W r W r dr i i , ( ) ( ) 1 2 ? sont indépendants pour i N=1,...,, que ] E W r W r dr i i, , ( ) ( ) 1 2 0 ? = et ,0,l'applicationduthéorèmecentrallimitedeLindberg-Levypermetdemontrerquelenumérateur 1 ] Var W r W r dr i i , ( ) ( ) / 1 2 1 5 ?= de N ? converge vers une loi normale lorsque N tend vers l'infini.
equation im22

Ainsi, lorsque T puis N tendent vers l'infini, l'estimateur ? converge vers une loi normale à la vitesse N, alors que dans le cas des séries temporelles, l'estimateur MCO convergeait vers une loi non standard.
equation im23

On retrouve alors un cas particulier du résultat général de Kao (1999) ou Phillips et Moon (1999). En outre, Kao (1999) retrouve le résultat usuel selon lequel :
equation im24

Si les innovations des deux marches aléatoires sont indépendantes ( )?µ? =0, ce résultat se résume à :
equation im25

44En conclusion, dans un modèle de régression de panel, si l'on souhaite uniquement estimer les paramètres d'une relation entre des variables non stationnaires, peu importe que ces variables soient cointégrées ou non. Dans les deux cas, i.e. cointégration ou régression fallacieuse, les estimateurs usuels convergent en probabilité vers la vraie valeur du paramètre. C'est là une différence fondamentale avec le cadre des régressions fallacieuses en séries temporelles. En revanche, dès lors que l'on souhaite faire de l'inférence sur l'un ou plusieurs des paramètres du modèle, il convient d'être très prudent quant à l'existence ou non d'une relation de cointégration, puisqu'en présence de régression fallacieuse, les statistiques usuelles de tests ont des distributions divergentes, tout comme c'était le cas en séries temporelles.

Hypothèse nulle d'absence de cointégration

45Les tests d'absence de cointégration sur données de panel proposés par Pedroni (1995,1997,1999,2004), Kao (1999) et Bai et Ng (2001) sont des tests résiduels analogues aux tests proposés par Engle et Granger (1987) dans le cadre des séries temporelles. Larsson et alii (2001) et Groen et Kleibergen (2003) se sont quant à eux inspirés des travaux de Johansen (1991,1995) afin de proposer des tests basés sur le rapport de vraisemblance dans un système où a priori le nombre de relations de cointégration n'est pas connu. Notons que pour tous ces tests, on suppose la convergence séquentielle : T ? ? suivi de N ? ?.

Les tests de Pedroni

46Pedroni (1995,1997) a proposé divers tests visant à appréhender l'hypothèse nulle d'absence de cointégration intra-individuelle à la fois pour des panels homogènes et hétérogènes. Les valeurs critiques figurant dans ces travaux étant relatives à la présence d'un seul régresseur dans les relations de cointégration, Pedroni (1999, 2004) propose une extension au cas où les relations de cointégration comprennent plus de deux variables. Tout comme les tests de racine unitaire de Im, Pesaran et Shin (2003), les tests de Pedroni prennent en compte l'hétérogénéité par le biais de paramètres qui peuvent différer entre les individus. Ainsi, sous l'hypothèse alternative, il existe une relation de cointégration pour chaque individu, et les paramètres de cette relation de cointégration ne sont pas nécessairement les mêmes pour chacun des individus du panel. La prise en compte d'une telle hétérogénéité constitue un avantage indéniable puisqu'en pratique, il est rare que les vecteurs de cointégration soient identiques d'un individu à l'autre du panel. Dans ces conditions, imposer de manière erronée une homogénéité des vecteurs de cointégration aurait pour conséquence un non rejet de l'hypothèse nulle d'absence de cointégration, alors même que les variables sont cointégrées (voir Pedroni, 1998).

47La mise en œuvre des tests nécessite d'estimer en premier lieu la relation de long terme :

equation im26

Sur les sept tests proposés par Pedroni, quatre sont basés sur la dimension within (intra) et trois sur la dimension between (inter). Les deux catégories de tests reposent sur l'hypothèse nulle d'absence de cointégration : ? i i i= ?1 ,, désignant le terme autorégressif des résidus estimés sous l'hypothèse alternative tels que :
equation im27

Ladistinction entre lesdeuxcatégoriesde testsse situe auniveaudela spécification de l'hypothèsealternative :
  • pour les tests basés sur la dimension intra, l'hypothèse alternative s'écrit : ? ? i i= < ?1;
  • pour les tests basés sur la dimension inter, l'hypothèse alternative s'écrit : ?i i< ?1.

48On constate ainsi que le test basé sur la dimension inter est plus général au sens où il autorise la présence d'hétérogénéité entre les individus sous l'hypothèse alternative.

49Les sept tests développés par Pedroni sont les suivants :
• Tests basés sur la dimension within (panel cointegration statistics) :
(i) Test non paramétrique de type rapport de variance (panel v ? statistic) :

equation im28

(ii) Test non paramétrique du type de la statistique rho de Phillips-Perron (panel ? ? statistic) :
equation im29

(iii) Test non paramétrique du type de la statistique t de Phillips-Perron (panel t • statistic) :
equation im30

(iv) Test paramétrique du type de la statistique t de Dickey-Fuller Augmenté (panel t • statistic) [15] :
equation im31

• Tests basés sur la dimension between (group mean panel cointegration statistics) : (i) Test non paramétrique du type de la statistique rho de Phillips-Perron (group ? • statistic) :
equation im32

(ii) Test non paramétrique du type de la statistique t de Phillips-Perron (group t • statistic) :
equation im33

(iii) Test paramétrique du type de la statistique t de Dickey-Fuller Augmenté (group t • statistic) [16] :
equation im34

avec :
equation im35

Dans ces sept tests, les statistiques sont construites sur la base des résidus des relations de cointégration (31) et d'un certain nombre d'estimateurs de paramètres de nuisance. À titre d'exemple, le paramètre de nuisance L12 correspond à la variance conditionnelle de long terme individuelle des résidus. Notons enfin que le nombre de retards retenus dans les régressions de type ADF (Dickey-Fuller Augmenté) peut varier entre les individus.

50Afin de mettre en œuvre les différents tests, Pedroni suggère une procédure en cinq étapes [17] : Étape 1. On estime la relation de long terme (31) et on récupère les résidus estimés ?it. Étape 2. Pour chaqueindividu, on différencie la série yit et oncalcule les résidusissusde la régression suivante : Étape 3. On estime la variance de long terme Li112 de ?it.

51Étape 4. En utilisant les résidus estimés ?it, on choisit la régression appropriée :

  • pour les tests non paramétriques, à l'exception des tests de type t de Dickey-Fuller Augmenté, on estime la relation ? ? ? it i it it u= + ?1. On calcule la variance de long terme de uit, notée ?i2. On en déduit alors
    equation im36

    si2 désigne la variance de uit;
  • pour les tests paramétriques, on estime la relation * uit, notée * si2.
    equation im37

52. On calcule la variance de Étape 5. À l'aide des calculs réalisés dans les étapes précédentes, il est possible de construire l'une des sept statistiques présentées.

53Pedroni (1995,1997) a montré que, sous des normalisations appropriées basées sur des fonctions de mouvements browniens, chacune des sept statistiques suit une loi normale centrée réduite pour T et N suffisamment importants :

equation im38

x désigne une des sept statistiques normalisées. Pedroni (1999) a tabulé les valeurs des moments µ et N T, ? nécessaires à la définition de telles normalisations en fonction du nombre de régresseurs et de la présence ou non d'une constante et d'une tendance dans les relations de long terme. À partir de ces valeurs, il est alors possible de calculer les valeurs critiques relatives à chacun des sept tests (voir Pedroni, 1999, tableau 2).

54Afin de comparer les différents tests entre eux, synthétisons les résultats issus des simulations effectuées par Pedroni (1997,2004). Concernant tout d'abord la taille des tests, les conclusions peuvent être résumées comme suit :

  • dans le cas où N est fixe ( N = 20) et où T varie, les tests du type tstatistics exhibent une taille relativement importante (en excès de l'ordre de 10% par rapport à la taille théorique pour T = 40), alors que les autres tests sont caractérisés par une taille inférieure à la taille théorique;
  • dans le cas oùT est fixe ( T =250) et N varie, les tests panel v • statistic et panel? • statistic affichent une taille au dessus de la taille théorique pour de faibles valeurs de N, alors que la taille des tests du type tstatistics est très proche de la taille théorique, même pour de faibles valeurs de la dimension individuelle;
  • lorsque N et T varient à des taux différents ( N T=1 2/ à N T=5 6/ ), le test panel? • statistic converge vers la taille théorique très rapidement pour N T=3 4/ et plus lentement pour N T=1 2/. Pour ce qui est du test? •group statistic, les meilleurs résultats sont obtenus pour N T=5 6/.

55Concernant à présent la puissance des tests, les simulations menées par Pedroni montrent que :

  • lorsqueles résidus de la relationde cointégration suivent un processus AR (1) avec un coefficient autorégressif égal à 0,9, N est fixe( )N =20 et T varie, la puissance de tous les tests augmente rapidement lorsque Taugmente; le test atteignant la puissance maximale le plus lentement étant le test group ? • statistic. Les autres tests atteignent la puissance de 100% pour une valeur de T égale à 50;
  • lorsque le coefficient autorégressif augmente et prend la valeur 0,95, les résultats précédents restent globalement valables, même si la taille T nécessaire pour atteindre la puissance maximale est désormais plus élevée. À titre d'exemple, le test panel v • statistic atteint une puissance égale à 100% pour T = 90;
  • enfin, dans le cas où le coefficient autorégressif est très proche de 1 (0,99), c'est-à-dire que l'hypothèse alternative est très proche de l'hypothèse nulle, la taille de l'échantillon nécessaire pour atteindre une puissance égale à 100% est nettement plus importante : T = 350 pour le test panel v • statistic et T = 500 pourle test panel? • statistic.

Les tests de Kao

56Kao (1999) a également proposé des tests de l'hypothèse nulle d'absence de cointégration : test de type Dickey-Fuller et test de type Dickey-Fuller Augmenté. Contrairement aux tests de Pedroni, Kao considère le cas particulier où les vecteurs de cointégration sont supposés homogènes entre les individus. En d'autres termes, ces tests ne permettent pas de tenir compte de l'hétérogénéité sous l'hypothèse alternative et ne sont par ailleurs valablesquepourunsystème bivarié (i.e. lorsqu'unseul régresseur estprésentdanslarelationde cointégration). Soit w v it it it =( , )'µ unprocessusbivariéde moyennenulleetde matrice devariance-covariance delongterme :

equation im39

et soit ? la matrice telle que :
equation im40

Kao (1999) considère le modèle suivant [18] avec effets individuels :
(46) y x it i it it = + +? ? ?, pour i N=1,..., et t T=1,...,, avec
equation im41

.

57Le premier test proposé est un test de type Dickey-Fuller appliqué aux résidus estimés ?it de (46) :

equation im42

quiconsisteà testerl'hypothèsenulle ? =1. Soit ? l'estimateurMCOde?et soit t? la t-statistiquecorrespondante définie par :
equation im43


equation im44

En posant ? ? µ µu v v = ? µ 0µ0 0 0u v v =, et en notant ?u2 et ?02u des estimateurs convergents de ? ? 2 2 2 2 ?? et ? ? ? 2 2 2 2 ?? ?u2 et ?02u, Kao (1999) propose les quatre statistiques suivantes de type Dickey-Fuller :
equation im45

En considérant un mode de convergence séquentiel où T ? ? suivi de N ? ?, Kao montre que ces quatre statistiques suivent une loi normale centrée réduite sous l'hypothèse nulle d'absence de cointégration. Les statistiques DF?* et DFt* prennent en compte la possibilité de corrélations entre les innovations des régresseurs I( )1 et les erreurs (endogénéité de second ordre). À l'inverse, les statistiques DF? et DF reposent sur t l'hypothèse d'exogénéité forte des régresseurs et des erreurs puisque, dans ce cas, on a en effet ? ? ? ? µ µ2 02 2 02 = = = u u (voir notamment Kao et Chen, 1995).

58Le second test proposé par Kao (1999) est un test de type ADF basé sur la régression suivante :

equation im46

La statistique de test est donnée par :
equation im47

t est la t • statistique de ? dans (53). Sous l'hypothèse nulle d'absence de cointégration, cette statistique ADF suit une loi normale centrée réduite.

59Afin d'évaluer la performance des cinq tests proposés, Kao (1999) a mené des simulations de Monte Carlo. Celles-ci font globalement ressortir que pour de faibles valeurs de T (T = 10), les écarts à la taille théorique sont importants pour les 5 tests et disparaissent lorsque T augmente à 25 (quelle que soit la valeur de N). De manière générale, les tests DF?* et DFt* conduisent à de meilleurs résultats que les 3 autres tests en termes de taille. Concernant la puissance, les tests ne sont pas très performants pour T = 10 et de faibles valeurs de N, ce qui est conforme à ce que l'on attendait. Pour T = 25, le test DF?* domine le test DFt* ainsi que le test ADF, quelle que soit la valeur de N. Les simulations de Kao (1999) mettent donc globalement en avant que les tests DF?* et DFt* sont plus performants que les tests DF?, DFt et ADF en termes de taille et de puissance.

Le test de Bai et Ng

60Bai et Ng (2004) ont proposé un test de racine unitaire [19] qu'ils ont étendu au cas d'un test résiduel afin de tester l'hypothèse nulle d'absence de cointégration. La méthodologie générale sous-jacente au test repose sur la décomposition de chaque série du panel en la somme d'une composante déterministe, d'une composante commune (ensemble de facteurs communs) et d'une composante individuelle (idiosyncratique) [20]. La série ainsi définie est alors non stationnaire si un ou plusieurs facteurs communs est non stationnaire, ou si la composante individuelle est non stationnaire, ou encore si les deux composantes sont non stationnaires. C'est précisément la possibilité qu'un ou plusieurs facteurs communs soit intégré qui permet au test de Bai et Ng de tenir compte de la présence possible de corrélations entre les individus [21].

61Soient eit les résidus estimés de la relation :

equation im48

si l'on considère seulement une constante, ou de la relation :
equation im49

si l'on rajoute une tendance déterministe. Ft désigne l'estimation du vecteur ( )r ?1 de facteurs communs et l'erreur e est la composante individuelle; la composante déterministe étant soit une constante ( )ci, soit une it tendance ( )c t i i +?.

62On note DF i ec ( )et DF i e? ( ) les tests de Dickey-Fuller appliqués aux résidus estimés respectivement des modèles (55) et (56). Supposons que r facteurs soient intégrés d'ordre 1, avec r r r<, désignant le nombre total de facteurs. Tester l'hypothèse nulle de racine unitaire dans de e revient alors à tester l'hypothèse nulle d'absence it cointégration entre y et les r facteurs. Dans ces conditions, Bai et Ng (2004) montrent que DF i ec ( ) et DF i e? ( )

63it ont les mêmes distributions asymptotiques que les tests de cointégration proposés par Phillips et Ouliaris (1990) avec r régresseurs, auxquels on rajoute une constante et une tendance déterministe dans la relation de cointégration, respectivement. Les simulations menées par Bai et Ng (2004) mettent en évidence que la taille du test est proche de la taille théorique de 5%.

Une note sur les tests de cointégration multiple

64Les tests que nous avons précédemment présentés reposent sur l'existence d'au plus une relation de cointégration pour chaque individu du panel et supposent que l'ensemble des variables intervenant dans cette relation est a priori connu. Il est cependant possible, à l'instar des travaux de Johansen (1991) en séries temporelles, de recourir à une approche vectorielle multiple de la cointégration en panel. Une telle approche permet de détecter l'existence de plusieurs relations de cointégration (cointégration multiple), sans supposer que le rang de cointégration est a priori connu. Dans cette catégorie de tests figurent notamment ceux proposés par Larsson et alii (2001), Groen et Kleibergen (2003) ou encore Breitung (2005).

65Groen et Kleibergen (2003) ont ainsi suggéré l'utilisation de statistiques du rapport de vraisemblance afin de développer un test du rang de cointégration dans des modèles à correction d'erreur vectoriels individuels, à la fois pour des vecteurs de cointégration homogènes et hétérogènes [22]. Il convient de souligner que, même si la présence de relations de cointégration intra-individuelles hétérogènes est autorisée, le rang de cointégration est supposé êtrelemême pourtouslesindividus du panel. Le testde Groenet Kleibergenest basé sur letestde la trace proposé par Johansen (1991,1995). Soit LR r k( | ) la moyenne des N statistiques de la trace individuelles :

equation im50

LR r k( | )désignela ième statistique durapport de vraisemblancede Johansen, r étantle rangde cointégration. i On rappelle que le test proposé par Johansen a pour objet de tester l'hypothèse nulle de r relations de cointégration, contre l'hypothèse alternative de k relations de cointégration, avec r k= ?0 1 1, ,..., [23]. On peut alors construire la statistique suivante :
equation im51

qui suit une loi normale centrée réduite pour une convergence séquentielle où T ? ? suivi de N ? ?.

66L'intérêt de ces tests est qu'ils permettent de détecter des relations de cointégration multiples au sein du panel considéré. Toutefois, comme le souligne Banerjee (1999), des recherches futures dans ce domaine sont nécessaires car divers résultats ne sont pas clairement établis. Tel est notamment le cas pour le test de Larsson et alii (2001) dont le théorème principal est supposé et non démontré.

Hypothèse nulle de cointégration : le test de McCoskey et Kao

67McCoskey et Kao (1998) ont quant à eux proposé un test de l'hypothèse nulle de cointégration dans des panels hétérogènes. Il s'agit d'un test résiduel du multiplicateur de Lagrange que l'on peut rapprocher du test de Shin (1994) élaboré dans le cadre des séries temporelles. Les auteurs considèrent l'équation de long terme [24] :

equation im52

avec ? ? ? ? i i i Mi =( , ,..., )'1 2, x x x x it it it M it =( , ,..., ), , ,1 2, i N=1,...,, t T=1,..., et M désigne le nombre de ' régresseurs. On suppose que ?it peut être décomposé en deux éléments :
equation im53

uit est i i d Nu.. . ( , )02 ? et :
equation im54

Tester l'hypothèse nulle de cointégration revient à tester ? =0. Sous l'hypothèse nulle, la relation (59) est une relation de cointégration. La matrice de variance-covariance de long terme de ?it it it u e=( , )''est donnée par :
equation im55

La statistique de test proposée par McCoskey et Kao (1998) s'écrit alors :
equation im56

. ?1 22 est un estimateur convergent de ?1 22., avec ? ? ? 1 2 1 12 22 21. = et : ? 2 2 1 ?? ?
equation im57

avec y y e ik ik ik i+ ? + = ? . ? ? 12 221 ? désigne l'estimateur FM-OLS (Fully Modified Ordinary Least Squares)  [25] de ?. Notons qu'un tel estimateur est asymptotiquement sans biais et permet de prendre en compte une possible i corrélation sérielle des résidus de la relation (59) ainsi qu'une endogénéité dite de second ordre des régresseurs. Cette endogénéité se traduit par une corrélation des résidus de la relation de cointégration avec les innovations des régresseurs I(1). Afin de mettre en œuvre leur test, McCoskey et Kao (1998) définissent une statistique modifiée donnée par :
equation im58

où µ et? sont la moyenne et l'écart type de fonctions de mouvements browniens [26]. Sous l'hypothèse nulle de ?? cointégration ( )? =0, la statistique LM+ suit une loi normale centrée réduite. La distribution asymptotique de LM+ ne dépend pas de paramètres de nuisance et est robuste à l'hétéroscédasticité.

68McCoskey et Kao (1999a, 2001) ont effectué des simulations de Monte Carlo afin de comparer la taille et la puissance de divers tests de cointégration dans le cas de panels hétérogènes. Ils considèrent le test de l'hypothèse nulle de cointégration de McCoskey et Kao (1998) et deuxtests de l'hypothèse nulle d'absence de cointégration : un test basé sur une moyenne des statistiques ADF (voir Wu et Yin, 1999) et un test basé sur une moyenne des statistiques de Phillips et Ouliaris (1990). Leurs résultats montrent que le test de McCoskey et Kao (1998) conduit à de meilleurs résultats en termes de taille et de puissance.

Simulations, estimation et inférence

Simulations : quelques résultats

69Il existe assez peu detravaux proposantune comparaisondesdiverstestsde cointégrationen termes de tailleet de puissance. Nous nous proposons ici de résumer les principaux résultats issus des simulations de Monte Carlo menées par Gutierrez (2003). Ce dernier compare la puissance des tests de Pedroni (1999), Kao (1999) et de Larsson et alii (2001). Il considère diverses valeurs pour la dimension individuelle N et la dimension temporelle T (10,25,50 et 100) et fait également varier le pourcentage relatif au nombre de relations qui sont cointégrées (de 0 à 100% relations de cointégration). Les résultats obtenus par Gutierrez (2003) peuvent être synthétisés comme suit :

  • la puissance de tous les tests croît avec la dimension temporelle, pour une valeur fixe de N.
  • lorsque la dimension temporelle est fixée et faible (T = 10) et que N augmente, les tests de Kao sont plus puissants que les tests de Pedroni. Pour ces derniers, la puissance reste relativement faible, même lorsque la dimension individuelle est égale à 100;
  • les tests de Kao dominent ceux de Pedroni en termes de puissance lorsque la dimension temporelle est faible, et les tests de Pedroni sont plus puissants que ceux de Kao lorsque T augmente. Ainsi, plus la taille de l'échantillon augmente, plus les tests de Pedroni dominent ceux de Kao;
  • concernant le test de cointégration multiple de Larsson et alii (2001), la puissance et la taille sont proches pour de faibles valeurs de T. La puissance du test tend à augmenter lorsque la dimension temporelle croît, mais les tests de Kao et de Pedroni restent toujours plus puissants.

70De façon générale, Gutierrez (2003) montre que la puissance de tous les tests tend à augmenter lorsque N et T augmentent et lorsque le nombre de relations de cointégration au sein du panel croît.

Estimation et inférence

71Bien que les estimateurs MCO des vecteurs de cointégration soient super-convergents, leur distribution est asymptotiquementbiaiséeetdépendde paramètres denuisance associésà laprésence decorrélationsérielle dans les données (voir Kao et Chen, 1995; Pedroni, 1996 et Kao et Chiang, 2000). De tels problèmes, existant dans le cas traditionnel univarié, se posent également pour les données de panel et ont tendance à être encore plus marqués en présence d'hétérogénéité (voir notamment Kao et Chen, 1995).

72Pour estimer des systèmes de variables cointégrées, tout comme pour effectuer des tests sur les vecteurs de cointégration, il est en conséquence nécessaire d'utiliser une méthode d'estimation efficace. Diverses techniques existent, comme par exemple la méthode FM-OLS (Fully Modified Ordinary Least Squares) initialement proposée par Phillips et Hansen (1990) ou la méthode des moindres carrés dynamiques (Dynamic Ordinary Least Squares, DOLS) de Saikkonen (1991) et Stock et Watson (1993). Dans le cas des données de panel, Kao et Chiang (2000) ont montré que ces deux techniques conduisaient à des estimateurs asymptotiquement distribués selon une loi normale de moyenne nulle. Des résultats similaires sont obtenus par Pedroni (1996) et Phillips et Moon (1999) pour la méthode FM-OLS.

La méthode FM-OLS

73Cette procédure, étudiée notamment par Pedroni (1996), permet de tenir compte des problèmes d'endogénéité du second ordre des régresseurs (engendrée par la corrélation entre le résidu de cointégration et les innovations des variables I(1) présentes dans la relation de cointégration) et des propriétés d'autocorrélation et d'hétéroscédasticité des résidus. Considérons le système cointégré suivant [27] :

equation im59

avec :
equation im60

où :
equation im61

Pour i =1,..., N. Levecteur des erreurs ( , )'?it u est stationnaire dematricede variance-covariance asymptotique it ?i, que l'on peut décomposer comme suit :
equation im62

où ?i0 désigne la covariance contemporaine et?i est une somme pondérée d'autocovariances.?est le vecteur de cointégration, le vecteur ( , )'y x it it étant intégré d'ordre 1.

74L'estimateur FM-OMS ?FM de ? est donné par (voir Pedroni, 1996) :

equation im63

Li est la décomposition triangulaire inférieure de l'estimateur ?i de la matrice de variance-covariance asymptotique ?i, Li étant normalisé de telle sorte que / Li i22 221 2 =? ?, et le paramètre d'ajustement pour la corrélation sérielle ?i s'écrit :
equation im64

Ainsi que l'a montré Pedroni (1996), l'estimateur (69) est distribué selon une loi normale.

75Il convient par ailleurs de noter que Pedroni (1996) a proposé une extension des tests de racine unitaire afin de tester des contraintes sur les coefficients estimés de la relation de cointégration, c'est-à-dire sur les vecteurs de cointégration. Ces tests reposent sur la méthode FM-OLS qui présente l'avantage de donner des résultats plus robustes que laméthode usuelle des MCO lorsque les échantillonssont depetite taille; lessimulations de Pedroni (1996) montrant que les tests de racine unitaire basés sur la méthode des MCO sont biaisés en petit échantillon et tendent à rejeter trop fréquemment l'hypothèse nulle (voir également Phillips et Moon, 1999). En outre, comme nous l'avons précédemment mentionné, les distributions asymptotiques des estimateurs basés sur la méthode FM-OLS sont non biaisés et ne dépendent pas des paramètres de nuisance.

La méthode DOLS

76L'approche DOLS a été initialement suggérée par Saikkonen (1991) dans le cas des séries temporelles, puis adaptée par Kao et Chiang (2000) et Mark et Sul (2003) au cas de données de panel. Cette technique consiste à inclure des valeurs avancées et retardées de ?x dans la relation de cointégration, afin d'éliminer la corrélation it entre les variables explicatives et le terme d'erreur :

equation im65

En pratique, la somme infinie est bien évidemment tronquée à une valeur relativement faible du nombre de retards/avanceset l'estimateur DOLSest obtenu enestimantla régression (72) parles MCO. L'estimateur DOLS a la même distribution asymptotique que l'estimateur FM-OLS.

77Pour conclure, mentionnons que Kao et Chiang (2000) se sont intéressés aux propriétés en échantillon fini des estimateurs des MCO, FM-OLS et DOLS. Leur étude met en avant que l'estimateur des MCO souffre d'un important problème de biais et que l'estimateur FM-OLS ne permet pas d'améliorer de façon substantielle l'estimateur des MCO. Ils concluent alors en termes de supériorité de l'estimateur DOLS dans l'estimation des relations de cointégration sur données de panel.

Conclusion

78Cet article a proposé une revue de la littérature méthodologique consacrée aux principaux tests de cointégration sur données de panel. Cette littérature a connu un grand nombre d'extensions depuis les travaux pionniers de Levin et Lin (1992) et fait aujourd'hui l'objet de très nombreuses recherches et de multiples applications au niveau empirique. À la lumière des avancées réalisées en économétrie des séries temporelles non stationnaires, l'économétrie des données de panel non stationnaires doit encore résoudre un certain nombre de problèmes, notamment au niveaude l'estimation et de l'inférence, et doits'attacher à tenircompte dedifférents phénomènes • courants dans la dimension temporelle • tels que la présence de mémoire longue, les effets de type ARCH, l'existence de non linéarités, etc.

Bibliographie

BIBLIOGRAPHIE

  • Bai J. et Ng S. (2004). “A PANIC Attack on Unit Roots and Cointegration”, Econometrica, 72, pp. 1127-1177.
  • Baltagi B.H. et Kao C. (2000). “Nonstationary Panels, Cointegration in Panels and Dynamic Panels : A Survey”, in Advances in Econometrics, 15, edited by B. Baltagi et C. Kao, pp. 7-51, Elsevier Science.
  • Banerjee A. (1999). “Panel Data Unit Roots and Cointegration : An Overview”, Oxford Bulletin of Economics and Statistics, 61, pp. 607-630.
  • Banerjee A., Marcellino M. et Osbat C. (2000). “Some Cautions on the Use of Panel Methods for Integrated Series of Macro-Economic Data”, Working Paper 170, IGIER.
  • Banerjee A., Marcellino M. et Osbat C. (2003). “Testing for PPP : Should We Use Panel Methods ?”, mimeo.
  • Banerjee A. et Zanghieri P. (2003). “A New Look at the Feldstein-Horioka Puzzle Using an Integrated Panel”, Working Paper CEPII, 2003-22.
  • Basher S.A. et Mohsin M. (2003). “PPP Tests in Cointegrated Panels : Evidence from Asian Developing Countries”, Working Paper, Department of Economics, University of Tennessee.
  • Breitung J. (2005). “A Parametric Approach to the Estimation of Cointegration Vectors in Panel Data”, Econometric Reviews, pp. 151-174
  • Breitung J. et Mayer W. (1994). “Testing for Unit Roots in Panel Data : Are Wages on Different Bargaining Levels Cointegrated ?”, Applied Economics, 26, pp. 353-361.
  • Breitung J. et Pesaran M.H. (2005). “Unit Roots and Cointegration in Panels”, Deutsche Bank Discussion Paper 42.
  • Canning D. et Pedroni P. (1999). “Infrastructure and Long-Run Economic Growth”, CAER II Discussion Paper 57, Harvard Institute for International Development.
  • Cechetti S.G., Mark N.C. et Sonora R. (1999). “Price Level Convergence among United States Cities : Lessons from the European Central Bank”, Mimeo.
  • Coakley J., Kulasi F. et Smith R. (1996). “Current Account Solvency and the Feldstein-Horioka Puzzle”, Economic Journal, 106, pp. 620-627.
  • Dees S., di Mauro F, Pesaran M.H. et Smith L.V. (2005). “Exploring the International Linkages of the Euro Area : A Global VAR Analysis”, CESifo Working Paper 1425.
  • Engle R.F. et Granger C.W.J. (1987). “Cointegration and Error-Correction : Representation, Estimation and Testing”, Econometrica, 64, pp. 813-836.
  • Evans P. et Karras G. (1996). “Convergence Revisited”, Journal of Monetary Economics, 37, pp. 249-265.
  • Fisher R.A. (1932). Statistical Methods for Research Workers, Oliver&Boyd, Edinburgh.
  • Funk M. (1998). “Trade and International R&D Spillovers among OECD Countries”, Working Paper, Department of Economics, St. Louis University.
  • Gerdtham U.G. et Löthgren M. (1998). “On Stationarity and Cointegration of International Health Expenditure and GDP”, Working Paper in Economics and Finance 232, Stockholm School of Economics.
  • Granger C.W.J. et Newbold P. (1974). “Spurious Regressions in Econometrics”, Journal of Econometrics, 2, pp. 111-120.
  • Groen J.J.J. et Kleibergen F. (2003). “Likelihood-based Cointegration Analysis in Panels of Vector Error Correction Models”, Journal of Busines and Economic Statistics, 21(2). pp. 295-318.
  • Gutierrez L. (2003). “On the Power of Panel Cointegration Tests : A Monte CarloComparison”, Economics Letters, 80, pp. 105-111.
  • Hamilton J.D. (1994). Time Series Analysis, Princeton.
  • Holtz-Eakin D., Newey W. and Rosen H.S. (1988). “Estimating Vector Autoregressions with Panel Data”, Econometrica, 56, 1371-1396.
  • Hurlin C. et Mignon V. (2005). “Une synthèse des tests de racine unitaire sur données de panel”, Economie et Prévision, 169-170-171, pp. 253-294
  • Im K.S., Pesaran M.H. et Shin Y. (2003). “Testing for Unit Roots in Heterogeneous Panels”, Journal of Econometrics, 115, pp. 53-74.
  • Islam N. (1995). “Growth Empirics : A Panel Data Approach”, Quarterly Journal of Economics, 110, pp. 1127-1170.
  • Johansen S. (1991). “Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models”, Econometrica, 59, pp. 1551-1580.
  • Johansen S. (1995). Likelihood-Based Inference in Cointegrated Vector Autoregressive Models, Oxford University Press.
  • Kao C. (1999). “Spurious Regression and Residual-Based Tests for Cointegration in Panel Data”, Journal of Econometrics, 90, pp. 1-44.
  • Kao C. et Chen B. (1995). “On the Estimation and Inference for Cointegration in Panel Data when the Cross Section and Time Series Dimensions Are Comparable”, Manuscript, Center for Policy Research, Syracuse University, New York.
  • Kao C. et Chiang M.H. (2000). “On the Estimation and Inference of a Cointegrated Regression in Panel Data”, Advances in Econometrics, 15, edited by B. Baltagi et C. Kao, pp. 179-222, Elsevier Science.
  • Kao C., Chiang M.H. et Chen B. (1999). “International R&D Spillovers : An Application of Estimation and Inference in Panel Cointegration”, Oxford Bulletin of Economics and Statistics, 61, pp. 691-709.
  • Larsson R., Lyhagen J. et Löthgren M. (2001). “Likelihood-Based Cointegration Tests in Heterogenous Panels”, Econometrics Journal, 4, pp. 109-142.
  • Lee K.E., Pesaran M.H. et Smith R. (1997). “Growth and Convergence in a Multi-Country Empirical Stochastic Solow Model”, Journal of Applied Econometrics, 12, pp. 357-392.
  • Levin A. et Lin C.F. (1992). “Unit Root Tests in Panel Data : Asymptotic and Finite Sample Properties”, Discussion Paper 56, Department of Economics, University of California at San Diego.
  • Levin A. et Lin C.F. (1993). “Unit Root Tests in Panel Data : New Results”, Discussion Paper 92-93, Department of Economics, University of California at San Diego.
  • Levin A., Lin C.F. et Chu J. (2002). “Unit Root Tests in Panel Data : Asymptotic and Finite Sample Properties”, Journal of Econometrics, 108, pp. 1-24.
  • Maddala G. et Wu S. (1999). “A Comparative Study of Unit Root Tests and a New Simple Test”, Oxford Bulletin of Economics and Statistics, 61, pp. 631-652.
  • Mark N.C. et Sul D. (2003). “Cointegration Vector Estimation by Panel DOLS and Long-Run Money Demand”, Oxford Bulletin of Economics and Statistics, 65, pp. 655-680.
  • McCoskey S. et Kao C. (1998). “A Residual-Based Test of the Null of Cointegration in Panel Data”, Econometric Reviews, 17, pp. 57-84.
  • McCoskey S. et Kao C. (1999a). “Comparing Panel Data Cointegration Tests with an Application to the Twin Deficits Problem”, Working Paper, Center for Policy Research, Syracuse University, New York.
  • McCoskey S. et Kao C. (1999b). “Testing the Stability of a Production Function with Urbanization as a Shift Factor : An Application of Non-Stationary Panel Data Techniques”, Oxford Bulletin of Economics and Statistics, 61, pp. 671-690.
  • McCoskey S. et Kao C. (2001). “A Monte Carlo Comparison of Tests for Cointegration in Panel Data”, Journal of Propagations in Probability and Statistics, 1, pp. 165-198.
  • McCoskey S. et Selden T. (1998). “Health Care Expenditures and GDP : Panel Data Unit Root Test Results”, Journal of Health Economics, 17, pp. 369-376.
  • McDonald R. (1996). “Panel Unit Root Tests and Real Exchange Rates”, Economic Letters, 50, pp. 7-11.
  • Moon H.R. et Phillips P.C.B. (1998). “A Reinterpretation of the Feldstein-Horioka Regressions from a Nonstationary Panel Viewpoint”, Working Paper, Yale University.
  • Oh K. (1996). “Purchasing Power Parity and Unit Root Tests Using Panel Data”, Journal of International Money and Finance, 15, pp. 405-418.
  • Pedroni P. (1995). “Panel Cointegration, Asymptotic and Finite Sample Properties of Pooled Time Series Tests with an Application to the PPP Hypothesis”, Working Paper in Economics, 92-013, Indiana University.
  • Pedroni P. (1996). “Fully Modified OLS for Heterogeneous Cointegrated Panels and the Case of Purchasing Power Parity”, Working Paper in Economics, Indiana University.
  • Pedroni P. (1997). “Panel Cointegration, Asymptotic and Finite Sample Properties of Pooled Time Series Tests with an Application to the PPP Hypothesis : New Results”, Working Paper in Economics, Indiana University.
  • Pedroni P. (1998). “Testing for Convergence to Common Steady States in Nonstationary Heterogeneous Panels”, Working Paper in Economics, Indiana University.
  • Pedroni P. (1999). “Critical Values for Cointegration Tests in Heterogenous Panels with Multiple Regressors”, Oxford Bulletin of Economics and Statistics, S1,61, pp. 653-670.
  • Pedroni P. (2001). “Panel Cointegration, Asymptotic and Finite Sample Properties of Pooled Time Series Tests with an Application to the PPP Hypothesis”, Working Paper in Economics, Indiana University.
  • Pedroni P. (2004). “Panel Cointegration. Asymptotic and Finite Sample Properties of Pooled Time Series Tests with an Application to the PPP Hypothesis”, Econometric Theory, 20(3). pp. 597-625.
  • Phillips P.C.B. (1986). “Understanding Spurious Regressions in Econometrics”, Journal of Econometrics, 33, pp. 311-340.
  • Phillips P.C.B. et Hansen B.E. (1990). “Statistical Inference in Instrumental Variables Regression with I(1) Processes”, Review of Economic Studies, 57, pp. 99-125.
  • Phillips P.C.B. et Moon H.R. (1999). “Linear Regression Limit Theory for Nonstationary Panel Data”, Econometrica, 67, pp. 1057-1111.
  • Phillips P.C.B. et Moon H.R. (2000). “Nonstationary Panel Data Analysis : An Overview of Some Recent Developments”, Econometric Reviews, 19, pp. 263-286.
  • Phillips P.C.B. et Ouliaris S. (1990). “Asymptotic Properties of Residual Based Tests for Cointegration”, Econometrica, 58, pp. 165-193.
  • Quah D. (1992). “The Relative Importance of Permanent and Transitory Components : Identification and Some Theoretical Bounds”, Econometrica, 60, pp. 107-118.
  • Quah D. (1994).“Exploiting Cross-Section Variation for Unit Root Inference in Dynamic Data”, Economics Letters, 44, pp. 9-19.
  • Rogoff K. (1996). “The Purchasing Power Parity Puzzle”, Journal of Economic Literature, 34, pp. 647-668.
  • Saikkonen P. (1991). “Asymptotically Efficient Estimation of Cointegrating Regressions”, Econometric Theory, 58, pp. 1-21.
  • Sala-i-Martin X. (1996). “The Classical Approach To Convergence Analysis”, Economic Journal, 106, pp. 1019-1036.
  • Shin Y. (1994). “A Residual-Based Test of the Null of Cointegration Against the Alternative of No Cointegration”, Econometric Theory, 19, pp. 91-115.
  • Stock J. et Watson M. (1993). “A Simple Estimator of Cointegrating Vectors in Higher Order Integrated Systems”, Econometrica, 61, pp. 783-820.
  • Wu S. et Yin Y. (1999). “Tests for Cointegration in Heterogeneous Panel : A Monte Carlo Study”, Working Paper, Department of Economics, State University of New York.
  • Yule G.U. (1926). “Why do we Sometimes Get Nonsense Correlation Between Time Series ?”, Journal of the Royal Statistical Society, 89, pp. 1-69.

Mots-clés éditeurs : cointégration, racine unitaire, données de panel non stationnaires

Mise en ligne 01/08/2008

https://doi.org/10.3917/ecop.180.0241

Notes

  • (*)
    LEO, Université d'Orléans. Faculté de Droit, d'Economie et de Gestion. E-mail : cchristophe. hurlin@ univ-orleans. fr
  • (**)
    EconomiX, Université Paris X - Nanterre et Cepii. E-mail : Valerie. MMignon@ u-paris10. fr
  • (1)
    On rappelle que des séries intégrées d'ordre d (où d est un entier positif), ce que l'on note I(d), sont cointégrées d'ordre (d, b)CI(d, b) • s'il existe une combinaison linéaire de ces séries intégrée d'ordre d-b, avec 0< ?b d.
  • (2)
    Pour une revue de la littérature, voir notamment Banerjee (1999), Phillips et Moon (2000), Baltagi et Kao (2000) ou encore Hurlin et Mignon (2005).
  • (3)
    Rappelons que tester la forme relative de la PPA revient à effectuer un test de cointégration entre le change nominal et les indices de prix.
  • (4)
    Notons que, même si la très grande majorité des études sur données de panel porte sur l'analyse des taux de change, il existe cependant des travaux dans d'autres domaines. À titre d'exemple, McCoskey et Selden (1998) et Gerdtham et Löthgren (1998) se sont attachés à l'étude des dépenses de santé et Breitung et Mayer (1994) à l'analyse des salaires. Islam (1995), Evans et Karas (1996), Sala-i-Martin (1996), Lee, Pesaran et Smith (1997), Pedroni (1998), Cechetti et alii (1999) et McCoskey et Kao (1999b) ont étudié les problèmes de croissance et de convergence. La dynamique de l'épargne et de l'investissement a fait l'objet de travaux de Coakley, Kulasi et Smith (1996) et Moon et Phillips (1998) ou encore Banerjee et Zanghieri (2003) sur le paradoxe de Feldstein-Horioka. Mentionnons également les travaux de Funk (1998), McCoskey et Kao (1999a) et Kao, Chiang et Chen (1999) sur les activités de R&D au niveau international.
  • (5)
    Augmenter le nombre de données en ajoutant la dimension individuelle et non en augmentant la dimension temporelle réduit en outre le risque de faire face à des ruptures structurelles.
  • (6)
    On peut étendre l'analyse à un vecteur xit incluant à la fois des variables I(0) et I(1) dèslors qu'au moins deux variables sont intégrées d'ordre 1.
  • (7)
    Une exception notable est le modèle VECM proposé par Groen et Kleibergen (2003). Cette approche semble toutefois difficile à mettre en oeuvre dans la mesure où elle nécessite des panels de taille très importante.
  • (8)
    Rien ne justifie a priori que tous les pays tendent vers la même relation technologique à long terme. Cette hypothèse mériterait à tout le moins d'être testée.
  • (9)
    Par abus de langage, nous parlons ici de modèle de cointégration homogène, mais rappelons que l'homogénéité des relations de cointégration n'implique pas l'homogénéité de la représentation VECM et donc du panel.
  • (10)
    L'absence de dépendances inter-individuelles dans la dynamique de court terme se traduit par l'hypothèse ?ij =0, ? ?i j.
  • (11)
    À noter que les effets individuels ?i et les trends ?i t appartiennent à l'espace de cointégration s'il existe et doivent donc être distingués des effets individuels et des trends de l'équation (1).
  • (12)
    « Communes » à la fois au sens usuel du terme en séries temporelles, i.e. communes à l'ensemble des m variables non stationnaires st, mais aussi « communes » au sens spécifique au panel, i.e. communes à l'ensemble des N individus.
  • (13)
    On exclut ici à la fois la cointégration intra et inter-individuelles.
  • (14)
    Phillips et Moon (1999) démontrent que ces résultats demeurent valides dans le cas d'une convergence simultanée.
  • (15)
    Ce test peut être vu comme un analogue du test de racine unitaire de Levin et Lin (voir Levin et Lin, 1992,1993, et Levin et alii, 2002) sur les résidus estimés de la relation de long terme.
  • (16)
    Ce test peut être vu comme un analogue du test de racine unitaire t-bar de Im, Pesaran et Shin (2003) sur les résidus estimés de la relation de long terme.
  • (17)
    Notons que pour les tests reposant sur la dimension between, les étapes 2 et 3 ne sont pas nécessaires, dans la mesure où ceux-ci ne nécessitent pas le calcul du paramètre de nuisance Li112.
  • (18)
    Notons que Kao (1999) a également considéré le cas où une tendance déterministe est présente.
  • (19)
    Pour un exposé détaillé de ce test, voir Hurlin et Mignon (2005).
  • (20)
    Cette procédure est dénommée PANIC (Panel Analysis of Nonstationarity in the Idiosyncratic and Common components) par les auteurs.
  • (21)
    Ce point est très important dans l'application des tests de racine unitaire et de cointégration sur données de panel (voir Hurlin et Mignon, 2005, pour des explications détaillées). En effet, à l'exception du test de Bai et Ng (2001), les tests de racine unitaire supposent l'absence de corrélation (et donc de relation de cointégration) entre les individus du panel : yit et yjt ne sont pas cointégrés pour i j?. Dansun tel contexte, les tests exhibent une taille et une puissance satisfaisantes. Cependant, en présence de cointégration entre les individus, la taille des tests devient très importante, surtout quand T augmente. En d'autres termes, les tests rejettent trop souvent l'hypothèse nulle d'absence de cointégration (voir les simulations effectuées par Banerjee et alii, 2000,2003).
  • (22)
    Il convient de noter que Larsson et alii (2001) ont proposé un test du rang de cointégration dans des panels hétérogènes basé sur la moyenne des statistiques de la trace introduites par Johansen (1991,1995). Ce test souffre néanmoins d'importants problèmes de taille et nécessite une valeur très élevée de T.
  • (23)
    Le test peut alors s'effectuer de manière séquentielle, partant de r = 0 jusqu'à r = k • 1.
  • (24)
    Il est également possible d'introduire une tendance spécifique dans la relation de long terme (voir McCoskey et Kao, 1998).
  • (25)
    Voir infra.
  • (26)
    Cesconstantes peuvent être obtenues par simulations de Monte Carlo. Elles dépendent uniquement du nombre de régresseurs M et de la présence ou non de termes constants et/ou de tendances dans la relation de cointégration. Elles prennent les valeurs suivantes : µ? =0,1162 et ??2 = 0,0109 (voir McCoskey et Kao, 1998).
  • (27)
    Dansle cas général, xi peut désigner un vecteur de M régresseurs qui ne sont pas cointégrés entre eux. À des fins de simplication, on considère ici que xi est univarié, les résultats pouvant être étendus sans difficulté au cas multivarié.
bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Avec le soutien de

Retrouvez Cairn.info sur

18.97.14.81

Accès institutions

Rechercher

Toutes les institutions