Notes
-
[1]
L’effet d’une politique éducative est en général mesuré en écart-type. Cela permet de comparer des effets portant sur des résultats mesurés dans des échelles différentes. En substance, on observe la progression d’un élève par rapport aux autres plutôt qu’une progression en valeur absolue. En pratique, un effet supérieur à 10 % d’un écart-type est considéré comme notable.
-
[2]
Dans le cas de la France, il est fréquent que des postes ouverts au concours ne soient pas pourvus dans certaines disciplines.
-
[3]
Suggérée par un rapporteur.
1Pendant longtemps, les enseignants n’ont pas été un enjeu dans le débat éducatif en France. Les discussions ont plutôt porté sur les programmes (avec, par exemple, la discussion des nouveaux programmes introduits par Luc Ferry), les pédagogies (avec notamment le fameux débat sur la méthode globale), la carte scolaire (avec la réforme Sarkozy de 2007), ou encore l’orientation (avec le débat sur les mérites du collège unique).
2Cependant, une série de réformes et de rapports officiels ont réintroduit les enseignants dans la discussion sur l’éducation. Tout d’abord, la réforme Sarkozy supprimant les IUFM et introduisant l’obligation d’obtenir un master pour pouvoir passer les concours de l’enseignement a mis au premier plan la question de la formation des enseignants. De même, la généralisation des heures supplémentaires a introduit de manière indirecte la question du statut des enseignants, question qui a de nouveau été abordée par un récent rapport de la cour des comptes appelant à une réforme en profondeur de ce statut.
3En effet, le système de gestion des enseignants en France apparaît comme très rigide (Cour des comptes [2013]). Les enseignants sont affectés aux écoles en fonction d’une règle administrative fondée sur l’ancienneté et sur leurs vœux, sans que les caractéristiques des écoles ou encore l’avis du directeur d’établissement ne soient pris en compte. Il existe par ailleurs très peu de différenciation et de spécialisation entre enseignants, qui ne sont officiellement pas sous la tutelle hiérarchique du directeur d’établissement. Ce dernier n’a qu’un rôle de coordination de l’équipe pédagogique. Les enseignants sont évalués de manière très irrégulière par un corps d’inspecteurs, et cette évaluation a relativement peu d’influence sur le déroulement de leur carrière, où la rémunération au mérite reste faible par rapport à l’ancienneté. Les enseignants sont donc pour l’essentiel laissés sans supervision, sans que l’administration ait une vraie politique de ressource humaine. C’est notamment cette lacune qui suscite aujourd’hui le débat.
4Progressivement, deux grandes positions ont émergé. Une position que l’on pourrait qualifier d’attentiste, ou encore de sceptique, consiste à vouloir préserver autant que possible l’autonomie pédagogique des enseignants, et à se méfier de toute tentative pour renforcer leur tutelle hiérarchique, leur évaluation, ou encore la part liée au mérite de leur rémunération. Le principal argument de cette approche est la peur de la mise en place d’un système arbitraire et clientéliste où les enseignants seraient placés sous le contrôle étroit de bureaucrates n’ayant pas les compétences nécessaires pour les évaluer. En effet, l’enseignant est seul face à sa classe, et il est difficile de mesurer son impact sur le long terme. Dès lors, l’évaluation serait illusoire, et ne serait qu’un moyen pour asseoir le pouvoir d’une administration centralisée. La seule politique éducative souhaitable serait donc d’augmenter la rémunération des enseignants afin d’attirer un vivier de candidats ayant un bon niveau académique, et d’augmenter leur nombre dans le but d’améliorer les conditions d’enseignement.
5A l’inverse, une position que l’on pourrait qualifier d’activiste promeut une gestion plus active des ressources humaines de l’éducation nationale. Elle affiche son scepticisme envers l’efficacité des moyens supplémentaires, soulignant que les résultats sont restés stables malgré la hausse du nombre d’enseignants par élève. Elle souligne l’importance d’attirer des enseignants plus motivés et de meilleure qualité en augmentant leur rémunération, quitte à réduire leur nombre pour financer la hausse de leur traitement et à accroître leur rémunération grâce à des heures supplémentaires. Enfin, elle valorise l’autonomie des établissements, et accorde un rôle central au proviseur, qui doit pouvoir constituer librement son équipe pédagogique, et jouer un plus grand rôle dans l’évaluation des enseignants, voire dans l’attribution de primes au mérite.
6On le voit, ces deux conceptions sont à l’opposé l’une de l’autre. D’une certaine manière, elles reflètent aussi des différences d’idéologie. La vision sceptique pourrait être vue comme proche d’un point de vue politique « de gauche », notamment en raison de l’importance donnée à l’égalité de traitement entre enseignants, la peur du contrôle hiérarchique vu comme liberticide et arbitraire, et sa volonté de garantir un service public homogène sur le territoire en réduisant l’autonomie des établissements et en traitant les enseignants de manière identique. A l’inverse, la vision activiste pourrait être vue comme plus proche d’un point de vue politique « de droite », notamment en raison de son insistance sur l’initiative personnelle, l’autonomie, les différences de capacité entre individus, et la nécessité de récompenser les meilleurs enseignants et de donner plus d’incitations. Il n’est d’ailleurs pas surprenant qu’une partie des éléments qui la composent ait été mise en œuvre durant le mandat de Nicolas Sarkozy, ni que d’autres aient fait partie du programme de l’UMP.
7Cependant, il faut se garder de réduire ce débat à un simple conflit idéologique. Tout d’abord, de nombreuses personnes ont une position nettement plus nuancée, et empruntent simultanément des éléments aux deux visions exposées ci-dessus. Ainsi, les conclusions du rapport de la Cour des comptes ont-elles été bien accueillies par la plupart des tendances politiques, l’idée que le statut des enseignants en France est inadapté faisant consensus.
8Surtout, le désaccord entre ces deux visions repose foncièrement sur des éléments empiriques. Est-il possible de mesurer la contribution d’enseignants individuels à la réussite des élèves ? Peut-on mettre en place des dispositifs incitatifs efficaces tout en évitant les effets pervers ? Les chefs d’établissements ont-ils une idée juste de la valeur des enseignants qu’ils supervisent ? Ces questions, parmi d’autres, sont au cœur du débat entre les deux conceptions que nous avons évoquées, et sont également des questions factuelles susceptibles d’être résolues par des études empiriques bien menées.
9Pendant longtemps, néanmoins, de telles études n’étaient pas réalisables dans la mesure où il était difficile de disposer de larges bases de données appariant simultanément les enseignants et leurs caractéristiques, celles de leurs élèves, et les résultats académiques de ces derniers. Cependant, ces dix dernières années, le développement de procédures d’évaluation des écoles aux Etats-Unis, notamment en raison de la loi « No child left behind », ont abouti à la mise à disposition des chercheurs de bases de données de ce type. Cela a permis la production de nombreuses études empiriques permettant de mieux comprendre ce qui rend les enseignants plus ou moins efficaces, ainsi que les effets de différentes politiques de ressources humaines.
10Le but de cet article est donc de passer en revue cette abondante littérature empirique afin d’éclairer le débat sur la gestion des enseignants en France. On s’interrogera tout d’abord sur l’existence de différences d’efficacité entres enseignants. Elles conditionnent en grande partie l’intérêt d’une politique active de ressource humaine. On s’interrogera ensuite sur les facteurs observables pouvant influencer l’efficacité des enseignants, et susceptibles d’éclairer les procédures de recrutement. On essaiera alors de faire le point sur l’impact de la formation des enseignants, qui est le principal moyen par lequel le système éducatif peut affecter leur efficacité après leur recrutement. On s’intéressera ensuite à l’efficacité des différents systèmes d’incitation et de rémunération au mérite ayant été expérimentés tant aux Etats-Unis que dans d’autres pays de l’OCDE. On discutera enfin la répartition des enseignants au sein du système éducatif.
Les différences d’efficacité entre enseignants
11Tous les enseignants se valent-ils ? La question pourrait prêter à sourire, tant chacun a des souvenirs d’enseignants atrocement médiocres, ou au contraire d’enseignants charismatiques, capables de passionner tout une classe. Cependant, il est possible que les enseignants n’aient qu’un impact négligeable sur les différences de réussite scolaire par rapport à des facteurs tels que les effets de pair ou bien l’origine sociale des étudiants. Même si les différences perçues sont importantes, il est possible qu’elles ne pèsent que peu face à ces facteurs moins spectaculaires, mais peut-être plus influents. De fait, la littérature essayant de mesurer les facteurs de réussite des élèves s’est pendant longtemps concentrée sur des éléments tels que la taille des classes, les effets de pair, l’appartenance ethnique, ou encore l’origine sociale.
12Néanmoins, depuis le début des années 2000, une littérature croissante s’est attachée à quantifier les variations en termes d’efficacité des enseignants, et à essayer de mesurer précisément la contribution d’un enseignant en particulier au progrès des élèves. La première étude robuste sur le sujet (Hanushek, Kain et Rivkin [2005]) a mis ainsi en évidence un écart-type de l’effet professeur non négligeable, de l’ordre de 10-15 % d’un écart-type de score [1] par année de scolarité. Si cet effet semble faible à première vue, il faut garder à l’esprit que l’éducation est un processus cumulatif, et qu’un élève se voit assigner plusieurs enseignants au cours de sa scolarité. Par conséquent, se voir assigner une série de bons ou de médiocres professeurs peut avoir un effet très important.
13Par la suite, la littérature sur l’effet professeur a, avant tout, essayé de proposer des mesures de valeur ajoutée fondée sur le calcul d’un effet fixe enseignant. Il s’agit en substance de mesurer la moyenne des performances scolaires des élèves d’un enseignant donné, après avoir contrôlé les caractéristiques de ces élèves.
14Un problème majeur auquel doit faire face cette littérature est l’allocation non aléatoire des enseignants aux classes. En effet, il est possible que les bons professeurs soient systématiquement assignés aux meilleurs élèves, ou inversement, ce qui mènerait à une sous- (sur)estimation de l’écart-type de l’effet professeur. Par ailleurs, même si les enseignants sont assignés aux élèves de manière aléatoire conditionnellement aux observables, l’écart-type de l’effet professeur risque d’être surestimé dans la mesure où, par chance, des professeurs ayant un niveau d’efficacité identique peuvent se trouver, pour certains, avec une « bonne classe », et pour d’autres avec une « mauvaise » classe, ce qui conduit à surévaluer la différence d’efficacité entre ces enseignants. Une partie des différences de résultats observées entre enseignants serait ainsi due au hasard plutôt qu’à des différences d’efficacité réelles.
15Par conséquent, une série d’articles (Rockoff [2004], Kane et Staiger [2008], Aaronson et al [2007]) a tenté de résoudre ces deux problèmes à l’aide de techniques économétriques plus robustes. Tout d’abord, ces chercheurs ont essayé de contrôler du mieux possible le niveau des élèves en utilisant leurs résultats scolaires antérieurs, ce qui permet de limiter l’ampleur d’un biais lié à la répartition des classes et des professeurs, s’il existe. Ainsi, en utilisant de riches bases de données sur les étudiants, il est possible d’expliquer jusqu’à 80 % de la variance de leurs résultats. L’ampleur des biais possibles devient donc relativement réduite.
16Par ailleurs, l’utilisation des estimateurs de réductions s’est généralisée. Ceux-ci accordent plus ou moins de poids aux effets professeurs en fonction de la précision avec laquelle ils sont estimés. Ainsi, un enseignant dont les résultats varient fortement d’une année sur l’autre, et dont les élèves ont eux-mêmes des résultats très hétérogènes au sein d’une même classe, se verra attribuer un poids très faible dans le calcul de la variance totale. A l’inverse, un enseignant qui, de manière répétée, a des résultats identiques et dont les élèves ont des résultats homogènes, se verra attribuer un poids important. Cela permet donc de prendre en compte l’impact de la chance par rapport à une mesure de l’effet professeur où tous les professeurs sont traités de manière similaire dans le calcul de la variance.
17Ces études ont trouvé des résultats proches de ceux de Hanushek, Kain et Rivkin, soit environ 10-15 % d’un écart type pour les enseignants en mathématiques, et 5-10 % pour les enseignants en français. L’existence d’une variation significative de qualité entre les enseignants semble donc confirmée.
18Cependant, comme le fait remarquer Jesse Rothstein [2010], même en contrôlant les résultats scolaires passés, il est toujours possible que des biais existent sur les inobservables, comme le montrent plusieurs tests statistiques qu’il met en œuvre pour montrer les limites des mesures de valeurs ajoutées. Par ailleurs, comme le font remarquer d’autres chercheurs, un accroissement des scores peut n’être que temporaire, et n’avoir aucun lien avec des résultats de long terme tels que les salaires ou l’obtention d’un diplôme universitaire. Carrell et West [2010] trouvent ainsi, en observant une université américaine, que les enseignants qui ont un impact négatif sur les résultats de fin d’année ont un effet positif sur les résultats des années suivantes, et réciproquement. Bien que difficilement généralisable en raison du contexte très spécifique où elle est menée, cette étude met cependant en garde contre une interprétation trop hâtive des mesures de valeur ajoutée comme capacité à faire progresser durablement les élèves. Par ailleurs, les mesures de valeur ajoutée n’évaluent que la capacité à faire augmenter les compétences cognitives, et ne disent rien sur l’efficacité des enseignants quant à l’augmentation des compétences non cognitives (telles que la capacité à respecter les règles, à faire des efforts, et ainsi de suite). Ainsi, Kirabo Jackson [2013] montre par exemple que certains enseignants apparemment peu efficaces se révèlent très capables si on évalue leur habileté à faire augmenter ces compétences non cognitives.
19Des travaux récents ont néanmoins permis de répondre à une partie de ces critiques, et de valider une grande partie des résultats antérieurs. Ainsi, Kane et Staiger [2008] ont mis en œuvre une expérience contrôlée où un groupe d’enseignants était assigné aléatoirement à des classes, tandis qu’un autre était assigné de manière traditionnelle, en fonction des choix des proviseurs. L’étude ne trouve pas de trace de sélection sur les inobservables, les résultats étant sensiblement identiques entre les groupes.
20Par ailleurs, Chetty et al. [2011] ont réussi à suivre sur une très longue période une série de cohortes d’enseignants et d’étudiants, et ont notamment pu obtenir des données sur les résultats des étudiants sur le marché du travail. Ils montrent ainsi que les élèves se voyant assigner un enseignant ayant une valeur ajoutée élevée réussissent significativement mieux sur le marché du travail, même des années plus tard. Se voir assigner au collège ou au primaire un enseignant ayant une valeur ajoutée supérieure à un écart-type par rapport à la moyenne est associé à une augmentation de salaire d’environ 1 %. Ils trouvent également des effets positifs sur la qualité du quartier habité, la probabilité d’éviter une grossesse précoce, et la probabilité de fréquenter une institution universitaire. Se voir assigner un professeur de bonne qualité, telle qu’elle est mesurée par les économistes, est donc bien associé à une amélioration de sa situation sur le long terme.
21Chetty et al. proposent également des tests de robustesse fondés sur les changements d’enseignants entre écoles. En effet, quand un nouvel enseignant arrive dans une école, il fait changer le niveau moyen des étudiants de l’établissement quelle que soit la classe à laquelle il est assigné, supprimant le problème du biais lié au tri entre enseignants et étudiants. Comparer la réussite moyenne des étudiants de l’école avant et après son arrivée permet donc d’évaluer dans quelle mesure la valeur ajoutée estimée est sans biais. Chetty et al. trouvent un biais minime, validant la méthodologie utilisée jusque-là. Dans la mesure où les modèles économétriques utilisés expliquent une très grande part de la variance des scores des élèves, une telle absence de biais n’est pas forcément surprenante.
22Enfin, Chetty et al. tentent également de quantifier les gains économiques générés par un enseignant plus efficace que la moyenne. Ils trouvent des résultats très élevés, égaux à plusieurs centaines de milliers de dollars par an pour les enseignants dans le haut de la distribution. Réalisée sur un échantillon de plusieurs millions d’élèves, portant sur une période d’une vingtaine d’années et avec des données très riches, l’étude de Chetty et al. permet donc d’apporter une conclusion définitive au débat.
23Par conséquent, la littérature scientifique a atteint un relatif consensus sur l’importance des enseignants. Leur efficacité varie de manière importante, et il s’agit d’un facteur crucial dans la réussite académique des élèves, ainsi que dans leur réussite future dans un ensemble de domaines économiques et sociaux. Cependant, comme on va le voir plus loin, cela ne fait pas pour autant des enseignants un facteur aisément manipulable pour améliorer les résultats scolaires.
Le recrutement et la formation des enseignants
24Si les enseignants diffèrent en termes de capacité, il est naturel de vouloir sélectionner en priorité les meilleurs d’entre eux. Cependant, avant le recrutement, il n’est pas possible de mesurer ces capacités, puisque les aspirants enseignants n’ont aucune expérience.
25Dès lors, les recruteurs se concentrent sur des caractéristiques aisément observables, dont on suppose qu’elles sont corrélées à la capacité d’enseigner. Ainsi, la plupart des systèmes éducatifs accordent un poids important à des critères académiques, tels que les programmes universitaires suivis, les diplômes obtenus, et surtout, la capacité à réussir un examen de certification des connaissances (c’est la voie suivie par la France). Par ailleurs, dans les systèmes où les changements d’affectation ne se font pas de manière administrative, mais à travers un marché externe et décentralisé, et où les écoles ne peuvent observer directement les performances passées dans d’autres établissements, un poids important est généralement donné à l’expérience.
26Il est donc important de mesurer l’impact réel de ces caractéristiques sur la réussite des élèves, ce qui permettrait de mettre en place des pratiques de recrutement efficaces. Les principales études sur le sujet aux Etats-Unis ont été réalisées par Clotfelter et al. [2006] à partir de données sur la Caroline du Nord. La difficulté essentielle dans l’estimation de l’impact de ces caractéristiques est l’existence d’un tri entre élèves et professeurs, les professeurs les plus qualifiés se voyant en général assigner les meilleurs élèves. Comme on l’a vu précédemment, même si on peut contrôler les caractéristiques observables des élèves, il est toujours possible qu’un tri subsiste à partir des caractéristiques inobservables. Ceci pourrait introduire un biais important dans l’estimation. Dans le cadre de leur première étude [2006], fondée sur des données sur des élèves de CM2 (fifth grade), Clotfelter et al. essaient de supprimer ce problème en contrôlant de nombreuses caractéristiques des élèves, incluant leurs résultats scolaires passés, en introduisant des effets fixes pour chaque école, et en gardant dans leur échantillon uniquement les écoles où il ne semble pas y avoir de tri fondé sur les observables entre les classes. Cette méthode ne résout pas le problème de sélection sur les inobservables, mais en réduit cependant fortement l’ampleur.
27La seule caractéristique ayant un effet est l’expérience de l’enseignant, et ce seulement pendant les deux premières années. Après deux années d’expérience, les enseignants ne gagnent plus en efficacité avec l’âge. Le niveau académique, mesuré par la sélectivité de l’institution universitaire fréquentée, par les résultats aux tests de certification (licensure test score, l’équivalent du CAPES), et la possession d’un titre universitaire post-licence n’a aucun impact sur la réussite des élèves.
28Dans une étude ultérieure [2010], Clotfelter et al. étudient l’impact des caractéristiques des professeurs sur des étudiants inscrits au lycée. La méthode utilisée dans ce cas est le contrôle de la qualité des élèves en utilisant des effets fixes élèves à travers les différentes matières. On regarde donc si les caractéristiques des enseignants dans une matière sont corrélées avec l’écart des résultats des élèves dans cette matière par rapport à leur moyenne générale. Ceci permet de tenir compte du niveau général de l’élève. De cette manière, la seule source de biais possible est qu’un professeur ayant un certain type de caractéristiques soit systématiquement affecté à une classe où en moyenne les élèves sont plus forts dans une discipline plutôt que dans une autre. Un tel phénomène pourrait apparaître si, par exemple, les élèves étaient systématiquement regroupés en fonction de leur capacité dans une discipline par rapport aux autres (création d’une classe forte en mathématiques, d’une autre classe forte en français, et ainsi de suite). En pratique, Clotfelter et al. ne repèrent pas un tel modèle sur les caractéristiques observables dans leurs données, ce qui rend peu probable l’existence d’un important tri sur les inobservables.
29Les résultats sont assez différents de la précédente étude, puisque la plupart des caractéristiques étudiées ont un impact. L’expérience a un effet approximativement similaire au cas du primaire. Par ailleurs, le fait d’être certifié (au lieu d’être recruté par une voie alternative) est assez important (5 à 7 % d’un écart-type), de même que le fait d’être certifié par le National Board for Certification, organisme évaluant la qualité d’un enseignant à partir de l’observation répétée de son comportement en classe (5 %). Cependant, même si les caractéristiques académiques ont un impact, celui-ci est extrêmement faible. L’impact du test à l’examen de certification est de 0,7 % d’un écart-type pour un enseignant ayant un score supérieur d’un écart-type à la moyenne (soit un enseignant se trouvant dans les 15 % les meilleurs à l’examen). De même, l’impact du niveau de sélectivité de l’institution universitaire fréquentée est faible ou nul. Par ailleurs, le sexe et l’origine ethnique ont une influence importante, à hauteur de 6 % chacun, mais ne sont guère susceptibles d’être utilisés dans le recrutement pour des raisons de non-discrimination.
30Ces résultats sont confirmés par Harris et Sass [2011] à partir de données venant du système scolaire en Floride, et avec une méthode proche. Disposant de données détaillées sur les cours pris par les enseignants à l’université durant leurs études, ils ne trouvent pas d’impact d’un type de cours en particulier sur l’efficacité des enseignants, quel que soit le niveau auquel ils enseignent. De manière similaire, ils ne trouvent aucun effet de la capacité académique des enseignants sur la réussite des élèves.
31On peut faire l’hypothèse que la certification a plus d’importance au lycée en raison du plus haut niveau académique exigé de l’enseignant. Cependant, dès lors que ce niveau minimal est atteint, les compétences académiques ne jouent plus de rôle important.
32On le voit donc, les caractéristiques observables susceptibles d’être utilisées pour recruter les enseignants, et en particulier les performances académiques, n’ont guère d’impact sur la réussite des étudiants. La seule caractéristique importante est le fait de se voir assigner un enseignant débutant mais elle n’est guère manipulable par les pouvoirs publics. Par conséquent, le processus de recrutement ressemble à un exercice de sélection à l’aveugle où les écoles sont obligées de départager les candidats sur des bases arbitraires.
33Si le problème de l’absence d’information est difficilement soluble lors du recrutement, il est cependant susceptible d’être résolu dans les années suivantes. En effet, il est alors possible de disposer de mesures de l’efficacité des enseignants fondées sur les résultats de leurs élèves. Dès lors, on peut imaginer un dispositif de titularisation où les jeunes enseignants passeraient à travers une période probatoire durant plusieurs années, avant d’être confirmés dans leur poste quand leurs résultats seraient jugés suffisamment bons. On pourrait également inciter les professeurs les plus médiocres à quitter l’enseignement en liant une part importante de la rémunération aux résultats. Cependant, cela suppose d’être capable de mesurer précisément l’efficacité des enseignants à leur poste de travail.
34Si les travaux passés en revue précédemment montrent bien l’existence d’une forte hétérogénéité entre enseignants, leurs estimations des effets professeurs individuels sont de faible qualité. En effet, ces études procèdent en deux étapes. Tout d’abord, elles estiment un effet professeur pour chaque enseignant. Il s’agit de regarder si l’enseignant fait progresser plus ou moins fortement ses élèves par rapport à la moyenne des autres professeurs (qui par convention est fixée à zéro). Ensuite, elles mesurent l’écart-type de ces effets professeurs (qui sont considérés comme étant une variable aléatoire). Comme on l’a vu précédemment, on peut considérer qu’en moyenne l’effet mesuré pour un enseignant donné est sans biais, comme le montrent de manière convaincante Chetty et al. [2011]. Cependant, chacun de ces effets individuels est mesuré avec une marge d’erreur, qui peut être importante.
35En effet, il existe la plupart du temps un faible nombre d’observations par enseignant, ce qui fait exploser la variance des effets professeurs tels qu’ils sont mesurés. Le problème est exacerbé si les enseignants évalués n’ont que quelques années d’expérience. Ce n’est pas une difficulté dès lors que l’on se concentre sur la mesure de la variance de l’effet professeur, puisque c’est principalement l’existence d’un biais qui compte, et que l’effet de la variance des effets professeurs individuels sur la mesure de la variance de l’ensemble des effets professeurs peut être neutralisée par l’utilisation d’estimateur de réduction, comme on l’a vu plus haut. En revanche, cela devient un obstacle majeur dès lors que l’on veut utiliser ces informations pour prendre des décisions de titularisation ou de paie au mérite, qui nécessitent notamment de comparer les enseignants les uns par rapport aux autres. Dans ce cas, le risque d’erreur devient très important.
36Cependant, on pourrait considérer qu’en moyenne, les professeurs titularisés sont meilleurs que ceux qui ne le sont pas, et qu’il est rentable de mettre en place un tel dispositif. C’est l’approche proposée par Rockoff et al. [2010] qui proposent de recruter massivement de jeunes professeurs et de n’accorder la titularisation qu’à un nombre très réduit d’entre eux, de l’ordre d’un quart, voire moins. Dès lors que le taux de sélection est très élevé, même une mesure très bruitée des capacités des professeurs peut permettre d’améliorer de manière très sensible l’efficacité moyenne des professeurs.
37Une telle approche suppose néanmoins que l’offre de travail pour le métier de professeur est très élevée, ce qui en général n’est pas le cas [2]. En effet, si une part importante des jeunes professeurs n’est pas titularisée, il faut recruter chaque année un nombre d’enseignants largement supérieur aux besoins (puisque seuls certains enseignants auront vocation à rester dans le système scolaire sur le long terme). Rockoff et al. objectent qu’utiliser un système de recrutement fondé sur une mesure sans biais de l’effet professeur permettrait d’élargir de manière considérable le réservoir des professeurs potentiels en réduisant fortement les prérequis nécessaires pour enseigner, prérequis qui en pratique ne sont que faiblement corrélés avec la capacité à faire progresser les élèves. Cependant, même en assouplissant les barrières à l’entrée, l’augmentation nécessaire du nombre de candidats ne semble pas réalisable.
38En effet, environ 4 % de la force de travail exercent en tant qu’enseignant dans la plupart des pays de l’OCDE, ce qui représente de l’ordre de 8 à 10 % des diplômés du supérieur. Dans un système où la titularisation est quasi systématique, cela signifie que le système éducatif doit approximativement réussir à attirer 8 à 10 % des jeunes diplômés chaque année, ce qui n’est déjà pas négligeable et peut devenir problématique dans certains pays. Par conséquent, ne titulariser que 50 % des jeunes enseignants reviendrait à s’imposer l’obligation d’attirer chaque année de l’ordre de 15 à 20 % des nouveaux diplômés du supérieur dans les carrières de l’enseignement, ce qui est considérable. Or Staiger et al. sont en faveur de taux de titularisation encore plus faibles.
39Par ailleurs, Rothstein [2012] fait observer qu’un taux élevé de sélection dégrade considérablement l’attrait de la profession d’enseignant. En effet, l’expérience acquise dans l’enseignement n’est généralement pas transférable à d’autres professions, et ce d’autant moins que l’enseignant a été licencié, ce qui envoie un signal négatif au futur employeur. Attirer des candidats requerrait donc une hausse massive de leur rémunération, au moins lors des premières années, afin de compenser les risques considérables pris.
40Or, plus la période de titularisation est élevée, plus le montant de la compensation doit être élevé. A l’inverse, plus la période de titularisation est faible, plus la variance de l’effet professeur mesuré est forte. Par conséquent, on voit que les problèmes liés à l’offre de travail des enseignants viennent sévèrement limiter les possibilités de mise en place d’un système de titularisation. L’existence d’un biais dans la mesure de l’effet professeur viendrait encore empirer la situation en réduisant les gains d’efficacité à espérer d’une plus grande sélection des professeurs.
41Finalement, sous des paramètres plausibles, et en faisant l’hypothèse d’une absence de biais des mesures de qualité des professeurs, Rothstein trouve des coûts très élevés sous forme de hausses de salaire aux politiques visant à augmenter le taux de licenciement des professeurs les plus faibles, où à mettre en place un système de bonus rémunérant la performance. Ainsi évalue-t-il à 30 % la hausse de la masse salariale nécessaire à la mise en place d’un taux de licenciement de 20 % en début de carrière.
42Dès lors que le mécanisme de licenciement et de bonus est biaisé, l’efficacité du système est réduite de manière considérable, alors que les coûts restent identiques. Par conséquent, le modèle proposé par Rothstein montre les limites d’une politique de titularisation débouchant sur un taux de licenciement important. Si elle peut donner des bénéfices réels, une telle politique a cependant des coûts qui deviennent rapidement exorbitants. Il est sans doute préférable de mettre en œuvre des politiques de titularisation et de bonus relativement mesurées.
43Une autre piste serait d’améliorer les mesures de performance des enseignants, notamment en utilisant des observations directes du professeur dans sa classe plutôt que des mesures fondées sur des scores. Cependant, les expériences d’évaluation fondée sur l’observation directe ne portent pas à l’optimisme. La tentative la plus aboutie a été menée par le « National Board for Professional Teaching Standards » qui a proposé une certification fondée sur l’observation répétée de l’enseignant dans sa classe, et sur le suivi d’un certain nombre de pratiques d’enseignement. Cependant, malgré le coût élevé en temps et en argent de cette procédure, qui dure un an et est relativement sélective (avec un taux d’échec de la moitié), les enseignants certifiés ne semblent que très faiblement plus efficaces que les autres (Goldhaber et Anthoni [2007]). Par conséquent, la mise en œuvre d’une procédure d’évaluation à grande échelle à partir de critères objectifs semble pour l’instant hors de portée.
44A défaut d’améliorer leur pratique de recrutement, les systèmes éducatifs pourraient essayer de dispenser une formation efficace aux nouveaux enseignants, que ce soit une formation à la pédagogie, ou bien une formation visant à renforcer des connaissances académiques quand celles-ci s’avèrent insuffisantes. La formation des enseignants fait l’objet d’intenses débats, qui ont souvent trait à son contenu. Ainsi, la formation dispensée dans les IUFM en France avant leur suppression a été fréquemment critiquée à cause de sa supposée abstraction, et du manque de qualifications des formateurs, qui n’avaient fréquemment plus eu d’expérience de l’enseignement dans le primaire ou le secondaire depuis des années.
45Ce débat, quant au contenu, renvoie à un problème économétrique : il est difficile de mesurer l’impact de la formation des enseignants dans la mesure où il est très difficile de quantifier ce que recouvrent ces formations, qui varient considérablement d’un pays à l’autre. Les leçons tirées d’une expérience nationale sont difficilement transposables dans d’autres contextes. De manière peu surprenante, les résultats sont d’ailleurs assez divers, mais globalement plutôt négatifs.
46Ainsi, Angrist et Lavy [2001] obtiennent des résultats positifs de la formation des enseignants sur les résultats académiques pour les écoles primaires laïques, mais pas de résultats pour les écoles primaires privées. L’étude est réalisée à l’aide d’une double différence, où l’on compare l’évolution au fil du temps du groupe d’élèves traité à celle du groupe qui ne l’est pas, ce qui offre de bonnes garanties d’identification. Les formations dispensées sont avant tout des formations à la pédagogie. Cependant, l’étude est menée sur un échantillon relativement restreint. Par ailleurs, le programme de formation semble avoir été associé à d’autres modifications de l’environnement des écoles susceptibles de faire augmenter les scores.
47Jacob et Lefgren [2004] étudient un programme de formation des professeurs d’écoles primaires dans la ville de Chicago. Ce programme est spécialement ciblé à destination des écoles comprenant le plus d’élèves en difficulté, et seules les écoles dont les élèves ont des résultats scolaires suffisamment faibles sont éligibles au programme. Le programme se concentre lui aussi sur les pratiques pédagogiques. Jacob et Lefgren comparent les résultats d’élèves venant d’écoles situées juste en dessous et au-dessus du seuil d’éligibilité, donc presque similaires bien que n’ayant pas le même accès au programme de formation. Cette régression sur discontinuité montre, à l’inverse de l’étude de Angrist et Lavy, des effets nuls du programme de formation des enseignants sur les résultats des élèves. Cependant, le programme de formation étudié portait sur des périodes relativement courtes, ce qui le rend peu susceptible d’être efficace.
48De manière similaire, Garet et al. [2008 et 2010] trouvent des résultats nuls dans des études expérimentales où les enseignants sont assignés de manière aléatoire à un programme de formation relativement intensif, aussi bien dans le primaire que dans le secondaire.
49Harris et Sass [2011] étudient à la fois l’effet de la formation initiale, et celui de la formation continue sur des données américaines (Etat de Floride). Disposant de données longitudinales, ils peuvent contrôler l’effet individuel des étudiants, des professeurs et des écoles par des effets fixes, et estimer l’impact des caractéristiques variant au fil du temps, telles que la formation continue. Harris et Sass trouvent un effet nul ou très faible de la formation continue sur les résultats des élèves, à tous les niveaux d’enseignement et pour toutes les disciplines. Quand des effets positifs existent, ils sont trop faibles pour qu’on puisse considérer socialement rentable d’investir dans la formation des enseignants.
50Enfin, il existe également une étude française réalisée par Bressoux, Kramarz et Prost [2009] dont les résultats sont plus contrastés. Bressoux et al. exploitent une erreur de prévision de l’Education nationale française. Sous-estimant le nombre d’enseignants à renouveler dans les écoles primaires, celle-ci n’a pas admis suffisamment d’élèves enseignants dans les écoles normales d’instituteurs qui dispensent une formation de deux ans pour répondre aux besoins. Par conséquent, un groupe d’étudiants supplémentaire a dû être recruté directement sur la liste complémentaire des concours de l’enseignement, sans avoir pu suivre de formation. Cette erreur de prévision a donc créé une différence aléatoire de durée de formation au sein des enseignants débutants au même moment. Les différences entre ces enseignants sont très faibles, les enseignants recrutés sur liste complémentaire ayant un niveau universitaire quasi similaire à ceux reçus directement. En comparant les deux groupes d’enseignants, Bressoux et al. trouvent un résultat nul de la formation en français (reading), mais positif et relativement large en mathématiques. Cet effet semble avant tout présent chez les enseignants n’ayant reçu aucune formation en mathématiques durant leurs études universitaires. Par conséquent, dans ce cas précis, il semble que ce soit l’amélioration des connaissances qui a augmenté l’efficacité des enseignants, plutôt que la modification de leurs pratiques pédagogiques.
51En général, la formation des enseignants semble donc avoir peu d’impact sur la réussite des élèves. Quand cet impact est présent, il semble qu’il puisse être attribué à l’augmentation des connaissances d’enseignants peu formés à certains sujets plutôt qu’à une amélioration de leurs pédagogies. Il semble bien qu’il soit impossible d’enseigner l’enseignement. En revanche, remédier à un manque de maîtrise des connaissances à enseigner peut s’avérer efficace.
Les dispositifs d’incitation des professeurs
52A défaut de pouvoir recruter des enseignants de manière efficace, on peut essayer de les rémunérer sur la base de leurs résultats et de leur donner de bonnes incitations.
53Trois grands arguments peuvent être avancés en faveur d’un salaire conditionné, au moins en partie, à la performance. Tout d’abord, l’efficacité des enseignants peut dépendre d’un effort qui est coûteux pour eux, et pas seulement de caractéristiques fixes. En les rémunérant en fonction de leur efficacité, on les incite à exercer un effort plus important. En outre, rémunérer les enseignants de manière différente peut créer une incitation à quitter l’enseignement pour les enseignants les plus médiocres, et à y rester plutôt que partir dans le secteur privé pour les meilleurs. Enfin, dans la mesure où les individus réagissent à leur perception de la justice, mettre en place un système d’incitation peut constituer une forme de rétribution symbolique pour l’ensemble des enseignants, dès lors que le système d’incitation est perçu comme étant juste. Cela rendrait la profession plus attractive, à l’heure où beaucoup de systèmes éducatifs peinent à recruter suffisamment d’enseignants.
54Comme on l’a vu dans la section précédente, un tel dispositif d’incitation est très complexe à mettre en place en raison de la difficulté à disposer de mesures fiables de performance, et surtout de leur forte variance. Une littérature importante en théorie des contrats (Baker et al. [1994]) montre que l’existence d’un signal ayant une variance importante réduit la possibilité de mettre en place des mesures incitatives puissantes, car elle fait exploser le risque supporté par les agents, qui doivent donc recevoir une compensation supplémentaire. En effet, dès lors que le signal envoyé par le professeur est très bruité, même un enseignant de grande qualité est susceptible de jouer de malchance (par exemple, en se voyant attribuer une classe où les élèves sont beaucoup plus faibles que leur caractéristiques observables pourraient le laisser penser), et d’être pénalisé. Inversement, un enseignant médiocre peut obtenir une récompense sans effort s’il est chanceux. Par conséquent, la rémunération des enseignants devient susceptible de varier fortement d’une année à l’autre à cause de facteurs qu’ils ne peuvent contrôler. Or, la plupart des individus ont de l’aversion pour le risque. Il faudrait donc augmenter leur rémunération de manière non négligeable pour leur faire accepter un système d’incitation incluant une part importante d’aléa.
55Par ailleurs, un dispositif incitatif peut mener à des comportements visant à contourner le système en satisfaisant les critères du dispositif seulement en apparence. L’un des comportements les plus répandus consiste ainsi à « enseigner pour l’examen » (teaching to the test) en enseignant uniquement les compétences nécessaires à la réussite du test, voire la réponse aux questions susceptibles de figurer à l’examen, au détriment d’un apprentissage plus large, plus profond, et surtout plus durable (Carrell et al. [2010]). Par ailleurs, un dispositif incitatif peut aussi amener les enseignants à détourner leur attention des élèves n’ayant que peu de marges de progrès, ou peu susceptibles d’atteindre le niveau minimal requis, au profit des élèves les plus susceptibles de s’améliorer et d’aider le professeur à atteindre ses objectifs. Dans certains cas, un système incitatif peut même mener certains enseignants à tricher et à corriger de manière incorrecte les examens de leurs élèves pour augmenter leurs performances apparentes. Plusieurs études réalisées aux Etats-Unis montrent que cette possibilité n’est pas qu’anecdotique (Jacob et Levitt [2003]).
56En outre, les tests utilisés pour mesurer la performance des élèves ne prennent en compte qu’une partie seulement des compétences apprises à l’école. En particulier, comme le montre Jackson [2013], les mesures de valeur ajoutée n’incluent pas la capacité d’un professeur à faire augmenter les compétences non cognitives de ces étudiants (telles que la capacité à fournir un effort, à respecter des règles, et ainsi de suite), alors même qu’elles représentent une part non négligeable des bénéfices tirés de l’éducation. Par conséquent, un système incitatif mal conçu peut distordre l’effort de l’agent dans une seule direction, et être préjudiciable quand il s’agit d’un agent « multitâches », devant remplir plusieurs fonctions à la fois. On peut ainsi imaginer que les enseignants se concentrent exclusivement sur les compétences académiques de leurs élèves, négligeant des compétences sociales potentiellement importantes.
57Malgré ces difficultés, un certain nombre d’expériences ont été menées aussi bien dans les pays en développement que dans les pays développés. En général, les bonus offerts le sont en addition aux salaires normaux, ce qui réduit le problème du risque supporté par les agents, mais augmente le coût de la rémunération totale. Mais la plupart de ces programmes ont été menés sur une période limitée, ou bien de manière non aléatoire, ce qui rend leur évaluation difficile.
58Si l’on se concentre seulement sur les études ayant été réalisées de manière expérimentale, avec une allocation aléatoire des écoles aux dispositifs incitatifs, les résultats sont nuls dans les pays développés. Ainsi, l’évaluation d’un système d’incitation mis en place au niveau du primaire et du secondaire dans l’Etat de New York par Fryer [2013] et Goodman et Turner [2013], trouve des résultats nuls, voire négatifs. Ce système d’incitation avait la particularité d’être fondé sur une récompense allouée non pas à des individus, mais à des groupes d’enseignants affectés à une école donnée, en fonction de l’atteinte d’objectifs fixés au préalable par le district. La répartition entre enseignants se faisait ensuite par un comité formé au sein de l’école. En pratique, la plupart des écoles ont choisi de répartir les primes perçues en fonction du rang hiérarchique des enseignants dans l’établissement, plutôt qu’en fonction d’un critère de mérite. Par conséquent, il apparaît que les incitations fournies sont considérablement diluées par la possibilité, pour un professeur, d’adopter un comportement de passager clandestin. De manière cohérente avec cette idée, Goodman et Turner trouvent que plus le groupe d’enseignants est de faible taille, plus le programme de primes à un effet positif. L’exemple de New-York montre l’importance de la manière dont le dispositif d’incitation est construit.
59Une autre étude expérimentale conduite à Nashville dans le Tennessee (Springer et al. [2010]) aboutit également à des résultats nuls dans le cadre d’un dispositif incitatif focalisé avant tout sur les enseignants eux-mêmes. Par conséquent, même un dispositif incitatif bien conçu ne semble pas faire preuve d’efficacité.
60D’autres études fondées sur des résultats non expérimentaux donnent des résultats positifs. Ainsi, Lavy [2002] étudie-t-il un programme d’incitation mis en œuvre sous la forme d’un tournoi où seules les trois meilleures écoles sont récompensées, de manière analogue au dispositif décrit par Lazear et Rosen [1981], en appliquant une forme de régression sur discontinuité comparant des écoles juste au-dessus et en dessous d’un seuil d’éligibilité pour participer aux programmes (seules les écoles les plus médiocres sont admises à participer). Il trouve un effet assez important de ce programme, bien que ce soit également un programme de groupe comme dans l’expérience new-yorkaise. Dans une étude ultérieure, Lavy [2009], évalue un programme donnant des primes à des enseignants en fonction des résultats de leurs élèves à un examen d’entrée dans l’enseignement supérieur. Les écoles sont assignées au programme en fonction des résultats préliminaires à cet examen, toutes les écoles en dessous d’un certain seuil participant au programme. Cependant, ces résultats préliminaires diffèrent en général de manière importante des résultats finaux, l’écart étant aléatoire. Pour les écoles se situant aux alentours du seuil, la participation au programme peut être considérée comme étant due au hasard. Lavy trouve là encore des résultats positifs relativement élevés. Cependant, ces études portent sur un nombre d’établissements assez restreint (quelques dizaines). Par conséquent, elles restent vulnérables à des chocs affectant des établissements de manière différente selon que l’école est traitée ou non.
61En ce qui concerne les pays en développement, les résultats des dispositifs d’incitation évalués par expérimentation aléatoire sont en général positifs (Duflo, Hanna et Ryan [2012], Muralidharan et Sundararaman [2012]), bien que les effets de ces programmes ne soient pas toujours durables (Glewwe, Ilias et Kremer [2010]). Ces résultats positifs dans les pays en développement pourraient s’expliquer par le moindre contrôle exercé par les directeurs d’écoles et les familles sur les professeurs. Ainsi Duflo et al. documentent-ils un taux d’absentéisme très élevé dans les écoles étudiées au Kenya, de l’ordre de 40 %. L’un des principaux effets du dispositif d’incitation est de diviser par deux ce taux d’absentéisme. Il semble que la marge de progression des enseignants dans les pays en développement soit importante, à l’inverse des pays riches où on peut penser que les cas les plus graves de manque de rigueur professionnelle sont déjà éliminés.
62Les résultats des dispositifs incitatifs déjà testés apparaissent donc très mitigés, les études les plus robustes ne trouvant aucun impact dans les pays développés. Il est difficile de privilégier une raison précise de cet échec parmi les explications proposées plus haut. On peut cependant penser que les incitations de groupe, plus faciles à mettre en place lorsque les performances individuelles sont difficiles à mesurer, souffrent d’un problème rédhibitoire de passager clandestin. Par ailleurs, la marge de progression des enseignants dans les pays développés est sans doute limitée.
63Ces études sont loin de donner des réponses définitives. En effet, la mesure incitative la plus répandue à travers les systèmes éducatifs est avant tout une évaluation subjective de l’enseignant par un supérieur hiérarchique, qui peut ensuite donner un avis influant sur le salaire de l’enseignant. Ainsi, les enseignants français sont contrôlés de manière régulière, bien qu’espacée, par des inspecteurs. Ils sont également évalués par le chef d’établissement. Ces évaluations qualitatives donnent lieu à une notation qui joue un rôle important dans l’avancement (et donc la progression salariale) des enseignants.
64Il semble que les évaluations qualitatives soient au moins en partie corrélées à l’efficacité des enseignants (du moins telle que mesurée par leurs effets sur les scores, Jacob et Lefgren [2008], Rockoff et Speroni [2011], Rockoff et al. [2012]). Il est en pratique difficile de mesurer l’impact de cette rémunération au mérite sur le résultat des élèves, et sur le niveau d’effort des enseignants. Cependant, elle pourrait expliquer l’absence d’effet de mesures incitatives additionnelles. En effet, il est possible que les enseignants soient déjà efficacement contrôlés par leur hiérarchie. Mais il faut que cette hiérarchie dispose d’un véritable pouvoir.
65Plusieurs études ont mis en évidence un effet positif d’une plus grande autonomie des écoles sur les résultats. Ainsi, Clark [2009] évalue un programme visant à donner un statut spécial d’autonomie à une fraction des écoles britanniques. Ce changement de statut dépendant d’un vote des parents compare les écoles où ce vote a été gagné avec une faible marge à celles où il a été perdu avec une marge identique. On peut en effet considérer que pour ce groupe d’écoles le changement de statut a été aléatoire. Clark trouve des résultats positifs de l’autonomie, d’une magnitude relativement large.
66Un des canaux par lesquels cette autonomie accrue pourrait avoir des effets bénéfiques est un plus grand pouvoir hiérarchique de la direction sur les enseignants. Dans l’étude de Clark, les écoles concernées par le statut d’autonomie se voyaient confier la gestion complète des ressources humaines, et notamment la gestion des salaires, ce qui rend ce canal plausible.
67Quoi qu’il en soit, il semble qu’il y ait peu à attendre de la mise en place de mesures formelles d’incitation. Etant donné le coût non négligeable de ces mesures, leurs avantages potentiels semblent très limités. A l’inverse, des travaux supplémentaires seraient nécessaires pour évaluer l’impact des mesures d’incitation fondées sur une évaluation qualitative des enseignants. Une autonomie accrue des écoles, incluant une plus grande capacité à évaluer et faire varier la rémunération de leurs enseignants, pourrait en effet se révéler une piste peu coûteuse d’amélioration de la gestion des enseignants.
L’appariement entre élèves et enseignants
68Outre le recrutement et l’incitation des enseignants, une politique des ressources humaines doit aussi les répartir au sein du système éducatif. L’équité de la répartition des professeurs au sein des établissements est un sujet relativement sensible. En particulier, les parents d’élèves essaient, autant que possible, d’éviter qu’un enseignant débutant ou peu expérimenté soit assigné à leurs enfants. Par ailleurs, la répartition des enseignants est souvent dénoncée comme injuste.
69De fait, plusieurs travaux sur le système éducatif américain mettent en évidence un tri important entre les élèves et les enseignants à partir de leurs caractéristiques observables. Les études de Clotfelter et al., vues plus haut, montrent qu’en moyenne les élèves issus de milieux défavorisés ou de minorités ethniques se voient assigner des professeurs moins expérimentés et moins qualifiés. La France n’échappe pas à ce phénomène.
70Ce tri entre élèves et enseignants est en général vu comme contribuant à l’existence d’inégalité scolaire entre les groupes par le grand public. On peut être assez sceptique quant à cette idée dans la mesure où seul le fait d’avoir un professeur débutant a un impact important sur les résultats scolaires en primaire, et que la situation au lycée n’est pas très différente, puisque la principale différence est l’existence d’un impact positif de la certification. Par ailleurs, Clotfelter et al. montrent que les différences entre caractéristiques des professeurs ne peuvent expliquer que quelques pour cent de l’écart entre groupes d’étudiants.
71Des études plus récentes (Harris et Sass [2013]) montrent néanmoins un impact un peu plus important de l’expérience au-delà des premières années, que Clotfelter et al. Ces différences entre études s’expliquent par le phénomène d’attrition des enseignants les plus faibles au fil du temps, qui mène à surestimer l’impact négatif du fait d’être un jeune professeur. En comparant la progression de l’efficacité au fil du temps pour un même enseignant, il est possible de mettre en évidence une progression faible mais régulière de l’efficacité dans certaines matières et certains niveaux. Cependant, là encore ces effets sont trop faibles pour que le tri entre élève et enseignant puisse entraîner des inégalités importantes de résultats entre groupes d’élèves.
72Un phénomène lié au tri est la rotation importante des professeurs dans les écoles les plus défavorisées. En effet, les professeurs affectés aux écoles ayant les plus mauvais résultats essaient d’en partir au plus vite en raison des mauvaises conditions de travail qui y règnent. Ce phénomène serait nuisible à la réussite des élèves, en déstructurant les équipes pédagogiques (Ronfelt et al. [2013]).
73A première vue, il semble qu’un système centralisé comme le système français puisse aisément manipuler la répartition des professeurs entre les écoles. En effet, il peut choisir directement l’affectation de chaque professeur à un établissement, sans que ce dernier puisse réellement refuser puisqu’il n’existe guère d’alternative à l’éducation nationale pour quelqu’un cherchant un poste d’enseignant. Cependant, ce pouvoir ne s’exerce pas sans limite. Les enseignants ont toujours la possibilité de quitter l’enseignement pour le secteur privé. Par conséquent, nommer les professeurs les plus qualifiés dans les écoles les moins attractives est susceptible d’augmenter leur taux d’attrition.
74Par ailleurs, le fait de nommer les professeurs les moins expérimentés dans les écoles les plus défavorisées est aussi une forme de paiement différé les incitant à rester ultérieurement au sein de la profession (de même que la hausse des salaires à l’ancienneté). En effet, affecter les jeunes enseignants aux écoles les plus désirées, et les enseignants expérimentés aux écoles les plus difficiles crée un problème d’incitation. Les enseignants pourraient choisir de changer de profession après leur passage dans les écoles les plus attractives, afin d’éviter la partie de leur carrière passée dans des écoles difficiles. Le système actuel a le mérite de rendre impossible ce comportement en différant la rémunération indirecte associée à l’affectation à une « bonne école ». Dès lors, même dans un système centralisé, il peut être coûteux de ne pas satisfaire les préférences des professeurs les plus qualifiés et les plus expérimentés.
75Outre cet argument d’efficacité, on peut penser que les enseignants ont la capacité d’influencer la répartition des professeurs à travers les organisations syndicales. Celles-ci valorisent en général la rémunération, aussi bien monétairement que non monétairement, à l’ancienneté. Dès lors, changer radicalement la répartition des enseignants entre établissements semble difficile, pour des gains très limités.
76Une solution [3] serait d’attribuer des primes importantes aux enseignants expérimentés acceptant d’aller dans les écoles les plus difficiles, et d’y rester suffisamment longtemps. Une telle mesure aurait l’avantage de ne pas remettre en cause le principe de rémunération différée qui permet de limiter l’attrition des enseignants au sein du système éducatif. Le Conseil général de la Seine-Saint-Denis, département qui concentre beaucoup d’établissements défavorisés, et qui peine à retenir des enseignants expérimentés, avait envisagé de mettre en place une telle prime. Cependant, il n’existe pas, à ce jour, d’évaluations d’une telle politique. En outre, celle-ci pourrait s’avérer coûteuse dans la mesure où il serait nécessaire d’attribuer un complément de rémunération à l’ensemble des enseignants expérimentés en fonction dans les établissements ciblés, même ceux qui seraient restés dans ces établissements de toute manière, faute de pouvoir identifier les enseignants qui sont à la marge de changer d’établissement. Ce genre de mesure génère donc d’importants effets d’aubaine. Néanmoins, dans la mesure où de telles dépenses contribueraient à augmenter l’attractivité globale du métier d’enseignant, on peut également considérer qu’elles bénéficieraient à l’ensemble du système.
77En introduction, nous avions évoqué le conflit entre une vision activiste, et une autre plus sceptique, de la gestion des enseignants. Les résultats de la recherche empirique en éducation semblent donner de solides arguments à l’approche sceptique. Ainsi, si les différences d’efficacité entre enseignants sont réelles, les mesurer au niveau individuel est très difficile.
78Sans mesure précise de l’efficacité des enseignants, les rémunérer au mérite, ou encore les recruter sur la base de leurs capacités potentielles, semble impossible, et peut-être même dommageable. La théorie économique montre en effet que des dispositifs d’incitation mal conçus peuvent se révéler désastreux.
79De même, il semble qu’il n’y ait guère à attendre de la formation professionnelle des enseignants qui, la plupart du temps, n’a aucun impact mesurable. Les cours de pédagogie en formation initiale ne semblent pas non plus avoir une quelconque efficacité.
80Quant aux politiques visant à mieux répartir les enseignants au sein du système éducatif, qui sont relativement consensuelles, elles semblent difficiles et coûteuses à mettre en œuvre pour des gains très limités.
81Certaines réformes récentes apparaissent également comme malheureuses. En particulier, recruter des enseignants au niveau master plutôt qu’au niveau licence ne semble pas justifié et entraîne des coûts importants pour les aspirants professeurs, tout en réduisant de manière considérable le vivier de candidats potentiels. De même, réintroduire de nouvelles écoles de professorat (ESPE) alors que la formation à la pédagogie est inefficace semble peu judicieux.
82Cela doit-il conduire au pessimisme face à toute réforme, et à l’immobilisme ? De fait, beaucoup de mesures fréquemment proposées semblent dépourvues d’efficacité. D’autres, cependant, n’ont pas encore été suffisamment testées pour pouvoir être réellement évaluées.
83Quelques pistes paraissent prometteuses.
84Tout d’abord, l’existence de fortes différences de performance entre enseignants, différences qui semblent durables et liées à leur personnalité plutôt qu’à leurs efforts, indique que de meilleures procédures de recrutement pourraient avoir des bénéfices importants. Si les mesures de performance fondées sur les scores semblent insuffisamment précises, les combiner avec des évaluations qualitatives, notamment l’évaluation par les pairs et les chefs d’établissement, pourrait se révéler informatif. Il serait donc intéressant d’essayer de manière expérimentale un système de titularisation, où les enseignants ne pourraient être confirmés qu’après deux ou trois années d’enseignement, et où une fraction d’entre eux pourrait se voir remercier à l’issue de cette période d’évaluation. Similairement, donner plus d’autonomie au chef d’établissement en matière de ressources humaines pourrait s’avérer fructueux, et mériterait d’être expérimenté.
85La recherche en économie de l’éducation entraîne la fermeture de certaines portes – en particulier l’espoir un peu naïf de mettre en place des procédures mécaniques d’évaluation et de recrutement fondées sur des scores – mais indique aussi des pistes qui mériteraient d’être explorées. Au scepticisme et à l’activisme, il faudrait sans doute préférer l’expérimentation raisonnée.
Références
- D. Aaronson, L. Barrow et W. Sander [2007] : Teachers and Student Achievement in the Chicago Public High Schools, Journal of Labor Economics, 25(11), pp. 95-135.
- J. Angrist et V. Lavy [2001] : Does Teacher Training Affect Pupil Learning ? Evidence from Matched Comparisons in Jerusalem Public Schools, Journal of Labor Economics, 19(2), pp. 343-369.
- G. Baker, R. Gibbons et K. Murphy [1994] : Subjective Performance Measures in Optimal Incentive Contracts, Quarterly Journal of Economics, 109(4), pp. 1125-1156.
- P. Bressoux, F. Kramarz et C. Prost [2009] : Teachers’ Training, Class Size, and Students’ Outcomes : Learning from Administrative Forecasting Mistakes, Economic Journal, 119, pp. 540-561.
- E. Bruegmann et K. Jackson [2009] : Teaching Students and Teaching Each Other : The Importance of Peer Learning for Teachers, American Economic Journal : Applied Economics, 1(4), pp. 85-108.
- S. Carrell et J. West [2010] : Does Professor Quality Matter ? Evidence from Random Assignment of Students to Professors, Journal of Political Economy, 118(3), pp. 409-432.
- R. Chetty, J. Friedman et J. Rockoff [2011] : The Long-Term Impacts of Teachers : Teacher Value-Added and Student Outcomes in Adulthood, NBER working paper, 17699.
- D. Clark [2009] : The Performance and Competitive Effects of School Autonomy, Journal of Political Economy, 117(4), pp. 745-783.
- C. Clotfelter, H. Ladd et J.Vigdor [2006] : Teacher-Student Matching and the Assessment of Teacher Effectiveness, Journal of Human Resources, 41(4), pp. 778-820.
- C. Clotfelter, H. Ladd et J. Vigdor [2010] : Teacher Credentials and Student Achievement in High School. A Cross-Subject Analysis with Student Fixed Effects, Journal of Human Resources, 45(3), pp. 655-681.
- Cour des comptes [2013] : Rapport public thématique : gérer les enseignants autrement, Paris, mai, 211 p.
- E. Duflo, R. Hanna et S. Ryan [2012] : Incentives Work : Getting Teachers to Come to School, American Economic Review, 102(4), pp. 1241-1278.
- R. Fryer [2013] : Teacher Incentives and Student Achievement : Evidence from New York City Public Schools, Journal of Labor Economics, 31(2), pp. 373-427.
- M. Garet, S. Cronen, M. Eaton, A. Kurki, M. Ludwig, W. Jones, K. Uekawa, A. Falk, H. Bloom, F. Doolittle, P. Zhu, et L. Sztejnberg [2008] : The Impact of Two Professional Development Interventions on Early Reading Instruction and Achievement, U.S. Department of Education, NCEE, Washington, DC. 2008–4031.
- M. Garet, A. Wayne, F. Stancavage, J. Taylor, K. Walters, M. Song, S. Brown, S. Hurlburt, P. Zhu, S. Sepanik et F. Doolittle [2010] : Middle School Mathematics Professional Development Impact Study : Findings after the First Year of Implementation. National Center for Education Evaluation and Regional Assistance, Institute of Education Sciences, U.S. Department of Education, NCEE, Washington DC. 2010–4009.
- P. Glewwe, I. Nauman et M. Kremer [2010] : Teacher Incentives, American Economic Journal : Applied Economics, 2(3), pp. 205-27.
- D. Goldhaber et E. Anthony [2007] : Can Teacher Quality be Effectively Assessed ? National Board Certification as a Signal of Effective Teaching, Review of Economics and Statistics, 89(1), pp. 134-150.
- S. Goodman et L. Turner [2013] : The Design of Teacher Incentive Pay and Educational Outcomes : Evidence from the New York City Bonus Program, Journal of Labor Economics, 31(2), pp. 409-420.
- D. Harris et T. Sass [2011] : Teacher Training, Teacher Quality and Student Achievement, Journal of Public Economics, 95(8), pp. 798-812.
- K. Jackson [2012] : Teacher Quality at the High-School Level : The Importance of Accounting for Tracks, Journal of Labor Economics, à paraître.
- K. Jackson [2013] : Match Quality, Worker Productivity, and Worker Mobility : Direct Evidence from Teachers, The Review of Economics and Statistics, à paraître.
- K. Jackson [2013] : Non-Cognitive Ability, Test Scores, and Teacher Quality : Evidence from 9th Grade Teachers in North Carolina, NBER working paper, 18624.
- B. Jacob et S. Levitt [2003] : Rotten Apples : An Investigation of The Prevalence and Predictors of Teacher Cheating, The Quarterly Journal of Economics, 118(3), pp. 843-877.
- B. Jacob et L. Lefgren [2004] : The Impact of Teacher Training on Student Achievement : Quasi-Experimental Evidence from School Reform Efforts in Chicago, Journal of Human Resources, 39(1), pp. 50-79.
- B. Jacob et L. Lefgren [2008] : Can Principals Identify Effective Teachers ? Evidence on Subjective Performance Evaluation in Education, Journal of Labor Economics, 26(1), pp. 101-136.
- B. Jacob, L. Lefgren et D. Sims [2010] : The Persistence of Teacher-Induced Learning Gains, Journal of Human Resources, 45(4), pp. 915-943.
- T. Kane, J. Rockoff et D. Staiger [2006] : What Does Certification Tell Us About Teacher Effectiveness ? Evidence from New York City, Economics of Education Review, 27(6), pp. 615-631.
- T. Kane et D. Staiger [2008] : Estimating Teacher Impacts on Student Achievement : An Experimental Evaluation, NBER wor- king paper, 14607.
- V. Lavy [2002] : Evaluating the Effect of Teachers’ Group Performance Incentives on Pupil Achievement, Journal of Political Economy, 110(6), pp. 1286-1317.
- V. Lavy [2009] : Performance Pay and Teachers’ Effort, Productivity, and Grading Ethics, American Economic Review, 99(5), pp. 1979-2011.
- E. Lazear et S. Rosen [1981] : Rank-Order Tournaments as Optimum Labor Contracts, Journal of Political Economy, 89(5), pp. 841-864.
- K. Muralidharan et V. Sundararaman [2011] : Teacher Performance Pay : Experimental Evidence from India, Journal of Political Economy, 119(1), pp. 39-77.
- S. Rivkin, E. Hanushek et J. Kain [2005] : Teachers, Schools and Academic Achievement, Econometrica, 73(2), pp. 418-458.
- J. Rockoff [2004] : The Impact of Individual Teachers on Student Achievement : Evidence from Panel Data, American Economic Review, Papers and Proceedings, 94(2), pp. 247-252.
- J. Rockoff et D. Staiger [2010] : Searching for Effective Teachers with Imperfect Information, Journal of Economic Perspectives, 24(3), pp. 97-118.
- J. Rockoff et C. Speroni [2011] : Subjective and Objective Evaluations of Teacher Effectiveness : Evidence from New York City, Labour Economics, 18(5), pp. 687-696.
- J. Rockoff, D. Staiger, T. Kane et E. Taylor [2012] : Information and Employee Evaluation : Evidence from a Randomized Intervention in Public Schools, American Economic Review, 102(7), pp. 3184-3213.
- M. Ronfeldt, S. Loeb et J. Wyckoff [2013] : How Teacher Turnover Harms Student Achievement, American Educational Research Journal, 50(1), pp. 4-36.
- J. Rothstein [2010] : Teacher Quality in Educational Production : Tracking, Decay, and Student Achievement, Quarterly Journal of Economics, 125(1), pp. 175-214.
- J. Rothstein [2010] : Teacher Quality Policy When Supply Matters, unpublished working paper.
- M. Springer, D. Ballou, L. Hamilton, V. Le, J. Lockwood, D. McCaffrey, M. Pepper et B. Stecher [2010] : Teacher Pay for Performance : Experimental Evidence from the Project on Incentives in Teaching, Conference paper, National Center on Performance Incentives.
Notes
-
[1]
L’effet d’une politique éducative est en général mesuré en écart-type. Cela permet de comparer des effets portant sur des résultats mesurés dans des échelles différentes. En substance, on observe la progression d’un élève par rapport aux autres plutôt qu’une progression en valeur absolue. En pratique, un effet supérieur à 10 % d’un écart-type est considéré comme notable.
-
[2]
Dans le cas de la France, il est fréquent que des postes ouverts au concours ne soient pas pourvus dans certaines disciplines.
-
[3]
Suggérée par un rapporteur.