Introduction
1Une grande part de nos comportements est dépendante de notre capacité à apprendre des séquences comportementales si automatisées que nous pouvons les réaliser sans effort conscient. Ce type d’apprentissage est crucial pour maximiser les performances et habiletés sensorimotrices, cognitives [1], mais également émotionnelles [2]. En d’autres termes, nous dépendons de cette capacité à nous libérer de la pensée consciente pour réagir de manière adaptée aux changements environnementaux. Un certain nombre d’éléments suggèrent que les noyaux gris centraux et le cervelet jouent un rôle central dans ce type de comportement, que nous nommerons ici habitude.
2L’apprentissage des habitudes est donc extrêmement adaptatif, permettant de reléguer les ressources ainsi libérées à des tâches nécessitant un contrôle cognitif élevé. Cependant, à l’autre extrémité du continuum, les comportements répétitifs peuvent aussi apparaître comme des symptômes cardinaux dans un large éventail de maladies neurologiques et neuropsychiatriques. À ce jour, la maladie de Parkinson, le syndrome Gilles de la Tourette ou encore les troubles obsessionnels compulsifs sont considérés comme des pathologies affectant typiquement ce type de processus. De même, un facteur de complication dans le traitement de la toxicomanie, est que de nombreux aspects des comportements de recherche de substance deviennent automatisés [1, 3].
3Comprendre les mécanismes psychologiques et les bases neurales sous-tendant les habitudes est donc très important, non seulement d’un point de vue théorique, mais aussi parce que de nombreux problèmes de société sont influencés par des comportements automatiques mal adaptés. Un modèle précis de la façon dont se développent les habitudes pourrait conduire à de nouveaux traitements comportementaux, pharmacologiques et chirurgicaux dont pourraient bénéficier de nombreuses personnes.
4Cependant, de nombreuses questions restent en suspens : quels sont les processus psychologiques et neuronaux sous-tendant cette capacité à transformer des comportements dirigés vers un but en habitudes ? Que se passe-t-il d’un point de vue moteur, cognitif et émotionnel lorsque ces processus dysfonctionnent chez l’homme ? Comment pouvons-nous rompre ces habitudes une fois formées ? Pouvons-nous utiliser ces processus à des fins psychothérapeutiques ?
5Pour tenter de répondre à ces questions, nous pensons qu’il est d’abord crucial d’adopter un consensus terminologique. Or, il existe une confusion conceptuelle, en grande partie due aux travaux menés en parallèle sur ce thème dans les champs de la recherche animale et de la recherche chez l’homme en sciences cognitives, entre les années 1960 et le début des années 1990 [4]. À certains égards, cette confusion (ou manque de consensus) persiste encore aujourd’hui. Comprendre l’évolution du concept permet d’en connaître l’origine, d’en recenser et définir les différents termes connexes ou synonymes, et in fine de proposer une définition opérationnelle et consensuelle des habitudes.
6Cet article se propose de réaliser une brève synthèse de l’évolution historique du concept de l’habitude dans le domaine des sciences humaines, de la psychologie et de la neuropsychologie cognitive. Il est divisé en six parties. Nous exposerons tout d’abord les premières occurrences du terme, à la fin du xixe siècle, dans le champ des sciences humaines (partie 1). Deuxièmement, nous nous attacherons à présenter le concept de l’habitude dans le contexte behaviouriste au sein duquel cette notion prend sa source en psychologie (partie 2). Nous verrons, dans la troisième partie de cet article, que la psychologie cognitive a abandonné ce concept pour en développer d’autres connexes (partie 3), alors que la quatrième partie est consacrée aux études en neuropsychologie cognitive auprès de patients souffrant de syndromes amnésiques dont les résultats permirent d’aboutir à concevoir les habitudes comme un sous-composant de la mémoire non déclarative. Le chapitre 5 abordera la réémergence d’une synthèse des travaux menés en parallèle chez l’animal et chez l’homme, grâce notamment à l’étude des syndromes sous-corticofrontaux. Finalement, nous présenterons une sélection des éléments qui paraissent consensuels, ainsi que ceux qui font débat (ou à tout le moins posent question) dans ce domaine porteur que représente la Neuropsychologie de l’habitude.
Les premières occurrences du terme dans le champ des sciences humaines
7Aristote concevait l’habitude comme moyen de développer la vertu. Selon le philosophe grec de l’Antiquité, la question était de savoir comment faire pour que le désir puisse vouloir avec la raison ce qui est beau. L’habitude serait ainsi une manière d’exercer la part en nous qui est irrationnelle, afin de la soumettre à la partie rationnelle.
8On peut lire dans le tome 1 du Traité de la nature humaine (Hume, 1739-1740) que « l’habitude est le grand guide de la vie, c’est ce principe seul qui nous rend notre expérience profitable et nous fait attendre dans l’avenir une suite d’événements semblables à ceux que nous avons constaté dans le passé ». Il existerait ainsi, d’après David Hume, une relation étroite entre la notion de prédiction et celle d’habitude. L’habitude permettrait de prédire ce qui va se passer dans l’avenir, car la répétition génèrerait une compréhension de la causalité entre deux événements, au-delà de l’expérience sensible. Comme nous le verrons ultérieurement, ce point est particulièrement intéressant car l’activité de prédiction est étroitement liée à celle des noyaux gris centraux et des boucles qui les relient au cortex d’une part, et au cervelet, d’autre part.
9Ravaisson soutient sa thèse de doctorat Sur l’habitude en 1837, elle est publiée en 1838. Il s’agit d’une réflexion sur la question philosophique de la nature, appréhendée à partir de notre manière d’être quand nous contractons une habitude. L’habitude est alors conçue, selon le philosophe, comme une forme de « conscience obscurcie » ou de « volonté endormie », et son mécanisme, « le résidu fossilisé d’une activité spirituelle ». Ne mobilisant pas la conscience, l’habitude libèrerait l’homme pour des tâches moins matérielles. L’habitude serait une seconde nature, mais serait aussi un comportement intelligent, quoique non conscient.
10Quelques années plus tard, en 1896, Bergson, dans Matière et mémoire, en parlant des habitudes, écrivait : « C’est une mémoire profondément différente… toujours tournée vers l’action, assise dans le présent mais ne s’intéressant qu’au futur… En vérité, pour nous, elle ne représente plus notre passé, et si elle mérite encore le nom de la mémoire, ce n’est pas parce qu’elle conserve des images d’antan, mais parce qu’elle prolonge leur utilité dans le moment présent » [5].
11Dans le domaine psychologique, la première occurrence du terme nous vient de William James. Dans Les principes de psychologie[6], le terme est utilisé, mais pas explicitement défini. Par la suite, le concept d’habitudes a évolué de manière différentielle et parallèle dans les champs de la recherche animale, de la psychologie cognitive et de la neuropsychologie cognitive. Le consensus actuel sur la définition et les caractéristiques des habitudes est issu des travaux sur le conditionnement instrumental dans le domaine animal et permet, à l’heure actuelle, la réémergence du concept dans les champs de la psychologie et de la neuropsychologie qui l’avaient abandonné à la suite des critiques à l’encontre du behaviourisme.
Les habitudes en tant que sous-système composant le conditionnement instrumental dans les études animales
12Dans les années 1980, Dickinson [7] proposa de distinguer le système des « comportements dirigés vers un but » (ou action-outcome [A-O] system en anglais) du système des « habitudes » (ou stimulus-response [S-R] system), selon que l’exécution du comportement appris est sensible à la valeur de la récompense (comportement dirigé vers un but, A-O) ou pas (habitudes, S-R). Ces propositions représentent l’aboutissement théorique d’une série de travaux et de débats menés dans le contexte de l’étude du conditionnement instrumental (ou opérant).
Thorndike et l’association stimulus-réponse (S-R)
13Dans ses études classiques auprès de chats, Thorndike découvrît que l’apprentissage instrumental est un apprentissage graduel, progressif plutôt que rapide. Sur la base de cette observation, et selon une perspective évolutionniste darwiniste, Thorndike proposa sa fameuse loi de l’effet. D’après cette proposition, lorsqu’une connexion modifiable, qui s’établit entre une stimulation et une réponse, est accompagnée ou suivie d’un état agréable pour l’organisme, la force de connexion augmente ; lorsque la connexion est accompagnée ou suivie d’un état désagréable, la force de connexion diminue. Il est à noter qu’un aspect important de cette approche est que le renforçateur, bien qu’important pour établir le lien entre le stimulus et la réponse, ne serait pas en lui-même codé comme partie intégrante de la structure associative apprise par l’animal.
Tolman et l’association action-outcome (A-O)
14Tolman s’opposait aux propositions de Thorndike et soutenait quant à lui que, durant l’apprentissage instrumental, l’animal encode le renforçateur. Plus précisément, il suggéra que l’animal intègre et anticipe les conséquences de ses propres actions.
15L’étude de Colwill et Rescorla [8] est venue conforter ce point de vue. Dans cette étude, les auteurs développèrent un paradigme dit de « dévaluation de la récompense », devenu classique de nos jours. Typiquement, les paradigmes de dévaluation de la récompense présentent le schéma suivant :
- le premier jour, les souris ont la possibilité d’appuyer sur un levier qui leur permet d’obtenir une récompense (e.g. du sucrose). Les souris sont exposées à cet environnement suffisamment longtemps pour encoder l’association : action d’appuyer sur le levier → récompense. C’est la phase d’association « action-résultat » ;
- le deuxième jour, les souris sont divisées en deux groupes :
- le premier groupe expérimente la « dévaluation de la récompense », c’est-à-dire que le sucrose est associé à une injection de lithium chloride qui induit des troubles gastriques (notons que cette dévaluation peut être obtenue par d’autres moyens tels que la satiété spécifique par exemple),
- le second groupe, le groupe témoin, reçoit également la nourriture et l’injection, mais les deux produits sont donnés à des temps différents afin que les souris ne considèrent pas ces deux événements comme liés ;
- le dernier jour, les souris ont à nouveau la possibilité d’appuyer sur le levier, mais ce test est conduit en extinction, c’est-à-dire que les souris ne reçoivent pas de sucrose lorsqu’elles appuient sur le levier.
16Les résultats montrèrent que les souris pour lesquelles la récompense avait été dévaluée appuyaient sur le levier significativement moins que l’autre groupe, lors de la phase d’extinction. Dans ce contexte, les auteurs ont conclu que les souris attribuaient une valeur différente à la récompense en fonction des conditions et anticipaient de recevoir le sucrose lorsqu’elles appuyaient sur le levier. En d’autres termes, le comportement des souris fut considéré comme dirigé par des représentations des relations entre l’action et la conséquence de cette action, c’est-à-dire dirigé vers un but (A-O).
Deux systèmes de mode de contrôle de l’action
17Cependant, le comportement des souris n’était pas toujours contrôlé par ce type de comportements et les souris n’étaient pas toujours sensibles à la dévaluation de la récompense. En effet, il fut en effet ensuite découvert, par Adams et Dickinson [9], que le comportement dépendait des conditions et de l’intensité de l’entraînement préalable. Après une phase d’entraînement intensif, les souris continuaient de réaliser l’action pour laquelle elles avaient été entraînées et ce, y compris si cette action était dévaluée. Le surentraînement menait à une perte de sensibilité de la dévaluation de la récompense. L’insensibilité à la dévaluation de la récompense fut considérée comme ce qu’il eut été prédit dans le cadre de comportements de type stimulus-réponse (S-R).
18À la suite de ces démonstrations, il fut largement accepté que ces résultats montraient que les souris utilisent deux systèmes pour contrôler les actions, un système de type action-outcome (A-O) c’est-à-dire de type dirigé vers un but, et un système de type stimulus-réponse (S-R) c’est-à-dire de type habituel (encadré 1).
Encadré 1. Influence des schémas de renforcement sur la formation des habitudes
Les habitudes en tant que processus implicites et automatiques en psychologie cognitive
19Le déclin de la perspective behaviouriste en psychologie est souvent rattaché aux critiques relatives à la réduction des comportements humains complexes, comme par exemple dans le domaine de la production de la parole et du langage, à une série linéaire d’unités simples de type stimulus-réponse. Dans ce contexte, le champ de la psychologie cognitive n’utilisa pas, initialement, le terme d’habitudes. À partir de la fin des années 1960 et jusque dans les années 1980, plusieurs concepts furent développés dans ce champ, tels que les notions de « non-conscient », « implicite » et « traitement automatique ». Ces conceptualisations s’intègrent pour une large part dans les théories dualistes du fonctionnement cognitif, qui proposent l’opposition entre deux systèmes : le premier relatif à des types de processus cognitifs relativement non conscients, automatiques et le second relatif à des types de processus cognitifs conscients, contrôlés, d’évolution plus récente sur les plans phylogénétique et ontogénétique et sujet à des variabilités interindividuelles importantes [4, 10].
Apprentissage (ou mémoire) implicite
20Le terme d’« apprentissage implicite » fut inventé par Reber [11] et le concept de « mémoire implicite » fut ensuite proposé par Graf et Schacter [12] qui le définirent comme un type de mémoire « mis en jeu quand des expériences préalables modifient la performance dans une tâche mais ne requiert pas le rappel conscient de ces expériences » [13]. Dans ce type de mémoire, les connaissances ne sont pas accessibles à la conscience. L’accent fut ainsi mis sur la conscience : identifier ce qui pourrait, ou ne pourrait pas, être encodé, stocké, et/ou récupéré sans conscience. Cette mémoire implicite fut opposée à la « mémoire explicite » qui serait mise en jeu quand le rappel des connaissances est conscient et volontaire.
Notion d’automaticité
21Initialement développés par Shiffrin et Schneider [14] pour tenir compte des différentes formes de contrôle attentionnel, les concepts de traitements automatiques versus contrôlés ont été largement adoptés et utilisés dans divers champs de la psychologie cognitive, contrairement à la notion d’habitude. Les auteurs ont proposé plusieurs critères pour considérer un processus comme étant automatique :
- les processus automatiques impliquent une pratique importante, nécessitant un passage progressif du contrôle cognitif vers les processus automatiques ;
- une fois acquis, les processus automatiques ne sont pas contraints par les limites de capacité de la mémoire à court terme et ne nécessitent pas de contrôle attentionnel ;
- ils sont généralement effectués trop rapidement pour être accessibles à la conscience et sont difficiles à modifier ;
- une fois initiés, ils sont exécutés jusqu’à leur terme indépendamment des intentions des individus.
Les habitudes en tant que sous-composant de la mémoire non déclarative en neuropsychologie cognitive
22C’est Larry Squire et al. qui réhabilitèrent, dans le champ des travaux chez l’homme, le terme d’habitudes, en tant que sous-système de la mémoire non déclarative. En intégrant les résultats de la psychologie cognitive et les travaux menés auprès de patients amnésiques présentant des lésions hippocampiques, ils développèrent un modèle théorique ayant pour principale caractéristique la mise en exergue de la non-homogénéité fonctionnelle de la mémoire humaine. Ils dissocièrent notamment une mémoire déclarative d’une mémoire non déclarative. Cette théorisation connut des évolutions au fil du temps, et dans les premières formulations, la dissociation fut proposée entre mémoire déclarative et mémoire procédurale.
Développement du concept de « non déclaratif » et réintroduction du terme « habitudes » dans les modèles de la mémoire humaine
23C’est le travail séminal de Brenda Milner [15] qui permit de mettre en évidence l’existence de deux types de mémoires. Milner observa en effet que des compétences de coordination visuomanuelles (durant une tâche de dessin de miroir par exemple) pouvaient être apprises sur une période de plusieurs jours par le fameux patient amnésique H.M. (Henri Molaison) et ce, en l’absence de tout souvenir conscient d’avoir pratiqué la tâche au préalable.
Mémoire déclarative versus mémoire procédurale
24Cohen et Squire [16] empruntèrent alors aux travaux menés en intelligence artificielle [17], la distinction entre mémoire déclarative et mémoire procédurale pour rendre compte de l’observation de Milner.
25En intelligence artificielle, les connaissances déclaratives sont inscrites dans le programme (sous forme de propositions indépendantes) alors que les connaissances procédurales sont confondues avec le programme. Cohen et Squire [16] définirent le terme « d’apprentissage procédural » comme « les opérations régies par des règles ou procédures », par opposition aux connaissances déclaratives qui constitueraient les « représentations des connaissances générales (sémantiques) et spécifiques (épisodiques) facilement verbalisables et accessibles à la conscience ». Dans ce contexte, la mémoire procédurale correspondrait à la mémoire « chargée de l’encodage, du stockage et du rappel des procédures qui sous-tendent les habiletés ». Les connaissances procédurales seraient difficilement verbalisables et s’exprimeraient dans l’action finalisée.
26Anderson proposa le modèle ACT pour rendre compte de la dynamique de l’apprentissage procédural [18-21]. Ce modèle propose un apprentissage en trois phases. La première phase dite « cognitive » impliquerait la mémoire déclarative, la mémoire de travail et la verbalisation. Elle consisterait à extraire et traiter des informations déclaratives concernant la procédure à encoder via l’application de Weaks Methods, c’est-à-dire des mécanismes d’analogie de type « si… alors ». La deuxième phase dite « associative » consisterait en une combinaison des productions déclaratives en une unique macroproduction (appelée « composition »). Cette étape serait marquée par le passage d’une macroproduction déclarative à une procédure hautement spécifique de la tâche ; les connaissances déclaratives ne seraient ainsi plus maintenues en mémoire de travail mais inclues dans la procédure. Ce processus se manifesterait, d’un point de vue comportemental, par une accélération de la vitesse de résolution et une chute de la verbalisation. Finalement, la troisième phase dite « autonome » (aussi appelée phase procédurale) consisterait en un ajustement et une automatisation de la procédure marquée par une augmentation de la vitesse de traitement jusqu’à un niveau asymptotique où le sujet arrive au maximum de ses capacités (par exemple, il ne peut plus aller plus vite). Cette étape serait permise grâce à des mécanismes de généralisation, discrimination et renforcement.
Mémoire déclarative versus mémoire non déclarative
27Durant les années 1980 et au début des années 1990, il est vite devenu évident que le terme procédural était insuffisant pour caractériser l’ensemble des différents types d’apprentissages non hippocampiques, préservés dans l’amnésie. Squire et Zola-Morgan [22] créèrent ainsi le terme « non déclaratif », qu’ils définirent comme « une collection hétérogène de capacités incluant la motricité, les compétences perceptives et cognitives, ainsi que le conditionnement classique simple, les effets d’amorçage, et d’autres cas où l’expérience impacte sur les performances indépendamment du souvenir conscient de ces expériences passées ». La mémoire non déclarative incluait donc la distinction de la psychologie cognitive entre mémoire implicite et explicite, avec l’idée que la mémoire déclarative, sous-tendue par l’hippocampe, était maintenant identifiée comme une mémoire accessible à la conscience, alors que la mémoire non déclarative référait aux aspects mnésiques inconscients.
28Squire et Zola-Morgan (1988, 1991) développèrent alors leur célèbre modèle de la mémoire humaine dont la version de 1991 est présentée ci-dessous. Dans la version de 1988, Squire et Zola-Morgan n’utilisent pas le terme « habitudes ». La version de 1991 fut marquée, en revanche, par l’intégration d’un sous-type de mémoire non déclarative (ou implicite) appelé « compétences et habitudes » (skills and habits en anglais), dissocié des effets d’amorçage, du conditionnement classique simple, et du conditionnement non associatif.
29Cependant, aucune définition de ce que les auteurs entendaient par « habitudes » ne fut proposée à ce stade, et il faut attendre 2015 pour que ces auteurs [23] définissent ce concept en reprenant, de manière assez surprenante, la définition behaviouriste originale proposée par Dickinson [7].
30Ce sont les travaux sur les syndromes neuropsychologiques liés à l’atteinte des noyaux gris centraux qui permirent une nouvelle avancée majeure à partir du début des années 1990.
L’apport des études sur les syndromes sous-corticofrontaux chez l’animal et chez l’homme : réémergence d’une synthèse
La découverte du processus de chunking
31Le rôle du striatum dans les habitudes est suspecté depuis longtemps. David Ferrier concevait déjà en 1876 le striatum comme « le centre de l’intégration automatique et sub-volontaire » [24].
32Au début des années 1990, les chercheurs du MIT, à la suite de Ferrier, ont recommencé à se demander si les noyaux gris centraux ne pouvaient pas tenir un rôle dans la formation des habitudes. Ils ont remarqué que les animaux souffrant de lésions des noyaux gris centraux rencontraient subitement des problèmes face à l’exécution de certaines tâches, comme apprendre à courir dans des labyrinthes. Ils décidèrent d’expérimenter ce point en réalisant des enregistrements électrophysiologiques intracérébraux multi-unitaires dans le striatum sensorimoteur (putamen) lorsque la souris était placée dans un labyrinthe avec une récompense à la fin [25].
33Une série de patterns neuronaux et comportementaux de nature dynamique émergèrent de cette expérience. Plus la souris apprenait à parcourir le labyrinthe pour obtenir sa récompense et plus l’activité cérébrale décroissait au milieu du parcours. Sur le plan comportemental, à mesure que l’itinéraire devenait familier, les comportements d’exploration par essais et erreurs diminuaient. Au bout d’une semaine, une fois que l’itinéraire fut habituel, les pics d’activité étaient enregistrés au début et à la fin du parcours.
34Selon les auteurs, cette activité signerait la transition d’un mode de comportement exploratoire à un mode plus focalisé de comportements habituels cristallisés. Ce processus serait critique pour permettre l’émergence de comportements habituels en tant qu’entités structurées, appelées chunks par Ann Graybiel [1].
35Le processus de chunking permettrait au cerveau de convertir une séquence d’actions dirigées vers un but en habitude. En d’autres termes, il permettrait de regrouper des micro-unités en macroproductions, lorsque certains comportements se produisent de manière répétée et séquentielle dans un environnement stable et constant. L’inflexibilité, une des caractéristiques des habitudes, découlerait en partie de cette agrégation (ou chunking) des séquences d’actions au fil du temps.
36Le terme de chunking fut emprunté aux célèbres travaux de Miller [26], ce processus correspondant au recodage de sous-unités d’informations en macro-unités qui peuvent ensuite être traitées en mémoire comme des entités. Il existerait des centaines, si ce n’est des milliers de chunks comportementaux sur lesquels nous nous reposons tous les jours. Certains sont simples comme allumer la lumière, d’autres sont éminemment plus complexes, comme se rendre sur son lieu de travail en voiture.
Shift associativo-sensorimoteur durant la formation des habitudes
37Cependant, la réalité s’avéra encore plus complexe, et les travaux subséquents démontrèrent que les noyaux gris centraux étaient des structures hétérogènes sur le plan fonctionnel.
38Il fut en effet démontré que la formation des habitudes était en fait caractérisée par un shift de la boucle reliant les noyaux gris centraux au cortex associatif, à la boucle reliant les noyaux gris centraux au cortex sensorimoteur. La première boucle dite « associative » prendrait en charge les fonctions de mémoire de travail et les actions dirigées vers un but. Cette boucle relie le cortex préfrontal et les aires associatives au noyau caudé et à la partie antérieure du putamen. La seconde boucle dite « sensorimotrice » participerait à la formation des associations inflexibles de type « stimulus-réponse » qui sous-tendrait les habitudes. Cette boucle relie les cortex somatosensoriel et moteur aux parties médianes et postérieure du putamen.
39L’équipe dirigée par Graybiel démontra, dans une série de travaux remarquables, qu’à mesure que les individus répétaient une réponse de manière à former une habitude, un shift de la boucle associative vers la boucle sensorimotrice s’opérait [1, 27]. En d’autres termes, la formation des habitudes serait marquée par un transfert d’activité antéropostérieur.
40Pour résumer, les habitudes se créeraient afin de libérer des ressources qui peuvent ainsi être réallouées à des processus qui nécessitent un contrôle cognitif accru, tels que de nouveaux apprentissages par exemple. Cette formation d’habitudes aurait lieu lorsqu’un comportement séquentiel, répétitif se produit dans un contexte environnemental stable, via un processus d’agrégation de micro-unités en macroproductions autrement appelé chunking. D’après Graybiel, ces mécanismes de compression de l’information s’étendraient à une variété de répertoires comportementaux (pas seulement moteurs) mais également cognitifs [1]. Les travaux chez l’homme auprès de patients présentant un syndrome sous-corticofrontal, et notamment les patients neurostimulés, ont permis d’étendre ces propositions aux processus émotionnels [2].
L’apport des études auprès de patients présentant une atteinte des noyaux gris centraux
41Les travaux sur les effets de l’atteinte des noyaux gris centraux chez l’homme peuvent être divisés en deux phases : une première phase, assez grossière sur le plan anatomique, caractérisée par l’étude de patients présentant un syndrome sous-corticofrontal, le plus fréquemment d’étiologie neurodégénérative (e.g., la maladie de Parkinson) ou lésionnelle, et une deuxième phase, beaucoup plus focale sur le plan anatomique, dans le contexte des travaux sur les effets de la stimulation cérébrale profonde.
L’expérience de Knowlton et al. (1996)
42Dans l’expérience princeps de Knowlton et al. [28], les chercheurs étudièrent les performances de quatre groupes de participants : un groupe de patients souffrant de syndrome amnésique, deux groupes de patients parkinsoniens (l’un sévère et l’autre modéré), ainsi qu’un groupe témoin apparié, durant une tâche d’apprentissage probabiliste de prédiction de la météo.
43Les résultats mirent en évidence une double dissociation. Les patients amnésiques, incapables d’apprendre des faits nouveaux, présentaient des performances en amélioration au fil des essais, de la même manière que pour H.M. (voir infra). Les patients parkinsoniens, en l’absence d’amnésie antérograde, présentaient des courbes quasi plates d’apprentissage probabiliste.
44Ces résultats furent parmi les premiers chez l’homme à démontrer le rôle des noyaux gris centraux dans un type d’apprentissage qui ne nécessite pas le rappel antérieur des expériences d’acquisitions. Cependant, la précision anatomique de ces modèles pathologiques ne permit pas d’élaborer au-delà de cette proposition anatomofonctionnelle et il fallut attendre les travaux sur les effets de la stimulation cérébrale profonde des noyaux gris centraux, et en particulier du noyau sous-thalamique, pour que des inférences plus spécifiques soient réalisées concernant la spécialisation et l’intégration fonctionnelles de ces structures dans les fonctions cognitives et émotionnelles chez l’humain.
Les effets non moteurs de la stimulation cérébrale profonde
45Le principe de la stimulation cérébrale profonde est de moduler, par une stimulation électrique, le fonctionnement des circuits cérébraux impliqués dans les symptomatologies des pathologies ainsi traitées ; les cibles chirurgicales principales étant les noyaux gris centraux.
46Au cours de la dernière décennie, l’étude des effets non moteurs de la stimulation cérébrale profonde du noyau sous-thalamique chez les patients souffrant de la maladie de Parkinson ou de troubles obsessionnels compulsifs, associée à des enregistrements intracrâniens et à l’imagerie métabolique, a permis aux chercheurs de poser des hypothèses concernant la spécialisation et l’intégration fonctionnelles du noyau sous-thalamique de manière beaucoup plus focale et spécifique que ne l’avaient permis les travaux précédents chez l’homme.
47Sur la base de ce corpus de résultats, un modèle intégratif fut récemment proposé [2]. D’après cette proposition, le noyau sous-thalamique, qui ferait partie d’un réseau neuronal distribué sous-tendant le traitement de l’action, de la cognition et également des émotions, agirait en tant que coordinateur de patterns neuronaux, synchronisant ou désynchronisant l’activité des différentes populations neuronales impliquées dans les processus à l’œuvre. Si l’on prend l’exemple de la reconnaissance des expressions vocales émotionnelles, les noyaux gris centraux recruteraient et synchroniseraient l’activité des structures impliquées dans les différentes étapes du traitement de la prosodie émotionnelle, tout en inhibant les profils neuronaux en concurrence [2].
48Cette proposition rend compte d’un processus mécaniste mais la question de savoir quelle fonction métacognitive est sous-tendue par ce processus se pose. Or, les modèles théoriques chez l’homme, proposés par exemple par Squire et al., ne s’avérèrent pas pertinents pour rendre compte des effets comportementaux observés au décours de la stimulation cérébrale profonde chez ces patients, et ce sont les travaux chez l’animal, et notamment ceux de Ann Graybiel [1], qui permirent d’élaborer la proposition suivante. Le processus mécaniste décrit plus haut sous-tendrait l’évaluation itérative des contextes et la sélection des actions pertinentes, en vue de former (ou de contrôler l’expression) des séquences motrices, cognitives et/ou émotionnelles coordonnées. Lorsque ces séquences émotionnelles sont récurrentes ou répétitives, les noyaux gris centraux créeraient des unités de ces représentations de séquence, i.e., les chunks. En d’autres termes, les noyaux gris centraux coderaient pour la co-activation neuronale des différentes structures corticales et sous-corticales nécessaires à des processus moteurs, cognitifs et émotionnels afin de regrouper les informations manipulées en quanta gérables par un système cognitif limité en termes de ressources attentionnelles et exécutives. Ce regroupement ou agrégation d’informations correspondrait au mécanisme d’acquisition et d’expression de répertoires comportementaux qui, sans cette compression d’informations, serait biologiquement difficile à mettre en œuvre. Les noyaux gris centraux permettraient l’évaluation constante de l’environnement (externe ou interne) à la recherche de patterns récurrents, en vue, in fine, d’en anticiper et prédire ses changements, comme le suggérait déjà David Hume. Ce rôle « méta » serait le même pour l’action, la cognition et l’émotion [2, 29].
La neuropsychologie de l’habitude : consensus, débats, questions
Définition consensuelle des habitudes
49C’est la définition des habitudes d’Ann Graybiel (2008) qui semble faire consensus actuellement. D’après elle, les habitudes impliquent l’acquisition de comportements séquentiels, répétitifs, moteurs et/ou cognitifs induits par des déclencheurs externes ou internes qui, une fois mis en route, peuvent aller à leur terme sans contrôle conscient.
50D’après cette définition, plusieurs caractéristiques émergent. Tout d’abord, les habitudes (maniérismes, coutumes, rituels) sont largement apprises, acquises par l’expérience. Deuxièmement, les comportements habituels se produisent à plusieurs reprises au cours des jours ou des années, et ils peuvent devenir remarquablement fixés. Troisièmement, les habitudes entièrement acquises sont effectuées presque automatiquement, pratiquement non consciemment, permettant de focaliser l’attention ailleurs. Quatrièmement, les habitudes ont tendance à impliquer une séquence d’actions structurée et ordonnée qui peut être provoquée par un contexte ou un stimulus particulier. Et enfin, les habitudes peuvent s’exprimer dans le domaine moteur mais également cognitif (habitudes de pensée).
51Graybiel reprend ainsi plusieurs caractéristiques du travail de Dickinson concernant le mode de contrôle de l’action de type stimulus-réponse. Les habitudes sont relativement automatiques et inconscientes, peuvent être inflexibles et rigides (notamment celles bien apprises), mais Graybiel souligne également deux caractéristiques supplémentaires de l’habitude : d’abord, les habitudes sont des comportements séquentiels avec des structures complexes, allant au-delà d’une simple notion de « réponse », et deuxièmement, les habitudes peuvent s’étendre au-delà des comportements moteurs en incluant les processus cognitifs et probablement émotionnels également comme nous l’avons développé précédemment.
Questions
52La synthèse des travaux dans le domaine des sciences cognitives chez l’homme d’une part, et chez l’animal d’autre part, entraîne de nombreuses questions qui pourraient être déclinées de manière exponentielle tant ce champ théorique est nouveau et porteur. Quelques exemples de ces questions sont proposés dans les paragraphes suivants.
53Nous pourrions tout d’abord nous interroger sur les différences et les points communs entre le concept d’habitude et ceux de mémoire procédurale, processus automatiques, mémoire implicite, mémoire non déclarative ou encore les effets d’amorçage ? Certaines caractéristiques cognitives permettraient de distinguer les habitudes de ces autres formes de processus « implicites » : l’encodage ou la formation, le niveau de contrôle, la récurrence d’occurrence du comportement, et la flexibilité. Le rappel, quant à lui, en serait le point commun, en ce sens que l’ensemble de ces processus ne nécessiteraient pas le rappel conscient des expériences antérieures d’acquisition.
54Comme énoncé précédemment, Squire et al. ne définirent pas les habitudes lorsqu’ils l’ajoutèrent à leur modèle de 1991. Ce n’est qu’en 2015, que ces auteurs [23] reprirent la définition behaviouriste originale proposée par Dickinson [7] en suggérant que les habitudes correspondaient à un mode de contrôle de l’action de type stimulus-réponse. Ainsi, ils n’intégrèrent pas les amendements proposés par Graybiel. De même, Tulving quant à lui n’a, à notre connaissance, jamais abordé cette question de l’apprentissage des habitudes dans ses modélisations de la mémoire humaine. De surcroît, Squire et al. proposèrent que la mémoire non déclarative serait caractérisée par un apprentissage graduel. Or, ils incluent les effets d’amorçage comme sous-composant de ce type de mémoire. Non seulement les effets d’amorçage sont caractérisés par un apprentissage rapide, mais la présentation unique d’un stimulus peut modifier la performance ultérieure durant ces paradigmes. Pourquoi ces biais existent-ils dans les études chez l’homme ? Quelles en sont les raisons, doit-on, et si oui, comment, les dépasser ?
55Pour Wood et Runger [3], les habitudes sont stockées en mémoire procédurale alors que Graybiel [1] propose une distinction entre l’apprentissage des habitudes et celui des habiletés. D’après cette dernière, tous deux impliquent l’apprentissage de comportements séquentiels ; l’apprentissage de séquences d’actions, jusqu’au stade où elles peuvent être réalisées sans grand effort ou attention, serait un mécanisme commun aux deux. Cependant, il existerait des différences notamment relativement à la fréquence d’occurrence du comportement. Par exemple, savoir-faire du vélo serait différent d’avoir l’habitude de faire du vélo tous les soirs après le travail. L’encodage des habitudes implique-t-il la mise en œuvre de processus interprétatifs de connaissances déclaratives, comme c’est le cas pour la mémoire procédurale ? Quel est le mécanisme d’encodage des habitudes ? Est-il différent de celui des habiletés stockées en mémoire procédurale ?
56La notion de généralisation est très importante dans l’apprentissage de type stimulus-réponse, et probablement de facto dans le domaine de la formation des habitudes. Par exemple, le stimulus « tasse » va déclencher la séquence comportementale d’en boire son contenu, si c’est l’heure du café. Dans ce contexte, on peut se demander comment s’opère cette généralisation et sur quels critères cognitifs. Par exemple, quels critères perceptifs et sémantiques seront sélectionnés et amplifiés pour généraliser le percept/concept « tasse de café » ? De surcroît, quid de la généralisation si le processus de traitement des indices pertinents est biaisé, comme dans la dépression par exemple ?
57La question de la relation entre émotions et habitudes se pose également de manière cruciale d’après nous. Quel est le rôle des émotions dans la formation et l’expression des habitudes ? Sont-elles facilitatrices ou bien entravent-elles ces mécanismes ? Ont-elles des rôles différents selon la phase : formation versus expression des habitudes ? Existe-t-il des « habitudes émotionnelles » ? Si oui, quel en serait le rôle fonctionnel ? Quel impact ont-elles sur notre fonctionnement mental, nos comportements, les relations interpersonnelles ? Quels en sont les soubassements cérébraux ?
58Finalement, l’étude de patients amnésiques montre que l’apprentissage orienté vers un but n’est pas toujours nécessaire pour former de nouvelles habitudes puisqu’il est possible d’en créer, même quand les patients ne sont pas capables de raisonner de manière délibérée ou consciente sur la façon d’atteindre des buts explicites [30]. Quel est le corrélat neuro-anatomofonctionnel de ces mécanismes d’apprentissage chez les patients amnésiques ? L’apprentissage orienté vers un but est-il une condition nécessaire pour permettre la formation des habitudes ?
Conclusion
59Les recherches sur les habitudes permettent actuellement l’émergence d’un champ théorique extrêmement novateur et porteur au sein de nombreuses disciplines des sciences humaines et sociales.
60Depuis le milieu des années 1990, une vaste synthèse s’est opérée incorporant des éléments clés de la boîte à outils behaviouriste, tout en modélisant la nature intrinsèquement dirigée vers un but du comportement animal et humain. Par exemple, dans les modèles sociocognitifs de l’automaticité, le mode de réponse dirigé vers un but peut être déclenché par des stimuli environnementaux.
61L’apprentissage de l’habitude représente un champ de recherche très vaste couvrant différents domaines d’étude. Cependant, c’est un concept difficile à étudier, en partie parce que son opérationnalisation est coûteuse en termes de temps et de ressources. Théoriquement, la question de l’acquisition des habitudes n’est pas triviale, puisque plutôt caractérisée par des modifications dans des réseaux neuronaux distribués et vastes, que dans une région spécifique. En dépit de ces obstacles, les dernières années ont vu des percées spectaculaires dans notre connaissance de ce phénomène psychologique tout à fait fascinant qui régit nos conduites à notre insu. La neuropsychologie de l’habitude émerge, et avec elle, l’autre facette de la même médaille, la neuropsychologie du libre arbitre.
Liens d’intérêts
62l’auteure déclare ne pas avoir de lien d’intérêt en rapport avec cet article.
Références
- 1. Graybiel A.M.. Habits, rituals, and the evaluative brain. Annu Rev Neurosci 2008 ; 31 : 359-87.
- 2. Péron J., Frühholz S., Vérin M., et al. Subthalamic nucleus : A key structure for emotional component synchronization in humans. Neurosci Biobehav Rev 2013 ; 37 : 358-73.
- 3. Wood W., Runger D.. Psychology of Habit. Annu Rev Psychol 2016 ; 67 : 289-314.
- 4. Seger C.A., Spiering B.J.. A critical review of habit learning and the Basal Ganglia. Front Syst Neurosci 2011 ; 5 : 66.
- 5. Bergson H.. Matière et mémoire. Paris : Presses Universitaires de France, 1965 .
- 6. James W.. Principles of Psychology. New York : Henry Holt, 1890 .
- 7. Dickinson A.. Actions and habits : The development of behavioural autonomy. Phil Trans R Soc Lond B Biol Sci 1985 ; 308 : 67-78.
- 8. Colwill R.M., Rescorla R.A.. Effect of reinforcer devaluation on discriminative control of instrumental behavior. J Exp Psychol Anim Behav Process 1990 ; 16 : 40-7.
- 9. Adams C.D., Dickinson A.. Instrumental responding following reinforcer devaluation. Exp Psychol 1981 ; 33 : 109-21.
- 10. Evans J.S.. Dual-processing accounts of reasoning, judgment, and social cognition. Annu Rev Psychol 2008 ; 59 : 255-78.
- 11. Reber A.S.. Implicit learning of artificial grammars. J Mem Lang 1967 ; 6 : 855-63.
- 12. Graf P., Schacter D.L.. Implicit and explicit memory for new associations in normal and amnesic subjects. J Exp Psychol Learn Mem Cogn 1985 ; 11 : 501-18.
- 13. Schacter D.L.. Implicit memory : History and current status. Exp Psychol Learn Mem Cogn 1987 ; 13 : 501-18.
- 14. Shiffrin R.M., Schneider W.. Automatic and controlled processing revisited. Psychol Rev 1984 ; 91 : 269-76.
- 15. Milner B. Les troubles de la mémoire accompagnant des lésions hippocampiques bilatérales. In : Passouant P (ed). Physiologie de l’Hippocampe. CNRS : Paris, 1962 : 257-72..
- 16. Cohen N.J., Squire L.R.. Preserved learning and retention of pattern-analyzing skill in amnesia : dissociation of knowing how and knowing that. Science 1980 ; 210 : 207-10.
- 17. Winograd T.. Understanding natural language. Cogn Psychol 1972 ; 3 : 1-191.
- 18. Anderson J.R., Fincham J.M.. Acquisition of procedural skills from examples. J Exp Psychol Learn Mem Cogn 1994 ; 20 : 1322-40.
- 19. Beaunieux H., Desgranges B., Lalevee C., et al. Preservation of cognitive procedural memory in a case of Korsakoff's syndrome : methodological and theoretical insights. Percept Mot Skills 1998 ; 86 : 1267-8.
- 20. Beaunieux H., Hubert V., Pitel A.L., et al. Episodic memory deficits slow down the dynamics of cognitive procedural learning in normal ageing. Memory 2009 ; 17 : 197-20.
- 21. Beaunieux H., Hubert V., Witkowski T., et al. Which processes are involved in cognitive procedural learning?. Memory 2006 ; 14 : 521-39.
- 22. Squire L.R., Zola-Morgan S.. Memory : Brain systems and behavior. Trends Neurosci 1988 ; 11 : 170-5.
- 23. Squire L.R., Dede A.J.. Conscious and unconscious memory systems. Cold Spring Harb Perspect Biol 2015 ; 7 : a021667.
- 24. Ferrier D.. The Functions of the Brain. New York : Putnam's Sons, 1876 .
- 25. Barnes T.D., Kubota Y., Hu D., et al. Activity of striatal neurons reflects dynamic encoding and recoding of procedural memories. Nature 2005 ; 437 : 1158-61.
- 26. Miller G.A.. The magical number seven plus or minus two : Some limits on our capacity for processing information. Psychol Rev 1956 ; 63 : 81-97.
- 27. Yin H.H., Knowlton B.J.. The role of the basal ganglia in habit formation. Nat Rev Neurosci 2006 ; 7 : 464-76.
- 28. Knowlton B.J., Mangels J.A., Squire L.R.. A neostriatal habit learning system in humans. Science 1996 ; 273 : 1399-402.
- 29. Péron J., Renaud O., Haegelen C., et al. Vocal emotion decoding in the subthalamic nucleus : An intracranial ERP study in Parkinson's disease. Brain Lang 2017 ; 168 : 1-11.
- 30. Bayley P.J., Frascino J.C., Squire L.R.. Robust habit learning in the absence of awareness and independent of the medial temporal lobe. Nature 2005 ; 436 : 550-3.
Mots-clés éditeurs : habitudes, mémoire procédurale, noyaux gris centraux, conditionnement instrumental, mémoire implicite
Date de mise en ligne : 06/10/2019
https://doi.org/10.1684/nrp.2019.0507