1Quand estime-t-on qu’un enfant a développé une réelle capacité de penser ? Est-ce quand il peut se représenter le monde comme un ensemble d’objets stables, indépendants de lui, et leur attribuer des propriétés grâce à la maîtrise des concepts de la langue qu’il a apprise ? Est-ce quand il raisonne comme il faut, c’est-à-dire conformément aux standards de la logique ou des mathématiques ? Est-ce quand il a appris à juger de manière réfléchie ? Est-ce quand il comprend les tenants et aboutissants de ce qu’il fait et de ce qu’il dit ? Est-ce quand il est capable de réviser ses attentes, ses préférences et ses croyances pour surmonter des obstacles dans ses actions et traiter l’incertitude des situations auxquelles il se trouve confronté ? Est-ce quand il peut dépasser ses réactions affectives spontanées et faire place à des jugements de valeur en matière de formation de ses désirs et intérêts ? Est-ce quand il a acquis les méthodes de l’intelligence pour organiser ses conduites ? Mais qu’est-ce que faire preuve d’intelligence ? On connaît la réponse du grand théoricien de l’éducation que fut Dewey : « Un homme est intelligent non pas parce qu’il dispose d’une raison qui saisit des vérités premières et indémontrables au sujet de principes fixés, et qui lui permet de passer, en raisonnant de manière déductive, de ces principes aux situations particulières qu’ils gouvernent. Mais en raison de sa capacité à estimer les possibilités d’une situation et à agir conformément à cette situation » (Dewey, The Quest for Certainty, p. 170).
Le privilège de la représentation et du raisonnement discursif
2On l’aura compris, la réponse à la question dépend en partie de la conception que l’on se fait de la pensée. De nos jours, deux capacités sont particulièrement mises en valeur par les sciences cognitives : la capacité de représentation et la capacité de raisonnement. C’est ce que l’on voit par exemple dans les débats récents sur la possibilité d’attribuer une capacité de penser aux animaux. À la question de savoir si les animaux ont un esprit et peuvent penser, Proust répond par la négative au motif que ceux-ci ne peuvent ni accéder à une représentation structurée du monde en termes d’objets stables, indépendants de la position et de l’état de l’organisme à un moment donné, ni leur attribuer des propriétés (forme, couleur, texture, odeur, chaleur). L’absence de possession de concepts est ce qui empêche les animaux de « penser », c’est-à-dire d’identifier des objets, d’observer leurs propriétés pertinentes, de former des souvenirs relatifs à leur disposition et de prédire les transformations de l’environnement. « Il y a […] deux grandes dimensions de la pensée : la référence à “cet objet” (n’importe quel objet présent, identifiable comme tel) et l’attribution d’une ou plusieurs propriétés, c’est-à-dire l’application d’un concept, lesquelles déterminent conjointement un raisonnement et une action adaptée. Appliquer un concept suppose à la fois la possibilité de discriminer, parmi les objets ou propriétés perçues, ceux ou celles qui relèvent de ce concept ; et de former sur cette base les inférences permettant au sujet d’agir de manière adaptée » (Proust, 2003, pp. 31-32). Ainsi conçue, la pensée permet notamment de prévoir l’avenir et de planifier l’action. Si elle a une telle capacité c’est parce qu’elle opère par signes ou symboles (voir aussi Proust, 1997).
3À la capacité de représenter un monde objectif est étroitement associée une capacité de « former des inférences », c’est-à-dire de raisonner. On fait des inférences, qu’elles soient de nature déductive, inductive ou abductive, dans un discours ordonné. En effet, à strictement parler, raisonner c’est établir des relations d’idées ou de significations, dans un système de significations ; c’est, plus exactement encore, produire un ordre rigoureux de propositions (cf. Dewey, 1993, p. 400). Il est rare cependant que l’on s’en tienne à ce sens strict du mot. Il arrive ainsi fréquemment que, par raisonnement, on entende les opérations de différentes sortes permettant de traiter une situation, d’effectuer une tâche ou de résoudre un problème. Par exemple, si la tâche consiste à assembler les pièces d’un puzzle, on appellera raisonnement l’ensemble des opérations par lesquelles on arrive à trouver et à effectuer les emboîtements et les assemblages qui conviennent. Ces opérations, constitutives d’une activité pratique spécifique, excèdent le raisonnement proprement dit, car elles impliquent, outre des inférences dans l’ordre du discours, l’organisation et la catégorisation d’un matériau (des pièces d’un certain type), ainsi que des observations, des comparaisons, des révisions de croyances, d’attentes ou de préférences. La formation d’idées et la mise à l’épreuve d’hypothèses s’accompagnent aussi de diverses actions corporelles de tri, de manipulation, de regroupement, d’ajustement, etc. De telles opérations sont constitutives de ce qu’on appelle « enquête » dans la tradition ethnométhodologique ou pragmatiste. L’enquête est une activité pratique, socialement apprise, qui met en jeu des habitudes d’inférence, guidées par des normes, non seulement dans l’ordre du discours, mais aussi dans l’ordre des attitudes et des comportements. Elle relève d’un savoir-faire qui s’acquiert progressivement à travers l’exercice et la pratique.
4Une autre tendance, s’agissant des recherches sur le raisonnement, est de se donner des standards auxquels comparer les raisonnements effectifs des personnes. Par exemple, dans les études sur les erreurs et les biais cognitifs, on conçoit facilement l’erreur ou la défaillance comme un écart par rapport à une norme de la vérité ou de la rationalité, à une norme du raisonnement déductif correct ou à une norme du raisonnement probabiliste. Les études cherchent alors à faire apparaître, pour expliquer causalement les erreurs commises par les personnes soumises à des tests, des mécanismes mentaux inconscients, ou des pentes naturelles de l’esprit humain. L’erreur et la défaillance sont ainsi extraites de leurs sites naturels d’occurrence, et des différentes formes de normativité qui y prévalent, et sont caractérisées en référence aux standards de la logique et de la théorie des probabilités, ou à des modèles, tel celui de la décision rationnelle, élaborés par les mathématiciens. Ces standards et modèles sont présupposés figurer la solution ou le comportement correct, les erreurs ne pouvant être que dans le raisonnement et le jugement de ceux qui ne s’y conforment pas dans leur conduite. Il arrive même que les normes et standards soient crédités d’une réalité psychologique : leur connaissance intuitive est alors supposée faire partie de l’équipement inné de l’esprit humain. Ainsi serions-nous des logiciens, des mathématiciens ou des statisticiens « intuitifs ». Mais les gens ne raisonnent pas abstraitement comme des logiciens, des mathématiciens ou des statisticiens ; ils le font concrètement en situation, dans le cadre de leurs activités et selon des méthodes éprouvées ; et leur « penser » excède de loin le seul discours ordonné. C’est ce qu’essaient de faire valoir deux traditions de recherche que nous allons évoquer, l’ethnométhodologie et l’approche dite de la « cognition située ». Mais avant d’y venir, il nous faut préciser le point de vue que nous adoptons.
Acquérir les méthodes du jeu de l’enquête et du jugement
5Ce point de vue consiste à aborder la formation de la capacité de penser comme une affaire d’apprentissage de méthodes et de techniques, et plus précisément de méthodes d’enquête et de jugement, appliquées plus ou moins systématiquement dans l’organisation des activités les plus ordinaires. Cette direction de recherche a une double inspiration philosophique : Wittgenstein et le pragmatisme américain.
6 Wittgenstein nous met en garde contre notre ensorcellement possible par le mot « pensée ». D’abord, les critères d’attribution de la pensée à quelqu’un sont très divers ; il faut donc les examiner cas par cas. Ensuite, « penser » a l’air d’être un verbe d’activité – une activité exercée par un organe, l’esprit –, ce qui nous incite à recourir, pour rendre compte de cette activité, aux concepts d’acte, de processus, d’esprit et de mental, etc Mais ces concepts nous font construire des images de la pensée qui nous égarent et nous font souvent nous poser de mauvaises questions (cf. Hacker, 1990).
7 Ensuite Wittgenstein recommande de rendre compte des capacités en termes de maîtrise de techniques ou de méthodes. On acquiert la capacité de penser en apprenant les méthodes du jugement et de l’enquête (au sens général d’investigation). Dans De la certitude, Wittgenstein (qui a été, un bref moment de sa vie, instituteur) évoque à plusieurs reprises le cas d’un enfant à qui l’on apprend à juger et à enquêter. La capacité de penser s’acquiert notamment à travers l’apprentissage du « jeu de jugement » qui est le nôtre humainement et culturellement – un jeu « dont nous n’avons pas le choix » –, et celui de ses méthodes (Wittgenstein, 1965, § 131). Une de celles-ci consiste à utiliser « des jugements comme principes de l’acte de juger » (§124) : « Nous n’apprenons pas la pratique du jugement empirique en apprenant des règles ; on nous apprend des jugements ainsi que leur lien avec d’autres jugements. C’est une totalité qui nous est rendue plausible » (§140). En effet, « l’enfant apprend à croire une masse de choses. C’est-à-dire : il apprend, par exemple, à agir selon ces choses qu’il croit. L’enfant se forme peu à peu un système de ce qu’il croit – un système où nombre d’éléments également sont plus ou moins mobiles. Ce qui est fixé l’est non pour sa qualité intrinsèque de clarté ou d’évidence, mais parce que solidement maintenu par tout ce qu’il y a alentour » (§144).
8On n’apprend pas les jugements explicitement – mais on les « avale » comme conséquences de ce que l’on apprend explicitement. « On me raconte par exemple que quelqu’un a fait il y a longtemps l’escalade de cette montagne. Vais-je toujours enquêter sur le degré de confiance à accorder à celui qui me le raconte, ou pour savoir si cette montagne a existé il y a longtemps ? Un enfant apprend qu’il y a des gens dignes ou non dignes de foi longtemps après avoir appris les faits qui lui sont racontés. Mais que cette montagne existe depuis longtemps déjà, il ne l’apprend pas du tout. L’enfant, pour ainsi dire, avale cette conséquence avec ce qu’il apprend » (§143).
9La totalité des jugements appris de cette façon constitue notre image du monde. Elle devient « le substrat [allant de soi et non formulé] de tout ce que je cherche et affirme » (§162), ou « le point de départ de la croyance » (§209). Ces choses solidement fixées, au sujet desquelles nous n’avons pas de doutes, « donnent leur forme à nos façons de voir, à nos recherches » (§211) ; elles en constituent l’échafaudage.
10Quant à la méthode de l’enquête, elle est acquise à travers l’apprentissage de la bonne manière de douter et de questionner : on ne peut pas douter ni questionner n’importe comment. Par exemple, il faut apprendre à soustraire certaines catégories de faits au doute. « Pourquoi ne m’assuré-je pas que j’ai encore deux pieds lorsque je veux me lever de mon siège ? Il n’y a pas de pourquoi. Simplement, je ne le fais pas. C’est ainsi que j’agis » (§148). L’enquête n’est pas possible si l’on doute de tout ou si l’on doute n’importe comment : « Il faut que quelque part je commence à ne pas douter ; et ce n’est pas là, pour ainsi dire, une procédure trop précipitée mais excusable ; non, cela est inhérent à l’acte de juger » (§150). Apprendre à penser c’est apprendre à s’appuyer sur certaines choses en les considérant comme solidement fixées. Car telle est la méthode de l’enquête. Pour le prouver, Wittgenstein imagine un élève qui exprimerait systématiquement un doute face à tout ce que lui enseigne son maître : « Imagine que l’élève ait demandé pour de bon : « Et la table, est-elle encore là lorsque je me détourne ; y est-elle lorsque personne n’est là pour la voir ? » Attend-on du maître qu’il le tranquillise et qu’il lui dise : « Bien sûr elle y est encore » ? Peut-être le maître s’impatientera-t-il un peu, se disant toutefois que l’élève se déshabituera bientôt de telles questions » (§314).
11« C’est-à-dire : le maître aura le sentiment que ce n’est pas vraiment une question légitime. Et ce serait la même chose si l’élève mettait en doute que la nature obéisse à des lois, donc contestait la légitimité des raisonnements inductifs. – Le maître aurait le sentiment que le seul effet de ce doute, c’est de les bloquer, lui et l’élève, et que de la sorte ce dernier ne pourrait que s’arrêter et non aller plus loin dans son apprentissage. – Et il aurait raison. Ce serait comme pour quelqu’un qui cherche un objet dans une pièce : il ouvre un tiroir et ne l’y voit pas ; alors il le referme, attend, puis l’ouvre de nouveau pour voir si peut-être cet objet n’y est pas maintenant – et il continue de la sorte. C’est qu’il n’a pas encore appris à chercher. L’élève lui non plus n’a pas encore appris à poser des questions. Il n’a pas appris le jeu que nous voulons lui enseigner » (§315). « Et ce qui arrive là n’est-il pas identique à ce qui se passerait si l’élève bloquait la leçon d’histoire en doutant que la terre existe vraiment… ? » (§316). « Un doute de ce genre ne fait pas partie de ceux que nous connaissons dans notre jeu. (Mais ce n’est pas que nous ayons le choix de ce jeu) » (§317). Ceux que « nous connaissons dans notre jeu » présupposent tout un système de croyances et decertitudes.
12Apprendre à poser des questions qui traduisent un doute authentique, un doute qui a des causes extérieures et des enjeux pratiques et réels, plutôt qu’un « doute de papier » (Peirce), est à la base de l’apprentissage de l’enquête. Car questionner et enquêter sont, jusqu’à un certain point, des termes synonymes : « Nous enquêtons quand nous questionnons » (Dewey, 1993, p. 170). Et nous questionnons quand nous sommes confrontés à des situations douteuses, indéterminées, incertaines, confuses, présentant des tendances contradictoires, etc. Nous venons à bout de telles situations en les observant et en les analysant : nous émettons et testons des idées sur la nature des problèmes, examinons des alternatives d’action, révisons nos croyances, nos préférences et nos attentes, modifions les conditions existantes et voyons ce que cela donne ; nous aboutissons ainsi à une conclusion, qui est l’action à faire ou la conduite à adopter. L’enquête est sérielle et temporelle. Son but est de former un « jugement de pratique ». Elle n’a pas lieu dans l’esprit, mais dans le monde, car les opérations qui la constituent sont des transactions avec l’environnement, et elles sont distribuées sur celui-ci et sur l’agent, le sujet ou la personne.
13Les opérations de l’enquête sont certes d’ordre intellectuel, mais elles sont aussi pratiques et « profondément ancrées dans des activités organiques » (Dewey, 1993, p. 232), notamment parce qu’il faut transformer le matériau d’une situation pour venir à bout du doute et de l’incertitude. Les explorations sensorielles participent donc à l’enquête, de même que les émotions, dont le rôle est important : ce sont elles qui colorent les situations et déclenchent les révisions. L’imagination est aussi requise pour découvrir les possibilités contenues dans une situation. L’aspect intellectuel n’est pas coupé des sensations immédiates, car celles-ci traduisent une appréciation immédiate des idées que l’on a et des conclusions auxquelles on aboutit : « À différentes idées correspondent des “sentiments” différents, des aspects qualitatifs différents, exactement comme pour d’autres choses. C’est grâce à ces propriétés de nos idées que celui qui cherche sa voie dans la résolution d’un problème complexe parvient à trouver une direction. Elles l’arrêtent lorsqu’il est sur la mauvaise voie et le font avancer lorsqu’il suit la bonne. Elles sont le signe de la circulation intellectuelle […]. Chaque fois qu’une idée perd sa qualité immédiate sentie, elle cesse d’être une idée et devient, comme un symbole algébrique, un pur stimulus permettant d’exécuter une opération sans le secours de la pensée » (Dewey, 2005, pp. 151-52).
14Les artistes et les poètes pensent tout autant que les philosophes et les scientifiques. Dans tous ces cas il y a « une pensée empreinte d’émotion ainsi que des sentiments dont la substance est faite de significations et d’idées qui sont appréciées. […] La seule distinction significative concerne le genre de matériau auquel s’applique l’imagination empreinte d’émotion ». Ce qui distingue la pensée proprement intellectuelle c’est le recours à des symboles signifiants : « Penser directement en termes de couleurs, de sons ou d’images n’est pas la même opération sur un plan technique que d’exprimer sa pensée sous forme de mots » (ibid., p. 107). En effet, il y a des significations qui ne peuvent pas être exprimées par des mots. Mais il y a un critère de la qualité de la pensée dans chacun de ces cas : à savoir l’intégration de ses composantes, le fait qu’elles se renforcent mutuellement.
15Telle est, schématisée, la conception pragmatiste de l’enquête, c’est-à-dire, au fond, de la pensée. « Personnellement, je me demande s’il existe quelque chose que l’on puisse appeler pensée en tant qu’existence strictement psychique. Mais il n’est pas nécessaire d’approfondir cette question ici. Car même si une chose de ce genre existe, elle ne détermine pas la signification de “pensée” pour la logique. Ou bien le mot “pensée” n’a rien à faire en logique, ou bien il est synonyme d’“enquête”, et sa signification est déterminée par ce que nous découvrons concernant l’enquête. Le dernier membre de la disjonction semblerait raisonnable » (Dewey, 1993, p. 79).
16Lorsqu’il précise sa conception, Dewey préconise une approche adverbiale de la pensée et de l’esprit. « “Pensée”, raison, intelligence, peu importe le mot que nous choisissons, est du point de vue de l’existence un adjectif (ou encore mieux un adverbe), non un nom. C’est un arrangement d’activités, une qualité de la conduite qui anticipe les conséquences des événements existants, et qui se sert de ce qui est anticipé comme plan ou méthode pour administrer les affaires » (Dewey, 1925, pp. 158-59). La possibilité d’une telle qualité de la conduite est fondée sur une caractéristique des événements : étant non finis, incomplets, indéterminés, ils offrent la possibilité d’être contrôlés, de telle sorte que les changements ou les processus peuvent être dirigés et que des fins peuvent être satisfaites. Ce contrôle et cette direction peuvent avoir lieu au nom de conséquences sélectionnées par l’observation et l’anticipation. Ce qui importe du coup c’est la saisie des relations entre les objets ou entre les événements. Des relations et des connexions existent dans toute situation immédiate. Quand elles sont établies par une observation, par un examen réfléchi et une formulation discursive, elles deviennent des « moyens intellectuels nous permettant de nous servir des événements comme moyens concrets pour diriger le cours des choses en vue de prévoir des conclusions » (ibid.). En un sens penser c’est établir des relations définies entre des faits, entre des objets, ou entre des événements, leurs conditions et leurs conséquences.
17L’esprit lui-même n’est rien d’autre qu’un mode de conduite adopté en référence à des situations, des événements, des objets ou des personnes. « Mind est originairement un verbe. Il se réfère à toutes les transactions au moyen desquelles nous traitons consciemment et expressément les situations dans lesquelles nous sommes placés. Par malheur, une manière de penser influente a métamorphosé ces modalités actives en un substrat accomplissant les activités en question. On a traité l’esprit comme une entité indépendante, laquelle renvoie à, incline à, s’inquiète de, prend acte de et se souvient de. Cette transmutation de modes de réponse à l’environnement en une entité d’où procèdent les actions a ceci de fâcheux qu’elle coupe l’esprit de ses liens avec les objets et les événements, passés, présents et futurs, et avec l’environnement auquel les activités de réponse sont intrinsèquement connectées » (Dewey, 2005, p. 308).
18Si penser est synonyme d’enquêter, on ne peut savoir ce que c’est que penser qu’en menant une enquête sur l’enquête. Dewey souhaitait que cette enquête soit empirique. Mais il ne s’est pas réellement donné les moyens de la conduire selon son souhait : il s’est contenté d’imaginer ce que pouvait être l’enquête à partir de ses représentations de la science ou des manières de procéder du sens commun. Il a proposé une théorie de l’enquête plus qu’il n’a procédé à des observations et à des descriptions du fonctionnement de l’enquête « à l’état naturel », que ce soit dans le travail des scientifiques ou dans les activités de la vie courante des gens. Le même défaut est reproduit aujourd’hui dans nombre d’études expérimentales du raisonnement ou de la résolution de problèmes. Parmi les courants qui relèvent le défi d’une enquête empirique (non expérimentale) sur l’enquête, on peut mentionner l’ethnométhodologie et l’étude de la « cognition située ».
Essais d’ethnographie de la pensée
19 Livingston, un ethnométhodologue qui a commencé par s’intéresser au travail « vivant » des mathématiciens lorsqu’ils s’appliquent à démontrer leurs théorèmes, a récemment publié un ouvrage intitulé Ethnographies of Reason. Il s’y intéresse aux formes du raisonnement telles que pratiquées par les personnes dans leurs activités courantes. Le but n’est pas de comparer le raisonnement effectif aux standards d’un raisonnement correct, mais de saisir les procédures et les méthodes concrètes suivies par « l’homme ordinaire » pour venir à bout de ses tâches. Le lieu de déploiement de ces procédures et méthodes est la réalisation en temps réel d’une activité. C’est dans ce cadre qu’est saisi le raisonnement, terme que Livingston utilise en un sens plutôt lâche. Pour lui, le raisonnement pratique est un midenic reasoning : c’est un raisonnement situé et local ; il se déploie « au milieu des choses », en particulier au milieu d’une activité en cours à un moment donné, et dépend des méthodes de son effectuation ; c’est un raisonnement pratique puisqu’il consiste à trouver ce que l’on peut et doit faire ; enfin c’est un raisonnement lié à une présence corporelle et à un engagement physique dans l’activité. On ne peut découvrir ses propriétés qu’en examinant ce que l’on fait, et la manière dont on le fait, quand on essaie de mener à bien une tâche, de résoudre un problème ou une énigme. Le raisonnement impliqué est donc tout autre chose qu’un discours ordonné (même s’il comporte inévitablement des inférences discursives comme opérations), tout simplement parce que les agents n’ont pas besoin d’articuler discursivement ce qu’ils sont en train de faire pour le faire intelligemment, ni de « formuler » avec des mots l’ordonnancement qu’ils produisent. Le midenic reasoning est souvent un « raisonnement visuel » étayé sur la perception de possibilités dans des configurations de type « gestaltique ».
20Un des cas dont il esquisse l’ethnographie est une activité que l’on fait souvent pratiquer aux enfants : l’assemblage d’un puzzle. Une composante importante de la tâche (qui est sérielle et temporelle) consiste à découvrir la pertinence des détails de chaque pièce (notamment des échancrures et des saillies) dans ses relations à ceux des autres, de sorte à pouvoir les assembler. Il arrive d’ailleurs assez souvent que les caractéristiques précises d’une pièce ne soient perçues précisément que lorsqu’on a découvert l’endroit où elle va. Plusieurs techniques sont utilisées : commencer par trier les pièces de bordure du puzzle, en faire un premier classement grossier en fonction d’un critère, par exemple les regrouper en fonction des couleurs de ce qui est représenté (le ciel, une maison, un animal, etc.), choisir un endroit pour commencer l’assemblage, etc. En rapprochant et regroupant les pièces, on commence à découvrir leur pertinence les unes par rapport aux autres. Il arrive souvent que se constituent des trous dans l’assemblage ; ceux-ci permettent de fixer les détails des pièces à rechercher pour les combler, etc. Il arrive aussi qu’en constituant l’entourage, on commence à entrevoir la structure locale d’une autre partie du puzzle, ce qui permet de trouver et de placer d’autres pièces, etc.
21Ce qui est crucial dans l’accomplissement de ce genre de tâche c’est l’élaboration et la modification des manières de procéder dans la recherche et l’examen des pièces pour trouver leurs détails pertinents permettant de les assembler : « Travailler à assembler un puzzle c’est s’efforcer continuellement de trouver des façons de travailler sur le puzzle. Nous nous occupons de chercher et de développer des façons d’examiner les pièces du puzzle de manière à y découvrir comment celles-ci peuvent aller ensemble » (Livingston, 2008, p. 48). Le raisonnement mis en œuvre pour accomplir cette tâche est un raisonnement spécifique à ce type d’activité. L’investigation elle-même se structure et se développe à travers l’engagement dans l’exploration requise pour effectuer l’activité.
22L’accent ainsi mis sur la spécificité du raisonnement, sur son caractère situé, sur sa teneur méthodologique, sur son imbrication dans l’action et sur son articulation à la perception, à la manipulation du matériel, à l’orientation du corps et aux mouvements corporels, rend difficile de tenir un discours général sur lui. C’est d’ailleurs pourquoi Livingston se rabat sur l’idée de simplement constituer un « cabinet de raisonnements », c’est-à-dire de collectionner des observations et des descriptions de raisonnements spécifiques à différents domaines de pratiques ou à différentes activités. En constituant un tel « cabinet » on doit pouvoir « voir » en quoi consiste exactement une enquête en observant son « comment ».
23C’est à un constat du même genre qu’aboutissent ceux qui s’intéressent à la « cognition située ». Tout raisonnement est lié à une situation concrète et est déterminé par les spécificités de l’activité en cours dans cette situation. En un sens il est « idiosyncrasique ». C’est en interagissant activement avec leur environnement que les gens identifient et traitent leurs situations. Ils organisent et agencent l’environnement de telle sorte que cette organisation et cet agencement informent l’activité cognitive en l’allégeant ou la simplifiant. Ils pensent aussi avec les artefacts, les ressources et les outils qui sont à leur disposition (cf. Kirsh, 2009).
24Une source importante d’inspiration de cette approche est la théorie des affordances de Gibson : il s’agit de propriétés des objets et de traits de l’environnement qu’un agent, doté de certaines capacités, et familier avec les invariants et régularités de l’environnement, perçoit ; ces propriétés et ces traits sollicitent des gestes et des actions appropriés, sans réflexion, dans le cadre d’activités déterminées.
25En un sens, l’argument reste cependant en deçà de l’intuition du pragmatisme et de l’ethnométhodologie selon laquelle l’environnement co-opère, c’est-à-dire effectue une partie des opérations nécessaires au traitement de la situation conjointement avec les sujets. Tandis que Dewey insiste sur les changements provoqués dans le traitement d’une situation par les interactions de « conditions », l’ethnométhodologie situe les opérations de l’environnement dans l’auto-organisation des social settings. Un social setting est un cadre ou un environnement organisé d’activité, comportant des idées et des règles, des procédures et des méthodes, une distribution de l’activité et des guides pour regarder-voir-et-dire. Dans Studies in Ethnomethodology, Garfinkel considérait la connaissance de ces environnements organisés des actions concertées comme le noyau de la « connaissance de sens commun des structures sociales ». Dans les recommandations de recherche qu’il formulait à la fin du premier chapitre de l’ouvrage, il demandait d’envisager tout social setting comme s’auto-organisant de telle sorte qu’il puisse être connu de l’intérieur, ou qu’une organisation puisse être saisie dans le flux de tout ce qui s’y passe : « Tout contexte organise ses activités aux fins de rendre ses propriétés – en tant qu’environnement organisé d’activités pratiques – décelables, racontables, enregistrables, rapportables, démontrables, analysables – bref observables-et-descriptibles (accountable) » (Garfinkel, 2007, p. 95, trad. mod.). Pour prendre un exemple de deux ethnométhodologues britanniques, les sociologues de l’éducation qui s’intéressent à ce qui se passe dans une salle de classe n’ont pas à découvrir que les événements qui y ont lieu sont des événements-dans-une-classe, ni que les catégories appropriées pour en rendre compte sont celles de cours, de maître, d’élève, de salle de classe avec sa disposition et son équipement spécifiques, et d’autres du même ordre. Le social setting qu’est le cours en salle de classe présente une organisation, et pourvoit d’emblée à sa propre accountability : en particulier, ces sociologues « ne tirent pas les catégories “classe”, “enseignant”, “élève” d’un ensemble d’observations, mais organisent leurs observations et descriptions sur la base de ces catégories qui sont en place dès le début. Elles sont en place dès le début parce qu’elles sont institutionnalisées dans le contexte social qui est décrit, parce qu’il s’agit de manières socialement entérinées de décrire les événements qui s’y produisent » (Sharrock & Button, 1991, p. 158). Une salle de classe peut être utilisée, à la suite d’un cours, pour une AG d’étudiants en grève. Le social setting n’est plus alors le même, mais il n’est pas moins « socialement organisé » que le précédent.
26Une critique que l’on peut adresser au travail de Livingston – du moins à la partie où il prend des activités ludiques comme exemples – est que l’objectif de la tâche est d’emblée relativement défini. Ce qui n’est pas le cas dans les activités de la vie courante, où la définition des problèmes rencontrés n’est pas donnée d’emblée : il faut « instituer le problème » (Dewey), c’est-à-dire trouver quel il est par des allers-retours entre des conjectures, des observations, des inférences, des formations d’idées, des actions concrètes mettant ces idées à l’épreuve, l’observation de leurs résultats, la révision des croyances et des attentes, et la formulation de nouvelles idées. D’où l’importance de la manière dont les problèmes sont institués, et du registre où ils le sont : sont décisives non seulement la compréhension immédiate de la situation, qui provient le plus souvent de conjectures sur ce qui se passe, de préconceptions sur ce qui est pertinent ou sur ce qui peut être efficace, mais aussi les habitudes d’inférence et les capacités d’action, ainsi que la familiarité avec des ressources et des outils disponibles. À noter d’ailleurs que souvent l’identification ou la compréhension exacte d’une situation ou d’un problème n’émerge qu’avec la résolution elle-même.
27On peut sans doute dire que la capacité de penser se manifeste en partie dans la capacité d’« instituer » un problème et de former un « jugement de pratique » (déterminer quoi faire) dans une situation. Pour le montrer, nous allons brièvement analyser un exemple, tiré d’un corpus d’interactions réelles entre un serveur vocal et ses utilisateurs. Il n’implique donc pas des enfants, mais des adultes interagissant avec une machine dite « intelligente », plus précisément un automate dont la mission est de traiter des demandes de clients en matière de gestion de leur abonnement téléphonique. Les interactions avec un tel automate sont loin d’être fluides. Un des problèmes auxquels sont confrontés les usagers est celui des boucles de répétition de la machine, dont souvent ils ne savent pas comment sortir. L’observation du traitement de ce problème permet de repérer des différences importantes de mode de pensée et de qualité de raisonnement des usagers.
Manifestations de la pensée dans un dialogue homme-machine
28Les séquences retenues mettent en scène un système qui présente un menu d’options et des utilisateurs qui doivent en choisir une en prononçant les mots appropriés. Elles se caractérisent par le fait que la réponse de l’usager provoque une répétition exacte du menu d’options préalablement présenté par l’automate, sans addition ni soustraction. Il se peut que l’utilisateur soit ainsi confronté à des répétitions en boucle. Comment s’en sort-il ? Il apparaît qu’il y a diverses voies de sortie, inégalement « intelligentes ».
29 Avant d’exposer le schéma de ces différents traitements, empiriquement constatés, illustrons la difficulté concrète à laquelle un utilisateur fait face. Dans la transcription ci-dessous la lettre S (première colonne à gauche) désigne les interventions de l’automate, la lettre C les interventions de l’utilisateur.
Figure 1. Transcription d’exemple de répétition du système en réponse à la demande de l’utilisateur
Figure 1. Transcription d’exemple de répétition du système en réponse à la demande de l’utilisateur
30 Nous allons appeler <i1> l’instruction du système et <a1> l’action que l’utilisateur accomplit en réponse. Dans le dialogue ci-dessus, le système présente un menu d’options (<i1>), l’utilisateur produit une réponse (<a1>), le système répète le menu (<i1>). Toutes les séquences du corpus obéissent à cette forme initiale. Les différences émergent dans la suite, dans la manière de faire face à cet obstacle.
31 Dans le langage de la psychologie cognitive, surmonter cet obstacle équivaut à satisfaire les exigences de « l’environnement de la tâche ». Une de ces exigences est que l’utilisateur produise un signal acoustiquement traitable, que le module de reconnaissance vocale pourra « interpréter » comme un ensemble de mots déterminés. Si ses mots sont reconnaissables au niveau du signal, l’utilisateur devra alors prononcer des termes que le module de gestion du dialogue pourra associer à l’option du menu que l’utilisateur souhaite. Nous laissons de côté les problèmes liés à la reconnaissabilité du signal acoustique, les séquences du corpus portant toutes sur des difficultés concernant le choix lexical. Dans les dialogues retenus, les exigences de la tâche sont satisfaites si l’utilisateur réussit simplement à prononcer les mots qui redirigeront le système vers l’option visée. L’application est ainsi programmée que chaque état du dialogue fait intervenir ce que les concepteurs appellent une « grammaire », c’est-à-dire une liste de mots dont la reconnaissance rend vraies les conditions qui déclenchent une réponse déterminée. La difficulté de la tâche réside dans le fait que le langage naturel admet plusieurs manières de faire référence à une option figurant dans un menu, alors que le serveur vocal ne peut traiter qu’un sous-ensemble d’entre elles. Les exigences de « l’environnement de la tâche » consistent donc non seulement à produire un énoncé qui indique l’option choisie, mais aussi à le faire dans les limites du sous-ensemble de possibilités admissibles par le système.
32Ainsi décrite, la tâche peut sembler triviale, mais souvent elle ne l’est pas à cause d’ambiguïtés que le concepteur n’a pas pu prévoir. Par exemple, l’utilisateur prononce une phrase que tout locuteur compétent pourra aisément comprendre dans le contexte, mais elle s’avère excéder la capacité de traitement de l’automate. Ainsi, dans la transcription précédente, on peut voir que l’utilisateur dit « transfert » pour sélectionner l’option « vous pouvez demander à transférer vos appels ». Or, pour la grammaire active du système, à ce point du dialogue, le mot « transfert », bien que reconnaissable, reste en deçà du seuil de fiabilité qui lui permettrait de l’associer à l’une des options listées. Pour le dire de manière anthropomorphique, le système entend bien le mot « transfert » mais ne comprend pas son sens dans le contexte ; d’où sa réponse : répéter le menu verbatim. La difficulté de l’utilisateur à saisir la signification de cette répétition est d’ailleurs aggravée par le fait que le mot « transfert » fait partie du discours du système. Les usagers tendent en effet à prendre comme allant de soi que l’automate est capable de comprendre tout ce qu’il est capable de dire.
33Comment les usagers font-ils face à ce genre de répétition ? Voici une représentation schématisée des parcours qu’ils suivent lorsqu’ils se trouvent pris dans une séquence de type <i1> <a1> <i1>. Les cases en bleu désignent les interventions du système ; les cases en rouge celles de l’utilisateur. Dans ce schéma le système n’est capable que de deux actions : donner l’instruction numéro un, <i1>, ou bien donner l’instruction numéro deux, <i2>. La récurrence de <i1< signifie que l’utilisateur n’avance pas dans la procédure ; l’occurrence de <i> indique que la difficulté a été surmontée.
34L’utilisateur, lui, est capable de trois actions : <a1>, <a2> et <R>, <R>, désignant l’action de raccrocher. S’il produit <a1> deux fois de suite, nous allons dire qu’il répète ; si, au lieu de répéter, il produit <a2> nous allons dire qu’il reformule. Pour l’utilisateur il y a donc deux issues possibles : susciter l’instruction suivante, <i2>, ou bien abandonner le dialogue, <R>. Dans le premier cas, il y a « réussite », dans le second, « échec ». S’il n’y a que ces deux issues possibles, il y a pourtant quatre parcours pouvant y conduire.
Figure 2. Graphe des parcours suivis par les utilisateurs dans le traitement des répétitions du système
Figure 2. Graphe des parcours suivis par les utilisateurs dans le traitement des répétitions du système
35Quelles sont les différences entre ces parcours ? Occupons-nous uniquement du contraste entre les deux parcours de réussite (ceux dont l’issue est ). Égaux du point de vue du résultat, ils sont inégaux du point de vue des ressources engagées pour y arriver. Le premier parcours, que nous allons qualifier d’optimal, implique un utilisateur qui reformule sa sélection aussitôt que le système répète son instruction. Le second parcours, que nous allons qualifier de sous-optimal, implique un utilisateur qui ne reformule sa sélection qu’après la deuxième répétition du système. Ce dernier parcours est [1] sous-optimal car il demande plus d’énergie et de temps que le premier : plus d’énergie car il y a une action supplémentaire, et plus de temps car s’ajoute la durée d’un autre tour de parole du système.
36Cette distinction descriptive peut être expliquée en termes d’évaluations de la situation par les usagers à chaque point du dialogue. Ces évaluations ne passent pas nécessairement par des jugements conscients ; elles s’expriment plutôt dans la manière dont l’utilisateur se rapporte à l’environnement à un moment donné, c’est-à-dire dans son comportement. Elles présentent plusieurs dimensions, correspondant à des questions que l’individu se pose sur les circonstances qui l’entourent. Deux de ces dimensions sont directement pertinentes pour notre analyse : l’évaluation de causalité et l’évaluation de coping ability. La première attribue une cause à l’événement inattendu ; la seconde estime la capacité d’intervention de l’individu dans la situation adverse ou favorable que cet événement a précipitée.
37Les bifurcations dans le graphe que nous avons présenté plus haut peuvent être interprétées comme exprimant des évaluations différentes de la situation sur ces deux dimensions. Ces évaluations se combinent pour donner lieu à des diagnostics différents de la situation, qui appellent des réponses différentes en conséquence. Voici leur contenu concret et les diagnostics que leur combinaison génère.
Table de correspondance entre évaluations de la situation et réponses de l’utilisateur
Table de correspondance entre évaluations de la situation et réponses de l’utilisateur
38Si on compare les deux parcours de réussite, l’optimal et le sous-optimal, on s’aperçoit que le premier comporte d’emblée un diagnostic de problème (une réponse inappropriée, nécessitant d’agir autrement), alors que dans le second ce diagnostic de problème vient après l’attribution d’un dysfonctionnement accidentel au système. Nous pouvons dire qu’une réévaluation a eu lieu dans le second cas. Cette différence amène à se poser les deux questions suivantes : Pourquoi certains utilisateurs diagnostiquent-ils immédiatement le caractère inapproprié de leur réponse, alors que les autres doivent passer par une réévaluation ? Comment ces réévaluations sont-elles accomplies en situation ?
39La première question peut être éclairée à partir de la distinction entre compréhension et interprétation, ou bien entre perception directe et détermination inférentielle du sens. On peut en effet dire qu’une partie des utilisateurs perçoit directement la répétition du système comme une invitation à réviser leur énoncé – ils comprennent donc la répétition comme une notification d’erreur de leur part – tandis que les autres n’y parviennent que par la médiation d’un travail tâtonnant de déchiffrement (quand ce n’est pas par des essais à l’aveugle).
40Sans doute les premiers possèdent-ils des habitudes ou des dispositions que les seconds n’ont pas. Mais à ce stade, l’explication doit faire intervenir d’autres éléments : à savoir des événements dans la situation qui déclenchent les inférences. S’il est vrai que tout acte d’inférence présuppose une règle d’inférence, que doit-il advenir dans la situation pour que la règle se présente en acte ? Plus concrètement, que doit-il se passer dans le dialogue pour que les utilisateurs infèrent qu’ils ont affaire à un problème et non pas à un simple dysfonctionnement accidentel ? Il ne suffit pas de dire qu’ils sont capables d’appliquer une règle d’inférence ; il faut aussi montrer comment cette capacité s’exerce grâce à une interaction précise entre l’utilisateur (l’organisme) et le système (l’environnement).
41 Nous allons prendre le cas d’un dialogue où l’utilisateur procède à une réévaluation de la situation, ce qui lui permet de surmonter la difficulté [2]. La séquence obéit à la forme suivante : <i1> <a1> <i1> <a1> <i1> <a2> <i2> (nous mettons en gras le moment où s’exprime la réévaluation, et en italique le dénouement de l’épisode). Avant que la réévaluation ait lieu, le système a présenté trois fois le même menu d’options et l’utilisateur a répondu deux fois de la même manière. Comment l’utilisateur en est-il venu à réévaluer la situation, passant du diagnostic de dysfonctionnement accidentel (<a1>) au diagnostic de problème (<a2>) ?
42Nous avons proposé de considérer ce délai comme la manifestation d’un travail interprétatif de déchiffrement (par opposition à une perception directe du sens). Voici une reconstruction possible de la chaîne d’inférences :
43<a1> cause <i1>
44<a1> étant responsable de <i1>, si on veut éviter la répétition de <i1> il faut s’abstenir de répéter <a1>
45Comme on se sent toujours capable d’intervenir dans le cours des événements de manière à les rendre favorables à ses projets, cette conclusion oblige à tenter quelque chose d’autre.
46 On est dès lors en pleine résolution de problème : on désire un état final, on est devant un état initial, on ne sait pas par quelles opérations produire l’état final désiré à partir de l’état initial présent. Si l’utilisateur comprend la situation en ces termes, c’est qu’il a institué un problème, pour reprendre l’expression de Dewey. Il l’a fait en inférant que <a1> est la cause de <i1>. Il révise du même coup son évaluation précédente et s’oblige à changer d’action, étant donné qu’il persiste dans le jugement qu’il est capable d’altérer la situation en sa faveur. Mais, contrairement à ce qui arrive lorsqu’il vaque de manière routinière aux affaires de tous les jours, il ne sait pasquelle est l’action qui produira le résultat que <a1> s’est révélée incapable de produire.
47Comment l’utilisateur accomplit-il une telle inférence ? C’est d’abord le développement temporel du dialogue qui lui permet de le faire à partir de la perception d’une série. On peut formaliser ce développement comme suit dans le cas retenu : sur la base de la séquence <i1> <a1> <i1> <a1> <i1>, l’utilisateur organise sa perception de l’environnement de la manière suivante, à partir de la ligne 23 : <i1> <a1> <i1> ; <a1> <i1>. En appliquant la règle selon laquelle, si la série <x> <y> est perçue un certain nombre de fois (deux dans le cas présent), on est en droit d’en conclure que <x> est la cause de <y>, il infère <a1> => <i1> à partir de la perception de <a1> <i1> ; <a1> <i1>. La conclusion de cette inférence défait l’évaluation de causalité précédente, selon laquelle l’utilisateur n’était pas responsable de la répétition.
48 La transcription met en évidence une autre dynamique qui coïncide avec le développement temporel du dialogue, et qui peut aussi jouer un rôle dans la restructuration du champ perceptif faisant passer de <i1> <a1> <i1> <a1> <i1> à <i1> <a1> <i1> ; <a1> <i1>. Cette autre dynamique est une dynamique émotionnelle. Le constat de cette dynamique s’appuie sur des variables acoustiques physiques (dB, Hz, seconde) tout autant que sur des jugements perceptifs. Dans la transaction présentée, un épisode émotionnel est non seulement perceptible sur l’enregistrement audio, mais aussi analysable dans son évolution par le biais des variables acoustiques. Cette analyse suggère un lien entre dynamique émotionnelle et dynamique cognitive. En effet, la réévaluation a tendance à se produire suite à un épisode d’intensification émotionnelle. Des émotions se laissent percevoir (et mesurer approximativement) dans la manière de prononcer successivement le même énoncé, notamment lorsque l’utilisateur révise son évaluation de causalité suite au développement de la série <i1> <a1> <i1> <a1> <i1>.
49 Ces épisodes peuvent aller toujours crescendo, ou bien d’abord longuement crescendo, puis brièvement diminuendo, avant de donner lieu à des réévaluations. Ces régularités semblent concerner non seulement les évaluations de causalité, mais aussi celles de la capacité d’intervention. En effet, lorsque les appelants abandonnent le dialogue c’est généralement suite à des intensifications émotionnelles perceptibles et plus ou moins mesurables, mais pas majoritairement au point culminant d’un crescendo colérique, comme on l’imagine d’ordinaire.
50 Dans notre exemple, les graphiques de gauche font voir que l’épisode émotionnel qui précède la réévaluation prend la forme d’un crescendo constant. Quant aux graphiques de droite, ils montrent que la mesure du ton d’attaque, mesuré en Hz, de l’énoncé interrompu en ligne 16 est cohérente avec la dynamique d’intensification dont témoignent les variations entre les énoncés complets. L’interaction entre dynamique émotionnelle et dynamique cognitive représente l’une des questions ouvertes de cette recherche en cours : les coïncidences observées sont-elles l’indice d’un lien systématique, et si oui, quelle est la nature de ce lien ?
51 En ce qui concerne la question de la qualité des raisonnements, l’analyse des différences entre les parcours de réussite nous laisse avec un résultat paradoxal : dans la stratégie optimale, le problème est résolu sans qu’intervienne d’enquête pour instituer le problème ; celui-ci est, en un sens, communiqué par le système à travers une répétition que l’utilisateur perçoit directement comme une notification d’erreur de sa part. La stratégie sous-optimale, en revanche, requiert plus de temps et d’énergie, mais précisément le temps et l’énergie nécessaires pour que l’environnement atteigne le point de développement requis pour rendre perceptible une série et susciter une inférence quant au lien causal entre la répétition du système et l’action de l’utilisateur. Ce qui rappelle que l’absence d’une habitude peut rendre une tâche apparemment triviale bien plus difficile que prévu.
Annexe1
Conventions de transcription
Conventions de transcription
Annexe 2
52La transcription ci-dessous comporte quatre colonnes : les chiffres figurant dans la première numérotent les tours ; la deuxième colonne identifie les locuteurs (S pour système, C pour utilisateur) ; dans la troisième sont transcrits leurs actes de discours ; dans la dernière apparaît un label qui code ces actes selon la grille du graphe, c’est-à-dire <i1> et <i2> pour les actes du système, et <a1>, <a2> et <R> pour les actes de l’utilisateur. La transcription est enrichie par des graphiques qui mesurent des variables acoustiques pour chaque effectuation du même énoncé, en l’occurrence l’intensité, le ton et la durée des versions successives de l’énoncé « transfert d’appel ». Dans les graphiques de gauche, la ligne bleue désigne l’intensité moyenne, mesurée en dB, la ligne rouge le ton moyen, mesuré en Hz, la ligne verte la durée de l’énoncé, mesurée en secondes ("). Les graphiques de droite mesurent le ton de l’attaque, mesuré en Hz ; ils sont destinés à rendre comparables les effectuations interrompues d’un énoncé (par ex. « tran- » en ligne 16) avec les effectuations complètes
Figure 3. Transcription de dialogue problématique et schéma des variations acoustiques dans la vocalisation du même énoncé par l’utilisateur
Figure 3. Transcription de dialogue problématique et schéma des variations acoustiques dans la vocalisation du même énoncé par l’utilisateur
Bibliographie
Bibliographie
- Dewey J. (1925). Experience and Nature. New York: Dover Publications.
- Dewey J. (1993). Logique. La théorie de l’enquête. Paris : PUF.
- Dewey J. (2005). L’art comme expérience. Tours : Farrago.
- Garfinkel H. (2007). Recherches en ethnométhodologie. Paris : PUF.
- Hacker P. M. S. (1990). Wittgenstein. Meaning and Mind. Londres: Basil Blackwell.
- Kirsh D. (2009). Problem solving and situated cognition. In Robbins P. & Aydede M. (Eds.), The Cambridge Handbook of Situated Cognition (pp. 264-306). Cambridge: Cambridge University Press.
- Livingston E. (2008). Ethnographies of Reason. Aldershot: Ashgate.
- Proust J. (1997). Comment l’esprit vient aux bêtes. Paris : Gallimard.
- Proust J. (2003). Les animaux pensent-ils ? Paris : Bayard.
- Sharrock W. & Button G. (1991). The social actor: action in real time. In Button G. (Ed.), Ethnomethodology and the Human Sciences (pp. 137-175). Cambridge: Cambridge University Press.
- Wittgenstein L. (1965). De la certitude. Paris : Gallimard.
Mots-clés éditeurs : enquête, résolution de problèmes, ethnométhodologie, cognition située
Date de mise en ligne : 01/11/2017.
https://doi.org/10.3917/enf1.111.0117