Couverture de ANPSY_122

Article de revue

Segmentation et perception intuitive dans la compréhension de l’action. Quels liens possibles ? Proposition d’un niveau intermédiaire de représentation

Pages 277 à 308

Notes

  • [1]
    Certains auteurs préféreront le terme « action », faisant ici référence à la fois à l’opération de segmentation et à celle d’attribution cognitive de la part de l’observateur.
  • [2]
    Newtson présentait par exemple une femme découpant des patrons pour une robe, un homme réparant une moto, ou feuilletant nerveusement un magazine.
  • [3]
    Des résultats similaires ont été obtenus récemment avec des techniques d’analyse du flux optique (Rui, Rui, & An, 2000).
  • [4]
    Nous utiliserons le terme de « segmentation perceptive » pour souligner l’impact des indices perceptifs lors du processus de segmentation et, par contraste, celui de « segmentation conceptuelle » pour souligner l’impact des connaissances. Nous ne souhaitons pas cependant suggérer une séparation nette entre segmentation perceptive et segmentation conceptuelle, une dichotomie qui, bien qu’ayant une valeur didactique, peut apparaître légèrement artificielle tant il est clair que de nombreux processus interagissent pour aboutir à la définition de points de rupture dans une séquence.
  • [5]
    D’autres études montrent par exemple que les enfants, dont les capacités d’attribution de buts et d’intentions ne sont pas totalement développées, sont néanmoins capables de percevoir des combinaisons de mouvement biologiques, tel que « attraper un objet », comme une unité discrète (Woodward, 1988).
  • [6]
    Notons toutefois qu’un certain nombre de recherches en psychologie du développement (Baldwin & Baird, 1999), en psychologie comparative (Byrne, 2002) et en psychologie cognitive (Hard et al., 2006b) suggérèrent que des indices perceptifs serait suffisant pour percevoir l’organisation hiérarchique de l’action.
  • [7]
    Zibetti, Poitrenaud et Tijus (2001) ont montré que, simplement en inversant la taille et la forme des trois figures géométriques, tout en conservant les même déplacements, il est possible d’obtenir des descriptions verbales où les termes utilisés sont relatifs au domaine de l’amabilité (embarrasser, caresser...).
  • [8]
    Les résultats de cette étude ont cependant fait l’objet d’une rétractation de la part des auteurs en raison d’erreurs de codage des observations (Uller, 2001).
  • [9]
    Les d’expériences menées par Hard et ses collaborateurs (Hard et al., 2006b) peuvent suggérer qu’il existe bien un impact de primitives d’action à la fois sur la segmentation et la hiérarchisation de l’action. Le point critique dans ces expériences est de présenter des séquences animées dans leur sens normal puis en sens inverse pour mesurer l’effet de la direction de l’action sur la segmentation et «l’intérprétabilité». Le fait qu’il y ait très peu de différences dans les frontières d’événement choisies entre les deux conditions suggère que certaines structures d’événement restent invariantes quelque soit la direction de l’événement, et que les schémas conceptuels ne jouent pas un rôle fondamental dans la segmentation, mais au contraire pourraient être dépendant de la détection préalable de ces structures d’événement.

1. – Introduction

1 Aux yeux d’un être humain, les actes d’autrui font sens, ils sont porteurs de significations, donnent une indication sur les intentions de la personne, guident l’interaction en définissant des gestes à imiter, à approuver ou à vilipender, ils sont aussi l’occasion d’histoires à raconter. Comprendre l’origine de cette capacité de donner sens au comportement observable d’autrui est l’objectif primordial des études regroupées ici sous le terme de compréhension de l’action. Lorsque nous percevons un geste, une interaction entre deux personnes, ou tout événement physique qui puisse se produire autour de nous, ce que nous voyons n’est pas un flux ininterrompu et indistinct de mouvements disparates. Bien plutôt, nous distinguons des phases, nous échelonnons des moments selon leur importance, nous voyons certains actes s’accomplir, d’autres débuter, arriver à terme ou se répéter. Nous évaluons d’autre part les actes d’autrui selon les buts qu’ils manifestent. Certaines actions sont fortuites, d’autres sont pleinement volontaires. Ainsi attraper une tasse de café est volontaire, mais renverser son contenu ne l’est pas.

2 Ces simples faits nous indiquent que notre perception de l’action est éminemment structurée, qu’elle est composée de différentes unités qui peuvent porter des valeurs différentes du point de vue de la façon dont une action s’organise dans le temps. Ils nous indiquent également que nous faisons constamment, et de la manière la plus naturelle qui soit, une distinction entre les actions qui manifestent une intention et celles qui sont le simple reflet de contraintes physiques, comme la tendance - malheureuse - du café à rejoindre le sol.

3 La littérature consacrée à ces phénomènes de compréhension de l’action se donne pour tâche d’étudier les compétences psychologiques qui guident la compréhension des mouvements et des transformations d’objets, ainsi que celles qui conduisent l’observateur à sélectionner le niveau d’organisation temporelle le plus pertinent pour rendre compte de l’action en cours. Ces compétences psychologiques sont vraisemblablement organisées selon trois paramètres cruciaux :

4

  • Le type d’objets vers lequel se dirige le processus d’interprétation. S’agit-il d’un être motivé par des buts, des croyances, des désirs (comme par exemple un être humain), ou au contraire s’agit-il d’un objet dépourvu d’intentions, dont le comportement est essentiellement déterminé par les propriétés physiques de l’environnement dans lequel il est placé (comme par exemple la tasse de café qui se renverse) ?
  • le fait que l’action soit dirigée ou non vers un but, et par conséquent le caractère adapté ou non de l’action à ce but (ainsi le but de prendre la tasse pour boire le café détermine la trajectoire de la main) ;
  • le niveau de granularité que nous utilisons dans le découpage des événements que nous cherchons à comprendre et interpréter, c’est-à-dire le degré de détail que nous prenons en compte dans les situations dynamiques auxquelles nous faisons face. Par exemple : « Pierre a renversé le café par terre » peut également être perçu et décrit en décomposant l’action : « Pierre a frappé accidentellement la tasse, elle s’est renversée et le café est tombé par terre ».

5 L’existence de ces différentes composantes de la compréhension de l’action favorise une certaine spécialisation des recherches concernant les bases psychologiques de ce domaine de compétence. Certaines études se focalisent plutôt sur la nature animée ou inanimée des entités considérées dans des séquences dynamiques (par ex. Michotte, 1954 ; Scholl & Tremoulet, 2000), quand d’autres concentrent davantage leurs efforts sur les règles de décomposition d’une scène animée en hiérarchies d’événements (par ex. Newtson, 1973 ; Zacks, Tversky, & Iyer, 2001). Les premières vont mettre en évidence des différences systématiques dans l’interprétation des objets dont le comportement est régi par des lois physiques, par rapport aux entités dont le comportement est déterminé par des buts poursuivis. Les secondes vont chercher à déterminer l’importance respective des propriétés du stimulus et des connaissances en mémoire sur la décomposition de la séquence dynamique en segments temporels, et donc sur le niveau de granularité de l’interprétation.

6 Jusqu’à présent ces deux perspectives sur la compréhension de l’action ont été peu traitées simultanément, laissant apparaître un fossé entre deux pans de littérature qui méritent pourtant d’être reliés pour offrir une vue synthétique de la recherche concernant la compréhension de l’action, ainsi que pour dessiner de nouvelles perspectives théoriques fructueuses.

7 Dans cet article, nous proposons un schéma directeur permettant d’intégrer ces deux aspects de la compréhension de l’action. Nous présentons dans un premier temps les résultats d’un ensemble de travaux concernant la segmentation de l’action en unités de plus ou moins grande échelle temporelle qui composent une séquence d’action. Nous mettrons ensuite ces recherches en perspective avec les résultats de travaux issus du domaine de la perception intuitive d’interactions élémentaires. Notre but est de mettre en évidence, en s’appuyant sur des faits expérimentaux issus de ces deux domaines, un hypothétique niveau de représentation intermédiaire dans lequel apparaissent des primitives d’action. Ces primitives d’action pourraient jouer un rôle important dans le découpage perceptif et l’organisation conceptuelle d’une séquence d’actions. Cette proposition, cohérente avec un ensemble de résultats empiriques et trouvant sa légitimité dans une approche modulaire de l’architecture cognitive, pourrait être complémentaire des modèles utilisés classiquement dans le domaine de l’interprétation de l’action. Nous conclurons ainsi sur la possibilité de concevoir une architecture cognitive unifiant les domaines de la segmentation perceptive et l’organisation conceptuelle de schémas d’action, en proposant un certain nombre de questions expérimentales permettant de la valider.

2. – Segmentation et hiérarchisation de l’action

8 Dans la compréhension des scènes visuelles interviennent à la fois l’identification de traits statiques, comme la forme ou la taille des objets, mais également celle de traits dynamiques associés aux déplacements des objets. Confronté à la complexité et au caractère éphémère de ces déplacements, une tâche importante pour le système visuel est d’imposer une structure aux transformations perçues, de déterminer des unités capables de synthétiser certains aspects des évolutions de la scène. Cette contrainte pour le traitement des scènes dynamiques fonde le champ d’étude de la segmentation de l’action.

9 Lorsque nous évoquons une séquence d’actions, nous décomposons naturellement celle-ci en plusieurs phases qui mènent à son accomplissement : le nombre d’étapes à parcourir pour rejoindre un bar à cocktails (aller d’abord jusqu’à la place principale, puis prendre l’avenue sur la gauche, enfin monter le perron du vieux bâtiment), le nombre de gestes pour effectuer un service au tennis (lancer la balle, fléchir les genoux, déployer son bras, etc.), le nombre d’opérations à réaliser pour obtenir une sauce (faire fondre le beurre, ajouter la farine, porter à frémissement, etc.). Au-delà de cet aspect linguistique et procédural de la segmentation, des preuves s’accumulent pour reconnaître à celle-ci une véritable réalité psychologique, à la fois perceptive et cognitive. Il semble ainsi que nous décomposions spontanément et de façon automatique (voir par exemple Newtson, 1976 ; Zacks, Speer, Swallow, & Maley, 2010) une action perçue en plusieurs épisodes discrets, qui eux-mêmes vont déterminer un ensemble de processus ayant trait à l’interprétation, la prédiction, la mémorisation, et éventuellement la verbalisation de cette action (pour une revue de ces travaux, voir Kurby & Zacks, 2008). Ces épisodes discrets sont généralement appelés « événements » [1]  . Les événements sont définis comme étant des segments temporels conçus par l’observateur comme ayant un début et une fin (Newton & Engquist, 1976 ; Casati & Varzi, 1996 ; Zacks & Tversky, 2001). Dans cet article nous utiliserons plutôt le terme d’unité d’action pour décrire ces épisodes discrets, afin de marquer la relation entre la segmentation d’une scène et l’interprétation en terme de causes et de buts.

10 Il existe plusieurs raisons de supposer l’existence d’un processus perceptivo-cognitif spécifique pour segmenter une séquence d’action en unités discrètes. De la même façon que, pour la perception des objets, nous cherchons à extraire des propriétés invariantes afin d’en déterminer les contours et les identifier, la recherche de structures stables à l’intérieur de séquences dynamiques semble une condition requise pour le traitement de propriétés complexes comme le caractère intentionnel d’une action (voir Baldwin & Baird, 2001). La segmentation d’une action pourrait être également un préalable à son imitation par autrui, en définissant les unités d’action à reproduire (voir Blakemore & Decety, 2001). Enfin, la définition d’événements est importante lors de la communication entre individus, dans la mesure où deux interlocuteurs doivent partager dans une certaine mesure la même décomposition d’une action pour comprendre à quoi certains concepts réfèrent (voir Zacks & Tversky, 2001).

11 Alors qu’il existe un vaste corpus de recherche se focalisant sur les mécanismes perceptivo-cognitifs impliquées dans l’identification et la reconnaissance d’objets, on trouve comparativement encore peu d’études consacrées à l’identification et la reconnaissance d’événements. Dans les sections qui suivent nous commencerons par décrire certains résultats empiriques de ce champ d’étude, des résultats qui laissent entrevoir une activité psychologique consacrée au découpage d’événements dans l’analyse perceptive d’une scène dynamique.

2.1. – Les points de rupture de l’action

12 Le processus de segmentation de séquences d’action a d’abord été étudié dans les années 1970 par des psychologues sociaux pour comprendre l’importance du niveau de granularité d’une description dans l’interprétation du comportement d’autrui. Développée initialement par Newtson et ses collaborateurs (Newtson, 1973 ; Newtson & Engquist, 1976 ; Newtson, Engquist, & Bois, 1977), la méthode de unit marking consiste à demander à un observateur de regarder une séquence d’actions (par exemple un homme qui tend le bras, prends une tasse et bois son café) et d’indiquer en pressant un bouton chaque fois que, selon lui, un événement se termine et qu’un autre commence. L’observateur a donc pour tâche de définir ce qui lui paraît la décomposition naturelle de la séquence en choisissant les « points de rupture » qui marquent les frontières des unités d’action. Les moments d’appui et les délais entre chacun des appuis sont ainsi enregistrés pour être mis en relation avec le déroulement de la séquence. Les premiers travaux de Newtson et de ses collaborateurs ont mis en évidence le fait que, lors de la segmentation d’une séquence présentant des mouvements exécutés par des acteurs humains [2], les moments choisis comme points de rupture présentent des propriétés particulières. Ces propriétés, qui sont par exemple la contiguïté spatiale des objets, leur vitesse relative ou leur changement de position, déterminent la possibilité de restituer ultérieurement les détails de la scène. Ainsi par exemple, en supprimant certaines images des séquences, on se rend compte que la suppression d’images associées à des points de rupture est mieux détectée que la suppression d’images situées entre ces points de rupture (Newtson & Engquist, 1976) [3]. Les points de ruptures sont donc associés à des moments qui ont une valeur informative particulière en ce qui concerne la « concaténation » en mémoire des changements perçus dans la scène.

13 Dans une autre étude, Newtson, Engquist et Bois (1977), lorsqu’ils demandent aux observateurs de segmenter une séquence d’action d’un acteur humain, remarquent que, en particulier pour les segments courts produits spontanément, les points de rupture correspondent à des moments dans la scène où les gestes de l’acteur sont au maximum de leur amplitude. Par exemple, dans l’image associée à un point de rupture, la position des articulations des jambes et des bras d’un acteur change de plus de 45° par rapport à la position qu’elles occupent dans l’image qui précède immédiatement. Ce type de changement brusque dans l’amplitude des gestes semble une caractéristique associée régulièrement aux points de rupture dans une séquence. Les transitions associées aux frontières des événements définis par l’observateur présentent un plus grand nombre de changements qu’à l’intérieur même des événements, laissant supposer que ces périodes de changement brutal sont utilisées pour la segmentation spontanée de la scène.

14 Cette relation entre définition des points de rupture et changement dans les paramètres spatio-temporels de la séquence présentée a fait récemment l’objet d’une étude systématique. En particulier, un effort a été accompli pour dissocier le rôle des ruptures directement attribuables aux modifications spatio-temporelles de celles qui pourraient être liées au mouvement biologique (Zacks, Kumar, Abrams, & Mehta, 2009), en substituant aux entités humaines des figures géométriques abstraites (Hard, Tversky, & Lang, 2006b ; Zacks, 2004). Dans une expérience de 2004, Zacks a présenté les déplacements aléatoires d’un cercle et d’un carré en demandant aux participants d’appuyer sur un bouton chaque fois qu’ils estimaient qu’un segment s’était achevé et qu’un autre commençait, il a ainsi pu vérifier le degré de corrélation entre les occurrences de certains attributs de mouvement (la vitesse des objets, leur accélération, leur distance l’un par rapport à l’autre, leur vitesse relative, etc.) et l’attribution de points de rupture dans la séquence. Zacks a montré que les attributs de mouvements peuvent permettre de prédire de manière significative la position des points de rupture attribués par les observateurs, en particulier dans les conditions où l’on demandait à ceux-ci de déterminer les segments les plus fins possibles.

15 De façon similaire, Hard, Tversky et Lang (2006b) ont mis en évidence le fait que les points de ruptures qui définissent les frontières des unités d’action correspondent à des changements de propriétés du mouvement. Les auteurs ont utilisé des séquences de déplacement de figures géométriques inspirées de celles initialement créées par Heider et Simmel (1944) dans leur étude paradigmatique de l’attribution d’intentionnalité. En examinant la relation entre l’occurrence des points de rupture et celle de types particuliers de mouvement (comme par exemple l’arrêt ou le changement de direction des objets), grâce à une analyse qualitative des paramètres de mouvement dans chaque image du film, les auteurs ont pu remarquer qu’aux points de ruptures correspondent plus souvent des changements dans le mouvement des objets qu’aux points de non-rupture. Plus précisément, les types de changement dans le déplacement susceptibles de susciter l’attribution d’un point de rupture sont les modifications rapides telles que l’arrêt complet, le démarrage et le changement de direction des objets. Autant d’indices cinématiques qui correspondent à des pauses dans l’action ou à l’initiation d’une nouvelle action. Ce type de résultat est observé aussi bien lorsque la séquence est présentée dans sa version originale qu’en sens inverse, où la possibilité d’attribuer des intentions aux déplacements est perturbée.

16 En résumé, nous avons vu que lors de la tâche de segmentation d’une séquence dynamique, des points de rupture sont attribués à des moments de la séquence possédant une valeur informationnelle plus importante que d’autres moments. Cette valeur semble elle-même dépendante de la quantité et de l’amplitude des mouvements observés. À travers ces études se dessine un processus de segmentation étroitement dépendant des caractéristiques perceptives de la scène visuelle. Il est possible à cet égard que le processus de segmentation intervienne de façon précoce dans l’analyse perceptive de la scène dynamique.

17 Néanmoins les études que nous venons d’évoquer sont établies sur la base du jugement conscient de l’observateur. Faisant de ce fait appel à des mesures associées à l’intuition de la personne – une notion en elle-même extrêmement ambiguë dans la mesure où elle recouvre un ensemble de processus cognitifs difficiles à délimiter – ces études n’apportent pas de preuves directes de l’activité perceptive de segmentation et ne permettent pas de valider le caractère automatisé et précoce de ce processus. D’autres études très récentes, utilisant les possibilités de l’imagerie cérébrale, semblent cependant appuyer l’existence d’un processus de segmentation automatisé qui aurait lieu précocement au niveau perceptif [4] pendant la perception de scènes dynamiques, même en l’absence de consigne explicite de segmentation.

2.2. – Indices physiologiques du processus de segmentation

18 Un premier ensemble encore très limité et parfois contradictoire d’études examinant les mécanismes neuronaux associés à l’activité de segmentation commence à voir le jour. Des changements dans l’activité cérébrale ont ainsi pu être mis en évidence lors de la perception de moments particuliers d’une séquence dynamique. Zacks, Braver, Sheridan, Donaldson, Snyder, Ollinger, Buckner et Raichle (2001a) ont par exemple proposé à leurs participants de regarder de courtes vidéos présentant des êtres humains réalisant des tâches quotidiennes, pendant que leur activité cérébrale était enregistrée par un appareil d’imagerie par résonance magnétique fonctionnelle (IRMf). Dans une première phase, les participants regardaient un film sans consignes explicites de segmenter ce qu’ils regardent. Dans un second temps, ils avaient pour tâche de segmenter ce film en événements. Les résultats suggèrent que les bornes des événements identifiées par les participants dans la deuxième phase de l’étude se trouvent associées à des augmentations d’activité cérébrale dans des zones qui s’activent également lors de la phase dite de « visionnage passif ». Ainsi, le cortex postérieur frontal droit et tout particulièrement la zone MT+, connue pour son implication dans le traitement du mouvement (Sekuler, Watamaniuk & Blake, 2002), sont activés sélectivement lors des moments correspondant aux frontières d’événements. Cette activation de la zone MT+ en réponse à la détection de points de rupture a été observée également par Speer, Swallow et Zacks (2003), confirmant l’importance des phases de transitions brusques associées à des déplacements pour la segmentation.

19 Cette augmentation d’activité n’est pas seulement liée à la perception de mouvements biologiques. Des résultats similaires ont été obtenus dans une autre étude reprenant un paradigme similaire mais présentant cette fois des figures géométriques à la place des acteurs humains (Zacks, Swallow, Vettel, & McAvoy, 2006). Dans cette étude comme dans la précédente, l’activation de certaines zones cérébrales est corrélée à la présence de points de rupture dans la séquence présentée. En particulier MT+ répond de façon sélective lorsque les objets se déplacent plus vite.

2.3. – Apports des études sur les jeunes enfants

20 À ces indices d’une activité de segmentation automatique à partir de données sensorielles, il faudrait ajouter ceux apportés par les études sur de jeunes enfants. Celles-ci, encore rares, peuvent néanmoins servir de preuves supplémentaires de la réalité psychologique d’un processus de segmentation précoce et probablement enracinée dans des mécanismes relativement indépendants de ceux qui gèrent l’activation des connaissances acquises sur la base de l’expérience vécue. La logique est que les enfants de bas-âge ne sont pas censés disposer de schémas conceptuels pour qualifier certaines étapes d’une action en cours. Dès lors, montrer qu’ils sont néanmoins capables d’identifier des séquences d’action à l’intérieur de séquences dynamiques donne crédit à l’hypothèse d’un processus automatisé de segmentation. Karen Wynn a été la première à montrer que des enfants âgés seulement de six mois sont capables d’énumérer mentalement des séquences d’action (Wynn, 1996 ; Sharon & Wynn, 1998). Une poupée était présentée aux enfants, qui sautait deux fois ou trois fois dans une première phase d’habituation. La phase de test consistait simplement à présenter le même nombre de sauts ou un nombre différent, avec comme hypothèse celle que les enfants doivent être capables de distinguer les phases d’habituation et de test s’ils possèdent la capacité à énumérer les sauts, donc à identifier un saut comme une unité d’action. Les enfants testés manifestent en effet une attention plus importante lorsque le nombre de sauts est différent, à la fois lorsque des pauses séparent les sauts mais aussi lorsque la séquence est continue et qu’aucune pause ne vient séparer distinctement les phases de mouvement (Wynn, 1996, expérience 2).

21 Si cette première étude représentait des mouvements extrêmement simples, il a depuis été montré que les jeunes enfants peuvent également distinguer des séquences signifiantes dans le comportement complexe d’êtres humains engagés dans des tâches naturelles. Baldwin, Baird, Saylor et Clark (2001) ont ainsi présenté à des enfants de 10 mois des séquences interrompues par un écran figé. La pause de la séquence pouvait intervenir soit en plein milieu d’une action, soit au moment correspondant à la complétion d’une action. Il s’est avéré que les enfants manifestaient une attention plus marquée lorsque la pause venait rompre une action en cours, suggérant qu’ils perçoivent certaines séquences comme des unités naturelles [5] dont la rupture artificielle contredit certaines attentes concernant leur déroulement.

22 En dépit des preuves que nous venons de présenter en faveur du caractère automatisé de la segmentation pendant la perception de séquences dynamiques, il est juste d’apporter une nuance. On ne saurait dire en effet que la segmentation est un processus purement guidé par des informations perceptives. Si tel était le cas, les unités d’actions considérées dans une séquence seraient les mêmes pour tous, et l’on trouverait un accord entre les individus concernant la longueur de ces unités. Or, comme nous allons le voir dans le prochain sous-chapitre, il existe une variation interindividuelle naturelle dans l’échelle temporelle choisie pour déterminer les unités d’action.

2.4. – L’implication de schémas conceptuels dans la segmentation

23 Bien que de nombreuses études aient mis en évidence un large consensus dans le choix des points de rupture choisis par les observateurs pour découper une séquence continue, plusieurs évidences expérimentales ont montré très tôt que les observateurs peuvent adopter différents niveaux de segmentation (par ex. Newtson, 1973 ; Wilder, 1978a, 1978b ; Massad, Hubbard, & Newtson, 1979), révélant une grande variation dans la taille des intervalles séparant deux points de rupture. La méthode utilisée dans ces études consiste en effet à demander de segmenter une séquence en unités plus ou moins grandes, en produisant de ce fait des interprétations plus ou moins sémantiquement riches. Ainsi la taille de la séquence choisie pour déterminer les unités d’action semble être plutôt déterminée par la structure physique de l’événement lors d’une segmentation en séquences courtes et inversement plus fortement influencée par une représentation conceptuelle de l’action (attribution de buts et de causes) lors de la segmentation en séquences d’action de plus grande échelle temporelle (Zacks et al., 2009).

24 La variation dans la taille des intervalles dépend également des instructions données aux participants dans leur tâche de segmentation. Lorsque, par exemple, un groupe de participants reçoit pour consigne de prêter attention aux traits de personnalité manifestés par les gestes des acteurs du film, tandis qu’on demande à un autre groupe de prêter attention aux détails des tâches réalisées par ces acteurs, le type de segmentation peut varier considérablement, et les actions ainsi déterminées se révèlent qualitativement différentes (Cohen & Ebbesen, 1979). De même, la présence ou l’absence de verbalisation de la part des participants pendant la tâche de segmentation (Hard et al., 2006b), ou encore l’insistance sur le caractère aléatoire ou au contraire intentionnel des actions présentées (Zacks, 2004 ; Zacks et al., 2009) sont des facteurs pouvant influencer la taille des unités sélectionnées. La plus ou moins grande familiarité avec les événements présentés dans les expériences de segmentation est également un facteur contribuant à la variation de la taille des unités d’action. Lorsque les événements sont ambigus ou peu familiers, la segmentation devient plus fine que lorsqu’il est possible d’insérer les différentes actions dans des schémas connus (Newtson, 1973 ; Newtson et al., 1977 ; Vallacher & Wegner, 1987 ; Wilder, 1978a, 1978b ; Zacks et al. 2001, Zacks et al., 2010).

25 Ces phénomènes indiquent que la segmentation dépend non seulement de la possibilité d’identifier les points de rupture au niveau perceptif, mais aussi pour une large part de la capacité à rassembler ces points de rupture sous des formes plus larges. Le caractère modulable des unités de segmentation suggère qu’au moins deux niveaux sont impliqués dans le processus de découpage de la séquence, un niveau perceptif que nous avons déjà décrit, et un niveau conceptuel résultant de la mobilisation de connaissances préalables pour organiser les changements perçus dans l’action. À ce dernier niveau, les bornes de l’action sont essentiellement dépendantes de la possibilité d’assimiler une action perçue à un enchaînement familier. Si, par exemple, je vois une personne en face d’une pile d’assiettes prendre un torchon, je comprends alors qu’elle s’apprête à faire la vaisselle. Ma connaissance de la séquence typique « faire la vaisselle » me sert ici à identifier une action particulière comme une borne dans cette séquence, ou encore une étape vers un objectif, qui consiste ici à obtenir une pile d’assiettes de nouveau brillantes et prêtes à être réutilisées (Zacks et al., 2001b). La segmentation des séquences en événements aux contours définis dépend donc pour une large part de la possibilité d’utiliser des schémas connus qui représentent des actions familières ou des actions pouvant être définies par des buts poursuivis (voir Bartlett, 1995 ; Schank & Abelson, 1977 ; Rumelhart, 1980).

26 Si la segmentation au niveau conceptuel s’apparente en premier lieu à la mobilisation de connaissances sur le déroulement typique d’une action, possiblement à travers l’activation de schémas (Zwaan & Radvansky, 1998) et de scripts (par ex., Rumelhart, 1980 ; Abelson, 1981 ; Spector & Grafman, 1994), elle met en jeu également une activité de hiérarchisation des événements (Zacks et al., 2001b ; Zibetti, Hamilton, & Tijus, 1999 ; Hard et al., 2006b). De la même manière que les objets sont considérés comme des entités composées de certaines parties, les événements possèdent une structure partonomique, des sous-événements au grain plus fin s’assemblant pour constituer des événements plus larges (voir Zacks et Tversky, 2001 ; Zibetti, 2001 ; Kurby & Zacks 2008 pour une revue de questions). Nous avons fréquemment recours à ce type de structure pour expliquer une activité complexe, en la découpant en différentes composantes qui constituent à la fois des étapes dans le déroulement temporel et explicitent le mode de réalisation même de l’activité.

27 Cette décomposition hiérarchique correspond sans doute à l’organisation intrinsèque des actions dirigées vers un but. Au niveau même de l’organisation cérébrale, des structures hiérarchiques soutiennent la mise en oeuvre de gestuelles complexes (Lashley, 1951), les séquences motrices fines étant sous la dépendance de structures codant des plans généraux d’action de plus en plus large jusqu’à l’intention du geste. Il est possible à cet égard que les schémas que nous utilisons pour interpréter le déroulement d’une action reflètent cette structure inhérente des activités intentionnelles. Les modèles de la compréhension de texte et du raisonnement (Newell & Simon, 1972 ; Rumelhart, 1980 ; Shanks & Abelson, 1977) ont très tôt intégré l’organisation hiérarchique des actions pour rendre compte de la mémorisation ou de la planification d’actions. Ainsi les schémas décrits par Rumelhart (1977 ; 1980) sont typiquement des structures possédant une structure partonomique organisée autour de buts et de sous-buts.

28 La nature hiérarchique [6] de la segmentation conceptuelle est également mise en évidence dans les tâches expérimentales de segmentation que nous avons déjà décrites. Zacks, Tversky et Iyer (2001b), ainsi que Hard, Lozano et Tversky (2006a) ont ainsi vérifié l’alignement entre des unités de segmentation déterminées à différents niveaux de granularité. En présentant des scènes variant selon leur degré de familiarité, et en demandant aux participants de segmenter soit au niveau le plus fin, soit au niveau le plus large, ils ont pu montrer un degré d’alignement important entre les deux types d’unité. En d’autres termes, les points de rupture correspondant aux unités fines coïncident souvent avec le début ou la fin des unités larges, ce qui semble indiquer une organisation hiérarchique de la segmentation. Les unités fines semblent refléter les étapes de progression d’une action vers son accomplissement, et sont englobées dans des unités plus larges qui les résument et reflètent sans doute la finalité de l’action.

29 Ces études nous paraissent intéressantes dans la mesure où elles abordent la question des différents niveaux de représentation de l’action. La problématique centrale concerne ici le rôle respectif des unités d’action définies sur la base d’indices perceptifs et celles qui émergent de l’application de schémas conceptuels dans l’interprétation globale de la scène visuelle. L’enjeu est alors de définir l’architecture permettant de rendre compte de ces deux niveaux et de la réorganisation dynamique dans des structures hiérarchisées qui semble avoir lieu de manière spontanée. À cet égard, il est important de faire place à des travaux non directement liés au problème de la segmentation mais susceptibles d’indiquer une voie de liaison entre ces deux niveaux. Nous aborderons ainsi dans le prochain chapitre l’étude de la perception intuitive de l’action.

3. – La perception intuitive de l’action

30 Parmi les études consacrées à l’interprétation de l’action, un autre aspect de la littérature concerne la question de la compréhension intuitive de l’action. Cette littérature cherche à comprendre la distinction entre mouvement animé et mouvement provoqué, à mettre en évidence des formes d’interprétation non inférentielles, et à cerner les principes qui dirigent la compréhension spontanée de certaines formes d’interactions.

3.1. – Perception de la causalité et perception de l’agentivité

31 Que se passe-t-il lorsque nous voyons soudainement deux objets s’entrechoquer, une voiture entrer en collision avec une autre, un livre sur une étagère entraînant un vase dans sa chute ? Il semble que, dans ce type d’événements, une énergie particulière soit transmise qui détermine la direction que prend l’événement. Nous percevons la collision des objets et cette perception ne semble pas le fruit d’un raisonnement. L’impact et la transmission de force s’imposent plutôt à nos yeux et nous reconnaissons dans cette succession d’événements un enchaînement naturel et nécessaire. De la même façon, les mouvements d’un organisme semblent porter en eux-mêmes la signature de la nature intentionnelle des opérations mentales qui les dirigent.

32 Tout se passe comme si nous étions capables de reconnaître immédiatement, simplement en observant le déroulement d’une séquence visuelle, le caractère causal ou intentionnel d’un mouvement perçu. Le psychologue Michotte a sans doute été le premier à proposer l’idée que ce type d’intuitions appartiennent à un répertoire psychologique spécifique et peuvent être considérés comme des phénomènes perceptifs à part entière (Michotte, 1954, 1962). Dans les années 1940, Michotte a procédé à une série d’investigations minutieuses de ces intuitions. À travers un dispositif simple présentant le déplacement isolé de figures bidimensionnelles, lui et ses collaborateurs ont entrepris de faire l’inventaire systématique des conditions d’apparition de ce que ces auteurs appellent la « perception phénoménale de la causalité ». Une des situations expérimentales typiques consiste à présenter un rectangle (A) situé à gauche d’un autre rectangle (B). A commence à se déplacer horizontalement dans la direction de B. Lorsqu’il le rencontre, celui-ci entre en mouvement à son tour à la même vitesse, de sorte que les deux rectangles restent accolés sur une courte distance jusqu’à leur disparition. Selon Michotte, les observateurs indiquent quasi-unanimement que l’objet A est venu pousser ou entraîner l’objet B. Il s’agit là de l’effet d’entraînement, que vient compléter l’effet de lancement dans lequel le rectangle A arrête sa course au moment où il contacte B et qui suscite l’impression que A a provoqué le déplacement de B.

33 À la même époque, une expérience devenue classique s’intéresse à la perception du comportement intentionnel et aux attributs de personnalité. Heider et Simmel (1944) présentent une animation contenant des objets géométriques, un grand triangle, un petit triangle et un cercle, et demandent aux participants de décrire ce qu’ils voient. En dépit de l’absence totale de contexte pour les mouvements présentés, et de l’absence de traits reconnaissables des objets, les observateurs réussissent à produire une histoire détaillée, prêtant intentions et désirs aux figures en mouvement : « le cercle veut s’échapper de la maison », ou encore « le petit triangle cherche à délivrer sa promise d’un rival particulièrement violent » [7]. De manière systématique, les déplacements présentés dans cette étude vont susciter des attributions d’un ordre particulier, les termes utilisés sont relatifs au domaine de l’agentivité, c’est-à-dire à la capacité pour un objet de produire son propre mouvement et à prendre en compte les éléments de l’environnement pour modifier sa trajectoire.

34 Dans ces dernières expériences et dans celles de Michotte, les conditions visuelles sont réduites de manière drastique pour ne laisser évidentes que les caractéristiques des déplacements, les accélérations, les changements de trajectoire, les collisions, etc. Ce caractère appauvri des scènes sert d’argument à Michotte pour suggérer l’idée que ce sont les mouvements tels qu’ils sont perçus, et pas les propriétés, qui peuvent être inférés à partir des caractéristiques visuelles de l’objet porteur du mouvement, qui provoquent les impressions de causalité ou d’agentivité. Cet argument est appuyé par le fait que des variations, parfois très subtiles, introduites dans les conditions expérimentales ont pour conséquence des changements dramatiques dans l’impression subjective des observateurs. Ainsi par exemple dans l’effet de lancement (voir Michotte, Thinès, Costall, & Butterworth, 1991), il existe des variations systématiques de l’impression causale associées à des modifications du délai entre le moment où A parvient à côté de B et le moment où ce dernier commence sa trajectoire. À partir de 50 ms s’effectue le passage d’un report constant de l’effet de lancement au report d’impressions variées indiquant un « retard », et qui se transforme finalement en la sensation de voir deux mouvements indépendants quand le délai dépasse 150 ms.

35 Cette dépendance des jugements de causalité à l’égard de conditions spatio-temporelles précises pousse Michotte à soutenir que la connexion entre les déplacements est directement perçue, et qu’il y a donc une certaine captation intuitive des relations de causalité. Le point fort du raisonnement de Michotte consiste donc à isoler un niveau d’attribution causale qui ne dépend pas de connaissances que peuvent mobiliser les observateurs à l’égard de la réalité physique du phénomène perçu. Au contraire, selon Michotte, la « causalité phénoménale » doit se manifester à chaque fois que certaines structures perceptives bien particulières sont présentes dans le champ visuel, et conduire à l’impression irrépressible de voir la production d’un mouvement par un autre mouvement, et ceci indépendamment du caractère réaliste ou non du dispositif présenté. Le même type d’argument peut être proposé pour les déplacements suggérant un comportement dirigé vers un but, une intuition du caractère intentionnel du mouvement aurait lieu pourvu que certaines conditions perceptives soient réunies (Premack, 1990).

3.2. – Innovations méthodologiques dans la perception de l’action

36 Il a été souvent reproché à Michotte d’avoir fait intervenir dans ses expériences de proches collaborateurs au fait des enjeux de l’étude (Joynson, 1971). Bien que ce choix puisse être justifié par la volonté de produire les réponses les plus précises (voir Costall, 1991), il est de manière générale opportun de souligner les limitations du recours aux réponses verbales pour explorer un phénomène perceptif, de nombreuses sources de « contamination » pouvant intervenir entre l’instant de formation du phénomène perceptif et la réponse produite.

37 À cet égard, des études plus récentes sur la perception intuitive de l’action ont mis l’accent sur la recherche de nouvelles modalités de réponse. En cherchant par exemple les effets perceptifs collatéraux de la présence d’un événement causal au sein d’une scène visuelle (Scholl & Nakayama, 2002), en mesurant l’impact d’un effet de lancement sur la vitesse perçue des mobiles (Parovel & Casco, 2006), ou encore en évaluant l’influence de la causalité perçue sur la capacité à prédire la trajectoire d’un objet (Levillain, 2008 ; Levillain & Bonatti, 2010).

38 En particulier, un effort a été accompli pour cerner les conditions minimales qui, réunies, provoquent de manière systématique une attribution intentionnelle. Si Michotte (1954) avait déjà répertorié de façon extrêmement minutieuse les conditions spatio-temporelles favorables au percept de causalité, un effort similaire manquait du côté de la perception de l’agentivité. Tremoulet et Feldman (2000 ; 2006) ont réparé ce défaut en prenant le parti de simplifier à l’extrême les scènes présentées, isolant le déplacement d’une particule lumineuse de tout contexte capable de renseigner le spectateur sur les sources du mouvement qu’il perçoit. Une particule se déplaçait sur un fond noir, décrivant une première translation avant de prendre une nouvelle direction qu’elle maintenait jusqu’à sa sortie de l’écran. Les participants avaient pour tâche d’indiquer sur une échelle graduée de 1 à 7 si le mouvement de la particule évoquait le comportement d’un être vivant. La manipulation expérimentale consistait principalement à modifier la vitesse de la cible (le rapport entre sa vitesse finale et sa vitesse initiale) et l’angle de son changement de trajectoire. La capacité à rattacher le mouvement à celui d’un être vivant évolue proportionnellement à l’accroissement de ces deux facteurs : plus l’accélération de la particule est importante et plus elle effectue un changement de trajectoire abrupt, plus elle donne l’impression d’être animée d’un mouvement lui appartenant.

39 Ces deux études de Tremoulet et Feldman spécifient des conditions minimales de reconnaissance d’un mouvement autopropulsé. Bien que la variation des paramètres cinématiques ne soit pas la seule prise en compte – l’appréciation du caractère agentique de la trajectoire dépend également de caractéristiques relatives à la forme de l’objet présenté et à l’alignement de son axe antéro-postérieur sur sa trajectoire de déplacement – elle correspond à des caractéristiques cinématiques de violation de conservation d’énergie auxquelles le système visuel pourrait être particulièrement sensible, en vertu de leur capacité à indiquer la présence d’une source interne d’énergie (Bingham, Schmidt et Rosenblum, 1995 ; Stewart, 1982).

40 Le type d’expérience que nous venons de décrire a pour principal défaut de faire encore appel à des jugements subjectifs de la part des observateurs. De façon similaire à la méthode utilisée par Michotte et la plupart des études portant sur la perception de l’agentivité, un manque d’évaluation quantitative, ainsi qu’une difficulté à distinguer les apports propres aux inférences perceptives par rapport à des inférences de haut niveau, rendent difficile l’attribution directe des effets observés à des registres perceptifs spécialisés. Ce défaut a pu récemment être corrigé par Gao, Newman et Scholl (2009) dans une étude qui illustre en même temps la capacité de reconnaissance des interactions à distance, autre propriété fondamentale d’un comportement intentionnel. Dittrich et Lea (1994) avaient déjà montré dans une séquence de poursuite (un objet en chasse un autre) l’importance de la vitesse de déplacement et de la déviation maximum du mobile par rapport à sa cible dans l’impression que le mouvement reflète une intention, c’est-à-dire la poursuite d’un but. Cependant, dans cette nouvelle étude, Gao et al. (2009) ne cherchent pas à évaluer l’impression subjective des observateurs mais à mesurer leurs performances visuelles en terme de capacité à identifier les mobiles impliqués dans une relation de poursuite. Pour cela, ils font varier la déviation angulaire maximale de la trajectoire du poursuivant par rapport à celle du poursuivi, déterminant des conditions où, bien que le « loup » se rapproche progressivement de l’« agneau », la déviation autorisée est telle que cette relation peut devenir difficile à détecter pour l’observateur. Les résultats de cette étude indiquent une relation psychométrique entre la valeur de la déviation autorisée et les capacités d’identification, avec une chute des performances quand la déviation est supérieure à 60°. Ceci suggère que le système visuel est précalibré pour des valeurs précises de l’interaction à distance, au-delà desquelles la relation devient indétectable.

3.3. – Nature perceptive de l’attribution causale et intentionnelle

41 À travers la mise en évidence de phénomènes de perception de la causalité et de l’agentivité, il semble que certaines configurations de mouvement fassent l’objet d’une reconnaissance instantanée et suscitent de manière privilégiée l’utilisation de descripteurs d’action. Des conditions précises au niveau des déplacements perçus déterminent ainsi la différenciation entre un mouvement dont la cause est externe et un mouvement qui porte en lui-même sa propre énergie et est susceptible de réagir à distance à l’environnement qui l’entoure. Ces caractéristiques et le caractère spontané des descriptions associées à ces événements ont suggéré, notamment à Michotte, que leur nature est en grande partie perceptive, et non conceptuelle, c’est-à-dire déterminé par des inférences de haut niveau soutenues par des connaissances en mémoire. Ceci ne veut pas dire que l’attribution causale ou intentionnelle n’existe qu’au niveau perceptif – au contraire nous avons vu que les schémas conceptuels intègrent les notions de buts ou de causes – mais qu’il existe un type particulier de causalité et un type particulier d’agentivité, auxquels nous semblons accéder de manière perceptive, et non par le biais de raisonnements conscients.

42 Des critiques anciennes, notamment à l’égard des travaux de Michotte, ont néanmoins contesté le caractère irrésistible de la perception de l’action, montrant par exemple que l’utilisation de termes causaux pour décrire verbalement un enchaînement de mouvements varie fortement selon les individus et semble dépendre de leur expérience passée (Gemelli & Cappellini, 1952 ; Boyle, 1960 ; Beasley, 1968). La possibilité que les jugements impliqués dans la perception de l’action soient modelés de façon massive par le profil des observateurs est sans doute contraire à l’argumentation principale de Michotte et de ses suiveurs, elle laisse penser que ce ne sont pas tant les structures imposées par les mécanismes perceptifs que la disponibilité des concepts dans l’outillage mental qui détermine ce qui est vu ou non dans telle ou telle configuration de mouvements.

43 Il existe à cette critique plusieurs répliques. La première consiste simplement à mettre en cause la valeur des jugements verbaux, que ce soit pour prouver ou pour infirmer la thèse michotienne. Comme nous l’avons vu, il existe d’autres manières d’évaluer la réalité perceptive de l’attribution causale et intentionnelle que d’avoir recours à l’introspection (Gao et al., 2009), et celles-ci suggèrent l’existence de mécanismes perceptifs impliqués dans le traitement causal et intentionnel du mouvement. Les suivantes se placent sur le terrain expérimental. Depuis les travaux de Michotte, il a par exemple été démontré l’existence d’une dissociation entre causalité inférée, c’est-à-dire un jugement d’attribution causale basé sur l’observation de relations de covariation entre plusieurs événements, et causalité perçue, telle que manifestée dans l’effet de lancement (Schlottmann & Shanks, 1992). Il existe par ailleurs un grand nombre de travaux abordant le caractère inné de la perception de l’action, suggérant que des nourrissons sont déjà sensibles à l’asymétrie entre un agent et un patient dans une interaction mécanique perçue visuellement (Leslie & Keeble, 1987 ; Oakes & Cohen, 1990 ; Newman, Choi, Wynn & Scholl, 2008), ou qu’ils reconnaissent le caractère intentionnel d’un mouvement dirigé vers un but et séparent en conséquence les objets animés des objets inanimés (Gergely, Nádasdy, Csibra & Biró, 1995 ; Luo et Baillargeon, 2005 ; Csibra, 2008). Enfin, il est possible d’ajouter que des travaux en imagerie cérébrale commencent à mettre en évidence des systèmes neurologiques consacrés au traitement perceptif des interactions mécaniques et intentionnelles (Castelli, Happé, Frith, & Frith, 2000 ; Blakemore, Fonlupt, Pachot-Clouard, Darmon, Boyer, Meltzoff, Segebarth, & Decety, 2001 ; Fugelsang, Roser, Corballis, & Michael, 2005).

44 Dans une remise au goût du jour des travaux de Michotte, Scholl et Tremoulet (2000) ont suggéré que, de la même façon qu’il recrée spontanément la structure tridimensionnelle de l’environnement à partir d’une image en deux dimensions sur la rétine, le système visuel cherche à retrouver la structure causale et intentionnelle des événements à travers des inférences tout aussi indépendantes d’un contrôle volontaire. Les phénomènes de perception de la causalité et de l’agentivité possèdent en effet des propriétés qui permettent de les assimiler à des mécanismes modulaires, c’est-à-dire à des mécanismes autonomes et spécialisés dans des routines très spécifiques (Fodor, 1983). Ils sont essentiellement rapides, l’impression de percevoir une collision ou un changement intentionnel de trajectoire apparaissant de façon instantanée, et irrésistible dans la mesure où les observateurs, sachant le caractère fictif des scènes présentées, ne peuvent s’empêcher de donner sens à ces événements. Ce dernier point souligne par ailleurs le caractère « encapsulé » du phénomène, c’est-à-dire son indépendance à l’égard d’autres processus perceptifs et cognitifs, et notamment de processus relatifs à l’organisation conceptuelle de la scène.

45 À travers ces différents travaux, nous avons montré qu’il est possible de suggérer un niveau d’attribution causale et intentionnelle étroitement lié aux sources perceptives de l’action, un niveau dans lequel se forment instantanément certaines inférences concernant soit les sources directes du mouvement, soit les buts immédiats. Nous proposons d’utiliser ces phénomènes de perception intuitive de l’action pour enrichir les modèles de la segmentation et des relations entre sources perceptives et sources conceptuelles dans l’interprétation de l’action.

4. – Propositions pour un niveau intermédiaire de représentation de l’action

4.1. – Entre segmentation au niveau perceptif et segmentation au niveau conceptuel

46 Traditionnellement, les théories de la segmentation de l’action oscillent entre un accent porté sur les facteurs ascendants (c’est-à-dire les points de rupture définis sur une base perceptive) et un accent porté au contraire sur les facteurs descendants, c’est-à-dire l’ensemble des informations en mémoire pouvant déterminer la taille des événements considérés comme pertinents dans une séquence d’action. C’est au sein d’un schéma binaire que s’organisent la plupart des réflexions et des pratiques expérimentales, avec une logique de complémentarité dans laquelle la structure d’événements définie au niveau perceptif est modulée et enrichie par les informations provenant de schémas mentaux (voir par exemple Newtson, 1973 ; Neisser, 1976 ; Vallacher & Wegner, 1987 ; Wilder, 1978a, 1978b ; Zacks et al. 2001). Quand la segmentation au niveau perceptif est essentiellement dépendante de la détection de traits de bas-niveau appartenant au mouvement (tels que l’accélération ou la décélération), la segmentation conceptuelle dépend, elle, de la mise en jeu de schémas implantés en mémoire et définissant l’organisation temporelle typique d’une action. L’aller-retour entre ces deux niveaux est le cadre principal des théories sur la segmentation (voir Zacks & Tversky, 2001).

47 Selon ce schéma binaire, on suppose qu’au niveau perceptif le processus de segmentation est aveugle au type d’entités impliquées dans l’action (animé vs inanimé), ou encore au rôle de ces entités dans l’organisation de l’action (agent vs patient). C’est seulement au niveau de la segmentation conceptuelle, organisée par les connaissances en mémoire, que sont censés apparaître des concepts comme les buts ou les intentions. À travers une catégorisation des entités et du rôle qu’elles ont dans l’action, ainsi qu’à travers la hiérarchisation des événements, c’est à ce niveau que, selon cette hypothèse, apparaîtrait la possibilité d’organiser par exemple une séquence en termes de moyens utilisés pour parvenir à un but.

48 Des raffinements dans ce modèle ont néanmoins été proposés. Au contraire d’une opposition franche entre un niveau perceptif et un niveau conceptuel, Zacks, à travers le modèle EST (Event Segmentation Theory : Zacks et al., 2007 ; Zacks et al., 2010) privilégie une approche dynamique dans laquelle les unités d’actions sont définies simultanément à plusieurs niveaux, et où la taille des unités est constamment ajustée en fonction de l’interaction entre les données perceptives et les apports conceptuels. Selon Zacks, des « modèles d’événement », qui correspondent à des schémas, sont générés constamment pendant la perception d’une action, et c’est leur capacité prédictive, c’est-à-dire leur capacité à indiquer ce qui va se produire dans le futur, qui va déterminer quels changements transitoires sont pris en compte au niveau perceptif pour déterminer les points de rupture. Les bornes des événements vont ainsi être fonction de l’adéquation d’un modèle d’événement en cours à la structure évaluée au niveau perceptif, la réussite prédictive de ce modèle déterminant sa continuation, ou en cas d’échec son remplacement par un autre, et ainsi la taille des segments.

49 Ce type de modèle, bien qu’extrêmement intéressant, laisse néanmoins encore peu de place à une notion que nous avons voulu mettre en évidence dans ce texte, celle de la perception intuitive de l’action. Nous l’avons vu, notre capacité à déterminer les contours de l’action ainsi que le fait qu’une action soit délibérée ou au contraire causée par une source extérieure apparaît en effet extrêmement spontanée. Le fait que nous soyons particulièrement rapides à déchiffrer une action, que nous le faisions sans effort et avec une grande efficacité peut laisser penser que tout ne se joue pas dans l’assimilation de structures perceptives à des schémas conceptuels, mais qu’une partie de la compréhension de l’action réside dans la possibilité d’une lecture immédiate de la structure des actions perçues. Notre apport à l’égard des théories de l’interprétation de l’action consiste donc à imaginer à l’intérieur des différents « niveaux de segmentation » un niveau en position intermédiaire, entre prise en compte des indices perceptifs et activation de schémas conceptuels, capable d’intégrer les phénomènes étudiés dans ce pan de littérature que semblent encore ignorer même les modèles les plus avancés (Zacks et al., 2007). L’introduction de ce niveau intermédiaire permettrait essentiellement d’affirmer qu’une représentation des hiérarchies d’événements est possible indépendamment de l’accès à des structures de connaissances, et que certaines briques apparaissent spontanément dans la structure d’une action perçue, pouvant contraindre et diriger le processus même de segmentation (voir Figure 1).

Représentation des trois niveaux de segmentation à travers l’exemple d’une séquence interprétée comme l’agression d’un objet sur un autre

equation im1

Représentation des trois niveaux de segmentation à travers l’exemple d’une séquence interprétée comme l’agression d’un objet sur un autre

Figure 1. Illustration of the three segmentation levels through the example of a sequence interpreted as an assault

50 Au moins deux arguments relatifs à l’architecture du système cognitif peuvent être proposés pour justifier l’existence d’un niveau intermédiaire de représentation de l’action. Un premier argument consiste à dire qu’un niveau intermédiaire permet l’accès à des contenus concernant le déroulement de l’action à des organismes possédant un système de connaissances limité. Des expériences s’accumulent pour supporter l’existence de capacités sophistiquées d’interprétation de l’action chez les enfants de bas âge (Gergely et al., 1995 ; Kotovsky & Baillargeon, 2001 ; Newman et al., 2008). Concernant les animaux non-humains, bien que la réplication des principaux phénomènes de perception de l’action n’ait pas été tentée (à l’exception de Uller & Nichols, 2000 [8]), il existe certains arguments théoriques pour supposer de telles capacités. L’un d’entre eux est que la différenciation entre les sources du mouvement dans la scène visuelle et les contraintes physiques peut constituer un avantage d’importance pour le repérage des congénères ou des prédateurs.

51 Un second argument concerne directement la question de la segmentation de l’action. Le niveau intermédiaire aurait un rôle direct dans la délimitation d’unités d’action en vue de favoriser la compréhension de la scène et sa mémorisation. Nous pouvons supposer qu’à ce niveau a lieu une intégration de déplacements qui seraient distingués à un niveau purement perceptif. Nous l’avons vu dans les expériences de Michotte (1954), la succession particulière de deux mouvements, associée à des conditions précises de contiguïté spatio-temporelle, détermine une impression qui représente davantage que le regroupement des deux phases du mouvement, mais constitue une véritable entité perceptive correspondant à la transmission de force. Ceci suggère que, dans les conditions appropriées, une unité d’action est formée spontanément qui intègre les différentes composantes du déplacement perçu, une unité qui commence par le mouvement du premier objet et se termine avec celui du deuxième objet, englobant les prémisses de l’action et ses conséquences.

52 Un des aspects de la perception de l’agentivité revient à connecter des trajectoires isolées spatialement sur la base de leur degré de contingence (Dittrich & Lea, 1994 ; Santos, David, Bente, & Vogeley, 2008 ; Gao et al., 2009), ce qui semble aboutir à la formation de nouvelles unités perceptives pouvant être décrites selon des paramètres d’ajustement d’un des mouvements par rapport à l’autre. Par exemple, l’ajustement de la position d’un joueur de football avec la trajectoire du ballon dans les airs pourrait, sur la base du degré de contingence entre le mouvement du joueur et celui du ballon, servir à délimiter une unité d’action (« réception du ballon »).

53 Au niveau intermédiaire seraient donc déterminées des unités de segmentation plus grandes que les unités qui seraient définies sur la base des seuls indices de changement transitoire, et pourraient servir de première étape vers une intégration massive des déplacements dans une scène, pour aboutir à un “tableau” unifié par des schémas conceptuels.

4.2. – Modules et primitives d’action

54 Quels sont les mécanismes qui permettent d’aboutir à la formation d’unités d’action au niveau intermédiaire ? Nous devons supposer que des processus sont capables d’agir indépendamment de ressources conceptuelles pour former des unités qui contiennent néanmoins des informations sur la structure, causale ou intentionnelle, de l’action. Cette contrainte d’autonomie est celle qui préside au fonctionnement modulaire. Les modules sont des structures imaginées pour accomplir certaines tâches très spécifiques, routines cognitives qui doivent être exécutées de manière rapide, automatique, et de telle façon que leur produit soit propulsé vers d’autres relais de l’architecture cognitive de manière irrésistible, sans devoir faire l’objet d’une « délibération » consciente (Fodor, 1983 ; Pinker, 1997 ; Sperber, 2001). Nous supposons alors que des modules consacrés spécifiquement à certaines interactions entre objets sont activés lors du processus de segmentation de la scène, prenant pour entrée les changements transitoires observés et ayant pour sortie des unités d’action contenant l’ébauche de structures de transmission causale de force ou d’interactions volontaires entre objets animés.

55 Cette proposition correspond par exemple à la théorie de Leslie (1994) qui considère qu’un module est chargé de produire une description de la répartition des énergies, des transmissions de force et des conditions minimales de production du mouvement. Un module qui serait disponible à la naissance pour contraindre l’apprentissage de l’enfant sur les interactions entre objets. D’autres auteurs, tels que Pinker (1997) ou Spelke (1998) ont également défendu des idées similaires concernant la possibilité d’intégrer des domaines de connaissances à une architecture modulaire.

56 Au niveau intermédiaire, des modules auraient donc pour rôle de former des sortes de briques élémentaires dans la description et l’interprétation de l’action. Ces unités perceptives correspondraient selon nous à des primitives d’action dont une liste de propriétés peut commencer à être élaborée.

57 Les primitives d’action peuvent être décrites par des conditions cinématiques précises : Nous l’avons vu en ce qui concerne notamment la perception de la causalité, un petit nombre de paramètres tels que la contiguïté spatio-temporelle entre les mobiles impliqués dans une interaction mécanique, leur vitesse relative ou leur direction ont un rôle considérable dans la formation des impressions concernant l’origine et le sens de l’action (Michotte, 1954 ; Scholl & Nakayama, 2002). Bien que la définition des paramètres cruciaux dans la perception de l’agentivité soit plus complexe, il apparaît que des variations transitoires dans la direction et la vitesse des déplacements perçus participent de manière cruciale à l’impression spontanée d’avoir affaire à des mouvements d’êtres animés (Tremoulet & Felman, 2000).

58 Les primitives d’action spécifient des rôles aux entités impliquées : Nous l’avons vu, la distinction entre objets animés et objets inanimés est au coeur de la compréhension intuitive de certaines interactions, et ceci peut être considéré comme une amorce de l’identification de buts et de schémas causaux à un niveau plus élaboré d’interprétation de l’action. La délimitation d’une séquence d’action coïncide avec la définition de rôles à l’intérieur de cette séquence. En ce qui concerne la perception de la causalité, il s’agit essentiellement de déterminer la place qu’occupent les objets considérés dans le processus de transmission et de réception d’énergie. Ainsi dans une collision entre deux objets, l’un des objets est considéré comme celui qui transmet une certaine quantité d’énergie, tandis que l’autre objet reçoit passivement cette énergie (Michotte, 1954). Pour la perception de l’agentivité, il s’agit avant tout de reconnaître un ordre temporel qui va définir une entité initiatrice de l’action, celle qui agit en premier, et une entité qui manifeste une réaction à cette première action.

59 Les primitives d’action peuvent faire l’objet d’une description verbale : À ces briques élémentaires au niveau de la segmentation perceptive d’une scène pourraient correspondre des briques verbales. Des verbes ayant trait à la description de l’action, tels que « lancer », « pousser », « déclencher », « poursuivre », etc. sont naturellement utilisés dans les situations impliquant une action causale directe d’un agent sur un patient, par contraste avec des expressions composées qui interviennent généralement lorsqu’un intermédiaire est identifié dans la séquence d’action considérée (Kemmer & Verhagen, 1994 ; Wolff, 2003). À cet égard, il est possible que la lexicalisation des descripteurs d’action ait pour racine l’implication de modules d’analyse perceptive pour la segmentation de primitives d’action. La possibilité de relier des événements par ce type de mécanismes constituerait une condition minimale pour qu’une séquence d’action fasse l’objet d’une verbalisation.

60 À ces primitives d’action fait encore défaut aujourd’hui une typologie précise qui tenterait d’inventorier les différentes formes d’interaction susceptibles de faire l’objet d’un traitement modulaire. Nous avons décrit deux domaines principaux de recherche sur la perception de l’action mais, ainsi que l’ont suggéré Gao et al. (2009), il pourrait exister parmi ces grandes catégories, causalité et agentivité, différentes sous-catégories (comme combattre, jouer, garder, etc.) obéissant à des traits perceptifs distincts (Tijus & Zibetti, 2001). En guise de préalable à une telle tentative de classification des primitives d’action, nous pouvons essayer de distinguer deux types principaux d’interactions : les interactions mécaniques et les interactions contingentes.

61 L’interaction mécanique définit le type de relation causale que peuvent entretenir plusieurs objets inanimés. Comme dit précédemment, elle représente la relation de transfert d’énergie entre un objet considéré comme actif et un autre passif. Son exemple typique est celui d’une boule de billard entrant en collision avec une autre, avec arrêt instantané de la première au départ de la seconde, qui correspond à « l’effet de lancement » décrit par Michotte et qui s’accompagne de l’impression de voir le premier objet « lancer » le second.

62 Il semble que la propriété fondamentale qui gouverne la possibilité de connecter les deux mouvements dans une interaction causale soit la contiguïté temporelle de l’arrêt du premier mouvement et du commencement du second. Curieusement, le contact direct entre les objets n’est pas nécessaire pour que s’établisse l’impression irrésistible de poussée de la part d’un objet sur l’autre, bien plutôt la contiguïté temporelle entre les deux mouvements est la condition nécessaire à la connexion des déplacements, un retard significatif se traduisant par l’impression de voir deux mouvements indépendants (Yela, 1952).

63 L’interaction contingente définit le type de relation causale que peuvent entretenir plusieurs agents. Le degré de contingence entre les mouvements considérés est défini par la probabilité plus ou moins grande que le déplacement de l’objet B coïncide avec le déplacement de l’objet A, ainsi que la probabilité que les caractéristiques du déplacement de l’objet B coïncident avec les caractéristiques du déplacement de l’objet A. Ainsi, le degré de contingence entre deux déplacements sera augmenté si le mouvement de B est contigu temporellement avec celui de A, et plus encore si B se déplace dans la même direction, avec la même vitesse que A. Ce type d’interaction peut être réciproque, lorsque par exemple deux objets semblent jouer ensemble, ou non réciproque, lorsque par exemple un objet paraît en poursuivre un autre.

64 Dans les deux types d’interactions, le « ciment » qui permet de joindre plusieurs trajectoires réside dans le caractère causal de l’interaction, par contact direct ou à distance. Une première définition des rôles apparaît alors dans la hiérarchie entre un objet qui initie l’interaction (en provoquant mécaniquement un déplacement ou en suscitant un déplacement) et un objet qui y répond.

65 En résumé, le niveau intermédiaire de représentation de l’action tel que nous le supposons aurait pour rôle de délimiter, sans effort réflexif de la part de l’observateur, des briques d’action dans lesquelles sont spécifiés certains rôles et qui peuvent être lexicalisées. Ces briques ou primitives d’action permettraient d’organiser la séquence perçue en vue de l’application de schémas conceptuels, favorisant la reconnaissance immédiate d’événements pertinents du point de vue de l’organisation causale de la scène, et définissant des unités d’action intermédiaires entre la perception de points de rupture et l’engagement de schémas de haut niveau.

5. – Conclusion

66 La capacité humaine de donner sens à des séquences complexes d’action est aussi frappante qu’elle est obscure du point de vue des mécanismes psychologiques qui la soutiennent. Deux manières d’aborder la compréhension de l’action ont déterminé deux approches dans la littérature, l’une étant consacrée aux mécanismes perceptifs automatisés de détections d’invariants dans l’analyse de séquences dynamiques d’action, l’autre se donnant pour objectif de résoudre le problème de la segmentation de séquences en différentes unités ou événements. Ces champs de recherche fabriquent des paradigmes expérimentaux et des théories qui leur appartiennent en propre. Ce cloisonnement est la marque d’une spécialisation des méthodes de recherche, bénéfique d’un point de vue pragmatique, mais potentiellement nuisible dans l’optique d’une unification théorique du domaine de la compréhension de l’action. Il est ainsi regrettable que des découvertes effectuées dans l’un de ces champs ne retentissent pas sur l’autre. Souvent la littérature concernant la segmentation de l’action semble ignorer l’autre pan de la littérature concernant l’existence possible de modules dédiés à la perception automatisée de l’action, et vice-versa. Pourtant, nous l’avons vu, rien n’indique que nous ayons affaire à deux niveaux d’analyse radicalement indépendants.

67 Nous avons proposé dans cet article un préambule à l’unification théorique de ces deux champs, à travers l’hypothèse d’un niveau intermédiaire de représentation de l’action. Ce dernier serait chargé de structurer les scènes perceptives dynamiques pour favoriser certaines interprétations relatives aux buts poursuivis et aux causes d’un comportement observé. À travers le traitement automatisé de primitives d’action, le niveau intermédiaire de représentation favoriserait une lecture quasi-instantanée des points d’organisation de la scène dynamique pour suggérer certaines unités d’action, qui elles-mêmes déterminent la compréhension globale de l’action en cours.

68 De nombreuses questions expérimentales réclament d’être considérées pour étayer cette hypothèse. Il s’agit par exemple de vérifier dans quelle mesure certaines formes d’interaction entre objets ont un impact sur la compréhension globale de la scène. Ceci pourrait être déterminé expérimentalement en évaluant la relation systématique entre des variations des paramètres spatio-temporels constitutifs de ces interactions et les points de rupture choisis au sein d’une séquence d’action. Il s’agirait également de déterminer si la catégorie d’interaction représentée, mécanique ou contingente, influence le niveau de granularité choisi pour décrire l’action. On peut imaginer ainsi que la perception d’interactions contingentes “oblige” l’observateur à se situer à un niveau de description plus large que celles des interactions locales qui règlent les transformations mécaniques [9]. Il importe enfin de connaître dans quelle mesure le traitement de ce que nous avons qualifié de primitives d’action est vraiment indépendant du contexte dans lequel prend place l’action, autrement dit de savoir s’il existe véritablement des opérations locales dans le traitement d’une scène visuelle dynamique.

69 Bien d’autres questions pourraient être abordées, concernant notamment la nature de l’architecture cognitive qui soutient la possibilité de donner sens à des phases d’action. Dans quelle mesure les intuitions de l’action sont-elles isolées des connaissances conceptuelles ? Quelle est leur relation avec les concepts élaborés appartenant au domaine de la physique ou à celui de la compréhension des états mentaux d’autrui ? Pour l’heure, il nous suffit de remarquer que ces formes d’attribution intuitive que nous avons décrites se distinguent par de fortes contraintes perceptives, elles encouragent ainsi à réfléchir à la variété des niveaux de représentation impliqués dans la compréhension de l’action, et à penser les modèles capables d’accueillir les différentes strates et les différentes modalités d’interaction qui participent à l’élaboration d’interprétations cohérentes et partagées de l’action en cours.

70 Reçu le 14 juin 2010.

71 Révision acceptée le 22 février 2011.

Remerciements. Les auteurs tiennent à remercier Luca Bonatti pour ses commentaires avisés durant l’élaboration de cet article.

Bibliographie

Bibliographie

  • Abelson R. P. (1981). Psychological status of the script concept. American Psychologist, 36, 715-729.
  • Baldwin D. A., & Baird J. A. (1999). Action analysis: A gateway to intentional inference. In Rochat P. (Ed.), Early social cognition: Understanding others in the first months of life (pp. 215-240). Mahwah, NJ: Erlbaum.
  • Baldwin D., & Baird J. (2001). Discerning intentions in dynamic human action. Trends in Cognitive Sciences, 5, 171-178.
  • Baldwin D., Baird J., Saylor M., & Clark M. (2001). Infants parse dynamic action. Child Development, 72, 708-717.
  • Bartlett S. (1995). Remembering: A study in experimental and social psychology. Cambridge University Press.
  • Bingham G., Schmidt R., & Rosenblum L. (1995). Dynamics and the orientation of kinematic forms in visual event recognition. Journal of Experimental Psychology: Human Perception and Performance, 21, 1473-1493.
  • Blakemore S. J., & Decety J. (2001). From the perception of action to the understanding of intention. Nature Reviews: Neuroscience, 2, 1-8.
  • Blakemore S., Fonlupt P., Pachot-Clouard M., Darmon C., Boyer P., Meltzoff A., Segebarth C., & Decety J. (2001). How the brain perceives causality: an event-related fMRI study. NeuroReport, 12, 3741-3746.
  • Beasley N. E. (1968). The extent of individual differences in the perception of causality. Canadian Journal of Psychology, 22, 399-407.
  • Boyle D. G. (1960). A contribution to the study of phenomenal causality. Quaterly Journal of Experimental Psychology, 12, 171-179.
  • Byrne R. W. (2002). Seeing actions as hierarchically organized structures: Great ape manual skills. In Meltzoff A. N. & Prinz W. (Eds.), The imitative mind: Development, evolution, and brain bases (pp. 122-140). Cambridge: Cambridge University Press.
  • Casati R., & Varzi A. C. (1996). Events. Aldershot, England ; Brookfield, Vt.: Dartmouth.
  • Castelli F., Happé F., Frith U., & Frith C. (2000). Movement and mind: a functional imaging study of perception and interpretation of complex intentional movement patterns. Neuroimage, 12, 314-325.
  • Cohen C., & Ebbesen E. (1979). Observational goals and schema activation: A theoretical framework for behavior perception. Journal of Experimental Social Psychology, 15, 305-329.
  • Costall A. (1991). Phenomenal Causality. In Thinès G. Costall A. & Butterworth G. (Eds.), Michotte’s Experimental Phenomenology of Perception. Erlbaum.
  • Csibra G. (2008). Goal attribution to inanimate agents by 6.5-month-old infants. Cognition, 107, 705-717.
  • Dittrich W., & Lea S. (1994). Visual perception of intentional motion. Perception, 23, 253-253.
  • Fodor J. (1983). The modularity of mind. Cambridge, MA: MIT press.
  • Fugelsang J., Roser M., Corballis P., & Michael S. (2005). Brain mechanisms underlying perceptual causality. Cognitive brain, 24, 41-47.
  • Gao T., Newman G., & Scholl B. (2009). The psychophysics of chasing: A case study in the perception of animacy. Cognitive psychology, 59, 154-179.
  • Gemelli A., & Cappellini A. (1958). The influence of the subject’s attitude in perception. Acta Psychologica, 14, 12-23.
  • Gergely G., Nádasdy Z., Csibra G., & Biró S. (1995). Taking the intentional stance at 12 months of age. Cognition, 56, 165-193.
  • Hard B. A., Lozano S., & Tversky B. (2006a). Hierarchical encoding: A mechanism for observational learning. Journal of Experimental Psychology: General, 135, 588-608.
  • Hard B. M., Tversky B., & Lang D. (2006b). Making sense of abstract events: Building event schemas. Memory & Cognition, 34, 1221-1235.
  • Heider F., & Simmel M. (1944). An experimental study of apparent behavior. The American Journal of Psychology, 57, 243-259.
  • Joynson R. B. (1971). Michotte’s experimental methods. British Journal of Psychology, 62, 293-302.
  • Kemmer S., & Verhagen A. (1994). The grammar of causatives and the conceptual structure of events. Cognitive linguistics, 5, 115-156.
  • Kotovsky L., & Baillargeon R. (2001). Reasoning about collisions involving inert objects in 7.5-month-old infants. Developmental Science, 3, 344-359.
  • Kurby C., & Zacks J. (2008). Segmentation in the perception and memory of events. Trends in cognitive sciences, 12, 72-79.
  • Leslie A. (1994). ToMM, ToBy, and Agency: Core architecture and domain specificity. In Hirschfeld L. & Gelman S. Mapping the mind: Domain specificity in cognition and culture (pp. 119-148). Cambridge University Press.
  • Leslie A. M., & Keeble S. (1987). Do six-month-old infants perceive causality? Cognition, 25, 265-288.
  • Levillain F. (2008). Poursuivre des chimères: Limitations de l’imagerie dynamique. Thèse de Doctorat, Université Paris 8.
  • Levillain F., & Bonatti L. L. (2010). On the limitations of dynamic imagery: A mental extrapolation task. Proceedings of the annual conference of the Cognitive Science Society.
  • Luo Y., & Baillargeon R. (2005). Can a self-propelled box have a goal? Psychological Science, 16, 601.
  • Massad C., Hubbard M., & Newtson D. (1979). Selective perception of events. Journal of Experimental Social Psychology, 15, 513-532.
  • Michotte A. (1954). La Perception de la Causalité. Publications Universitaires de Louvain.
  • Michotte A. (1962). La causalité physique est-elle une donnée phénoménale? In Michotte A.Causalité Permanence et Réalités Phénoménales : Études de Psychologie Expérimentale. Louvain : Publications Universitaires.
  • Michotte A., Thinès G., Costall A., & Butterworth G. (1991). Michotte’s experimental phenomenology of perception. Lawrence Erlbaum Associates.
  • Neisser U. (1976). Cognition and reality: Principles and implications of cognitive psychology. San Francisco: Freeman.
  • Newman G. E., Choi H., Wynn K., & Scholl B. J. (2008). The origins of causal perception: evidence from postdictive processing in infancy. Cognitive Psychology, 57, 262-291.
  • Newtson D. (1973). Attribution and the unit of perception of ongoing behavior. Journal of Personality and Social Psychology, 28, 28-38.
  • Newtson D. (1976). Foundations of attribution: the perception of ongoing behavior, in Harvey J. H.Ickes W. J. and Kidd R. F. (Eds), New Directions in Attribution Research Hillsdale, NJ: Lawrence Erlbaum Associates.
  • Newtson D., & Engquist G. (1976). The perceptual organization of ongoing behavior. Journal of Experimental Social Psychology, 12, 436-450.
  • Newtson D., Engquist G., & Bois J. (1977). The objective basis of behavior units. Journal of Personality and Social Psychology, 35, 847-862.
  • Oakes L., & Cohen L. (1990). Infant perception of a causal event. Cognitive Development, 5, 193-207.
  • Parovel G., & Casco C. (2006). The psychophysical law of speed estimation in Michotte’s causal events. Vision Research, 46, 4134-4142.
  • Pinker S. (1997). How the mind works. Norton.
  • Premack D. (1990). The infant’s theory of self-propelled objects. Cognition, 36, 1-16.
  • Rumelhart D. (1980). Schemata: The building blocks of cognition. In Spiro R. J. Bruce B. C.& Brewer W. F. (Eds.), Theoretical issues in reading comprehension: Perspectives from cognitive psychology, linguistics, artificial intelligence, and education. Hillsdale, NJ: Erlbaum.
  • Rui YA., Rui Y. and An P., (2000) Segmenting Visual Actions Based on Spatio-Temporal Motion Patterns. In IEEE Conference on Computer Vision and Pattern Recognition, 111-118.
  • Santos N.S., David N., Bente G., & Vogeley K. (2008). Parametric induction of animacy experience. Consciousness and Cognition, 17, 425-437.
  • Scholl B. J., & Nakayama K. (2004). Illusory causal crescents: misperceived spatial relations due to perceived causality. Perception, 33, 455-469.
  • Scholl B., & Tremoulet P. (2000). Perceptual causality and animacy. Trends in Cognitive Sciences, 4, 299-309.
  • Schlottmann A., & Shanks D. R. (1992). Evidence for a distinction between judged and perceived causality. Quaterly Journal of Experimental Psychology, 44A, 321-342.
  • Sekuler R., Watamaniuk S.N.J., & Blake R. (2002). Perception of visual motion. In Pashler H. & Yantis S. (Eds.), Stevens’Handbook of Experimental Psychology. New York: J.Wiley Publishers.
  • Sharon T., & Wynn K. (1998). Individuation of actions from continuous motion. Psychological Science, 9, 357-362.
  • Spector L., and Grafman J. (1994). Planning, Neuropsychology and Artificial Intelligence: Cross-Fertilization, Vol. 9. Amsterdam: Elsevier.
  • Speer N., Swallow K., & Zacks J. (2003). Activation of human motion processing areas during event perception. Cognitive, Affective, & Behavioral Neuroscience, 3, 335-345.
  • Spelke E. (1998). Nativism, empiricism, and the origins of knowledge. Infant Behavior and Development, 21, 181-200.
  • Stewart J. (1982). Perception of animacy. PhD Thesis, University of Pennsylvania.
  • Tijus C. A., & Zibetti E. (2001). Le rôle du but et de l’objet dans la détermination sémantique des verbes d’action. Journal des Anthropologues - A. F. A., 85-86, 157-182.
  • Tremoulet P., & Feldman J. (2000). Perception of animacy from the motion of a single object. Perception, 29, 943-952.
  • Tremoulet P., & Feldman J. (2006). The influence of spatial context and the role of intentionality in the interpretation of animacy from motion. Perception & Psychophysics, 68, 1047-1058.
  • Uller C. (2001). Retraction Notice for the Brief Article “Goal attribution in chimpanzees” by Claudia Uller and Shaun Nichols Published in Cognition Volume 76 (2000) pp. B27–B34. Cognition, 80(3), iii.
  • Uller C., & Nichols S. (2000). Goal attribution in chimpanzees. Cognition, 76, B27–B34.
  • Wilder D. (1978a). Effect of predictability on units of perception and attribution. Personality and Social Psychology Bulletin, 4, 281-284.
  • Wilder D. (1978b). Predictability of behaviors, goals, and unit of perception. Personality and Social Psychology Bulletin, 4, 604-607.
  • Wolff P. (2003). Direct causation in the linguistic coding and individuation of causal events. Cognition, 8, 1-48.
  • Wynn K. (1996). Infants’ individuation and enumeration of actions. Psychological Science, 7, 164-169.
  • Woodward A. L. (1998). Infants selectively encode the goal object of an actor’s reach. Cognition, 69, 1-34.
  • Yela M. (1952). Phenomenal causation at a distance. The Quarterly Journal of Experimental Psychology, 4, 139-154.
  • Zacks J. (2004). Using movement and intentions to understand simple events. Cognitive Science: A Multidisciplinary Journal, 28, 979-1008.
  • Zacks J. M., Braver T. S., Sheridan M. A., Donaldson D. I., Snyder A. Z., Ollinger J. M., Buckner R. L., & Raichle M. E. (2001a). Human brain activity time-locked to perceptual event boundaries. Nature Neuroscience, 4, 651-655.
  • Zacks J., Swallow K., Vettel J., & McAvoy M. (2006). Visual motion and the neural correlates of event perception. Brain research, 1076, 150-162.
  • Zacks J. M., Speer N. K., Swallow K. M., Braver T. S., & Reynolds J. R. (2007). Event perception: A mind/brain perspective. Psychological Bulletin, 133, 273-293.
  • Zacks J. M., Speer N. K., Swallow K. M. & Maley C. J. (2010). The brain’s cuting-room floor: Segmentation of narrative cinema. Frontiers in Human Neuroscience, 4, ArtID 168.
  • Zacks J. M., Kumar S., Abrams R. A., & Mehta R. (2009). Using movement and intentions to understand human activity. Cognition, 112, 201-216.
  • Zacks J. M., Tversky B., & Iyer G. (2001b). Perceiving, remembering, and communicating structure in events. Journal of Experimental Psychology: General, 130, 29-58.
  • Zacks J., & Tversky B. (2001). Event structure in perception and conception. Psychological Bulletin, 127, 3-21.
  • Zibetti E. (2001). Catégorisation contextuelle et compréhension d’événements visuellement perçus et interprétés comme des actions. Thèse de Doctorat, Université Paris 8.
  • Zibetti E., Hamilton E., & Tijus C. A. (1999). The role of Context in Interpreting Perceived Events as Action. In Akman V. Bouquet P. Thomason R. Young R. (Eds.). Lectures Notes in Artificial Intelligence, vol. 1688, Modeling and Using Context . New-York: Springer Verlag.
  • Zibetti E., Poitrenaud S., & Tijus C. A. (2001). La construction de la représentation de l’action perçue. Intellectica, 32, 123-153.
  • Zwaan R. A., and Radvansky G. A. (1998). Situation models in language comprehension and memory. Psychological Bulletin, 123, 162-185.

Notes

  • [1]
    Certains auteurs préféreront le terme « action », faisant ici référence à la fois à l’opération de segmentation et à celle d’attribution cognitive de la part de l’observateur.
  • [2]
    Newtson présentait par exemple une femme découpant des patrons pour une robe, un homme réparant une moto, ou feuilletant nerveusement un magazine.
  • [3]
    Des résultats similaires ont été obtenus récemment avec des techniques d’analyse du flux optique (Rui, Rui, & An, 2000).
  • [4]
    Nous utiliserons le terme de « segmentation perceptive » pour souligner l’impact des indices perceptifs lors du processus de segmentation et, par contraste, celui de « segmentation conceptuelle » pour souligner l’impact des connaissances. Nous ne souhaitons pas cependant suggérer une séparation nette entre segmentation perceptive et segmentation conceptuelle, une dichotomie qui, bien qu’ayant une valeur didactique, peut apparaître légèrement artificielle tant il est clair que de nombreux processus interagissent pour aboutir à la définition de points de rupture dans une séquence.
  • [5]
    D’autres études montrent par exemple que les enfants, dont les capacités d’attribution de buts et d’intentions ne sont pas totalement développées, sont néanmoins capables de percevoir des combinaisons de mouvement biologiques, tel que « attraper un objet », comme une unité discrète (Woodward, 1988).
  • [6]
    Notons toutefois qu’un certain nombre de recherches en psychologie du développement (Baldwin & Baird, 1999), en psychologie comparative (Byrne, 2002) et en psychologie cognitive (Hard et al., 2006b) suggérèrent que des indices perceptifs serait suffisant pour percevoir l’organisation hiérarchique de l’action.
  • [7]
    Zibetti, Poitrenaud et Tijus (2001) ont montré que, simplement en inversant la taille et la forme des trois figures géométriques, tout en conservant les même déplacements, il est possible d’obtenir des descriptions verbales où les termes utilisés sont relatifs au domaine de l’amabilité (embarrasser, caresser...).
  • [8]
    Les résultats de cette étude ont cependant fait l’objet d’une rétractation de la part des auteurs en raison d’erreurs de codage des observations (Uller, 2001).
  • [9]
    Les d’expériences menées par Hard et ses collaborateurs (Hard et al., 2006b) peuvent suggérer qu’il existe bien un impact de primitives d’action à la fois sur la segmentation et la hiérarchisation de l’action. Le point critique dans ces expériences est de présenter des séquences animées dans leur sens normal puis en sens inverse pour mesurer l’effet de la direction de l’action sur la segmentation et «l’intérprétabilité». Le fait qu’il y ait très peu de différences dans les frontières d’événement choisies entre les deux conditions suggère que certaines structures d’événement restent invariantes quelque soit la direction de l’événement, et que les schémas conceptuels ne jouent pas un rôle fondamental dans la segmentation, mais au contraire pourraient être dépendant de la détection préalable de ces structures d’événement.
bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Avec le soutien de

Retrouvez Cairn.info sur

18.97.14.80

Accès institutions

Rechercher

Toutes les institutions