Notes
-
[1]
Les items sélectionnés pour cette évaluation ont été pré-testés parmi un questionnaire de 21 items qui permettait à des sujets (population étudiante de licence de psychologie, 50 % de femmes, âge moyen : 21,78) d’identifier, sur une échelle en 5 points, les termes les plus pertinents pour évaluer les caractéristiques d’une interaction avec une interface d’un cours multimédia. Nous avons retenu les 12 items parmi ceux ayant obtenu les plus fortes moyennes (M > 3,75).
-
[2]
Le nombre moyen d’erreurs par conditions expérimentales est directement relié au temps d’exécution, puisque plus le sujet fait des erreurs sur un niveau de complexité, plus son temps sur ce niveau augmente.
-
[3]
Ces tests post-hoc ont été réalisés par agrégation du facteur « type de personnification » (absence de visage contre visage schématique) et « contexte social de passation » (avec enjeu endocentré contre exocentré) pour former un plan à quatre conditions.
-
[4]
Les tests post-hoc ont été réalisés par agrégation du facteur « type de personnification réelle » (visage réel jeune contre visage réel âgé) et « contexte social de passation » (avec enjeu endocentré contre exocentré) pour former un plan à quatre conditions : C1 (visage réel pair endocentré), C2 (visage réel pair exocentré), C3 (visage réel non pair endocentré) et C4 (visage réel non pair exocentré).
1La conception d’interfaces permettant, lors des interactions Homme-Machine, de reproduire certaines caractéristiques des interactions interpersonnelles, constitue une préoccupation récurrente au sein des recherches et travaux en développement informatique. Durant la dernière décade, un grand nombre d’agents logiciels (software agents) sous forme de personnages humains (interface personnifiée) a été réalisé (Badler, Phillips, & Webber, 1993 ; Bates, 1994 ; Ball et al., 1996 ; Blumberg, 1994 ; Elliott, 1994 ; Lashkari, Metral, & Maes, 1994 ; Sheth, 1994 ; Laurel, 1990 ; Rickel & Johnson, 1997 ; Thórisson, 1996 ; Vilhjá lmsson & Cassell, 1998 ; etc.). Les concepteurs utilisent des visages schématiques ou réels obtenus à partir de dessins, de photographies, voire d’images de synthèse (Agawa, Xu, Nagashim, & Kishino, 1990 ; Choi, Aizawa, Harashima, & Tsuyoshi, 1994 ; Morishima, Aizawa, & Harishima, 1990 ; Takeuchi & Nagao, 1993). Au-delà des considérations techniques, on peut s’interroger sur les effets de la personnification des interfaces sur le comportement des utilisateurs de logiciels interactifs (jeux, apprentissage, travail, etc.). Cet article propose d’analyser, par une série d’expériences, l’effet de la personnification des interfaces et du contexte social d’interaction sur la persévérance des utilisateurs dans une tâche d’apprentissage et leur appréciation de la qualité de l’interface.
I. INTERFACES PERSONNIFIÉES ET INTERACTION HOMME-MACHINE
I . 1. L’INTERFACE PERSONNIFIÉE : UNE MÉTAPHORE PERTINENTE POUR FACILITER L’INTERACTION HOMME-MACHINE ?
2La conception d’interface personnifiée pose comme postulat que la représentation d’un visage humain (schématique ou réaliste ; statique ou dynamique ; en 2D ou 3D, etc.) permet d’améliorer l’interaction Homme-Machine, car l’utilisateur peut se servir, lors du dialogue, de ses propres connaissances interpersonnelles acquises quotidiennement auprès d’autres humains. La perception par les utilisateurs du niveau de « sociabilité » de l’ordinateur augmenterait (Parise, Kiesler, Sproull, & Waters, 1996) en fonction du degré de personnification (voix, regard, etc.) de l’interface. Plus l’interface va reproduire les caractéristiques essentielles des expressions faciales et des émotions fréquemment utilisées lors des interactions interpersonnelles courantes, plus son efficacité interactive est supposée (Laurel, 1990). Ce postulat de « meilleure efficacité de l’interface personnifiée » se fonde intuitivement sur une métaphore anthropomorphique (Tamir & Zohar, 1991 ; etc.). Un grand nombre d’études empiriques a été réalisé pour évaluer les effets des interfaces personnifiées développées au sein de programmes informatiques. Ces études se sont principalement centrées sur l’évaluation du degré de satisfaction et sur le sentiment d’engagement de l’utilisateur face à un agent logiciel. Oren, Salomon, Kreitman et Don (1990) ont développé, au sein d’un programme éducatif sur l’histoire des États-Unis, des personnages présentant des physionomies et des costumes typiques des différentes époques historiques qui guident l’utilisateur au sein des divers chapitres. Les résultats d’une enquête qualitative post-utilisation montrent que l’interface personnifiée augmente le sentiment de satisfaction et d’engagement. Kozierok (1993), pour la planification de réunions, et Lashkari et al. (1994), pour la gestion du courrier électronique, ont créé des agents logiciels sous forme de caricature de visages humains présentant des expressions faciales. Cette forme d’interface procure chez l’utilisateur un sentiment général de satisfaction et de confiance. Bates (1994) a créé, lui aussi, un agent logiciel manifestant des émotions positives ou négatives. Il observe que la crédibilité d’un assistant humanisé dépend de l’illusion de vie qu’il dégage. Pour l’auteur, la traduction d’émotions constitue le moyen le plus efficace pour améliorer l’interaction Homme-Machine. Un grand nombre d’autres enquêtes de satisfaction, après l’utilisation de programmes utilisant des interfaces personnifiées, a montré que l’interaction est jugée satisfaisante car plus « naturelle » et plus « émotionnelle » (Ball et al., 1996 ; Blumberg, 1994 ; Maes, 1995 ; Nass, Steur, & Tauber, 1994 ; Shneiderman, 1995 ; Thórisson, 1996). La perception du confort d’interaction avec la machine est augmentée car les interfaces personnifiées rendent l’ordinateur plus « humain », plus engageant et plus motivant (Elliott, Rickel, & Lester, 1997 ; Oren et al., 1990 ; Takeuchi et al., 1993).
3L’ensemble de ces évaluations empiriques, réalisées post-utilisation et effectuées de manière qualitative par entretiens avec les utilisateurs, montre globalement que l’utilisateur perçoit la personnification des interfaces comme une source d’engagement et une aide sociale dans la gestion de l’interaction Homme-Machine. Cependant la portée de ces études est discutable, car :
- les résultats sont dépendants des caractéristiques intrinsèques de l’application développée (structure du programme informatique, influence du contenu de la leçon, forme des attributs de personnification de l’agent logiciel, particularités des utilisateurs, etc.) ;
- les méthodes d’évaluation employées sont à la fois très peu explicitées et non standardisées (entretiens d’appréciation générale post-utilisation).
I . 2. QUELS INTÉRÊTS RÉELS À UTILISER UNE INTERFACE PERSONNIFIÉE ?
4Certaines études ont tenté de répondre à ces insuffisances, en comparant différents dispositifs de conception d’interfaces personnifiées à partir d’une application identique.
I . 2 . A. Interface personnifiée et attributions spontanées
5Plusieurs attributions spontanées de traits à l’égard de l’interface personnifiée ont été constatées dans la littérature. King et Ohya (1996) ont demandé à des participants d’évaluer différents stimuli [sphères géométriques contre visages humains schématiques (icônes avec expressions faciales positives ou négatives) contre formes humaines plus réalistes en 2D/3D (visages en fil de fer)]. Chaque stimulus est présenté pendant quinze secondes par l’ordinateur, dans un ordre aléatoire, soit statiquement soit dynamiquement. Les résultats montrent que les formes humaines sont perçues comme plus intelligentes que les formes géométriques et que les visages en 3D sont perçus comme plus intelligents que les icônes. Dans une situation de jeu de poker sur écran mettant en scène des interfaces personnifiées sous différentes formes (icône de chien ou icône d’Homme), Koda et Maes (1996) constatent que si, avant la situation de jeu, l’icône de l’animal est perçue comme moins intelligente que celle de l’Homme, aucune différence n’est constatée après la partie. L’attribution de l’intelligence d’une interface « personnifiée » ne se détermine donc pas seulement à partir de son apparence mais aussi par sa compétence déployée lors de l’interaction. En ce qui concerne des traits de sociabilité, Sproull, Subramani, Kiesler, Walker et Waters (1996) ont demandé à des utilisateurs d’interagir via l’ordinateur avec un conseiller en carrière qui est représenté, lors de ses réponses, soit uniquement sous forme de texte écrit affiché à l’écran, soit sous forme de texte audio accompagné d’un visage neutre ou sévère. La forme textuelle écrite obtient un meilleur score de sociabilité, d’attractivité et de sympathie que les modalités avec visage. Inversement, Koda et al. (1996) constatent une plus grande sympathie pour un joueur de poker représenté avec un visage, au-delà de ces attributs (sexe : homme contre femme ; degré de personnification : animal contre Homme ; réalisme : représentation schématique contre réaliste) que pour la condition sans visage (homme invisible).
6Si, dans la majorité de ces études, l’interface humanisée obtient des attributions sociales plus positives, cet effet n’est cependant pas généralisable. Ainsi, l’expérience de Sproull et al. (1996) montre que dans un contexte particulier (situation de recherche d’emploi et traduction par l’interface personnifiée d’émotions non chaleureuses) l’interface avec visage laisse à l’utilisateur une impression plus désagréable qu’une interface non personnifiée.
I . 2 . B. Interface personnifiée et score d’attention et de persévérance
7Peu de travaux expérimentaux sont disponibles sur l’étude des effets de la personnification des interfaces sur le score de persévérance des utilisateurs. Takeuchi et Naito (1995) ont étudié, dans une situation virtuelle de jeu de cartes, les contacts visuels et les temps de réaction des joueurs en faisant varier deux formats de présentation de l’agent logiciel (une flèche en 3D contre un visage synthétique en 3D). La condition avec visage permettait de traduire des expressions faciales en lien avec la situation des joueurs (ex. visage heureux ou visage triste). Les résultats montrent que la condition avec visage augmente les contacts visuels et le temps de réaction des joueurs (i.e. retourner la carte). La flèche est jugée comme un outil sérieux et utile ; l’interface faciale, comme plus amusante et plus divertissante. Les auteurs concluent que les sujets essaient d’interpréter les visages, ce qui diminue leur concentration sur le jeu. Cependant, le faible nombre de sujets (n = 7) n’autorise pas la généralisation des résultats. De plus, l’allongement des temps de réaction peut simplement résulter de la prise en compte d’informations sur le visage estimées utiles au jeu. Walker, Sproull et Subramani (1994) ont aussi montré qu’un visage plus émotionnel (visage triste contre visage neutre) engage plus l’utilisateur dans l’interaction. De même, Koda et al. (1996), dans la partie de poker, montrent que les interfaces personnifiées aident les utilisateurs à s’engager dans la tâche. Dans le domaine de l’apprentissage, Van Mulken, André et Muller (1998) ont réalisé deux protocoles. Le premier est une leçon sur ordinateur qui montre les divers composants de différents systèmes de poulies. Les descriptions, distribuées sous forme audio, sont accompagnées de schémas qui sont visualisés soit à l’aide d’une interface personnifiée qui montre du doigt les composants exposés, soit à l’aide d’une flèche. Suite à la présentation initiale, on pose des questions de compréhension et de résolution de problèmes sur les conséquences dynamiques et la cybernétique d’un système donné. Dans le second protocole, on présente aux sujets des photographies avec des noms, des professions et des numéros de bureau d’employés fictifs. Ces informations sont présentées soit par une flèche, soit par une interface personnifiée. En phase de rappel, les sujets disposent des photographies en indice. Ils doivent indiquer le nom, la profession et le numéro de bureau de la personne représentée. Les auteurs ne constatent pas de différence, dans le niveau de distraction de l’utilisateur, entre le format de dialogue par flèches et celui par interface personnifiée. Au contraire, les utilisateurs estiment que l’interface personnifiée leur permet davantage de se concentrer que la flèche. Le niveau d’attention des utilisateurs a aussi fait l’objet d’une évaluation par Sproull et al. (1996). Dans l’expérience d’interaction avec un conseiller à distance (condition texte écrit contre condition texte audio avec visage neutre ou sévère), les sujets doivent répondre à de nombreux items d’un test psychologique (estime de soi). L’augmentation du temps de réponse aux questions du test et la faiblesse du nombre d’items omis mesurent le degré d’élaboration et d’attention des sujets. Les conditions texte audio avec visage obtiennent des temps significativement supérieurs (effet de facilitation sociale selon les auteurs) à celui de la condition texte écrit. Sproull et al. (1996) constatent aussi que, dans les conditions avec visage, les participants font une description d’eux-mêmes plus valorisée socialement. Pour autant, il est difficile de conclure que les conditions avec visage augmentent réellement le niveau d’attention car les sujets oublient moins d’items avec la condition texte. On ne constate aucune différence de scores sur les échelles d’estime de soi entre ces trois conditions.
8Les divers résultats obtenus de l’effet de la personnification d’interface sur le degré de persévérance et d’attention des sujets sont donc très mitigés. De plus, ces études abordent des dimensions à la fois imprécises et différentes (degré d’attention, niveau de concentration, temps de réponse, estimation subjective, etc.) sur des contextes divers (jeu de cartes, situation d’apprentissage, conseils professionnels, etc.) qui rendent les résultats difficilement comparables.
I . 2 . C. Quelle synthèse retenir des résultats des études comparatives ?
9L’ensemble de ces recherches a le mérite de comparer différentes interfaces à partir d’une même application. Au regard des résultats, il est cependant difficile d’extraire des généralités sur la pertinence des interfaces personnifiées dans la relation Homme-Machine. Les résultats sont contradictoires et s’expliquent, en partie, par l’utilisation d’un matériel expérimental différent : caractéristiques de personnification variées (icône contre dessin en 2D contre visage numérisé en 3D, etc.), non-intégration dans l’analyse des caractéristiques du contexte social d’interaction, utilisation de protocoles différents (« absence de visage » contre « visage schématique » ou « absence de visage » contre « visage réel », etc.), de variables indépendantes souvent confondues et de variables dépendantes non homogènes (« de satisfaction » contre « de persévérance » contre « de performance », etc.). L’ensemble de ces différences méthodologiques constitue de réels obstacles pour se forger une idée exacte du rôle des interfaces personnifiées dans l’interaction Homme-Machine (Dehn & Van Mulken, 2000). De plus, les travaux actuels sur les interfaces personnifiées ne permettent pas d’expliquer les résultats obtenus : il manque une explication théorique aux constats des études empiriques et expérimentales.
I . 3. COMMENT EXPLIQUER LES EFFETS DE L’INTERFACE PERSONNIFIÉE ?
10Si l’on opère un parallèle avec les travaux « classiques » de psychologie sociale, l’influence d’une présence humaine a été largement étudiée sous l’angle de la « facilitation sociale » : le rendement personnel s’améliore en présence d’observateurs ou de co-participants (Allport, 1920 ; Travis, 1925 ; Tripplet, 1898), mais il se détériore pour des tâches complexes car la personne appréhende d’être évaluée (Cottrell, Wack, Sekerak, & Rittle, 1968 ; Dashiell, 1930 ; Pessin & Husband, 1933 ; Zajonc, 1965).
11Si l’interface personnifiée permet une facilitation sociale, c’est qu’il existerait à la base un mécanisme d’identification et de comparaison sociale : l’ordinateur deviendrait aux yeux de l’utilisateur un agent quasi humain susceptible de reproduire (partiellement du moins) certains mécanismes psychosociaux constatés entre agents humains. Cette perspective, pour intéressante qu’elle soit, pose cependant un certain nombre d’interrogations sur la nature et le fonctionnement de ces processus face à une interface personnifiée (le parallèle d’équivalence parfaite entre « rapports Homme-interface personnifiée » et « rapports interagents humains » reste à démontrer). Cependant, en regard des résultats déjà observés dans la littérature sur les interfaces personnifiées, on peut envisager que le degré de personnification des interfaces agisse comme un élément déterminant dans la persévérance (processus de facilitation sociale). Néanmoins, on peut s’attendre à ce qu’un certain nombre de facteurs modulent les impressions des utilisateurs.
12Un de ces facteurs est bien évidemment relatif aux attributs de l’interface personnifiée. En effet, l’identification sociale et la comparaison sociale à l’égard de l’interface personnifiée ne sont pas seulement dépendantes de la présence d’un visage, mais aussi de son degré de personnification (visage schématique ou réel), de son degré de réalisme (version statique ou dynamique de l’agent personnifié) et de son type de personnification (degré de ressemblance par rapport à l’utilisateur, c’est-à-dire visage de pair ou de non-pair).
13L’autre facteur concerne la variation du « contexte social d’interaction » qui peut avoir un effet sur le processus de comparaison sociale à l’égard de l’interface personnifiée. Lorsque le contexte est abordé dans les recherches traitant de la conception d’agents personnifiés (de Carolis, Pelachaud, Poggi, & de Rosis, 2001 ; Pelachaud, 2000), il permet de décrire les caractéristiques émotionnelles, matérielles, organisationnelles, etc., de la situation sans jamais aborder la variation sociale du contexte (changement du rôle de l’utilisateur). Or cette variation n’est jamais neutre et exerce un ensemble d’effets sur la réalisation de la tâche, l’auto-estimation des sujets et conséquemment sur le comportement et les évaluations des utilisateurs. Si l’on se réfère, là encore, aux travaux en psychologie sociale (Lemaine, 1979), les études montrent que toute personne placée dans une situation évaluative avec des critères objectifs (indicateurs de temps, niveau explicite de réussite aux épreuves, etc.) s’auto-évalue en fonction de ces critères et n’utilise pas la comparaison sociale. Inversement, placée dans une situation évaluative où les critères objectifs ne sont plus prioritaires, le sens subjectif attribué à la situation se construit par l’intermédiaire d’une comparaison sociale avec les personnes possédant des caractéristiques perçues psychologiquement comme suffisamment proches. Si, dans cette situation, la personne a le sentiment d’être jugée négativement, elle a tendance à se démarquer de ceux avec qui elle peut se comparer, pour protéger son image par différentes stratégies (dévalorisation de l’enjeu de la situation, critiques de l’autre pour légitimer son infériorité, etc.). En regard de cette littérature, on peut penser que, face à une tâche d’apprentissage générant un échec permanent, l’utilisateur, devant une interface personnifiée et placé dans une situation :
- disposant de critères objectifs de réussite, ou d’échecs, va percevoir l’interface personnifiée de manière positive (impression de soutien social et facilitation sociale) ;
- où les critères objectifs ne sont plus prioritaires, va utiliser la comparaison sociale pour évaluer la qualité sociale de l’interaction et va dévaloriser l’interface personnifiée (stratégie de différenciation).
II. EXPÉRIENCES
II . 1. EXPÉRIENCE 1
II . 1 . A. Méthode
14Objectif. — L’objectif de cette expérience est de savoir si le temps de persévérance dans la tâche (facilitation sociale) et les formations d’impression (positive contre négative) sont influencés par la personnification des interfaces et le contexte social d’interaction.
15Matériel. — Le matériel expérimental concerne un cours d’initiation à la musique. L’écran de l’ordinateur est divisé en trois fenêtres distinctes (schéma 1). Pour la séquence d’apprentissage, deux fenêtres informatives, situées dans la moitié gauche de l’écran, placées l’une au-dessus de l’autre, correspondent à la leçon (solfège rythmique). Elles présentent, en cinq écrans, les bases théoriques d’une leçon musicale avec du texte (partie haute) et des illustrations graphiques et sonores (partie basse). Différents thèmes sont abordés (note de référence, pulsation, succession de notes, division du temps, etc.). Les outils de navigation sont très simples. Le sujet peut revenir sur l’ensemble des écrans sans limite de temps. Lorsque le participant estime avoir suffisamment consulté la leçon, il clique sur une croix qui ferme la partie « leçon » et active la partie « exercices ». Le participant est alors sollicité pour reconnaître des extraits de rythme à partir de différentes portées musicales.
Fenêtres de l’application lors de la leçon (à gauche) et des exercices (à droite)
Music lesson (on the left) and practical exercice (on the right)
16Cette partie débute avec une page sous forme textuelle qui présente la démarche à suivre pour réaliser les exercices. Ces exercices ont été pré-testés par 33 participants [étudiant(e)s de licence de psychologie, tous novices en solfège rythmique, âge moyen 22,5 ; 50 % femmes] pour obtenir un niveau de succès respectif d’environ 100 % (exercice 1), 75 % (exercice 2) et 50 % (exercice 3). L’exercice 4 est très difficile (10 % de succès moyen) et l’exercice 5 impossible à résoudre. Lors de la réalisation des exercices, selon l’exactitude de la réponse, l’interface affiche soit des commentaires à valence positive pour l’encourager, soit des commentaires à valence négative pour le mettre en garde et susciter sa vigilance. La valence de ces dialogues de renforcement a été pré-testée par 27 participants [étudiant(e)s de DEUG de psychologie, âge moyen 21,6 ; 50 % femmes] sur une échelle en 11 points (de « 1 », très négatif, à « 11 », très positif). Nous avons retenu les propositions les plus représentatives des valences positives (n = 7 ; M > 8,5) et négatives (n = 14 ; M < 3) avec un écart type faible. Lorsque le sujet estime qu’il n’arrive plus à réaliser les exercices, il clique sur un bouton « abandon » qui ferme l’application.
17Participants. — 120 étudiants de DEUG (âge moyen : 21,43 ans) répartis dans huit groupes différents (n = 15) ont participé à cette étude (80 % de femmes). Ils étaient tous volontaires et récompensés par un bon d’expérience. Tous les participants sont novices en musique. Leur niveau de compétence a été évalué par un questionnaire (23 questions à QCM d’une valeur de 1 point chacun) spécifiquement réalisé par un professeur de musique. Les questions abordent différents thèmes de théorie (comme la connaissance des notes de musique, la notion de pulsation, etc.) et de pratique musicale (savoir jouer d’un instrument à l’oreille). Ce questionnaire a permis de ne retenir pour l’expérience que les participants dont la note globale était inférieure ou égale à 2. Nous avons écarté tous les participants ayant une pratique musicale « empirique ». La constitution des groupes respecte un équilibre entre les scores des participants au pré-test pour éviter des capacités d’apprentissage différentes entre groupes (M = 0,98 ; SD = 0,32) et répartit équitablement, selon le sexe, les participants entre les groupes.
18Protocole de passation, modalités d’interaction ordinateur-participant et contexte social de passation. — La passation s’effectue individuellement dans un box équipé d’un ordinateur. L’expérimentateur présente verbalement les deux phases de l’expérience (leçon et exercices), montre sur un écran de démonstration les icônes de navigation du logiciel, s’assure de leur compréhension par le participant en lui demandant d’effectuer divers exercices de base (passer à la page suivante, revenir en arrière, etc.), rappelle aux participants qu’il s’agit d’une expérience sur l’interaction Homme-Machine sans limite de temps et se retire du box. La présentation de la leçon est toujours identique.
19La partie « exercices » présente des modalités d’interaction différentes. Quatre conditions expérimentales ont été réalisées pour permettre à l’ordinateur de dialoguer sous forme de commentaires : C1 (interface uniquement textuelle), C2 (interface uniquement audio), C3 (interface audio + visage schématique statique) et C4 (interface audio + visage schématique dynamique). Les conditions audio présentent une voix humaine enregistrée avec des tonalités correspondant aux valences des messages (négatif ou positif). Les conditions « avec visage schématique » (statique et dynamique) manifestent des expressions émotionnelles négatives ou positives correspondant à la valence des commentaires. Le visage neutre constitue toujours le point de retour après la présentation d’une émotion faciale (cf. schéma 2).
Les représentations schématiques des visages (de gauche à droite : expressions neutre, négative et positive)
Iconised expressions (from left to right : neutral, negative and positive)
20Parallèlement à ces différentes modalités d’interaction, les participants sont, par effet de consigne, soit répartis dans une condition :
- avec une tâche à enjeu endocentré : leur propre prestation fait l’objet d’une évaluation par le système avec des critères objectifs de temps et de niveau de complexité dans la réalisation des exercices ;
- avec une tâche à enjeu exocentré : leur rôle est de réaliser une évaluation sur la qualité de l’application, à partir de l’impression générale qu’ils se forgent lors de l’interaction. Cette condition place l’utilisateur dans une situation ambiguë produite par le conflit de rôles : du statut initial d’évaluateur, il se retrouve dans un contexte évaluatif qui fragilise son image de soi par des échecs permanents.
21Mesures. — Deux catégories de mesures ont été réalisées. Une première catégorie a été enregistrée automatiquement par l’ordinateur pendant la passation, comme le temps passé sur la leçon, le nombre d’erreurs par niveau de complexité des exercices, le temps passé sur les exercices après la 1re erreur. Cette dernière mesure permet de quantifier, suite à l’apparition d’un premier échec, le temps de persévérance du sujet dans la tâche. Une seconde série de mesures est relative à l’évaluation par l’utilisateur de l’interaction avec l’interface réalisée à l’aide d’un questionnaire (échelles en 6 points). Dans les items [1] qui composent le questionnaire, quatre questions concernent la perception de la gêne relationnelle avec l’ordinateur (sentiment d’énervement, de relation déplaisante, perturbante et difficile), quatre sont relatives à un jugement social de l’interface (sympathique, complice, conviviale, attachante) et quatre portent sur l’effet de soutien social de l’interface dans la motivation à poursuivre (rassurante, encourageante, stimulante, engageante).
II . 1 . B. Principaux résultats
22Corrélations interitems et test d’homogénéité. — Pour s’assurer de la cohérence des relations entre les différentes questions d’évaluation, nous avons réalisé une matrice de corrélations par sous-dimensions (cf. tableau 1). Pour les évaluations des items indiquant un sentiment de gêne sociale lors de l’interaction, seules la perception énervante et déplaisante, la perception énervante et perturbante et la perception déplaisante et perturbante sont assez bien corrélées. La perception de la difficulté obtient des corrélations assez faibles avec ces différents items. Les items du sentiment général d’estime sociale de l’interface sont assez bien corrélés entre eux, de même que ceux relevant du sentiment de soutien social.
Matrice de corrélations entre les items des sous-dimensions (expérience 1)
Matrix of correlations between dimensions items (experiment 1)
23N = 120. Seuils de significativité des corrélations : *** p < .001, ** p < .01, * p < .05.
24Tous les items des sous-dimensions ont fait l’objet d’une analyse psychométrique. Le coefficient d’homogénéité (Alpha de Cronbach) a été calculé à partir des réponses des participants. En tenant compte du nombre limité des items, la consistance interne par sous-dimension est relativement satisfaisante (sous-dimension 1 : α = .61 ; sous-dimension 2 : α = .76 ; sous-dimension 3 : α = .81). Les items par sous-dimensions sont donc suffisamment homogènes pour contribuer à la mesure d’un même facteur de jugement positif contre négatif pour chaque sous-dimension (score composite du sentiment général de gêne sociale ; score composite du sentiment général d’estime sociale et score composite du sentiment général de soutien social).
25Analyse du score de persévérance et des évaluations subjectives. — Le plan 4 (personnification de l’interface : C1 contre C2 contre C3 contre C4) × 2 (contexte social de passation : avec enjeu endocentré contre exocentré) a été traité par analyse de variance. Certaines analyses ont été réalisées par agrégation de conditions (« sans visage », C1 et C2, contre « avec visage », C3 et C4).
26Score de persévérance. — Le temps passé sur la partie « leçon » (temps d’apprentissage) et l’analyse des erreurs [2] sur les quatre premiers niveaux de complexité des exercices ne font pas apparaître de différence significative entre les conditions expérimentales (n.s.).
Temps passé sur la leçon et nombre moyen d’erreurs des quatre premiers exercices selon les conditions expérimentales (expérience 1)
Time spent by participants on the lesson and the mean of mistakes for the four exercises undertaken under all experimental conditions (experiment 1)
27Par contre, le temps passé par les participants dans la réalisation des exercices suite à la première erreur montre des différences significatives selon la personnification de l’interface [F(1;116) = 11,07 ; p < .001]. Les participants « avec des visages schématiques » [M = 480,0 ; SD = 261,05] ont passé plus de temps après la première erreur que les participants dans les conditions « sans visage » [M = 322,3 ; SD = 255,04]. Ce temps de persévérance est largement imputable au temps passé sur le 5e exercice (impossible à résoudre) puisque le temps de progression au sein des différents niveaux de complexité des exercices n’est pas significativement influencé par les différentes modalités d’interaction.
28Aucun effet du contexte social de passation n’est trouvé, ni aucun effet d’interaction. Les tests post-hoc (test de Tukey) ne montrent pas de différence de persévérance entre la condition textuelle C1 et la condition audio C2 (M = 294 contre 350,5 ; n.s.) ou entre la condition visage statique C3 et la condition visage dynamique C4 (M = 525, 8 contre 434,2 ; n.s.).
29Évaluation de la relation avec l’interface. — Nous avons tout d’abord effectué une analyse multivariée sur l’ensemble des 12 items. L’analyse ne révèle aucun effet simple du facteur degré de personnification et aucun effet simple du contexte social de passation. On note un effet d’interaction entre le facteur personnification de l’interface et le facteur contexte social de passation sur l’ensemble des variables dépendantes (F(12;104) = 3,15 ; p < .001). Dans le but de mieux comprendre comment interagissent ces facteurs sur le jugement positif/négatif des participants, nous avons, en regard des résultats de la Manova et des résultats précédents (cf. coefficient d’homogénéité), calculé des anova avec, comme facteurs dépendants, les différents scores composites.
30On note un effet d’interaction entre le facteur personnification de l’interface et le contexte social de passation pour le sentiment général de gêne sociale [F(1;116) = 4,38 ; p < .03], d’estime sociale [F(1;116) = 13,69 ; p < .0001] et de soutien social [F(1;116) = 2,86 ; p < .05]. Les tests post-hoc de Tukey [3] montrent que, dans le contexte avec enjeu exocentré, les conditions avec des visages schématiques sont évaluées comme plus gênantes (M = 3,25 contre 2,30 ; p < .01), font l’objet d’une estime sociale plus faible (M = 1,90 contre 2,85 ; p < .05) et sont perçues comme offrant moins de soutien social (M = 2,70 contre 3,30 ; p < .03) que les interfaces non personnifiées. Inversement, dans un contexte avec enjeu endocentré, les conditions « avec des visages schématiques » sont évaluées comme moins gênantes (M = 1,80 contre 3,93 ; p < .001), font l’objet d’attributions sociales plus positives (M = 3,37 contre 1,43 ; p < .001) et procurent un sentiment plus important de soutien social (M = 3,05 contre 1,75 ; p < .01) que les interfaces non personnifiées. Les tests post-hoc de Tukey ne révèlent aucune différence de perception sur ces trois sous-dimensions entre les conditions « sans visage » (textuel contre audio) et entre les conditions « avec visage » (statique contre dynamique).
Évaluation de l’interface selon la personnification de l’interface et le type de contexte social de passation (expérience 1)
Participants’ evaluations of the interface according to the degree of the humanization of the interface and the kind of social context of interaction (experiment 1)
II . 1 . C. Discussion
31Cette étude a été principalement conçue pour tester l’influence de la personnification d’une interface et de la variation du contexte social sur le score de persévérance des participants et sur la formation de leurs impressions. Deux points méritent d’être soulignés.
32Tout d’abord, les résultats montrent, dans la réalisation d’une tâche complexe, une influence de la personnification des interfaces sur le temps de persévérance. Les conditions « avec visage schématique » obtiennent des temps de réalisation d’exercices significativement plus importants que les conditions « sans visage ». Ces résultats corroborent les diverses mesures de persévérance des utilisateurs face à une interface personnifiée mentionnées dans la littérature (Koda et al., 1996 ; Oren et al., 1990 ; Takeuchi et al., 1995 ; Walker et al., 1994 ; etc.). On peut penser qu’avec la présence de visages schématiques la personnification renforcée de l’ordinateur augmente le processus d’identification entre l’utilisateur et la machine. L’effet de facilitation sociale obtenu (augmentation du temps de persévérance) est alors certainement imputable à la volonté des utilisateurs de se présenter de manière positive face à une interface qui leur « ressemble » (Sproull et al., 1996). On n’obtient pas, contrairement aux résultats de la littérature faisant référence à des situations de co-présence humaine (Bond & Titus, 1983 ; Guerin, 1986 ; Zajonc & Sales, 1966 ; etc.), la crainte sur une tâche complexe d’être jugée négativement qui nuit à la persévérance dans la tâche. Ce résultat illustre la non-comparabilité intrinsèque entre le rapport « Homme-Homme » et « Homme-Machine ». Contrairement aussi à ce que nous aurions pu attendre sur la base de travaux antérieurs (King & Ohya, 1996), l’animation dynamique du visage schématique n’implique pas plus les participants que la présentation statique.
33En termes de formation d’impressions, nous ne trouvons pas systématiquement de valorisation positive en faveur des interfaces personnifiées. Les perceptions sont dépendantes du contexte social de passation utilisé. Ce résultat infirme le postulat d’amélioration inconditionnelle de l’interaction Homme-Machine par la conception d’interface personnifiée (Koda et al., 1996 ; Tamir et al., 1991, etc.). Il montre la fluctuation de perception sociale illustrée dans la littérature par la divergence de résultats entre différentes études selon les caractéristiques du contexte social d’interaction Homme-Machine (Koda et al., 1996, contre Sproull et al., 1996). Dans le contexte avec enjeu endocentré, l’interface personnifiée apparaît comme peu gênante, fait l’objet d’une estime sociale importante et procure un sentiment de soutien social (on retrouve des résultats conformes à ceux d’un grand nombre d’études : Parise et al., 1996 ; Thórisson, 1996 ; etc.). Inversement, dans le contexte avec enjeu exocentré, l’interface personnifiée est perçue comme plutôt socialement gênante, comme peu valorisée socialement et ne fournit pas une impression de soutien social. On peut penser que cette situation génère à la fois un sentiment de frustration (réaction négative au conflit de rôles) et une mise en infériorité des utilisateurs. L’ambigu ïté de la situation sociale et l’identification plus importante envers les interfaces avec visage schématique entraîneraient un processus de comparaison sociale qui tend à dévaloriser l’interface personnifiée.
34Si, comme nous le supposons, les formations d’impressions négatives pour la situation avec enjeu exocentré résultent bien d’un processus de comparaison sociale, nous devrions vérifier, par une seconde expérience, que l’augmentation du réalisme des traits humains confirme cette hypothèse.
II . 2. EXPÉRIENCE 2
II . 2 . A. Méthode
35Objectif. — L’objectif de cette expérience est de savoir si le temps de persévérance dans la tâche et surtout les formations d’impressions (positives ou négatives selon le contexte social de passation) à l’égard de l’interface personnifiée résultent d’un processus d’identification et de comparaison sociale dépendant du degré de réalisme des traits personnifiés. Nous avons donc réalisé une interface personnifiée avec un visage réel.
36Méthode. — Dans cette expérience, le protocole, la tâche à réaliser et les variables de mesure sont identiques à celles de l’expérience 1.
37Participants. — 60 étudiants de DEUG et de licence (âge moyen 22,54 ans), répartis dans 6 groupes différents (n = 10) ont participé à cette étude (70 % de femmes). Tous les participants sont novices en musique (pré-test M = 0,58 ; SD = 0,29).
38Modalités d’interaction ordinateur-participant et contexte social de passation. — La présentation de la leçon est toujours identique. Pour la partie « exercices », nous avons réalisé une nouvelle condition d’interface personnifiée qui montre le “ visage réel d’un homme d’âge mûr (environ 50 ans) ” présenté selon une modalité uniquement statique. Les séquences visuelles statiques du visage réel présentent (comme pour le visage schématique de l’expérience 1) des émotions positives ou négatives qui correspondent à la valence des commentaires. Nous avons repris de la première expérience la condition « sans visage audio » et la condition « visage schématique statique ». La voix des dialogues est la même pour toutes les conditions. Les participants sont toujours, par effet de consigne, soit répartis dans une condition avec enjeu endocentré, soit dans une condition avec enjeu exocentré.
II . 2 . B. Principaux résultats
39Le plan 3 (degré de personnification : absence de visage contre visage schématique contre visage réel) × 2 (contexte social de passation : enjeu endocentré contre enjeu exocentré) a été traité par analyse de variance.
40Persévérance dans la tâche. — Le temps passé sur la partie « leçon » (temps d’apprentissage) et le nombre moyen des erreurs selon le niveau de complexité des exercices ne sont pas significativement différents pour toutes les conditions (n.s.). Par contre, pour la partie « exercices » (temps passé par les participants dans la partie application suite à la première erreur), les résultats montrent un effet simple du degré de personnification. Aucun effet simple du contexte social de passation, ni d’interaction n’est trouvé.
41L’effet simple de la variable degré de personnification (F(2;54) = 8,82 ; p < .0001) révèle que la condition avec le visage réel obtient respectivement un meilleur score de persévérance que les conditions avec le visage schématique et sans visage [visage réel M = 695,10 (SD = 302,34) contre visage schématique M = 556,82 (SD = 287,62) contre absence de visage M = 423,50 (SD = 277,06)]. Le test post-hoc de Tukey indique une différence significative de temps de persévérance entre la condition « sans visage » et la condition « avec visage schématique » (p < .05) et « avec visage réel » (p < .0001). On constate seulement un effet tendanciel entre la condition du visage schématique et celle du visage réel (p < .06).
42Évaluation de la relation avec l’interface. — Nous avons tout d’abord effectué une analyse multivariée sur l’ensemble des 12 items. L’analyse révèle un effet simple du degré de personnification (F(22;44) = 2,27 ; p < .01) et un effet d’interaction entre le facteur degré de personnification et le facteur contexte social de passation (F(22;44) = 2,11 ; p < .01) sur l’ensemble des variables dépendantes. Dans le but de mieux comprendre comment interagissent ces facteurs sur le jugement positif/négatif des participants, nous avons, là aussi, calculé des anova sur les différents scores composites.
43L’analyse révèle un effet simple du degré de personnification de l’interface sur le sentiment de gêne sociale [F(2;54) = 6,35 ; p < .001], sur l’évaluation de l’estime sociale de l’interface [F(2;54) = 3,62 ; p < .05] et sur le sentiment de soutien social généré par l’interface [F(2;54) = 5,12 ; p < .005]. Les présentations avec un visage schématique et réel apparaissent aux participants comme moins gênantes socialement et comme plus estimées socialement que la présentation sans visage. Elles engendrent aussi plus chez les participants un sentiment de soutien social (cf. tableau no 4). On ne constate pas d’effet simple du contexte social de passation sur l’ensemble de ces évaluations.
Évaluation de l’interface selon la personnification de l’interface (expérience 2)
Participants’ evaluations of the interface according to the degree of the humanization of the interface (experiment 2)
44On note un effet d’interaction entre le facteur « degré de personnification » et le facteur « contexte social de passation » sur le sentiment de gêne [F(2;54) = 4,25 ; p < .01], sur l’attribution d’estime sociale [F(2;54) = 3,28 ; p < .05] et un effet tendanciel sur le sentiment de soutien social généré par l’interface [F(2;54) = 2,51 ; p < .1].
45Les tests post-hoc de Tukey montrent que, dans la situation avec « enjeu endocentré », la relation avec les interfaces ne présentant aucun visage est perçue comme plus gênante qu’un visage schématique [M = 3,8 contre 1,6 ; p < .01] ou qu’un visage réel [M = 3,8 contre 1,7 ; p < .01]. Elle fait aussi l’objet de moins d’attributions sociales positives que la condition présentant un visage schématique [M = 1,3 contre 3,45 ; p < .001] et que celle présentant un visage réel [M = 1,3 contre 3,15 ; p < .01]. Elle génère une impression de soutien social moins importante que l’interface avec le visage schématique [M = 1,5 contre 3,30 ; p < .05]. Pour la perception du soutien social, on remarque seulement un effet tendanciel entre la condition sans visage et la condition avec le visage réel [respectivement : M = 1,5 contre 3,10 ; p < .1]. Aucune différence de perception n’est constatée entre les conditions avec visage schématique ou avec visage réel sur ces trois types d’évaluation.
46Inversement, pour la situation avec enjeu exocentré, l’interface ne présentant aucun visage est perçue comme moins gênante que celle avec un visage schématique [M = 2,1 contre 3,1 ; p < .05] ou que celle avec un visage réel [M = 2,1 contre 3,2 ; p < .05]. Elle fait aussi l’objet d’une estime sociale plus importante que la présentation avec un visage schématique [M = 2,7 contre 1,6 ; p < .05] ou que la présentation avec un visage réel [M = 2,7 contre 1,75 ; p < .05]. Si, pour le sentiment de soutien social, on constate un effet tendanciel entre les conditions « sans visage » et « visage réel » [M = 3,5 contre 2,5 ; p < .1], on ne relève par contre aucun effet entre les conditions « sans visage » et « visage schématique » [M = 3,5 contre 2,9 ; n.s.]. Aucune différence de perception n’est constatée entre les conditions avec visage schématique et avec visage réel sur ces trois types d’évaluation.
Évaluation de l’interface selon le degré de personnification et le type de contexte social de passation (expérience 2)
Participants’ evaluations of the interface according to the degree of the humanization of the interface and the kind of social context of interaction (experiment 2)
47Aucune interaction de second ordre n’est trouvée.
II . 2 . C. Discussion
48Cette étude a été principalement conçue pour tester l’influence du degré de réalisme de la personnification de l’interface et du contexte social de passation sur le score de persévérance et sur la formation des impressions des participants. Les résultats confirment :
491 / Un effet du degré de réalisme de la personnification de l’interface sur le temps de persévérance dans la tâche, et ce, indépendamment du contexte social de passation. Plus l’interface est composée d’attributs humains réalistes, plus elle implique. Ces résultats confirment, dans notre protocole, un processus d’identification renforcé par le réalisme des traits humains et son impact en termes de facilitation sociale. Dans la littérature, différents auteurs ont souligné cet effet. Néanmoins, leurs protocoles sont difficilement comparables puisque les analyses portent en grande majorité sur des « impressions d’engagement » de la part des utilisateurs (Koda et al., 1996) et pas sur des scores réels de temps d’engagement. Les études comparatives de temps réel, lorsqu’elles existent, mesurent uniquement le temps d’attention entre une condition « avec visage » contre une condition « sans visage » (Sproull et al., 1996 ; Walker et al., 1994, etc.). Elles ne font pas intervenir différents niveaux de réalisme de visage.
502 / Un effet d’interaction entre le degré de personnification et le contexte social de passation (id., expérience 1) sur les formations d’impressions à l’égard des interfaces personnifiées. Les interfaces personnifiées (avec visage schématique et avec visage réel) ne font pas l’objet des mêmes valences d’attributions sociales selon le contexte social de passation. Cependant, on ne constate pas de différence de perception sociale entre les deux types d’interface personnifiée (schématique contre réel). Contrairement à nos attentes, dans les contextes avec enjeu endocentré et avec enjeu exocentré, l’interface avec un visage réel ne fait respectivement l’objet ni d’évaluations plus positives ni d’évaluations plus négatives que l’interface avec un visage schématique. L’hypothèse d’un processus de comparaison sociale de l’interface à partir du réalisme des traits humains n’est donc pas confirmée. Il est possible que les traits matures du visage présenté n’évoquent pas chez les utilisateurs des caractéristiques perçues psychologiquement comme suffisamment proches pour servir de base à un processus de comparaison sociale différent de celui qu’ils produisent déjà avec le visage schématique.
51Nous avons donc voulu vérifier, par une troisième expérience, si ce processus de comparaison sociale peut être augmenté à l’aide de traits de visage réaliste pouvant évoquer une identification personnelle plus importante avec les utilisateurs.
II . 3. EXPÉRIENCE 3
II . 3 . A. Méthode
52Objectif. — L’objectif de cette expérience est de savoir si le temps de persévérance dans la tâche et les formations d’impressions (positives ou négatives selon le contexte social de passation) à l’égard de l’interface personnifiée résultent d’un processus de comparaison sociale dépendant d’une proximité des traits personnifiés de l’interface avec ceux des participants. Nous avons donc réalisé des interfaces personnifiées avec des visages réels représentant un pair (visage jeune ressemblant aux participants) et un non-pair (visage plus âgé). Pour augmenter le réalisme des interfaces, nous avons réintroduit la modalité dynamique pour reproduire les différents états émotionnels. Dans cette expérience, le protocole, la tâche à réaliser et les variables de mesure sont identiques à celles des expériences 1 et 2.
53Participants. — 80 étudiants de DEUG, de licence et de maîtrise (âge moyen 23,46 ans), répartis dans 6 groupes différents, ont participé (n = 15 ; 62 % de femmes). Tous les participants sont novices en musique (pré-test M = 0,64 ; SD = 0,21).
54Modalités d’interaction ordinateur-participant et contexte social de passation. — La présentation de la leçon est toujours identique. Pour la partie « exercices », nous avons réalisé trois nouvelles interfaces personnifiées qui montrent le “ visage réel d’un homme jeune (environ 25 ans) » présenté selon deux modalités (statique contre dynamique), et une autre interface personnifiée qui montre le même visage réel de l’expérience 2 mais présenté aussi selon une modalité dynamique. La voix enregistrée des dialogues est toujours la même pour toutes les conditions, et les participants sont toujours, par effet de consigne, répartis soit dans une condition avec enjeu endocentré, soit dans une condition avec enjeu exocentré.
II . 3 . B. Principaux résultats
55Le plan 2 (type de personnification réelle : visage réel jeune contre visage réel âgé) × 2 (modalité de présentation : statique contre dynamique) × 2 (contexte social de passation : enjeu endocentré contre enjeu exocentré) a été traité par analyse de variance.
56Persévérance dans la tâche. — Le temps passé sur la partie « leçon » (temps d’apprentissage) et le nombre moyen des erreurs selon le niveau de complexité des exercices sont identiques pour toutes les conditions (n.s.). Pour le temps passé sur les exercices (temps après la 1re erreur), les résultats montrent un effet du facteur « modalité de présentation » (F(1;72) = 4,90 ; p < .05), un effet tendanciel du facteur « type de personnification réelle » (F(1;72) = 3,21 ; p < .1) et un effet tendanciel de l’interaction entre le type de personnification réelle et le contexte social de passation (F(1;72) = 2,79 ; p < .1). Aucun effet simple du contexte social de passation n’est trouvé.
57L’effet simple de la variable modalité de présentation révèle que la présentation dynamique des visages augmente le temps passé sur les exercices [modalité dynamique M = 787,95 (SD = 314,49) contre statique M = 637,25 (SD = 294,31)]. L’effet tendanciel du type de personnification réelle indique que les visages réels pairs favorisent plus la persévérance que les visages non pairs [visage pair M = 730,10 (SD = 324,24) contre visage non pair M = 695,10 (SD = 302,31)]. Enfin, pour l’effet d’interaction entre les facteurs « type de personnification réelle » et « contexte social de passation », les tests post-hoc [4] (Tukey) montrent que, dans la condition avec enjeu endocentré, les visages pairs impliquent plus les participants que les visages non pairs (M = 786,65 contre 637,85 ; p < .05) ; alors que, pour la condition avec enjeu exocentré, aucune différence significative n’est trouvée entre la condition visage pair et visage non pair (M = 673,55 contre 752,35 ; n.s.).
Temps de persévérance (en secondes) dans la tâche selon le degré de personnification et le type de contexte social de passation (expérience 3)
Time spent on each task (in sec.) according to the degree of the humanization of the interface and the kind of social context of interaction (experiment 3)
58Évaluation de la relation avec l’interface. — Nous avons, là encore, effectué une analyse multivariée sur l’ensemble des 12 items. L’analyse révèle un effet tendanciel du type de personnification réelle (F(11;62) = 1,85 ; p < .1), aucun effet simple du contexte social de passation, ni du facteur modalité de présentation, et un effet d’interaction entre le facteur type de personnification réelle et le facteur contexte social de passation (F(11;62) = 3,07 ; p < .01) sur l’ensemble des variables dépendantes. Aucun autre effet d’interaction n’est obtenu. Dans le but de mieux comprendre comment interagissent ces facteurs sur le jugement positif/négatif des participants, nous avons, là aussi, calculé des anova sur les différents scores composites.
59L’analyse révèle un seul effet simple de la modalité de présentation sur l’évaluation du soutien social [F(1;72) = 4,51 ; p < .01]. Les présentations dynamiques des visages réels entraînent chez les participants le sentiment d’être socialement plus soutenus que les présentations avec les visages statiques [condition dynamique M = 3,40 (SD = 0,77) contre condition statique M = 2,92 (SD = 0,86)]. On constate un effet du type de personnification réelle pour l’évaluation de la gêne sociale portée à l’encontre de l’interface [F(1;72) = 3,32 ; p < .05]. Les présentations avec un visage de pair font l’objet d’un plus grand sentiment de gêne sociale [condition visage réel pair M = 2,77 (SD = 0,98) contre visage réel non pair M = 2,42 (SD = 0,99)]. L’analyse montre aussi un effet d’interaction entre le facteur type de personnification réelle et le facteur contexte social de passation pour les trois dimensions évaluées : sentiment de gêne sociale [F(1;72) = 4,51 ; p < .05], d’estime sociale [F(1;72) = 6,05 ; p < .01] et de soutien social [F(1;72) = 2,81 ; p < .03].
60Les tests post-hoc de Tukey montrent que, dans la situation avec enjeu exocentré, la relation avec les interfaces présentant un visage de pair est perçue comme plus gênante qu’un visage de non-pair [M = 3,65 contre 3,0 ; p < .05]. Elle est aussi moins estimée socialement que la condition présentant un visage réel non pair [M = 1,75 contre 2,15 ; p < .05]. Pour la perception du soutien social, on remarque seulement un effet tendanciel entre la condition « visage réel pair » et la condition « visage réel non pair » [respectivement : M = 2,5 contre 2,75 ; p < .1].
61Pour la situation avec enjeu endocentré, on ne note pas de différence selon le type de visage (pair contre non-pair, respectivement : M = 1,9 contre 1,85 ; n.s.) pour la perception de la gêne sociale. Par contre, l’interface présentant un visage de pair fait l’objet d’une estime sociale plus importante que l’interface avec un visage réel non pair (M = 3,75 contre 3,05 ; p < .05) et elle est aussi perçue comme procurant un meilleur soutien social (M = 3,65 contre 2,95 ; p < .01).
Évaluation de l’interface selon le type de personnification réelle et le type de contexte social de passation (expérience 3)
Participants’ evaluations of the interface according to the degree of the humanization and the kind of social context of interaction (experiment 3)
62Aucune interaction de second ordre n’est trouvée.
II . 3 . C. Discussion
63Cette étude a été principalement conçue pour tester l’influence du type de personnification réelle et du contexte social de passation sur le score de persévérance et sur la formation des impressions des participants. Les résultats confirment :
641 / Un effet du degré du type de personnification réelle de l’interface sur le temps de persévérance dans la tâche, et ce indépendamment du contexte social de passation. Plus l’interface est composée d’attributs humains réalistes proches des participants, plus elle semble engageante. On peut supposer que le visage présentant une personne réaliste d’âge mûr peut plus évoquer l’ « autorité » et, de ce fait, moins engager les utilisateurs, peut-être, plus inquiets de l’évaluation qui est faite d’eux.
652 / Un effet d’interaction entre le type de personnification réelle et le contexte social de passation sur les formations d’impressions à l’égard des interfaces personnifiées. Dans les deux contextes de passation, les types d’interface personnifiée (pair contre non-pair) font l’objet d’attributions sociales différentes. Dans un contexte avec enjeu endocentré, l’interface personnifiée présentant un non-pair n’apparaît pas plus gênante, mais elle fait l’objet d’une plus faible estime sociale et procure un sentiment de soutien social moins important que les interfaces avec un visage de pair. On retrouve ici des formations d’impressions qui peuvent évoquer la perception dissymétrique des rapports sociaux entre l’image de l’enseignant (véhiculée par le visage de non-pair) et le statut de l’étudiant. Au contraire, l’image du visage de pair crée un sentiment de plus forte proximité sociale avec une impression générale plus favorable. Inversement, dans le contexte avec enjeu exocentré, l’interface personnifiée d’un visage pair est perçue comme plus gênante et comme peu estimée socialement. Dans une situation ambiguë générant une menace identitaire par des échecs permanents, le visage de pair permettrait une identification encore plus forte avec l’interface. Le sentiment de malaise procuré par cette situation semble conduire l’utilisateur à se « démarquer » très fortement de cette identification en dévalorisant l’enjeu de la situation et en dégradant la perception de l’interface.
66L’ensemble des résultats semble confirmer un processus de comparaison sociale qui se renforcerait plus sur des traits du visage ouvrant des possibilités d’identification (i. e. un visage réel de jeune pour des jeunes) que seulement sur le simple réalisme des traits (visage réel).
III. DISCUSSION GÉNÉRALE
67L’objectif général de ces études était de mieux connaître l’influence des interfaces personnifiées sur la persévérance réelle des utilisateurs et sur leurs perceptions lors de l’interaction. À cet effet, plusieurs variables ont été manipulées comme le degré de personnification, le type de personnification réelle, la modalité de présentation des visages et le contexte social d’interaction pour tenter de combler les manques actuels des travaux existants. Au terme des résultats des trois expériences, que peut-on conclure ?
68Tout d’abord, les comportements de persévérance des utilisateurs sont bien influencés par le degré de personnification des interfaces. On retrouve l’effet de facilitation sociale largement évoquée dans la littérature (Oren et al., 1990 ; Sproull et al., 1996 ; Walker et al., 1994). Il semble bien se produire un processus d’identification sociale (Takeuchi et al., 1993 ; etc.) à l’égard de l’interface personnifiée qui augmente la persévérance de l’utilisateur. L’accroissement de proximité sociale entre l’utilisateur et l’ordinateur favoriserait alors un engagement plus important accordé à la fois à la machine et à la tâche. Ce processus ne semble pas générer une appréhension de l’évaluation, même pour la réalisation d’une tâche complexe : la machine « rendue plus humaine » reste in fine une machine. La facilitation sociale est beaucoup moins favorisée par la modalité de présentation puisque l’impact d’une présentation animée par rapport à une présentation statique n’intervient dans nos expériences que pour les conditions présentant un visage réel. Ce résultat est difficilement comparable avec celui d’autres études (King et al., 1996 ; Takeuchi et al., 1995 ; etc.) puisque les protocoles n’ont pas comparé systématiquement l’apport de l’animation au sein d’interfaces personnifiées identiques.
69En ce qui concerne la formation d’impressions sociales, le processus d’identification et de comparaison sociale de l’utilisateur avec une interface personnifiée semblerait créer chez les utilisateurs une modification de leurs perceptions. Ce processus s’opérerait, déjà, à partir de formes rudimentaires de personnification (dans nos expériences, le visage schématique) qui permettraient de distinguer des manières d’agir et de penser spécifiques de la part de l’utilisateur entre une interface matérielle et une interface personnifiée schématique. Cependant, les résultats des expériences 2 et 3 semblent montrer que le renforcement de ce processus initial s’opérerait moins à partir du réalisme des traits du visage (schématique contre réel) que des caractéristiques du visage (jeune contre âgé). Ainsi, dans l’expérience 3, les traits liés à la jeunesse favorisent des points d’ancrage à des mécanismes d’identification personnelle. Le processus d’identification se consoliderait à partir de caractéristiques de personnification des interfaces perçues psychologiquement comme les plus proches par l’utilisateur. Les éléments de renfort à l’identification pourraient de ce fait être multiples et variés selon les caractéristiques personnelles des utilisateurs. Il est important toutefois de noter que l’identification plus importante vis-à-vis du visage jeune peut aussi être imputable à d’autres facteurs que nos expériences n’ont pas suffisamment contrôlés comme l’attractivité supérieure, en termes absolus, du visage jeune. De plus, le sexe du personnage de l’interface (uniquement masculin) peut avoir des incidences sur les impressions des participants dont le facteur sexe lui-même n’est pas totalement équilibré (60 % de femmes et 40 % d’hommes).
70On notera aussi que la valence des attributions portées à l’égard des interfaces personnifiées n’est pas absolue mais qu’elle est fortement dépendante du contexte social d’interaction. Dans nos expériences, la modification du contexte social de passation entraîne des attributions sociales fortement contrastées sur des interfaces personnifiées pourtant identiques. Dans un contexte de réalisation de tâches d’apprentissage et d’exercices avec des critères objectifs, les résultats montrent, conformément à la littérature, que l’interface personnifiée procure un sentiment de confort, de relation plus chaleureuse et de soutien aux utilisateurs (Maes, 1995 ; Nass et al., 1994 ; Thórisson, 1996 ; etc.). Elle est alors, et ce quel que soit le degré de personnification de ses attributs, considérée comme un tuteur pertinent. Cependant, il suffit que les caractéristiques de la situation sociale se transforment (situation évaluative plus ambiguë) pour que les perceptions changent de valence. D’attributions positives portées à l’égard de l’interface personnifiée, on passe alors à des attributions négatives. Plus que l’interface personnifiée en soi, c’est avant tout l’interface personnifiée dans son contexte social qui fait l’objet d’une évaluation sociale. Ces résultats pourraient expliquer, du moins en partie, certaines divergences d’attribution sociale relevées dans la littérature (cf. Sproull et al., 1996). Des approfondissements dans cette perspective pourraient apporter de nouveaux éléments de réflexion utiles au développement des interfaces personnifiées. Ces aspects suggèrent la fécondité d’une approche croisée entre psychologie ergonomique, psychologie sociale et conception informatique.
71Quelle opérationnalisation suggère ces résultats ? Tout d’abord, que l’interface personnifiée constitue un moyen efficace pour stimuler la persévérance dans la tâche des utilisateurs. Notre étude montre aussi que plus les caractéristiques de l’interface personnifiée sont réalistes (dynamisme, traits réalistes, etc.) et présentent des traits proches de l’utilisateur (visage pair), plus l’engagement apparaît important. De ce point de vue, les interfaces personnifiées ne peuvent que favoriser une meilleure persévérance lors de l’utilisation de logiciels divers (éducation, travail, jeux, etc.). Cependant, les impressions des utilisateurs face à l’interface personnifiée sont fortement dépendantes du contexte social d’interaction. Si le travail, la performance ou les aptitudes et capacités particulières, etc., de l’utilisateur sont évalués avec des critères objectifs, l’interface personnifiée est perçue comme un important soutien social. Inversement, si la situation, pour une raison ou une autre, devient ambiguë ou qu’elle fait référence explicitement à des jugements, à des opinions ou à des aptitudes qui ne peuvent être évaluées de manière catégorique (cf. logiciels de conseil, d’accompagnement personnel, voire d’aide à la décision dans des domaines difficilement formalisables et empreints de valeurs sociales), l’interface personnalisée est perçue comme très gênante socialement, et ce d’autant plus qu’elle présente des traits de ressemblance physique importants avec l’utilisateur. La situation paradoxale (dissonance) qui naît alors entre persévérance réelle et perception négative peut à terme, si elle se répète, se révéler contre-productive. Au niveau opérationnel, ces constats suggèrent de proposer à l’utilisateur, avant la réalisation de la tâche, différentes interfaces personnifiées pour choisir celles qui lui ressemblent le plus et celles qui lui ressemblent le moins. La connaissance de ce choix et du type de situation sociale (critères objectifs contre critères subjectifs) dans lequel va se trouver l’utilisateur permettrait de configurer l’interface personnifiée qui générera soit le plus d’adéquation, soit le moins de dissonance entre persévérance dans la tâche et perception de la qualité de l’interaction Homme-Machine.
72Manuscrit reçu : avril 2002.
Accepté par V. Grosjean, É. Raufaste, A. Giboin
après modification : mars 2003.
Bibliographie
BIBLIOGRAPHIE
- Agawa, H., Xu, G., Nagashim, Y., & Kishino, F. (1990). Image analysis for face modeling and facial image reconstruction. Paper presented at the 5th SPIE : Visual Communications and Image Processing. Lausanne, Suisse, October.
- Allport, F. M. (1920). The influence of the group upon association and thought. Journal of Experimental Psychology, 3, 159-182.
- Badler, N. I., Phillips, C. B., & Webber, B. L. (1993). Simulating Humans : Computer Graphics, Animation, and Control. Oxford : Oxford University Press.
- Bates, J. (1994). The role of emotion in believable agents. Communications of the ACM, 37, 122-125.
- Ball, G., Ling, D., Kurlander, D., Miller, J., Pugh, D., Skelly, T., Stankosky, A., Thiel, D., Van Dantzich, M., & Wax, T. (1996). Lifelike computer characters : The persona project at Microsoft Research. In J. Bradshaw (Ed.), Software Agents (pp. 191-222). Cambridge, MA : The MIT Press.
- Blumberg, B. (1994). Action selection in Hamsterdam : Lessons from ethology. Paper presented at the 3rd International Conference on the Simulation of Adaptive Behavior. Brighton, UK, July.
- Bond, C. F. (1982). Social facilitation : A self presentational view. Journal of Personality and Social Psychology, 42, 1042-1050.
- Bond, C. F., & Titus, L. J. (1983). Social Facilitation : A meta-analysis of 241 studies. Psychological Bulletin, 94, 265-292.
- Choi, S. C., Aizawa, K., Harashima H., & Tsuyoshi, T. (1994). Analysis and synthesis of facial image sequences in model-based image coding. IEEE Transactions on Circuits and Systems for Video Technology, 4, 257-275.
- Cottrell, N. B., Wack, D. L., Sekerak, G. J., & Rittle, R. M. (1968). Social facilitation of dominant responses by the presence of an audience and the mere presence of others. Journal of Personality and Social Psychology, 9, 245-250.
- Dashiell, J. F. (1930). An experimental analysis of some group effects. Journal of Abnormal and Social Psychology, 25, 190-199.
- Dehn, D. M., & Van Mulken, S. (2000). The impact of animated interface agents : A review of empirical research. Journal of Human-Computer Studies, 52, 1-22.
- Carolis (de), B., Pelachaud, C., Poggi, I., & de Rosis, F. (2001). Behavior Planning for a Reflexive Agent. Paper presented at the International Joint Conference on Artificial Intelligence. Seattle, WA, August.
- Elliott, C. (1994). Multi-Media communication with emotion-driven « Believable Agents ». Paper presented in Working Notes for the AAAI Spring Symposium on Believable Agents (American Association for Artificial Intelligence). Stanford, CA, March.
- Elliott, C., Rickel, J., & Lester, J. C. (1997). Integrating affective computer into animated tutoring agents. Paper presented at International Joint Conference on Artificial Intelligence – Workshop on Animated Interface Agents. Nagoya, Japan, September.
- Guerin, B. (1986). Mere presence effects in humans : A review. Journal of Personality and Social Psychology, 22, 38-77.
- King, W. J., & Ohya, J. (1996). The representation of agents : Anthropomorphism, agency, and intelligence. Paper presented at CHI ’96 Conference Companion of Human Factors in Computing System. Vancouver, British Columbia, Canada, August.
- Koda, T., & Maes, P. (1996). Agents with faces : The effect of personification. In Tania, K. (Ed.), Proceedings of the 5th IEEE International Workshop on Robot and Human Communication (pp. 189-194). Piscataway, NJ : IEEE Press.
- Kozierok, R. (1993). A Learning Approach to Knowledge Acquisition for Intelligent Interface Agents. SM Thesis, Department of Electrical Engineering and Computer Science, Massachusetts Institute of Technology, Boston, MA.
- Lashkari, Y., Metral, M., & Maes, P. (1994). Collaborative interface agents. Paper presented at the National Conference of Artificial Intelligence. Seattle, WA, July.
- Laurel, B. (1990). Interface agents : Metaphors with character. In B. Laurel (Ed.), The Art of Human-Computer Interface Design (pp. 355-365). Reading, MA : The MIT Press.
- Lee, Y., Terzopoulos, D., & Waters, K. (1995). Realistic modeling for facial animation. Proceedings of SIGGRAPH’95 Conference (pp. 55-62). Los Angeles, CA : The ACM Press.
- Lemaine, G. (1979). Différenciation sociale et originalité. In W. Doise (Éd.), Expérience entre groupes (pp. 185-222). Paris : Mouton.
- Maes, P. (1995). Intelligent software. Scientific American, 273, 84-86.
- Morishima, S., Aizawa, K., & Harashima, H. (1990). A real-time facial action image synthesis system driven by speech and text. Paper presented at the 5th SPIE : Visual Communications and Image Processing. Lausanne, Suisse, October.
- Nass, C., Steur, J., & Tauber, E. R. (1994). Computers as social actors. In B. Adelson, S. Dumais, & J. Olsen (Eds.), Human Factors in Computing Systems : CHI’94 Conference Proceedings (pp. 72-77). New York, NJ : The ACM Press.
- Oren, T., Salomon, G., Kreitman, A., & Don, A. (1990). Guides : Characterizing the interface. In B. Laurel (Ed.), The Art of Human-computer Interface Design (pp. 367-381). Reading, MA : Addison-Wesley.
- Parise, S., Kiesler, S., Sproull, L., & Waters, K. (1996). My partner is a real dog : Cooperation with social agents. In M. S. Ackerman (Ed.), Proceedings of the Computer Supported Cooperative Work (pp. 399-408). Boston, MA : ACM.
- Pelachaud, C. (2000). Contextually embodied agents. In N. Magnerat-Thalmann & D. Thalmann (Eds.), Deformable Avatars (pp. 98-108). Geneva, Switzerland : Kluwer Academic Publishers.
- Pessin, J., & Husband, R. W. (1933). Effects of social simulation on human maze learning, Journal of Abnormal and Social Psychology, 28, 148-154.
- Rickel, J., & Johnson., W. L. (1997). Steve : An animated pedagogical agent for procedural training in virtual environments. Paper presented at International Joint Conference on Artificial Intelligence – Workshop on Animated Interface Agents. Nagoya, Japan, August.
- Shneiderman, B. (1995). Looking for the bright side of user interface agents, Interaction, 2, 13-15.
- Sheth, B. (1994). A Learning Approach to Personal Information Filtering. Master’s Thesis. Massachusetts Institute of Technology, Boston, MA.
- Sproull, L., Subramani, M., Kiesler, S., Walker, J. H., & Waters, K. (1996). When the interface is a face. Human Computer Interaction, 11, 125-156.
- Takeuchi, A., & Nagao, T. (1993). Communicative facial displays as a new conversational modality. Paper presented at the SIGCHI Conference on Human Factors in Computing Systems. Amsterdam, The Netherlands, April.
- Takeuchi, A., & Naito, T. (1995). Situated facial displays : Toward social interaction. In I. Katz, R. Mack, L. Marks, M. B. Rosson, & J. Nielsen (Eds.), Proceedings of Human Factors in Computing System (pp. 450-454). Reading, MA : Addison-Wesley.
- Tamir, P., & Zohar, A. (1991). Anthropomorphism and teleology in reasoning about biological phenomena, Science Education, 75, 57-67.
- Thórisson, K. (1996). Communicative Humanoids : A Computational Model of Psychosocial Dialogue Skills. Ph.D. Thesis, Program in Media Arts and Sciences. Massachusetts Institute of Technology, Boston, MA.
- Travis, L. E. (1925). The effect of a small audience upon eye-hand coordination, Journal of Abnormal and Social Psychology, 20, 142-146.
- Triplett, N. (1898). The dynamogenic factors in pacemaking and competition, American Journal of Psychology, 9, 507-533.
- Van Mulken, S., André, E., & Muller, J. (1998). The persona effect : How substantial is it ? In H. Johnson, L. Nigay, & C. Roast (Eds.), People and Computers, XIII : Proceedings of HCI’98 (pp. 53-66). Berlin : Springer.
- Vilhjalmsson, H., & Cassell, J. (1998). BodyChat : Autonomous communicative behaviors in avatars. Paper presented at ACM Second International Conference on Autonomous Agents. Minneapolis, MN, May.
- Walker, J. H., Sproull, L., & Subramani, R. (1994). Using a human face in an interface. In B. Adelson, S. Dumais, & J. Olson (Eds.), Proceedings CHI’94, Conference of Human Factors in Computing Systems (pp. 85-91). Reading, MA : Addison–Wesley.
- Zajonc, R. B. (1965). Social facilitation, Science, 149, 269-274.
- Zajonc, R. B., & Sales, S. M. (1966). Social facilitation of dominant and subordinate responses. Journal of Experimental Social Psychology, 2, 160-168.
Mots-clés éditeurs : Agents logiciels, Qualité sociale de l'interaction, Interfaces personnifiées, Persévérance dans la tâche
Notes
-
[1]
Les items sélectionnés pour cette évaluation ont été pré-testés parmi un questionnaire de 21 items qui permettait à des sujets (population étudiante de licence de psychologie, 50 % de femmes, âge moyen : 21,78) d’identifier, sur une échelle en 5 points, les termes les plus pertinents pour évaluer les caractéristiques d’une interaction avec une interface d’un cours multimédia. Nous avons retenu les 12 items parmi ceux ayant obtenu les plus fortes moyennes (M > 3,75).
-
[2]
Le nombre moyen d’erreurs par conditions expérimentales est directement relié au temps d’exécution, puisque plus le sujet fait des erreurs sur un niveau de complexité, plus son temps sur ce niveau augmente.
-
[3]
Ces tests post-hoc ont été réalisés par agrégation du facteur « type de personnification » (absence de visage contre visage schématique) et « contexte social de passation » (avec enjeu endocentré contre exocentré) pour former un plan à quatre conditions.
-
[4]
Les tests post-hoc ont été réalisés par agrégation du facteur « type de personnification réelle » (visage réel jeune contre visage réel âgé) et « contexte social de passation » (avec enjeu endocentré contre exocentré) pour former un plan à quatre conditions : C1 (visage réel pair endocentré), C2 (visage réel pair exocentré), C3 (visage réel non pair endocentré) et C4 (visage réel non pair exocentré).