Couverture de TL_082

Article de revue

Maillons forts et maillons faibles d’une chaîne de coréférence : une proposition de typologie issue d’une étude contrastive français-hongrois

Pages 101 à 127

Notes

  • [1]
    Ce travail a été réalisé dans le cadre du projet Democrat (ANR-15-CE38-0008). En plus des deux relecteurs anonymes, les auteurs remercient l’ensemble des participants de ce projet et notamment ceux qui étaient présents à la journée d’étude « Approches contrastives des chaînes de référence ».
  • [2]
    Le syntagme défini le Dabe, qui apparaît ici dans la construction dit le Dabe, dont le rôle est d’attribuer un surnom à un personnage déjà identifié par son nom propre, est sujet à discussion. De fait, il sert à caractériser le référent plutôt qu’à y référer, et on pourrait donc ne pas l’inclure dans la chaîne de coréférence relative à Ferdinand Maréchal. Au-delà de l’illustration de la démarche contrastive avec la comparaison de [5] et [6], l’argument que nous avons retenu ici est son rôle de réactivation de la référence.
  • [3]
    Les énoncés [9b] et [11], tirés du texte hongrois, comportent en effet un sujet zéro associé à un verbe conjugué.
  • [4]
    Nous remercions l’un des deux relecteurs anonymes pour cette suggestion.
  • [5]
    Avec une intonation et une accentuation neutres, le sujet et le COD préverbaux sont interprétés comme topiques non-contrastifs dans les versions hongroises ([32ab]. Toutefois, comme le signale l’un des lecteurs anonymes de cet article, ces expressions pourraient également être prononcées avec une prosodie de topique contrastif ou de focus. Étant donné que nos locuteurs ont dû évaluer ces exemples sous une forme écrite et sans indications contextuelles, ils ont sans doute attribué le rôle de topique par défaut au constituant préverbal de ces énoncés hongrois.
  • [6]
    Notons que les pronoms clitiques en français pourraient également, dans une perspective synchronique, être considérés comme des maillons faibles, tandis que les pronoms toniques resteraient dans la catégorie des maillons forts. D’un point de vue diachronique, on peut noter qu’ils sont à l’origine des maillons forts, et que le passage de l’un à l’autre s’est fait progressivement. Nous reléguons dans nos perspectives de recherche la mise en œuvre d’études qui pourraient étayer ce point de vue.

1 – Introduction [1]

1 L’objectif de cet article est d’établir une typologie des moyens d’accès aux référents et d’examiner les différentes stratégies que le lecteur peut mettre en œuvre pour identifier une chaîne de coréférence dans un discours particulier. Nous nous appuyons pour cela sur une étude contrastive français-hongrois des phénomènes référentiels – formes de référence, ambiguïtés – et de leurs implications syntaxiques, sémantiques, discursives et pragmatiques.

2 Dans cette étude, nous employons le terme référent dans le sens de ‘référent de discours’ (Karttunen, 1976 ; Lambrecht, 1994), désignant tout objet de discours individualisé : humains, objets concrets, objets abstraits, propriétés, événements, lieux, dates ou états de choses. Nous entendons par expression référentielle une expression désignant un référent de discours (Kleiber, 1981 ; Corblin, 1987 ; Charolles, 2002). Nous définissons l’anaphore ou relation anaphorique comme la relation entre une expression référentielle et une expression dans le contexte antérieur, son antécédent, qu’elle reprend et réactive (Corblin, 1995 ; Cornish, 1999 ; Kleiber et al., 1997). Notre étude a spécifiquement pour objet les relations anaphoriques qui permettent d’établir une chaîne de coréférence, c’est-à-dire « une suite d’expressions d’un texte entre lesquelles l’interprétation établit une identité de référence » (Corblin, 1995 : 174 – qui emploie le terme équivalent de chaîne de référence). Le terme chaîne (Chastain, 1975 ; Schnedecker, 1997 ; Baumer, 2015 ; Schnedecker et al., 2017) nous amène à parler de maillons pour les expressions référentielles qui la constituent.

3 Mais ces expressions référentielles ne sont pas les seuls outils linguistiques en jeu dans l’établissement des chaînes de coréférence : il existe des moyens pour rappeler l’existence (ou l’activation) d’un référent, sans pour autant y accéder de façon manifeste. Contribuant aux chaînes de coréférence, ces moyens sont des maillons sans constituer de véritables expressions référentielles : à l’instar de Landragin (2011) et de Landragin et Schnedecker (2014), nous sommes amenés à les qualifier de maillons faibles, et à réserver – par opposition – le terme de maillons forts pour les expressions référentielles.

4 En français, ce sont surtout les sujets non exprimés d’infinitifs ou d’impératifs, et diverses ellipses, comme dans les coordinations (il entra et prit son chapeau). Ils s’accompagnent souvent d’indices morphologiques, comme les marques d’accord qui comblent l’absence d’une expression référentielle phonétiquement réalisée. Dans les langues à sujet nul comme le hongrois, le sujet (ou l’objet) pronominal est souvent non exprimé et les traits de nombre et de personne de celui-ci sont marqués au niveau de la désinence du verbe. Faire appartenir à une chaîne de coréférence ces éléments vides ou situés à un niveau inférieur au mot est sujet à discussion : on peut considérer qu’une chaîne ne doit comprendre que les moyens ayant le statut de syntagmes phonétiquement réalisés, mais on peut aussi soutenir que sa constitution s’enrichit si on y intègre tous les aspects liés à l’activation et à la réactivation du référent. D’où le terme de maillon faible que nous utiliserons pour désigner ces indices. En considérant qu’une chaîne comprend à la fois des maillons forts et des maillons faibles, on autorise deux niveaux d’analyse : un niveau exhaustif qui tient compte de tous les moyens que la langue offre à ses locuteurs et un niveau restreint aux seules expressions explicitement constitutives des chaînes de coréférence. Bien entendu, il s’agit là d’une opposition binaire schématique : comme nous le verrons plus loin avec l’analyse de plusieurs exemples, il s’agit vraisemblablement plutôt d’un continuum, chaque maillon se plaçant à un certain endroit dans ce continuum. Opposer ainsi maillons forts et maillons faibles permet en fait de faire un premier pas vers une démarche d’annotation de corpus : s’il est difficile d’annoter des phénomènes s’articulant autour d’un continuum, il s’avère en revanche bien plus facile de les faire rentrer dans deux cases – quitte à forcer un peu.

5 Pour continuer avec les maillons faibles, notons qu’en dehors des cas cités plus haut, on repère aussi toute une série d’indices syntaxiques, sémantiques et discursifs, qui sont des indices interprétatifs dans la mesure où ils permettent d’identifier les chaînes de coréférence dans un discours particulier en cas d’ambiguïté référentielle, c’est-à-dire lorsqu’une expression référentielle peut être intégrée alternativement dans plusieurs chaînes de coréférence dans un même discours. Le fonctionnement de ces indices est probablement influencé par des principes universels (cognitifs et fonctionnels) de cohérence (Hobbs, 1979), ainsi que par les traits typologiques spécifiques à chaque langue.

6 Pour mieux appréhender la nature et le fonctionnement de ces moyens, nous avons choisi deux langues typologiquement éloignées : le français et le hongrois. L’hypothèse que nous testerons sur ces deux langues est que les catégories de maillons faibles sont probablement plus variables d’une langue à l’autre que celles des maillons forts, et que cette variabilité dépend avant tout de la richesse morphologique de la langue en question. Cet article propose une première série d’observations qui suivent cette approche et qui permettent d’aborder l’étude des chaînes de référence avec un nouvel angle contrastif, dont la pertinence devra bien entendu être confirmée par la mise en œuvre d’autres travaux similaires. Plus que cela, l’approche contrastive fait ressortir des phénomènes de grammaticalisation et permet de mettre en avant des catégories de maillons faibles et d’indices interprétatifs qui, autrement, risqueraient de passer inaperçus. Nous chercherons donc à proposer une typologie détaillée des maillons faibles incluant les indices interprétatifs qui permettent de désambiguïser les relations anaphoriques. L’établissement de cette typologie permettra d’apporter quelques éclaircissements concernant la question de l’universalité des indices sémantiques et pragmatiques étudiés.

7 Dans la suite de l’article, nous présentons d’abord les différents éléments permettant d’établir la référence, en montrant dans chaque cas les spécificités du français et du hongrois : les expressions référentielles (section 2), les ambiguïtés référentielles (section 3), les maillons identifiés comme faibles (section 4), puis les indices syntaxiques (section 5), sémantiques (section 6) et pragmatiques (section 7) mis en œuvre pour lever les ambiguïtés. Nous discutons ensuite de la typologie des maillons forts et faibles que nous obtenons (section 8). Chaque section ou presque fait appel à la même méthodologie, constituée premièrement de connaissances tirées de la littérature, deuxièmement d’études d’exemples et troisièmement d’une étude pilote sur la référence en français et en hongrois, dont les résultats seront indiqués au fur et à mesure. Enfin, nous concluons et proposons quelques perspectives de recherche.

2 – Formes de référence

8 Prenons tout de suite un exemple de texte court en français et en hongrois, en l’occurrence un résumé du film Le cave se rebiffe (Gilles Grangier, 1961), qui nous servira tout au long de cet article.

[1]
Éric Masson, un « demi-sel », est devenu l’amant de la belle Solange Mideau, femme d’un graveur raté. Éric veut se servir de Robert Mideau pour monter, à son insu, un trafic de fausse monnaie. Il s’associe à Charles Lepicard, tenancier d’une ancienne maison close, et à Lucas Malvoisin, l’homme d’affaires de celui-ci. Charles et Lucas n’ont pas grande confiance en Éric, mais Solange leur promet son concours. Elle souhaite en effet mener la grande vie. Avec l’accord de ses complices, Charles contacte Ferdinand Maréchal, dit le Dabe, vieux truand célèbre qui s’est retiré dans une île des Tropiques. Il le décide à venir à Paris.
[2]
Éric Masson, egy kétes ügyletekkel foglalkozó alak a szép Solange Mideau szeretője lett, aki egy kisiklott életű vésnök felesége. Éric fel akarja használni Robert Mideau-t, hogy a tudta nélkül hamispénz-ügyletekbe kezdjen. Összeáll Charles Lepicard-ral, egy nyilvánosház tulajdonosával és Lucas Malvoisin-nel, aki annak üzleti ügyeit intézi. Charles és Lucas nem bíznak túlságosan Éric-ben, de Solange megígéri, hogy segít nekik. Nagy lábon szeretne ugyanis élni. Cinkosai egyetértésével Charles felveszi a kapcsolatot Ferdinand Maréchal-lal, az « Öreggel », a hírhedt bűnözővel, aki egy trópusi szigeten visszavonulva él. Ráveszi, hogy Párizsba jöjjön. (Notons que nous ne gloserons que les extraits qui feront l’objet d’une étude particulière dans la suite de l’article.)

9 Ce sont les personnages du film – Éric Masson, Solange Mideau, Charles Lepicard, Lucas Malvoisin et Ferdinand Maréchal – qui servent de référents pour la majorité des expressions référentielles apparaissant dans les deux textes. Ces expressions référentielles peuvent être des noms propres (Éric Masson, Solange Mideau, etc.), des descriptions définies (ses complices), des descriptions indéfinies (un graveur raté), des pronoms personnels (il, elle, leur, le), démonstratifs (celui-ci) ou relatifs (qui), qui s’organisent en chaîne de coréférence pour chaque référent. Quelques-unes de ces chaînes de coréférence sont représentées en [3] et [5] pour le texte français, et en [4] et [6] pour le texte hongrois.

10 On observe dans le texte un certain nombre de différences entre le français et le hongrois sur le plan de l’encodage de ces référents. En hongrois, langue à sujet nul, un pronom sujet ou objet est phonétiquement non exprimé dans la plupart des cas. Dans les équivalents hongrois des chaînes de coréférence comportant en français un pronom sujet ou objet, ces derniers sont remplacés par un élément « vide », et c’est la conjugaison du verbe qui permet de récupérer le référent. En fait, un sujet vide peut apparaître en français aussi ; c’est le cas du sujet zéro du verbe à l’infinitif dans la dernière phrase du texte (cf. [5]) ; cependant, ce cas de figure est moins fréquent.

[3]
Éric Masson > Éric > Il > Éric
[4]
Éric Masson > Éric > ø >Éric[-ben]
Éric[-iness]
[5]
Ferdinand Maréchal > le Dabe [2] > qui > le > ø
[6]
Ferdinand Maréchallal> az « Öreggel »> aki > ø > ø
Fernand Maréchal[-instr] det Vieux[-instr] qui

11 Du point de vue distributionnel, les expressions référentielles « classiques » ont le statut de syntagme ; toutefois, dans les langues indo-européennes, les déterminants possessifs de 3e personne peuvent également participer aux chaînes de coréférence, comme dans la chaîne [7] correspondant au référent Solange Mideau :

[7]
la belle Solange Mideau > Solange > son [concours] > Elle

12 Le caractère pro-drop du hongrois se manifeste ici aussi : le pronom désignant le possesseur est généralement absent et ses traits de nombre et de personne sont marqués par un morphème d’accord sur le nom :

[8]
Charles Lepicard[-ral]> ez utóbbi> [cinkos]a[i] > Charles-ø > ø
Charles Lepicard-instr ce dernier complice-poss.3sg-pl

13 Ce court texte illustre bien l’existence de deux types de maillons participant à une chaîne de coréférence : d’une part les maillons forts, correspondant aux expressions référentielles classiques, ayant le statut de syntagmes phonétiquement réalisés, et d’autre part les maillons faibles, en particulier les sujets vides, mais aussi les éléments inférieurs au syntagme : les morphèmes d’accord et certains morphèmes grammaticaux libres comme les déterminants possessifs du français.

3 – Ambiguïtés référentielles

14 L’identification d’une chaîne de coréférence dans un discours particulier n’est pas toujours aisée, car les textes comportent souvent des ambiguïtés référentielles. Le texte présenté dans la section précédente montre que certains éléments anaphoriques (pronom de 3e personne, déterminant possessif…) peuvent rester ambigus, même en tenant compte des connaissances encyclopédiques d’un lecteur averti :

à son insu / atudtanélkül : Robert Mideau ou
detsavoir-poss.3sgsans
Solange Mideau ?
segítnekik : Charles (sûr) + Lucas (sûr) + Éric (possible).
aider.3Sgdat-3pl
son concours : ambigu entre Solange et Éric ;
ses complices / cinkos-a-i : Lucas (sûr) + Solange (pas si sûr) + complice-poss.3sg-pl
Éric (?).

15 À quoi sont dues ces ambiguïtés ? Une multitude de facteurs peuvent entrer en jeu, aussi bien morphologiques que syntaxiques, sémantiques ou pragmatiques. D’un point de vue morphologique, un pronom personnel de 3e personne (phonétiquement réalisé ou vide) peut être référentiellement associé à n’importe quelle expression référentielle à l’extérieur de sa proposition si leurs traits d’accord le permettent. Comparons le texte français en [9a] avec sa version hongroise en [9b], tirés des textes [1] et [2] :

[9]
a. Charles et Lucas n’ont pas grande confiance en Éric, mais Solange leur promet son concours. Elle souhaite en effet mener la grande vie.
figure im1

16 Dans le texte français, l’antécédent du pronom elle peut être identifié via les traits d’accord en genre qu’il partage avec le nom propre Solange de la phrase précédente. Quant à la version hongroise, la situation change ici, car ce texte est potentiellement ambigu. Le sujet de la dernière phrase est phonétiquement non exprimé, mais ses traits de nombre et de personne peuvent être récupérés sur la base des désinences du verbe indiquant la présence d’un pronom sujet zéro à la 3e personne du singulier (szeret-ne ‘voudrait’). Comme le hongrois ne connaît pas la catégorie morphologique du genre, rien ne permet de décider a priori quel est l’antécédent de ce pronom : Éric ou Solange ? Toutefois, il est très probable que le lecteur hongrois ne perçoit pas cette ambiguïté, car il associe naturellement un sujet vide au sujet de la proposition précédente, Solange (Pléh, 1994, 1998).

4 – Maillons faibles

17 Le hongrois, langue agglutinante, possède toute une série de spécificités qui font que le recours aux maillons forts y est moins fréquent que dans le français. Ces spécificités sont surtout liées au caractère pro-drop du hongrois (Puskás, 2000 ; É. Kiss, 2002), résultant d’une morphologie verbale riche.

18 Un grand nombre de pronoms personnels peuvent être non réalisés ; dans ce cas, les désinences du verbe permettent de récupérer les informations manquantes. En règle générale, un pronom sujet n’est réalisé phonétiquement que s’il est interprété contrastivement (comme topique ou focus contrastif) ou s’il est modifié par les morphèmes is ‘aussi’ ou sem ‘non plus’. Comme la plupart des sujets pronominaux fonctionnent comme des topiques ordinaires, i.e. non contrastifs, on recourt très rarement à un pronom sujet phonétiquement exprimé en hongrois. Cette tendance générale est bien illustrée par le texte [2], où tous les sujets pronominaux sont des sujets zéro [3].

19 Il est à noter que pour la plupart des verbes hongrois conjugués au présent de l’indicatif, l’affixe de 3e personne du singulier est un morphème zéro (cf. lát-ok ‘je vois’, lát-sz ‘tu vois’, lát-ø ‘il/elle voit’). On a donc affaire ici à un maillon faible correspondant à une forme zéro (le suffixe d’accord zéro du verbe) qui permet de récupérer le référent d’un autre élément zéro, celui d’un sujet pronominal. Dans le cas extrême des constructions copulatives au présent, la totalité du verbe (copulatif) peut se réduire à un élément zéro de 3e personne au présent de l’indicatif, comme dans l’exemple [10] ci-dessous :

[10]
Pali kiabál,mertø ideges.
Pali crier.3sgparce queénervé
‘Paul crie, parce qu’il est énervé’

20 Il en va de même pour le pronom objet qui reste également non réalisé en cas d’interprétation non contrastive, comme dans la dernière phrase du texte [2], reproduite ci-dessous en [11].

21 De façon analogue au sujet pronominal zéro, un objet zéro (singulier) peut aussi être récupéré sur la base des affixes de conjugaison du verbe. En effet, le verbe hongrois connaît deux types de conjugaison, la conjugaison indéfinie – appelée aussi conjugaison subjective – et la conjugaison définie – appelée aussi conjugaison objective (Bartos, 1997). La première est employée dans les constructions intransitives ou avec un COD indéfini, la seconde lorsque le verbe transitif se construit avec un COD défini. Étant donné qu’un pronom personnel est nécessairement défini, la présence d’un pronom personnel COD zéro est indiquée par le suffixe de conjugaison définie sur le verbe, qui s’accorde en personne avec le COD :

[11]
ø rávesz-iø, hogyPárizsbajöjjön.
 persuader-3sg-déf3 queParis-illatvenir-subj-3sg
‘Il le décide à venir à Paris’

22 Si le verbe rávesz ‘persuader’ de la proposition principale se construisait avec un objet indéfini, la forme verbale se réduirait au radical, suivant les règles de la conjugaison indéfinie :

[11’]
ø ráveszvalakit,hogyPárizsbajöjjön.
 persuader-3sgquelqu’un-accqueParis-illatvenir-subj-3sg
‘Il décide quelqu’un à venir à Paris’

23 Les caractéristiques décrites plus haut sont également valables pour les pronoms remplaçant un COD indéfini, correspondant au pronom adverbial en du français. Dans ce cas, c’est la conjugaison indéfinie du verbe qui permet de récupérer le pronom zéro :

[12]
– Kér-szkekszet ?
 vouloir-indéf-2sgbiscuit-acc
‘Tu veux des biscuits ?’
– Igen,kér-ek ø.
 ouivouloir-indéf-1sg
‘Oui, j’en veux’

24 Le caractère pro-drop du hongrois se révèle également dans la structure morphologique des pronoms personnels. En effet, les formes non contrastives des pronoms personnels marqués pour le cas sont des formes ‘zéro’ : elles consistent en la combinaison d’un affixe casuel et d’un suffixe d’accord – voir Creissels (2006) pour une présentation du système morphologique du nom et du pronom hongrois –, et la tête pronominale elle-même est élidée. Ainsi, un élément qui est formellement un maillon faible (combinaison de deux unités inférieures au mot) fonctionne ici comme maillon fort (un pronom personnel) sur le plan syntaxique. Comparons à ce titre la forme tonique en [13a] et la forme ‘neutre’ en [13b] :

[13]
  1. ő-vel-e
    lui-avec-3sg
  2. ø-vel-e
    avec-3sg
    ‘avec lui / avec elle’

25 Contrairement au français où le repérage de l’antécédent peut se faire sur la base d’indices de genre et/ou d’indices de proximité (celui-ci, celui-), les indices morphologiques de genre n’existent pas en hongrois. Nous avons vu dans la section précédente (ex. [9a-b]) que l’absence d’opposition de genre peut entraîner l’apparition d’ambiguïtés référentielles en hongrois. En revanche, le locuteur hongrois peut recourir à une opposition de nature « proxémique » entre le pronom personnel ő ‘il’ et le pronom démonstratif az ‘ça’ pour reprendre un antécédent plus éloigné ou un antécédent plus proche, respectivement. Dans le texte [2], on trouve l’emploi d’une forme fléchie (au datif) de ce pronom démonstratif, annak, fonctionnant de façon analogue au pronom celui-ci dans la version française :

[14]
a. Il s’associe à Charles Lepicardi, tenancier d’une ancienne maison close, et à Lucas Malvoisinj, l’hommej d’affaires de celui-cii.
b. Összeáll Charles Lepicard-rali, egy nyilvánosház tulajdonosával és Lucas Malvoisinj-nel, akij annaki üzleti ügyeit intézi.

26 Comme nous l’avons signalé dans la section 2, le hongrois ne possède pas de déterminant possessif ; le possesseur peut être désigné par un pronom personnel ou démonstratif (cf. [14b]), mais ces pronoms sont élidés dans la plupart des cas, conformément aux attentes pour une langue à sujet nul. Comme les relations possessives sont exprimées au moyen d’un suffixe d’accord sur le nom, ce suffixe peut fonctionner comme un indice morphologique (un maillon faible) en l’absence de l’élément pronominal, de façon similaire aux indices de conjugaison apparaissant sur le verbe – voir Kiefer (1985, 2000) pour les difficultés de l’analyse morphologique des constructions possessives du hongrois.

[15]
a.avec l’accord de ses complices
b.cinkos-a-i-nakegyetértés-é-vel
complice-poss3sg-pl-dataccord-poss3sg-instr

27 En hongrois, faute de pronom approprié, non seulement le possesseur, mais aussi l’objet ou individu possédé (ou les deux à la fois) peuvent être exprimés par des suffixes :

[16]
Péter gyerek-e-imár felnőttek,Pál-é-imég kicsik.
Péter enfants-poss3sg-pldéjà adultesPál- poss- plencore petits
Les enfants de Péter sont déjà adultes, ceux de Paul sont encore petits’

28 D’autres spécificités du hongrois concernent le verbe et les indices morphologiques liés à l’aspect verbal et à l’expression de la directionnalité d’un mouvement. Le hongrois emploie en effet une grande variété de préfixes verbaux pour exprimer des informations aspectuelles ou la directionnalité d’un mouvement. Comme le montrent les exemples [17a] et [18a], dans certaines conditions la présence d’un préfixe perfectivisant permet de récupérer un COD zéro et d’établir ainsi une chaîne de coréférence :

[17]
a.MialattMariénekelt,énrajzol-tam.
pendantMarichanter-past.3sgjedessiner-past.1sg
b.Pendant que Marie chantait, je dessinais.
[18]
a.MialattMariénekelt,énle-rajzol-tam ø.
pendantMarichanter-past-3sgjeperf-dessiner-past.1sg
b.Pendant que Marie chantait, je l’ai dessinée.

29 Comme le montrent les exemples ci-dessus, le verbe, conjugué au passé à la 1re personne du singulier, est ambigu entre une conjugaison définie et une conjugaison indéfinie. Il est donc en principe impossible de déterminer si le verbe en [17a] et [18a] a un emploi absolu ou si on doit supposer la présence d’un pronom zéro intégré dans une chaîne de coréférence. Toutefois, l’aspect perfectif en [18a] – exprimé par le préfixe le- du verbe – incite à récupérer un référent, même si le terme qui le dénote n’est pas phonétiquement exprimé. Rien n’empêche donc l’établissement d’une chaîne de coréférence reliant le COD non exprimé du verbe et le nom propre Mari de la phrase précédente. Dans ces cas, le préfixe perfectivisant peut être considéré comme un maillon faible en hongrois, c’est-à-dire un indice morphématique permettant de récupérer un référent, sans le représenter pour autant.

30 Un préfixe verbal peut également être utilisé pour référer à un lieu ou à la cible d’un mouvement (fictif ou physique). Issus d’un élément pronominal ou adverbial par grammaticalisation, les préfixes constituent une catégorie à cheval entre un morphème libre (maillon fort) et un morphème lié (maillon faible). Tel est le cas par exemple de l’adverbe ott ‘là’ qui peut également être employé comme préfixe locatif :

[19]
a.Visszamegyekaz egyetemre : øott-hagytama
retourner-1sgdet université-superlà-laisser-past-1sgdet
kulcsomat ø.
clé-poss.1sg-acc
b.Je retourne à l’université : j’y ai laissé ma clé.

31 En [20], le verbe nézni ‘regarder’ comporte un préfixe (-) qui fonctionne comme un quasi-pronom ; sa forme est identique à celle d’un pronom personnel ‘neutre’ (cf. [13b] ci-dessus).

[20]
a.Aférfiolvasott.Mari-nézett ø.
dethommelire-past.3sgMarisur.3sg-regarder-past.3sg
b.L’homme lisait. Mari l’a regardé.
[21]
a.Agyerekekkiabáltak.Marirá-juknézett.
detenfantscrier-past-3plMarisur.3plregarder-past.3sg
b.Les enfants criaient. Mari les a regardés.

32 Comme le montre É. Kiss (1998), seule la forme correspondant à la 3e personne du singulier a les caractéristiques d’un préfixe, tandis que les autres formes fléchies du paradigme sont en fait des pronoms personnels préverbaux. En effet, en [21a] rájuk n’est pas un préfixe mais un argument du verbe, ce qui est indiqué entre autres par le fait que le verbe ne peut pas se combiner avec un argument explicite marqué par le même cas [22b]. En revanche, rá- en [22a] et [22c] peut être redoublé par un argument – singulier ou pluriel – marqué par le cas sublatif :

[22]
a.Mari-nézettaférfi-ra.
Marisur.3sg-regarder-past.3sgdethomme-subl
‘Mari a regardé l’homme’
b.*Marirájuknézettaférfiak-ra.
Marisur.3sgregarder-past.3sgdethommes-subl
‘Mari a regardé les hommes’
c.Mari-nézettaférfiak-ra.
Marisur.3sg-regarder-past.3sgdethommes-subl
‘Mari a regardé les hommes’

33 Ces asymétries signalent une étape transitoire dans le processus de grammaticalisation des préfixes. En effet, en hongrois coexistent une forme pronominale morphologiquement variable et apte à fonctionner comme maillon fort dans une chaîne de référence et un préfixe locatif invariable qui peut signaler la présence d’un argument locatif zéro et servir ainsi de maillon faible dans une chaîne de coréférence.

34 Attaché au verbe, le préfixe contribue avec celui-ci à la construction d’une unité lexicale. Dans le passage équivalent en français, l’apport sémantique du préfixe hongrois se manifeste souvent sous la forme d’un sème, une composante du sens lexical du verbe. En hongrois, les constructions du type verbe + particule sont fréquentes et productives ; en revanche, en français, on trouve un grand nombre de verbes qui ne sont guère analysables en synchronie. Ainsi, à be-menni ‘entrer’ correspond le plus souvent entrer, dont la formation est assez proche (latin tardif in + *trare sur trans ‘à travers’, cf. Walde, 1910), mais celle-ci est devenue totalement opaque.

35 Considérons [23a] où le verbe bemenni ‘entrer’ comporte un préfixe exprimant l’orientation du déplacement vers l’intérieur d’un lieu. Ce lieu pourrait être exprimé par un complément coréférentiel du locatif a házban ‘dans la maison’ de la phrase précédente. Dans la version française de ce fragment de texte, le verbe entrer ne peut pas être décomposé de cette sorte : face à la forme analytique de bemenni, on trouve une forme synthétique (en synchronie), où c’est le sens lexical du verbe qui implique la présence d’un argument locatif non exprimé :

[23]
a.A házbanégettavillany.
det maison-dansêtre-allumé-past.3sgdetlampe
Be-mentem ø.
dans-aller-past-1sg
b.Dans la maison les lampes étaient allumées. J’entrai.

36 On a donc affaire à un indice morphologique en hongrois, un maillon faible qui permet d’accéder à un référent associé à un argument locatif zéro, complément du verbe bemenni. Il en va de même pour certains verbes de mouvement français comme entrer ou sortir, dont le sens lexical implique un argument locatif qui peut rester implicite. En effet, le contenu lexical d’un verbe de mouvement peut fonctionner en français comme maillon faible au même titre qu’un préfixe locatif en hongrois [4].

37 Les indices morphologiques analysés dans cette section ont pour fonction première de signaler la présence d’un référent de discours, mais ne sont pas toujours suffisants pour orienter le lecteur dans l’identification de ce référent. Pour lever les ambiguïtés référentielles, le lecteur dispose d’un certain nombre d’indices syntaxiques, sémantiques ou pragmatiques. Dans les sections suivantes, nous examinons le fonctionnement de ces indices, sur la base d’une enquête pilote réalisée auprès de 53 locuteurs hongrois et 265 locuteurs français. Nous soulignons que pour l’enquête française, certains locuteurs n’ont répondu qu’à une partie des questions (14 en tout). Par ailleurs, nous avons ajouté une question préliminaire sur la langue maternelle des répondants, et écarté tous les bilingues. Le nombre total de réponses étant de 296, on arrive ainsi à un nombre de réponses retenues plus bas, qui varie d’une question à l’autre (entre 196 et 262, avec une moyenne de 247 réponses).

5 – Indices syntaxiques

38 Sur le plan syntaxique, de même, des différences typologiques importantes séparent le hongrois et le français. Contrairement au français, où la position syntaxique d’un constituant est surtout déterminée par sa fonction grammaticale, le hongrois, langue discours-configurationnelle (É. Kiss, 2002), se caractérise par un ordre des constituants relativement libre, déterminé avant tout par leur statut discursif. En effet, face à l’articulation sujet grammatical – prédicat grammatical de la phrase française, la phrase hongroise se divise généralement en un constituant fonctionnant comme topique (appelé aussi sujet logique, cf. É. Kiss, 2002) et un constituant prédicatif, fonctionnant comme commentaire. Les phrases de ce type comportent une position topique en position initiale, qui peut accueillir n’importe quel argument (référentiel) du verbe fonctionnant comme topique.

39 Quant aux facteurs syntaxiques jouant un rôle dans la résolution des anaphores en cas d’ambiguïté référentielle, les théories psycholinguistiques de la coréférence distinguent trois stratégies qui seraient à l’œuvre dans les langues. Le principe des Fonctions Parallèles (Caramazza et al., 1977) postule une préférence pour la coréférence entre les éléments de fonction identique. Cette stratégie peut être illustrée par [24], tiré du texte [1].

[24]
Charlesi contacte Ferdinand Maréchalj, dit le Dabe, vieux truand célèbre qui s’est retiré dans une île des Tropiques. Ili lej décide à venir à Paris.

40 Ici, l’interprétation la plus naturelle est celle où l’antécédent du pronom sujet il est le nom propre sujet Charles, et l’antécédent du pronom COD le est le COD Ferdinand Maréchal de la phrase précédente. La même stratégie est appliquée dans la version hongroise du texte.

41 Le deuxième principe, celui de la Préférence du Sujet comme Antécédent (Smyth, 1994) postule qu’en cas de concurrence entre plusieurs antécédents potentiels, l’antécédent préféré est le sujet, quelle que soit la fonction grammaticale du terme anaphorique qui le reprend. Une illustration de cette stratégie pourrait être [25], également tiré du texte [1] :

[25]
[Charles et Lucas]i n’ont pas grande confiance en Éric, mais Solange leuri promet son concours.

42 En [25], le pronom leur a deux antécédents possibles : d’une part le GN Charles et Lucas et d’autre part l’union de cette coordination et du nom propre Éric, dénotant un groupe d’individus constitué de Charles, Lucas et Éric (voire Charles et Éric, ou encore Lucas et Éric). Le principe de la Préférence du Sujet comme Antécédent veut toutefois que l’antécédent préféré soit ici le GN coordonné Charles et Lucas.

43 Enfin, selon le principe de la Distance Minimale (Garnham et Oakhill, 1985), l’expression anaphorique tend à prendre comme antécédent le candidat le plus proche. Un exemple possible du fonctionnement de ce principe est le texte hongrois en [9b], analysé dans la section 3 et repris ici [26] :

[26]
Charles és Lucas nem bíznak túlságosan Éric-ben, de Solangei megígéri, hogy segíti nekik. øi nagy lábon szeretnei ugyanis élni.

44 Vu que le hongrois ne connaît pas l’opposition de genre (cf. section 3), le sujet zéro de la deuxième phrase a deux antécédents potentiels, notamment les noms propres Éric et Solange. Suivant le principe de la Distance Minimale, c’est Solange, l’antécédent le plus proche, qui sera sélectionné comme antécédent préférentiel.

45 Si l’on examine le hongrois et le français du point de vue de l’applicabilité de ces trois principes, les expériences de psycholinguistique de Pléh (1994, 1998) montrent qu’en hongrois, c’est le principe de la Préférence du Sujet comme Antécédent qui est pertinent dans la résolution des anaphores si l’expression anaphorique est un pronom zéro. Les résultats de Pléh sont confirmés par nos propres résultats : indépendamment de sa position syntaxique – initiale ou postverbale –, le sujet tend à être sélectionné en hongrois comme antécédent du sujet pronominal vide :

[27]
figure im2
‘La docteure a examiné la petite fille. Elle lui a chuchoté quelque chose’
figure im3
‘La petite fille, la docteure l’a examinée. Elle lui a chuchoté quelque chose’
c. La docteure a examiné la petite fille. Elle lui a chuchoté quelque chose.

46 Si la plupart des locuteurs identifient le sujet comme antécédent du pronom vide pour chacune des configurations en [27], on observe une légère baisse du taux de préférence si le sujet est postverbal [27b], où une majorité des locuteurs hongrois (49/53, soit 84,6 %) a sélectionné le sujet comme antécédent, tandis que la quasi-totalité des locuteurs hongrois (52/53, soit 98,1 %) a opté pour le sujet préverbal comme antécédent privilégié dans le cas de [27a]. Les données semblent indiquer que le référent du sujet de la 1re phrase, quelle que soit la position syntaxique de ce constituant, fonctionne comme un centre de perspective (ou point de vue) à partir duquel est organisée la suite du texte. C’est le maintien de ce centre de perspective qui autorise le choix d’un pronom anaphorique non exprimé dans la phrase suivante. Ceci est d’autant plus surprenant qu’on s’attendrait à ce que le centre de perspective soit le constituant en position topique. Or, comme le montre [27b], cela n’est pas nécessairement le cas.

47 Si l’on veut instaurer un changement de perspective (Tolcsvai-Nagy, 2001), on peut recourir à un pronom démonstratif comme en [28]. Lorsqu’un pronom démonstratif a plusieurs antécédents concurrents, c’est le statut syntaxique de l’antécédent (argument vs. ajout) qui semble déterminer les relations de coréférence en hongrois, bien que ce critère entre quelquefois en conflit avec le principe de la Distance Minimale.

[28]
figure im4

48 Le statut d’antécédent privilégié accordé au sujet se retrouve en français, mais de manière moins nette, d’après les résultats de notre enquête pilote. La phrase [27c] donne lieu préférentiellement à l’interprétation selon laquelle le pronom reprend le sujet la docteure (respectivement 99/203, soit 49 %, 68 % hors indécis), moins que les indécis mais nettement plus que pour l’objet la petite fille (46/203, soit 23 %, 32 % hors indécis). À la différence du hongrois, le français ne permet pas de faire une inversion « simple » du sujet et de l’objet. L’inversion doit être associée à une dislocation, qui entraîne naturellement une mise en relief et une préférence pour l’élément disloqué (cf. [31c-d] plus bas).

49 L’exemple [29a] est issu du corpus d’expériences de Pléh (1994, 1998), que nous avons testé avec des locuteurs hongrois (et avec des locuteurs français pour la version française) :

[29]
figure im5
b. Le client s’est approché du patron avec le vendeur. Celui-ci lui a donné une bonne idée.

50 Suivant le principe de la Distance Minimale, l’antécédent du pronom démonstratif az devrait être le GN a segéddel’avec le vendeur’, fonctionnant comme ajout dans la phrase. Toutefois, seule une minorité des locuteurs hongrois (15/53, soit 28,3 %) a considéré que l’antécédent préféré de az est le constituant le plus proche. Une faible majorité (52,9 %) a opté pour l’argument du verbe (a főnökhöz’au patron’), ce qui semble indiquer que le statut syntaxique de l’antécédent (argument vs. ajout) était un facteur plus puissant que le principe de la Distance Minimale ; enfin, un pourcentage relativement élevé des locuteurs (18,9 %) n’a pas de préférence. Quant à l’antécédent du pronom au datif neki ‘lui’, 60,4 % des locuteurs ont opté pour le sujet de la première phrase (a vevő ‘le client’), 15 % pour le complément du verbe et 5,7 % pour l’ajout.

51 En français, le rôle de celui-ci semble encore plus net. Ainsi, en [29b], le démonstratif est associé au dernier référent cité (le vendeur) par une large majorité de locuteurs (157/258, soit 61 %, et 68 % hors indécis). Cet effet peut encore être renforcé par des effets sémantiques, comme on le verra en [37b].

6 – Indices sémantiques

52 Les expériences psycholinguistiques de Pléh montrent que le rôle thématique des antécédents potentiels, en hongrois, a également une influence sur les préférences des locuteurs. Le rôle privilégié du sujet est pertinent surtout lorsque le verbe exprime une action et que le sujet a le rôle thématique d’agent, comme c’était le cas des exemples précédents. Il semblerait que l’agent, qui est le participant le plus actif ou le plus affecté par l’événement, soit un candidat idéal pour servir d’antécédent pour une reprise anaphorique.

53 Similairement au rôle thématique d’agent, le rôle de sujet d’expérience est associé à un référent hautement affecté par un événement, mais il occupe un rang inférieur à l’agent sur les hiérarchies des rôles thématiques – cf. par exemple les hiérarchies établies par Fillmore (1971) et Grimshaw (1990). C’est aussi un bon candidat, quoique moins favorable que l’agent, pour servir d’antécédent :

[30]
a.Petiharagsz-ikPalira. ønem adneki
Petiêtre fâché-3sgPalira-sublneg donner-3sgdat-3sg
csokoládét.
chocolat-acc
b.Pierre est fâché contre Paul. Il ne lui donne pas de chocolat.

54 Les résultats des expériences de notre enquête pilote confirment que le sujet d’expérience est moins apte à fonctionner comme antécédent d’un pronom personnel anaphorique. Tandis que dans le cas d’un sujet agent préverbal comme [27a], la quasi-totalité des locuteurs hongrois privilégie une chaîne de coréférence reliant le sujet agent au pronom personnel sujet zéro de la proposition suivante, seuls 75,5 % des locuteurs établissent une chaîne de coréférence entre le sujet d’expérience préverbal et le sujet zéro de la phrase suivante en [30a].

55 En français, Pierre a été associé au pronom de la seconde phrase (en [30b]) par une proportion non négligeable de locuteurs (131/261, soit 50 %, 69 % hors indécis).

56 Certains verbes, comme tetszeni / plaire, hiányozni / manquer attribuent le rôle du sujet d’expérience à un complément au datif et non pas au sujet grammatical. Selon les observations de Pléh (1998), s’il est placé en position préverbale, le sujet d’expérience au datif est sélectionné comme antécédent plutôt que le sujet grammatical qui suit le verbe. Aucun des trois principes syntaxiques évoqués ne s’applique donc ici. En revanche, comme le note Pléh, lorsque le sujet d’expérience occupe une position postverbale, le sujet pronominal de la phrase suivante a pour antécédent préférentiel le constituant fonctionnant comme sujet grammatical, en conformité avec le principe des Fonctions Parallèles et avec celui de la Préférence du Sujet comme Antécédent.

57 Nos résultats ne confirment que partiellement ceux de Pléh. En effet, indépendamment de sa position syntaxique, c’est le sujet d’expérience, plutôt que d’autres expressions ou d’autres fonctions syntaxiques comme le sujet, qui a été sélectionné par nos locuteurs comme antécédent préférentiel. La position syntaxique (préverbale vs. postverbale) des constituants influence aussi dans une certaine mesure l’établissement des chaînes de coréférence : placé avant le verbe, le sujet d’expérience au datif préverbal [31a] est un meilleur antécédent qu’en position postverbale [31b] : 86,8 % des locuteurs hongrois ont opté pour le datif préverbal, tandis que 73,6 % ont sélectionné comme antécédent préféré le datif postverbal. En français, l’effet semble moins fort : il y a une préférence pour Pierre en [31c] (117/197, soit 59 %, 85 % hors indécis), qui est également présente mais d’une façon moins nette en [31d] (98/196, soit 50 %, et 64 % hors indécis).

[31]
figure im6
c. Pierre, son fils lui manque beaucoup. Il lui a écrit une lettre récemment.
d. Son fils manque beaucoup à Pierre. Il lui a écrit une lettre récemment.

58 Dans le cas des constructions sans agent ou sujet d’expérience, c’est la fonction grammaticale des arguments qui semble déterminer les rapports de coréférence. Le sujet grammatical a tendance à fonctionner comme antécédent – quoique les jugements soient plus divisés ici – et la position syntaxique du sujet influence aussi les jugements. Ainsi, le sujet de la première phrase en [32a-b] a le rôle d’instrument et le COD le rôle de thème. 79,2 % des locuteurs hongrois sélectionnent quand même le sujet comme antécédent lorsqu’il est préverbal [32a], comparé à 67,9 % lorsque le sujet est postverbal [32b] :

[32]
figure im7
figure im8
c. La clé n’ouvre pas la serrure. Peut-être qu’elle est usée.
d. La serrure, la clé ne l’ouvre pas. Peut-être qu’elle est usée.

59 En français, le sujet est nécessairement préverbal dans une phrase non marquée. En [32c], le sujet est sélectionné comme antécédent par la moitié des locuteurs (128/261, soit 49 %, 80 % hors indécis). En revanche, la topicalisation opérée par la dislocation a un effet assez net [5], puisqu’en [32d] c’est l’objet (la serrure) qui est sélectionné comme antécédent par une majorité de locuteurs (154/260, soit 59 %, 73 % hors indécis).

60 Le contenu lexical du verbe associé à l’antécédent influence aussi le choix entre chaînes de coréférence. Selon Garvey et Caramazza (1974), chaque verbe possède une causalité implicite, déterminée par les rôles thématiques assignés par le verbe (V) à ses arguments et par la fonction cognitive du V. En d’autres termes, le contenu lexical de chaque V détermine le participant le plus important du procès dénoté par le V, et c’est ce participant qui sera responsable de l’événement exprimé par la proposition causale qui suit. On distingue trois types de V du point de vue de la causalité interne : ceux qui, parmi les antécédents potentiels, sélectionnent le sujet (type SN1, par exemple énerver, manquer – NB : les auteurs utilisent NP pour noun phrase, et nous utilisons SN pour syntagme nominal), ceux qui sélectionnent le complément (type SN2, par exemple tuer, critiquer) et ceux qui permettent de sélectionner le sujet aussi bien que le complément (type SNX, par exemple aider, donner). Le caractère potentiellement universel de l’hypothèse de Garvey et Caramazza a été confirmé par les expériences psycholinguistiques de Dankovics (2001, 2005), réalisées auprès de locuteurs hongrois, finlandais et estoniens. Dankovics souligne cependant que la causalité implicite d’un verbe peut être modifiée sous l’influence de certains facteurs.

61 Lors de notre enquête pilote, nous avons testé les verbes idegesíteni / énerver (SN1), kritizálni / critiquer (SN2) et adni / donner (SNX). Nos expériences sur le hongrois confirment les résultats des expériences antérieures. Ainsi, dans le cas de kritizálni / critiquer, une majorité de locuteurs estime que l’antécédent du sujet zéro de la deuxième phrase est plutôt le référent du COD du verbe kritizálni (84,9 % en hongrois, 180/261, soit 69 % en français – 87 % hors indécis) :

[33]
a.PetikritizáltaPalit,mertø hülye.
Peticritiquer-past-3sgPali-accparce queidiot
b.Pierre a critiqué Paul, parce qu’il est idiot.

62 Pour ce qui est de idegesíteni / énerver, une majorité de locuteurs a opté pour une coréférence entre les deux sujets (75,5 % en hongrois, 159/262, soit 61 % en français – 69 % hors indécis), tandis qu’une minorité a établi une chaîne de coréférence reliant le sujet zéro et le COD du verbe idegesíteni (20,8 % en hongrois, 27 % en français – 31 % hors indécis) :

[34]
a.PetiidegesítiPalit,mertø hülye.
Petiénerver-3sgPali-accparce queidiot
b.Pierre énerve Paul, parce qu’il est idiot.

63 Enfin, pour adni / donner, classé parmi les verbes SNX, nos expériences montrent en effet que les deux chaînes de coréférence sont accessibles et que certains facteurs, comme le choix du temps verbal, peuvent modifier les relations anaphoriques :

[35]
a.Peti csokitadottPalinak,mertø rendes.
Peti chocolat-accdonner-past-3sgPali-datparce quegentil
b.Pierre a donné du chocolat à Paul, parce qu’il est gentil.
[36]
a.Peti csokitadottPalinak,mertø rendes
Peti chocolat-accdonner-past-3sgPali-datparce quegentil
volt.
être-past-3sg
b.Pierre a donné du chocolat à Paul, parce qu’il était gentil.
[37]
a. Pierre a offert un livre à Paul parce qu’il est gentil.
b. Pierre a offert un livre à Paul parce qu’il était gentil.

64 Pour [35a], où le prédicat de la deuxième proposition exprime une propriété qui est valable pour le moment d’énonciation, les opinions sont plutôt partagées : 56,6 % des locuteurs ont sélectionné le sujet de donner comme antécédent du pronom sujet zéro de la phrase suivante, contre 30,2 % qui ont favorisé le complément au datif. En revanche, pour [36a], où le prédicat est associé à un événement passé, la grande majorité des locuteurs, soit 79,2 %, a sélectionné le complément au datif comme antécédent.

65 En français, l’effet est semblable, mais l’antécédent privilégié du pronom est déjà l’objet indirect Paul en [37a] (123/258, soit 48 %, 72 % hors indécis), et bien plus nettement encore en [37b] (194/259, soit 75 %, 89 % hors indécis).

66 Par ailleurs, les informations liées aux indices syntaxiques peuvent être annulées par des informations fournies par des indices sémantico-pragmatiques, ce qui suggère que les indices sémantico-pragmatiques sont placés plus haut dans la hiérarchie des indices que les indices syntaxiques. Dans les textes qui relèvent d’un domaine déterminé comme celui de l’éducation, de la santé, de la police, etc., l’appartenance des termes au vocabulaire de ce domaine oriente fortement les interlocuteurs dans le choix entre les antécédents potentiels (Boudreau et Kittredge, 2006).

67 En [29], analysé dans la section 5, le prédicat de la deuxième phrase ne dépend pas d’un domaine spécifique. L’antécédent optimal pour le pronom démonstratif anaphorique est donc le complément sélectionné par le V (a főnökhöz ‘au patron’), conformément à la tendance syntaxique du hongrois : un argument est mieux adapté qu’un ajout pour servir d’antécédent. Inversement, l’antécédent optimal pour le pronom personnel au datif est le sujet de la 1re phrase, conformément au principe de Préférence du Sujet comme Antécédent. L’exemple [38a] ci-dessous, issu de Pléh (1998), est structuralement identique à [29], mais constitué de termes dont la plupart relèvent du domaine des services médicaux :

[38]
figure im9
b. Le policier s’est approché du malade avec l’infirmier. Celui-ci lui a demandé s’il souffrait beaucoup.

68 En conséquence, c’est l’ajout (az ápolóval ‘avec l’infirmier’) qui sera sélectionné comme antécédent du sujet non exprimé de la 2e phrase et c’est l’argument (a beteghez ‘au malade’) qui sera sélectionné comme antécédent pour le pronom complément (tőle ‘de lui’), conformément aux contraintes de compatibilité sémantique imposées par le domaine spécifique. Ici encore, nos résultats confirment ceux de Pléh : 90,6 % des locuteurs hongrois ont estimé que c’est l’infirmier qui a demandé au malade s’il souffrait beaucoup.

69 En français, de même, les contraintes sémantiques semblent peser sur la sélection du référent, et en [38b] c’est l’infirmier qui est le plus souvent sélectionné comme antécédent du démonstratif (238/262, soit 91 %, 98 % hors indécis), plus encore que le vendeur en [29b] ; la différence entre les deux est statistiquement significative (chi2 = 64,02, p < 0,01).

70 Les indices qui sont à l’œuvre en [38] illustrent l’importance des connaissances encyclopédiques dans la résolution des anaphores. Ce type de mécanisme se retrouve également dans nos textes de départ [1] et [2]. Considérons le fragment de texte en [39] :

[39]
Éric Masson, un « demi-sel », est devenu l’amant de la belle Solange Mideau, femme d’un graveur raté. Éric veut se servir de Robert Mideau pour monter, à son insu, un trafic de fausse monnaie.

71 Pour identifier la chaîne de coréférence reliant le nom propre Rober Mideau à la description indéfinie un graveur raté, le locuteur doit s’appuyer sur ses connaissances encyclopédiques, notamment que l’identité du nom de famille des deux personnages indique très probablement un rapport de mariage entre eux. Il en va de même dans la version hongroise du texte.

7 – Indices discursifs et pragmatiques

72 Comme nous l’avons vu dans la section précédente, en cas de conflit entre indices syntaxiques et interprétatifs, ce sont généralement ces derniers qui l’emportent. Ces indices interprétatifs ne viennent pas nécessairement du sens lexical des termes, mais peuvent également relever des connaissances d’arrière-plan des interlocuteurs. Considérons les exemples [40] et [41], dont les versions hongroises ont été analysées par Németh T. et Bibok (2010 : 510) :

[40]
figure im10
b. Le marii a accompagné sa femmej chez le médecink parce qu’ili,k / ellej,k s’inquiétait.
[41]
figure im11
b. Le marii a accompagné sa femmej chez le médecink parce que celle-cij,k / celui-cik s’inquiétait.

73 L’antécédent du sujet de la proposition causale devrait être le sujet de la proposition principale en [40a], conformément au principe de Préférence du Sujet comme Antécédent, et le complément locatif en [41a], conformément au principe de Distance Minimale. D’un autre côté, le vocabulaire du domaine des services médicaux, ainsi que les connaissances encyclopédiques associées aux rôles de médecin et de malade, indiquent que l’antécédent du sujet de la proposition causale serait plutôt le COD de la proposition principale, dans chacune des deux variantes. En effet, la situation décrite par [40a] et [41a] suppose que le COD a feleségét ‘sa femme’ renvoie à une personne ayant le rôle de malade dans une relation médecin-malade. L’état d’âme exprimé par le verbe izgul ‘s’inquiéter’, qui est très probablement la manifestation d’une peur de l’examen médical, caractérise d’habitude le malade – plutôt que le médecin ou le proche du malade – dans les situations de ce genre.

74 Toutefois, comme l’observent Németh T. et Bibok (2010), rien n’exclut la possibilité d’une troisième situation où c’est le médecin qui s’inquiétait, par exemple parce que les derniers tests avaient été positifs et qu’il s’inquiéterait pour sa patiente. Ce sont notamment ces connaissances d’arrière-plan liées à une situation particulière qui s’avèrent les plus problématiques dans la résolution automatique des anaphores.

75 Nous avons vu dans la section 4 qu’en hongrois l’antécédent par défaut d’une reprise anaphorique par un pronom personnel (exprimé ou zéro) est le sujet grammatical de la phrase, même si celui-ci ne désigne pas nécessairement un référent topical. Cette observation va à l’encontre des prédictions liées au caractère discours-configurationnel du hongrois, car on s’attendrait à ce que l’antécédent privilégié soit le constituant en position de topique.

76 Dans certains cas, cependant, le principe de la Préférence du Sujet comme Antécédent peut être annulé par des indices pragmatiques qui relèvent de la structure informationnelle de la phrase hongroise. Ainsi, en [42a], la 2e phrase introduit un nouveau référent, dénoté par un GN indéfini sujet :

[42]
figure im12
b. Paul regarda autour de lui. Un homme se tenait près de lui. Il s’adressa à lui.

77 Suivant le principe de Préférence du Sujet, le pronom sujet anaphorique non exprimé de la 3e phrase devrait prendre comme antécédent le sujet indéfini de la phrase précédente. Toutefois, nos expériences montrent que l’antécédent préféré de ce pronom sujet zéro n’est pas le sujet, mais le pronom complément (mellette ‘près de lui’) qui, à son tour, prend comme antécédent le sujet de la 1re phrase (Pali). En fait, le sujet indéfini egy férfi ‘un homme’ n’est pas un constituant topical, il appartient à la nouvelle information véhiculée par l’énoncé. Le sujet indéfini est donc moins apte à servir d’antécédent pour un pronom sujet zéro que le sujet défini de la phrase précédente (Pali). Ainsi, le référent de celui-ci reste le centre de perspective des événements rapportés tout au long du passage pour la quasi-totalité (92,5 %) de nos sujets d’expérimentation.

78 Il en va de même en [43a], où le référent du sujet de la 1re phrase (Pali) continue à fonctionner comme topique : pour 92,5 % des enquêtés c’est par rapport au référent de ce terme que s’organise la chaîne de coréférence préférentielle qui traverse ce passage, reliant le sujet Pali, le COD zéro de la 2e phrase et le sujet zéro de la 3e phrase :

[43]
figure im13
b. Paul s’arrêta brusquement. Un cycliste faillit l’écraser. Il l’apostropha avec indignation.

79 Cet effet se retrouve en français : les locuteurs associent, dans leur grande majorité, le pronom à l’antécédent Paul (241/262, soit 92 %, 97 % hors indécis).

8 – Typologie des maillons forts et des maillons faibles

80 À l’issue de cette étude, il ne reste plus qu’à présenter de manière synthétique l’ensemble des maillons forts et des maillons faibles analysés tout au long des sections précédentes. C’est l’objet du Tableau 1, dans lequel nous indiquons également les indices interprétatifs relevés.

Tableau 1

Une typologie des maillons forts et faibles

Maillons forts
(identiques pour les deux langues)
Maillons faiblesIndices interprétatifs
pronom personnel [6]
pronom démonstratif
description définie
description indéfinie
nom propre
adverbe locatif
désinence du V (hongrois)
affixe de genre (français)
affixe possessif (hongrois)
déterminant possessif (français)
préfixe du V (hongrois)
sens lexical du V (français)
ø
position syntaxique
fonction grammaticale
rôle thématique
rôle discursif
contenu lexical du prédicat
vocabulaire du domaine
connaissances d’arrière-plan

Une typologie des maillons forts et faibles

81 Compte tenu des analyses déjà présentées, nous n’allons discuter ici qu’un seul aspect de cette typologie : la prise en compte des pronoms non exprimés. En effet, nous avons vu que le sujet non exprimé (sujet zéro) d’un verbe à l’infinitif ou d’une participiale pouvait être considéré comme un élément référentiel implicite (ou non marqué) : ce n’est pas parce qu’un tel élément n’est pas exprimé qu’il n’est pas saillant, que ce soit du point de vue du locuteur ou du lecteur, et c’est pourquoi nous l’avons étudié. Cependant, la notion même de « linguistiquement non marqué » peut prêter à discussion. Alors que tous les autres types de maillons relèvent d’un marquage et peuvent être vus comme appartenant à divers « degrés de contribution » de ce marquage à la chaîne de coréférence – on peut parler de « contribution lexicale » pour les expressions référentielles et de « contribution grammaticale » pour les possessifs, préfixes et affixes –, on peut se demander si l’absence de marquage est à compter en tant que contribution grammaticale ou en tant que contribution d’une autre nature. On pourrait par exemple considérer un troisième degré de contribution, que l’on appellerait « contribution implicite ».

Conclusion et perspectives

82 Nous avons montré dans cet article à quel point il est délicat de classer des marqueurs linguistiques en tant que maillons forts ou faibles, et donc en tant que contributeurs principaux ou secondaires – voire tout simplement contributeurs ! – d’une chaîne de coréférence. Chaque langue possède ses particularités, par exemple la possibilité de ne pas exprimer un pronom, ce qui complique encore le problème. Si la distinction initiale de Landragin (2011) était formulée de manière à « caser » les pronoms zéro dans des chaînes de coréférence, il nous semble que le statut précis de cette marque zéro reste encore à discuter.

83 Néanmoins, la typologie des maillons forts et des maillons faibles à laquelle nous aboutissons nous semble marquer une étape significative dans les recherches contrastives sur les chaînes de coréférence (cf. par exemple Baumer, 2015), et a le mérite de mettre en parallèle, malgré des matérialisations linguistiques différentes, des phénomènes référentiels similaires. Le point fort de notre étude est peut-être d’avoir creusé systématiquement, parmi ces phénomènes référentiels, les possibilités d’ambiguïtés, en recourant à chaque fois à l’avis de locuteurs des deux langues.

84 Plusieurs perspectives de recherche ont d’ores et déjà été identifiées suite à ce travail. Il s’agit d’une part de l’étude des phénomènes référentiels dans d’autres langues, et notamment de langues issues d’autres familles. Un travail de comparaison des maillons forts et faibles en français et en chinois a ainsi été amorcé. Le chinois permet également de ne pas exprimer des pronoms (pronoms sujets et objets) et son étude conduira probablement à compléter les résultats que nous obtenons ici. D’autre part, il s’agit de la mise en œuvre d’une méthodologie complémentaire : celle de la linguistique de corpus outillée, avec un travail d’annotation manuelle des maillons forts et faibles sur un corpus de textes issu en partie du corpus construit dans le cadre du projet Democrat.

Références bibliographiques

  • Bartos H., 1997, « On “subjective” and “objective” agreement », Acta Linguistica Hungarica, 44, p. 363-384.
  • Baumer E., 2015, Noms propres et anaphores nominales en anglais et en français : étude comparée des chaînes de référence, Paris, L’Harmattan.
  • Boudreau S. et Kittredge R., 2006, « Résolution d’anaphores et identification des chaînes de coréférence: une approche ‘‘minimaliste” », Huitièmes Journées internationales d’Analyse statistique des Données Textuelles (JADT 2006).
  • Caramazza A., Grober E. et Garvey C., 1977, « Comprehension of anaphoric pronouns », Journal of Verbal Learning and Verbal Behavior, 16, p. 601-609.
  • Charolles M., 2002, La référence et les expressions référentielles en français, Paris, Ophrys.
  • Chastain C., 1975, « Reference and Context 1 », in Gunderson K., Language Mind and Knowledge, Minneapolis, University of Minnesota Press, p. 194-269.
  • Corblin F., 1987, Indéfini, défini et démonstratif, Genève, Droz.
  • Corblin F., 1995, Les formes de reprise dans le discours. Anaphores et chaînes de référence, Rennes, Presses Universitaires de Rennes.
  • Cornish F., 1999, Anaphora, Discourse, and Understanding. Evidence from English and French, New York, Oxford University Press.
  • Creissels D., 2006, « Suffixes casuels et postpositions en hongrois », Bulletin de la Société de Linguistique de Paris 101/1, p. 225-272.
  • Dankovics N., 2001, « Anaforikus viszonyok finn, észt és magyar összetett mondatokban pszicholingvisztikai szempontból », Nyelvtudományi Közlemények, 98, p. 120-142.
  • Dankovics N., 2005, « A szórend szerepe az anafora-feldolgozásban », in Gervain J. et al., Az ezerarcú elme. Tanulmányok Pléh Csaba 60, születésnapjára, Akadémiai Kiadó, Budapest, p. 117-134.
  • Fillmore C. J., 1971, « Some problems for Case Grammar », in O’Brien R. J., Report of the 22nd Annual Roundtable Meeting on Linguistics and Language Studies, Washington DC, Georgetown University Press, p. 35-56.
  • Garnham A. et Oakhill J., 1985, « On-line resolution of anaphoric pronouns: effects of inference making and verb semantics », British Journal of Psychology, 76/3, p. 385-393.
  • Garvey C. et Caramazza A., 1974, « Implicit causality of verbs », Linguistic Inquiry, 5, p. 459-464.
  • Grimshaw J., 1990, Argument Structure, Cambridge MA, MIT Press.
  • Hobbs J. R., 1979, « Coherence and coreference », Cognitive Science, 3, p. 67-90.
  • Karttunen L., 1976, « Discourse Referents », in McCawley J.-D., Syntax and Semantics, 7, New York: Academic Press, p. 363-385.
  • Kiefer F., 1985, « The possessive in Hungarian : a problem for natural morphology », Acta Linguistica Hungarica, 35, p. 85-116.
  • Kiefer F., 2000, « A ragozás », in Kiefer F., Strukturális magyar nyelvtan 3. Morfológia, Budapest, Akadémiai Kiadó.
  • É. Kiss K., 1998, « Verbal prefixes or postpositions? Postpositional aspectualizers in Hungarian », in de Groot C. et Kenesei I., Approaches to Hungarian, 6, Papers from the Amsterdam Conference, Szeged, JATE, p. 125-148.
  • É. Kiss K., 2002, The Syntax of Hungarian, Cambridge, Cambridge University Press.
  • Kleiber G., 1981, Problèmes de référence : descriptions définies et noms propres, Paris, Klincksieck.
  • Kleiber G., Schnedecker C. et Tyvaert J.-E. (éds.), 1997, La continuité référentielle, Paris, Klincksieck.
  • Lambrecht K., 1994, Information Structure and Sentence Form: Topic, Focus, and the Mental Representations of Discourse Referents, Cambridge, Cambridge University Press.
  • Landragin F., 2011, « Une procédure d’analyse et d’annotation des chaînes de coréférence dans des textes écrits », Corpus, 10, p. 61-80.
  • Landragin F. et Schnedecker C. (éds.), 2014, Les chaînes de référence, Langages, 195, Paris, Larousse/Armand Colin.
  • Németh T. E. et Bibok K., 2010, « Interaction between grammar and pragmatics: The case of implicit arguments, implicit predicates and co-composition in Hungarian », Journal of Pragmatics, 42, p. 501-524.
  • Pléh Cs., 1994, « Mondatközi viszonyok feldolgozása: az anafora megértése a magyarban », Magyar Pszichológiai Szemle, 50, p. 287-320.
  • Pléh Cs., 1998, A mondatmegértés a magyar nyelvben, Osiris Kiadó, Budapest.
  • Puskás G., 2000, Word order in Hungarian. The syntax of Ā-positions, Amsterdam, John Benjamins.
  • Schnedecker C., 1997, Nom propre et chaînes de référence, Paris, Klincksieck.
  • Schnedecker C., Glikman J. et Landragin F. (éds.), 2017, Les chaînes de référence en corpus, Langue Française, 195, Paris, Larousse/Armand Colin.
  • Smyth R., 1994, « Grammatical determinants of ambiguous pronoun resolution », Journal of Psycholinguistic Research, 23/3, p. 197-229.
  • Tolcsvay Nagy G., 2001, « 3rd person anaphora in Hungarian », Hungarian Studies, 15, p. 287-298.
  • Walde A., 1910, Lateinisches etymologisches Wörterbuch, Heidelberg, Carl Winter.

Mots-clés éditeurs : grammaticalisation, ambiguïté, anaphore, référence, coréférence

Date de mise en ligne : 24/03/2022

https://doi.org/10.3917/tl.082.0101

Notes

  • [1]
    Ce travail a été réalisé dans le cadre du projet Democrat (ANR-15-CE38-0008). En plus des deux relecteurs anonymes, les auteurs remercient l’ensemble des participants de ce projet et notamment ceux qui étaient présents à la journée d’étude « Approches contrastives des chaînes de référence ».
  • [2]
    Le syntagme défini le Dabe, qui apparaît ici dans la construction dit le Dabe, dont le rôle est d’attribuer un surnom à un personnage déjà identifié par son nom propre, est sujet à discussion. De fait, il sert à caractériser le référent plutôt qu’à y référer, et on pourrait donc ne pas l’inclure dans la chaîne de coréférence relative à Ferdinand Maréchal. Au-delà de l’illustration de la démarche contrastive avec la comparaison de [5] et [6], l’argument que nous avons retenu ici est son rôle de réactivation de la référence.
  • [3]
    Les énoncés [9b] et [11], tirés du texte hongrois, comportent en effet un sujet zéro associé à un verbe conjugué.
  • [4]
    Nous remercions l’un des deux relecteurs anonymes pour cette suggestion.
  • [5]
    Avec une intonation et une accentuation neutres, le sujet et le COD préverbaux sont interprétés comme topiques non-contrastifs dans les versions hongroises ([32ab]. Toutefois, comme le signale l’un des lecteurs anonymes de cet article, ces expressions pourraient également être prononcées avec une prosodie de topique contrastif ou de focus. Étant donné que nos locuteurs ont dû évaluer ces exemples sous une forme écrite et sans indications contextuelles, ils ont sans doute attribué le rôle de topique par défaut au constituant préverbal de ces énoncés hongrois.
  • [6]
    Notons que les pronoms clitiques en français pourraient également, dans une perspective synchronique, être considérés comme des maillons faibles, tandis que les pronoms toniques resteraient dans la catégorie des maillons forts. D’un point de vue diachronique, on peut noter qu’ils sont à l’origine des maillons forts, et que le passage de l’un à l’autre s’est fait progressivement. Nous reléguons dans nos perspectives de recherche la mise en œuvre d’études qui pourraient étayer ce point de vue.

Domaines

Sciences Humaines et Sociales

Sciences, techniques et médecine

Droit et Administration

bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Retrouvez Cairn.info sur

Avec le soutien de

18.97.14.89

Accès institutions

Rechercher

Toutes les institutions