Notes
-
[1]
En ce moment, seules un certain nombre de traductions en néerlandais, en anglais et en espagnol sont disponibles.
-
[2]
La description lexicographique du Dafles est consignée dans une base de données relationnelle MySQL que l’on interroge en ligne. Les écrans avec les résultats des requêtes sont construits à l’aide de scripts PHP.
-
[3]
Cf. Verlinde & Selva (2002) pour plus de détails sur ce corpus. La lemmatisation du corpus a été effectuée à l’aide du logiciel Cordial analyseur ; le dépouillement du corpus et les comptages à l’aide du logiciel Wordcruncher. Nous tenons à remercier Lise Duquette, grâce à qui nous avons pu partager le corpus du quotidien Le Devoir dans le cadre du projet Didalect, financé par le Conseil de recherches en sciences humaines du Canada (numéro de subvention : 501-202-0169).
-
[4]
Le sens « combat intérieur, psychologique, d’arguments qui s’opposent », cité dans le PR, est marginal et n’a pas sa place dans un dictionnaire d’apprentissage.
-
[5]
L’espace sémantique de débat généré par le dictionnaire des synonymes de l’Université de Caen (elsap1.unicaen.fr) confirme grosso modo cet état de fait.
-
[6]
En fonction des mises à jour effectuées, il se peut que les écrans présentés dans cet article ne correspondent plus entièrement à ceux de la version en accès libre du Dafles.
-
[7]
Les collocations forment un ensemble flou, situé entre les combinaisons libres de mots (une voiture, un pull, une feuille, … blanc/blanche opposé à une nuit blanche) et les expressions et autres syntagmes figés (faire d’une pierre deux coups).
-
[8]
On notera ici les efforts fournis dans le Cobuild pour isoler les propriétés syntaxiques d’un mot dans une colonne supplémentaire en marge des articles. Dans le DEC, Mel’ãuk explicite ces propriétés dans le régime.
-
[9]
Les actants nominaux des verbes sont numérotés de 1 (N1 = sujet) à 4 (N4 = deuxième complément prépositionnel : N1 transférer N2 de N3 à N4). Dans le cas des noms, le nom de tête ne porte pas d’indice. Les noms en dépendance du nom de tête ont les mêmes indices que les compléments verbaux : N3 (premier complément prépositionnel) et N4 (deuxième complément prépositionnel). Dans la plupart des cas, les indices des compléments prépositionnels verbaux et nominaux se correspondent (N sur N3 : un débat sur qqch. ; N1 V sur N3 : des personnes débattent sur qqch.).
-
[10]
Dans une version en ligne, on pourrait encore pousser davantage l’identification des différents compléments dans les exemples par un jeu de couleurs. Pour un exemple de ce type de visualisation, cf. le site du Elektronisches Lernerwörterbuch Deutsch-Italienisch (ELDIT).
-
[11]
Grossmann & Tutin (2003 : 6) soulignent à juste titre qu’elles ont été beaucoup moins étudiées que les expressions et locutions figées, malgré leur fréquence souvent très élevée.
-
[12]
Au rang des projets en cours dans ce domaine, on retiendra tout particulièrement le Lexique actif du français (Polguère 2000), un produit dérivé du DEC et qui se veut accessible à tout public et le Dictionnaire des collocations des noms français, un projet mené conjointement par Peter Blumenthal et l’Atilf de Nancy (http://www.romanistik.uni-koeln.de/home/blumenthal/colloc-fr.shtml).
Pour le français sur objectifs spécifiques, on notera, pour le français des affaires, les ouvrages de Cohen (1986), le DICOFE et le DAFA. Il convient également ici de mentionner les travaux de Descamps et al. (1976-1977 et 1992) et de Lainé (1993). -
[13]
Lea & Runcie (2002), par exemple, montrent que le Oxford Collocations Dictionary for Students of English s’inspire aussi des fonctions lexicales pour classer les collocations, mais qu’il évite tout métalangage et donc tout renvoi explicite à l’un ou l’autre principe de classement.
-
[14]
Face à face est donné sans traits d’union. Dans le corpus, il est plus fréquent avec trait d’union. Vu sa fréquence limitée, il n’apparaît toutefois pas dans la nomenclature du DAFLES.
-
[15]
Pour l’antonymie, nous distinguons les antonymes exclusifs (mort vs vivant), gradables (tiède < chaud < bouillant) et conversifs (vendre vs acheter). Jusqu’à présent, nous n’avons pas intégré les antonymes contextuels (un vin rouge vs un vin blanc).
-
[16]
Dans ce sens, le nom est souvent employé au pluriel.
-
[17]
Les synonymes partiels ou intersectifs (Selva 1999 : 96) sont regroupés dans les cadres à ligne pleine à l’aide du symbole ?. La relation d’hyperonymie/hyponymie est identifiée à l’aide du symbole ?. Les mots entre lesquels cette relation opère sont regroupés à l’aide d’une ligne pointillée s’il y a lieu de préciser. La gradation est visualisée par le symbole ?.
Les indices renvoient aux numéros de sens dans le Dafles. -
[18]
Le symbole ? relie des synonymes approximatifs, à sens très proche : l’un peut se substituer à l’autre sans que le sens de l’énoncé soit fondamentalement différent.
0 – Préliminaires
1 Pendant longtemps, le dictionnaire bilingue a occupé une place privilégiée dans les cours de langues étrangères. De plus en plus, toutefois, et ceci principalement sous l’influence de la lexicographie pédagogique anglo-saxonne, le dictionnaire monolingue s’est positionné comme un instrument incontournable pour l’apprentissage d’une langue. Le dictionnaire semi-bilingue ou semi-multilingue, qui se caractérise par une voie d’accès à un dictionnaire monolingue par le biais de la langue maternelle de l’utilisateur, combine grosso modo les avantages des deux types de dictionnaires cités précédemment.
2 Un dictionnaire d’(auto-)apprentissage est un ouvrage de référence qui se fonde principalement sur deux qualités : pertinence de la sélection des matériaux décrits et explicitation systématique des informations concernant ces matériaux. Au lexicographe, en effet, de donner toutes les informations suffisantes et nécessaires en fonction des caractéristiques et des besoins du public-cible. Suffisantes en ce sens que l’apprenant de niveau élémentaire ou intermédiaire n’a aucun intérêt à trouver dans son dictionnaire des mots et des expressions désuets ou des constructions peu fréquentes. Nécessaires en ce sens que, comme pour l’apprenant, rien ne va de soi (Schneider 1998 : 73), le lexicographe est tenu d’expliciter toutes les informations utiles et de les didactiser suffisamment pour permettre à l’apprenant de procéder à un décodage ou à un encodage correct.
3
Dans ce qui suit, nous illustrerons à l’aide de l’article débat comment nous avons tenté de répondre à cette double exigence dans le Dictionnaire d’apprentissage du français langue étrangère ou seconde (Dafles), un dictionnaire d’(auto-) apprentissage semi-multilingue [1] du français général destiné à des apprenants de niveau intermédiaire et avancé. Nous étudierons successivement l’établissement des lexies et la rédaction des définitions (I.), les relations syntagmatiques (la syntaxe du mot et ses cooccurrents, 2.) et paradigmatiques (les corrélés, 3.). Pour chacun de ces aspects, nous mettrons en évidence l’intérêt d’un dépouillement de corpus en confrontant nos données à celles relevées dans plusieurs autres dictionnaires.
Le Dafles est un dictionnaire en ligne (www.kuleuven.ac.be/dafles), en accès libre pour l’essentiel de ses fonctionnalités, conçu dès le départ pour un environnement informatique (Selva, Verlinde & Binon 2003) [2]. L’une des principales caractéristiques du Dafles est son caractère dynamique. Contrairement à la première génération de dictionnaires électroniques, dont l’unité de base est l’article papier consacré au lemme, la conception du Dafles s’est faite en partant d’une réflexion sur les usages que l’utilisateur peut faire du dictionnaire. Pour chacune de ces utilisations potentielles, un écran spécifique a été créé. Une même information tirée de la base de données peut donc apparaître sur plusieurs écrans, éventuellement sous différents aspects, en fonction des besoins supposés de l’utilisateur. Cela explique la particularité des écrans présentés ci-dessous, comparés à une version papier de l’article débat, telle que l’on pourrait la concevoir à partir des données du Dafles (annexe 1) et un certain nombre de fonctionnalités inédites qu’offre ce nouveau type de dictionnaire électronique.
1 – Lexies et définitions
4 Comme nous l’avons signalé ci-dessus, un dictionnaire d’apprentissage doit rendre compte de l’usage actuel d’une langue. Pour saisir cet usage, nous avons opté en premier lieu pour le dépouillement d’un corpus plutôt que pour l’introspection et la consultation de dictionnaires existants. Même si nous ne sous-estimons pas l’importance de l’introspection dans la pratique lexicographique courante, il nous semble que le dépouillement d’un (large) corpus, pratique bien ancrée dans la tradition lexicographique anglo-saxonne, est le meilleur moyen pour obtenir une vue d’ensemble de l’usage réel d’une langue dans une communauté, puisque ce corpus reflète les compétences de nombreux locuteurs natifs et qu’il permet de quantifier bon nombre de phénomènes. Pour le Dafles, nous disposons d’un corpus de plus de 75 millions de mots, composé de textes journalistiques provenant de trois communautés francophones importantes (France : Le Monde (1998), Belgique francophone : Le Soir (1998), Québec : Le Devoir (1998-1999)) [3]. Ces trois corpus ont une taille approximativement égale.
5 Pour la délimitation des lexies d’un vocable nous procédons pour chaque vocable par induction à partir de larges extraits des concordances tirées de ce corpus, tout en nous basant sur un jeu de critères distinctifs formels inspirés de ceux mentionnés entre autres dans Moon (1987) et Mel’ãuk, Clas & Polguère (1995).
6 Pour le vocable débat, la question est de savoir s’il faut distinguer deux acceptions (« échange d’idées », dans une société par exemple, et « échange organisé d’arguments pour et contre », dans une réunion par exemple) ou seulement une (« discussion sur un sujet ») [4]. Le Dictionnaire du français (DF), seul véritable dictionnaire d’apprentissage du français langue étrangère récent, penche pour cette deuxième solution.
7 Seul le recours à des critères formels peut sortir le lexicographe de l’impasse, comme le démontrent Véronis (2001) et tout récemment L’Homme (2003) à partir d’études de cas. Or, lorsque l’on parcourt les cooccurrents fréquents du mot débat (liste accessible en ligne à l’adresse www.kuleuven.be/grelep/débat.pdf), on remarque qu’un débat interne ne s’utilise que pour le premier sens de débat et un débat houleux uniquement pour le second sens, alors qu’un débat public a un sens différent en fonction du sens donné au vocable débat. En outre, des synonymes, tels dispute ou querelle, se rapprochent plutôt du premier sens et réunion ou conférence du second [5]. Ces arguments nous font donc pencher pour la distinction de deux lexies différentes.
8 Comme les deux lexies ont une composante sémantique centrale qui leur est commune (« échange d’idées »), dans le Dafles, elles se trouvent au même niveau (lexie 1) et ne sont différenciées que par l’indice (1a et 1b). Pour le verbe débattre vient s’ajouter une lexie sans sémantisme commun (débattre 1 « échanger des idées » et débattre 2 « bouger violemment pour se libérer »). Les deux lexies se différencient en outre par leurs constructions syntaxiques différentes.
9 Dans le Dafles, l’ordre des lexies est principalement déterminé par la fréquence des acceptions dans l’extrait du corpus analysé : la souris informatique précède donc la souris vivante. On trouve une justification pour le choix de cet ordre dans la conviction que l’apprenant a le plus de chances d’être confronté aux sens les plus fréquents, tant en situation de décodage qu’en situation d’encodage.
10 Dans les cas où un même mot s’emploie comme nom d’action (le meurtre d’une personne par une autre) et comme nom de résultat (on a commis deux meurtres en deux heures), nous avons voulu garder une certaine régularité et nous avons favorisé l’ordre logique en plaçant toujours le nom d’action avant le nom de résultat, indépendamment de la fréquence d’emploi.
11
En ce qui concerne la rédaction des définitions, nous nous sommes inspirés des définitions phrastiques, actancielles telles qu’elles ont été lancées par le Cobuild et dont on retrouve une version plus formalisée dans les différents volumes du DEC (Verlinde, Dancette & Binon 1998). Le style définitoire du Cobuild se rapproche en effet le plus de la pratique courante en classe et permet en outre de mettre en évidence, principalement pour les verbes et, dans une moindre mesure, pour certains adjectifs et noms, des particularités de construction, tel l’emploi des prépositions par exemple (Hanks 1987). Dans le cas de débat (cf. annexe 1), les différentes constructions avec préposition n’apparaissent pas dans la définition, parce que l’emploi courant du mot est un emploi sans préposition. On trouve toutefois un inventaire des prépositions utilisées immédiatement après la définition [6].
Le caractère phrastique des définitions offre l’avantage supplémentaire de pouvoir détailler tous les actants sémantiques qui participent à l’action du débat : « des personnes » (sens 1a) vs « des hommes politiques, des invités, des participants » (sens 1b). Ces informations, ainsi que certaines précisions (« rencontre » (sens 1b) par exemple) sont nécessaires dès que l’on veut différencier les quasi-synonymes (cf. 3.). La longueur de la définition est donc pleinement fonctionnelle. Ceci est le cas tant en situation de décodage, vu que l’apprenant peut évaluer la congruence entre la définition et les informations contenues dans la phrase qu’il lit, qu’en situation d’encodage, puisque la définition est une amorce de phrase qui suggère des éléments lexicaux prototypiques et, éventuellement, syntaxiques à utiliser.
Suivant le principe de traitement uniforme (Mel’ãuk, Polguère & Clas 1995 : 40 sqq), les descriptions de lexies se font à l’aide des mêmes composants, comme on peut le constater pour la paire débat-débattre (annexe 1).
2 – Relations syntagmatiques
12 La combinatoire d’un mot ou les relations syntagmatiques qu’il entretient couvrent à la fois des phénomènes que l’on rapproche de la syntaxe, avec, essentiellement, la présence ou l’absence d’une préposition fixe, et des phénomènes d’associations syntagmatiques restreintes (Grossmann & Tutin 2003 : 5) ou de cooccurrences privilégiées de mots dans le discours, beaucoup moins étudiés jusqu’à présent. Ces derniers cas de cooccurrences couvrent de multiples restrictions sur les combinaisons possibles entre mots, entre autres celles désignées par le terme collocations [7].
13 À quelques rares exceptions près [8], les propriétés syntaxiques d’un mot ne sont pas explicitées systématiquement dans les dictionnaires. En effet, la seule indication régulière donnée concerne les verbes qui sont caractérisés comme (in)transitifs ((in)directs). Or, les adjectifs et les noms présentent des propriétés analogues (bon en qqch., apte à faire qqch., l’approvisionnement en qqch.). Cette information est essentielle pour l’apprenant, mais, généralement, elle ne se retrouve qu’implicitement dans les exemples.
14 Dans le Dafles, l’information syntaxique est triplement mise en évidence. Tout d’abord dans la première partie des définitions phrastiques, délimitée par la forme verbale est dans les définitions des noms ou située entre lorsque et la virgule pour les définitions des verbes (lorsque des personnes débattent,) par exemple. Ensuite, sous la forme d’une notation abstraite suivant la définition (ex. : N sur N3) [9]. Enfin, l’apprenant retrouve la construction illustrée sous la forme d’un exemple [10].
15 L’ordre dans lequel les constructions sont proposées est déterminé par leur complexité.
16 Même si le ‹ Wortschatzlernen ist Kollokationslernen › lancé par Hausmann (1984) est quelque peu provocateur, la place prépondérante de la collocation et de la combinatoire des mots en général dans le processus d’apprentissage d’une langue est incontestable, d’autant plus que ces collocations ne sont pas toujours motivées sémantiquement et qu’elles sont donc difficilement compréhensibles et prédictibles pour l’apprenant. Un dictionnaire d’apprentissage se doit donc d’en fournir un inventaire bien organisé (Verlinde, Selva & Binon 2003). La description des collocations est toutefois l’un des parents pauvres de la lexicographie française [11]. Pour le français général, les descriptions publiées les plus complètes sont à mettre à l’actif de Grobelak (1990), de Ilgenfritz et al. (1989), de Lacroix (1998), de Mel’ãuk et al. (DEC : 1984-1999) et, plus récemment, de Beauchesne (2001) et de Zinglé & Brobeck-Zinglé (2003) [12]. On y ajoutera le site du Dictionnaire des collocations (DC). Exception faite de Ilgenfritz et al. (1989), aucune n’est vraiment adaptée à des locuteurs non natifs, puisqu’il s’agit avant tout de simples listes de combinaisons de mots, sans explications. Le DFU (Picoche & Rolland 2002) mentionne un certain nombre de combinaisons de mots, mais n’est pas un véritable dictionnaire de collocations.
17 Grâce aux outils d’analyse performants dont nous disposons à l’heure actuelle (lemmatiseurs, procédures statistiques), il est possible d’extraire rapidement d’un important corpus les combinaisons de mots les plus fréquentes ou les plus pertinentes. On trouvera en ligne un inventaire des combinaisons les plus fréquentes avec le mot débat rencontrées dans notre corpus (www.kuleuven.be/grelep/débat.pdf). Cet inventaire y est confronté aux inventaires trouvés dans les ouvrages cités ci-dessus. Sans vouloir faire le procès de ces dictionnaires, on doit constater que, dans l’ensemble, les combinaisons présentées sont relativement peu nombreuses et/ou qu’elles ne couvrent pas vraiment bien l’usage courant du mot débat, tel qu’il apparaît dans notre corpus. On retiendra que le DF, en tant que dictionnaire d’apprentissage, ne mentionne que trois collocations : ouvrir un débat, au cœur du débat et un débat télévisé. Grobelak (1990) s’est appuyé sur un corpus constitué d’articles de presse variés, pris sur une période s’échelonnant de 1978 à 1984, et d’un certain nombre d’ouvrages d’intérêt général publiés entre 1956 et 1983. Son corpus de 2 millions de mots a été dépouillé manuellement. La taille réduite du corpus retenu explique probablement pourquoi un certain nombre de combinaisons manquent dans ce relevé. Ilgenfritz et al. (1989) listent 14 combinaisons de mots dont certaines n’apparaissent toutefois pas dans le corpus de référence. Lacroix (1998) ne mentionne aucune combinaison sous débat, mais il renvoie à l’article discussion. Certaines combinaisons suggérées dans cet article semblent toutefois difficilement compatibles avec débat. Néanmoins, l’inventaire reste assez complet, du moins en ce qui concerne les combinaisons avec un verbe. Les listes données par Beauchesne (2001) et le site du Dictionnaire des collocations, qui ont été établies à partir de sources très variées, sont de loin les plus fournies. Le fait que ces listes soient le résultat de notes de lecture échelonnées sur une période plus ou moins longue explique sans conteste cette richesse. L’étendue de ces listes constitue à la fois également leur faiblesse : en effet, pour un apprenant, comment et que choisir ? D’autant plus qu’un bon nombre de combinaisons retenues sont très peu fréquentes, voire inexistantes dans notre corpus. Zinglé & Brobeck-Zinglé (2003, couverture) affirment que « l’ouvrage repose sur le traitement informatisé de données collectées à partir d’un large échantillonnage du français standard ». Par manque de point de comparaison sur l’origine exacte des documents dépouillés, il est difficile de tirer des conclusions de la faible correspondance avec le relevé tiré de notre corpus. Assez étrangement, aucun des auteurs mentionnés ci-dessus ne retient la combinaison de mots la plus fréquente que nous avons relevée dans le corpus : débat public.
18 Une fois l’inventaire des combinaisons de mots établi, il s’agit de décider ce qu’il faut lister dans le dictionnaire. Seront exclues dès le départ les combinaisons peu courantes. En outre, parmi les combinaisons les plus fréquentes, nous avons écarté les combinaisons qui nous semblent de véritables associations libres de mots (un débat politique, organiser un débat, participer à un débat). Les combinaisons retenues sont celles dont nous estimons qu’elles peuvent occasionner des difficultés au décodage ou à l’encodage. Pour soulever un débat et alimenter un débat, par exemple, le verbe ne véhicule pas son sens premier, le plus commun pour l’apprenant et il y a exclusion d’autres verbes quasi-synonymes (*causer un débat, *approvisionner un débat). Un débat réunit des personnes paraît plus transparent, mais le choix du verbe n’est pas vraiment libre non plus, puisqu’un débat rassemble des personnes est une combinaison qui n’est pas du tout courante. D’autres combinaisons, comme un débat houleux sont parfaitement transparentes, mais tellement prototypiques d’un des deux sens retenus de débat qu’elles ne peuvent manquer à l’inventaire. Dans le Dafles, nous doublons donc un critère strictement objectif, la fréquence, de critères didactiques plutôt que strictement linguistiques. Ainsi, l’expérience du professeur de langue (étrangère) et celle du lexicographe se complètent et se renforcent pour créer un instrument fonctionnel pour l’apprenant.
19
La fréquence cumulée des combinaisons retenues dans le Dafles est de 3 949 occurrences, soit un peu moins d’un quart des emplois de débat dans notre corpus (16 930 occurrences au total).
En tout, plus de 12 500 combinaisons de mots différentes sont déjà listées dans le Dafles. Grâce à la structuration souple des données dans la base, chacune de ces combinaisons est accessible à partir de n’importe quel composant de la combinaison, ce qui évite tout problème d’accès propre aux dictionnaires papier.
La liste des collocations pour le vocable débat est assez longue, ce qui pose le problème de son organisation dans le corps de l’article. La linéarité des informations dans un dictionnaire papier impose au lexicographe de faire un choix. Il devra choisir une organisation qui privilégie le décodage ou l’encodage. Le décodage, en classant les collocations par exemple dans l’ordre alphabétique (Zinglé & Brobeck-Zinglé 2003) ou en fonction du type de construction (nom + nom, nom + adjectif, …), comme dans le Dictionnaire d’apprentissage du français des affaires (DAFA, cf. aussi Binon & Verlinde 1998) ; l’encodage, en organisant les collocations en fonction d’un système de repérage qui facilite la mise en discours, à l’aide par exemple des fonctions lexicales de Mel’ãuk, Polguère et Clas (1995 : 125 sqq), ou selon des critères d’ordre pragmatique, comme dans les tableaux de combinaisons avec verbe dans le DAFA.
En nous inspirant des fonctions lexicales de Mel’ãuk, nous avons défini pour le Dafles une quinzaine de fonctions fréquentes qui couvrent l’essentiel des intentions de communication et qui servent à modéliser les collocations :
20 Dans la version papier de l’article débat fournie en annexe, nous avons privilégié la fonction d’encodage en classant les collocations selon notre système de fonctions lexicales simplifiées. Pour économiser de la place dans la version papier, les fonctions lexicales sont identifiées uniquement à l’aide des indices mentionnés ci-dessus. Pour trouver une collocation qui doit exprimer le début d’un débat, l’apprenant se portera donc aux collocations précédées de l’indice 2. L’utilisation de fonctions lexicales offre aussi l’avantage de pouvoir économiser un certain nombre de définitions : pour les fonctions comme le début ou la fin d’une action, par exemple, le sens de la collocation peut en effet être déduit directement de la fonction lexicale.
21 Dans la version en ligne du Dafles, ce problème d’organisation des collocations ne se pose pas. En effet, l’inventaire des collocations est proposé sous trois formats différents, en fonction des besoins de l’utilisateur. Lorsque celui-ci accède au dictionnaire par le biais du français, il se trouve en situation de décodage. Il peut par exemple avoir lu dans un texte une séquence dans laquelle se trouve le mot débat. En réponse à sa requête ‹ débat ›, le dictionnaire lui propose, sur un premier écran, les informations suivantes (écran 1).
Résultat partiel de la requête ‹ débat ›
Résultat partiel de la requête ‹ débat ›
22 On trouve à l’écran non seulement le renvoi à un ou plusieurs lemmes de la nomenclature qui correspondent à la suite de caractères tapée, mais également la liste exhaustive des combinaisons de mots listées pour les lemmes sélectionnés. À ce stade, le critère de classification des collocations est double. En tête de liste figurent les collocations dont nous pensons qu’elles posent un problème du point de vue de la compréhension parce que le sens de la combinaison de mots ne peut pas être reconstruit à partir du sens de ses composants. Pour le mot débat, ceci est le cas uniquement pour un débat de société. Le critère utilisé est donc celui de la compositionnalité du sens de la combinaison de mots : le sens de la combinaison est-il égal ou non à la somme des composants. La décision à prendre est, dans un certain nombre de cas, partiellement subjective. Pour un débat de société, par exemple, il est clair qu’il s’agit d’une suite productive (un phénomène de société), avec toutefois des nuances de sens (« qui implique la société » vs « qui caractérise la société »).
23 Dans la deuxième partie de la liste sont alors rassemblées les collocations transparentes. À l’intérieur de chaque groupe joue le critère de la fréquence : les collocations sont classées de la plus fréquente à la moins fréquente. En parcourant la liste, l’utilisateur passe ainsi des collocations fréquentes les plus difficilement décodables aux collocations transparentes les moins fréquentes.
24
En situation d’encodage, le dictionnaire en ligne lui propose deux formats différents, accessibles à partir de la barre de navigation figurant sur l’écran des définitions du mot débat.
Dans la colonne de gauche de l’écran affiché figurent les différents sens pour lesquels des combinaisons de mots sont répertoriées dans la base. En fonction de l’intention de communication de l’apprenant, il clique sur l’un des liens, faisant apparaître les collocations qui reformulent cette intention (écran 2).
Liste des collocations de débat (1a) qui rendent une intensification/une atténuation
Liste des collocations de débat (1a) qui rendent une intensification/une atténuation
25
Si l’apprenant hésite, il a la possibilité de visualiser la liste entière des collocations par le biais du lien Toutes les collocations de débat. Contrairement à la liste de l’écran 1, les combinaisons sont simplement classées dans un ordre alphabétique. La liste entière peut être parcourue afin d’y trouver la collocation désirée. Cette dernière fonctionnalité, quoiqu’un peu en retrait par rapport à la précédente du point de vue de l’exploitation informatique des données, est essentielle. En effet, même si les fonctions lexicales définies correspondent à des intentions de communication assez facilement concevables, rien, à l’heure actuelle, ne prouve que les apprenants sont perméables à cette modélisation et qu’elle facilite l’intégration des données dans leur lexique mental [13]. L’intégration de tels modèles, et en particulier celui des fonctions lexicales, dans l’enseignement est d’ailleurs loin d’être monnaie courante : à notre connaissance, Berger (1995) est le seul à proposer un compte rendu (positif) d’une application de la théorie des fonctions lexicales à une situation de classe.
Nous sommes en train de mettre en place des applications informatiques qui permettront à un utilisateur plus avancé d’effectuer des recherches pointues en jouant par exemple sur les valeurs des paramètres propres aux combinaisons de mots : catégorie grammaticale de la base, fonctions lexicales, fréquence, compositionnalité du sens de la combinaison de mots, domaine de connaissance. L’écran 3 illustre le résultat (provisoire) d’une requête qui porte sur les critères suivants : [base de la combinaison de mots = nom, fonction lexicale = ‹ intensification ›, aucune restriction quant à la fréquence, la compositionnalité du sens et le domaine de connaissances].
Requête ‹ intensification du nom ›
Requête ‹ intensification du nom ›
26 D’autres requêtes du même genre permettront par exemple d’isoler tous les adjectifs qui suivent le même modèle morphologique, tous les verbes qui ont le même modèle de conjugaison, tous les mots qui sont des noms d’action, etc. Provisoirement, ces applications ne sont pas encore disponibles dans la version en ligne.
3 – Relations paradigmatiques
27 Le dictionnaire des synonymes en ligne de l’Université de Caen (elsap1.unicaen.fr) retourne 33 « synonymes » du mot débat. Huit de ces synonymes ne font pas partie de la nomenclature du Dafles, qui ne couvre que les 5 000 lemmes les plus fréquents de notre corpus : dispute, altercation, délibération, symposium, différend, palabre, panel, contention, démêlé. Des deux unités polylexicales, une seule, table ronde, est reprise dans les collocations du Dafles. La collocation échange de vues est peu fréquente et n’a pas été retenue [14].
28 Pour les mots consignés dans notre nomenclature, seul un nombre limité de noms ont réellement un sens proche de débat (sens 1a) sur base du trait sémantique central « échange d’idées » : conversation, dialogue, pourparlers, discussion, querelle, explication. La présence de pourparlers appelle intuitivement aussi le nom négociation(s), celle de conversation le nom dialogue, assez étrangement absents de la liste donnée par le dictionnaire des synonymes en ligne. Les noms controverse et polémique se rapprochent de débat parce qu’ils impliquent aussi la présence d’opinions différentes, sans toutefois qu’il y ait vraiment un échange d’idées.
29
Dans le Dafles, la synonymie (parfaite et partielle), mais aussi l’antonymie [15], l’hyperonymie/hyponymie, etc. sont établies de lexie à lexie (et non de lexie à mot comme dans la grande majorité des dictionnaires). Cela permet par exemple d’intégrer dans la description du paradigme des quasi-synonymes trois sens de dialogue (1a « échange d’idées pour parvenir à un point de vue commun », 1b « conversation entre deux personnes » et 1c « conversation entre deux acteurs » [16], avec le troisième comme hyponyme du second).
Le champ sémantique nous semble structuré à l’aide de deux traits sémantiques fondamentaux : [ + /– échange d’idées] et [+/– affrontement d’opinions différentes]. À ce deuxième trait vient se superposer le trait [+ violence des échanges] pour certains mots. Le paradigme connaît quatre mots de base : conversation, dialogue, discussion et dispute, l’un des mots absents de notre nomenclature. Ces quatre noms sont des synonymes partiels qui n’ont d’hyperonyme que l’unité polylexicale échange d’idées, dont on ne retrouve toutefois que quelques rares attestations dans les corpus (figure 1) [17].
Réseau sémantique de débat (1a)
Réseau sémantique de débat (1a)
30 Les relations entre les mots, telles que nous les avons présentées schématiquement dans le tableau précédent, sont affichées directement à l’écran. Les définitions des mots mettent en évidence les traits sémantiques distinctifs pertinents de chaque lexie.
31 Grâce aux liens établis dans la base de données du dictionnaire, on peut prendre n’importe quel mot comme point de départ pour explorer les relations qui se tissent entre tous les membres du paradigme.
32 Il serait possible d’augmenter le rendement didactique de ces données en les affichant sous la forme de graphes dynamiques à la suite des propositions faites par Selva (1999 : 129-138). Quelle que soit l’option prise, l’informatique offre ici à nouveau un avantage incontestable face au papier.
33
Pour le sens 1b de débat (« échange organisé d’arguments pour et contre »), nous distinguons les quasi-synonymes suivants : conférence, colloque, congrès, réunion, séance, table ronde. Le mot session peut y être rattaché comme hyperonyme de séance.
Il y a moyen de structurer ce paradigme de mots autour du couple réunion et débat, qui s’opposent en ce sens que seul le second implique la présence nécessaire d’opinions différentes et d’une discussion qui s’ensuit (figure 2). [18]
Réseau sémantique de débat (1b)
Réseau sémantique de débat (1b)
34 Le trait sémantique « échange d’idées, d’arguments » ne semble pas présent dans le sens des mots suivants, ou il s’agit d’emplois métaphoriques : examen, lutte, attaque, conflit, procès, combat, contestation. Dans le Dafles, ils ne sont pas directement mis en relation avec le mot débat (1b).
35 Dans le Dafles, plusieurs centaines de mots ont déjà trouvé leur place dans de nombreux réseaux sémantiques analogues à ceux présentés ci-dessus. On se reportera par exemple au réseau particulièrement riche constitué autour du mot habitation.
36
Malgré tout, l’organisation en réseaux reste un travail très complexe, qui ne semble véritablement être mené à bien que dans le DEC. On notera d’ailleurs qu’en plus des distinctions de sens, il faudrait également tenir compte de considérations de registre, de fréquence, voire même de combinatoire, trop souvent négligées.
À la suite des travaux de Mel’ãuk et Wanner (1996) pour les noms d’émotion en allemand, on pourrait également étudier dans quelle mesure les mots présents dans les deux réseaux sémantiques de débat présentent les mêmes combinatoires. Certaines combinaisons spécifiques de débat sont également propres à d’autres quasi-synonymes (mener une discussion/des pourparlers/une conversation), sans toutefois pouvoir généraliser ces observations (*mener un dialogue/une dispute). Les (ir)régularités sous-jacentes à ces phénomènes constituent un champ d’investigation prometteur mais très complexe, comme le soulignent Grossmann & Tutin (2003 : 14-19).
4 – Conclusions
37 Tout au long de notre article, nous avons mis en évidence l’importance du dépouillement d’un corpus pour guider le travail du lexicographe. Cette procédure est très importante dans le domaine de la lexicographie pédagogique, puisqu’il faut nécessairement effectuer des choix, tant en ce qui concerne la sélection des lexies que celle des combinaisons de mots et des quasi-synonymes. Les données fournies par le corpus ne sont toutefois pas à prendre pour argent comptant. Il reste un important travail d’interprétation de la part du lexicographe en fonction des besoins de son public-cible.
38 Au début de notre contribution, nous avons également souligné l’importance de l’explicitation systématique et de la didactisation des données présentées à l’apprenant. Nous avons montré que même pour un mot aussi familier que débat, de nombreuses informations doivent être données, ne serait-ce que du point de vue des propriétés combinatoires du mot.
39 Dans le Dafles, nous privilégions ainsi la qualité de la description par rapport à la quantité de mots décrits, qui constitue parfois à tort le seul argument de vente majeur des dictionnaires traditionnels. Ce choix en fait un dictionnaire principalement axé sur la production. Pour en faire également un dictionnaire de décodage à part entière, il faudrait ajouter aux données déjà présentes une brève description sémantique d’une tranche de vocabulaire supplémentaire de quelques milliers de mots.
Extrait de possibles articles de dictionnaire papier tirés du Dafles pour débat et débattre, avec traductions vers l’anglais
40 débatm (un ~, les ~s) *****
41 1a un débat est un échange d’idées entre plusieurs personnes qui défendent des opinions différentes concernant un problème particulier. [> debate] N L’adhésion de nouveaux pays à l’Union européenne n’a pas vraiment provoqué de débat. N sur N3 Certains partis politiques exigent un débat sur le futur de la maison royale. = N autour de N3 Le débat autour de la réduction du temps de travail passionne les salariés. N entre N3 et N3 Nous avons assisté à un débat entre croyants et non croyants. • 2 {ouvrir, engager, lancer} le debat C’est un article de journal qui a véritablement lancé le débat. susciter un débat Un projet de loi sur les renseignements personnels suscite un débat animé. • 4 clore le débat… • 7 un vif débaT… • 9 un débat de fond : débat sérieux qui porte sur l’essentiel Le Parlement a mené un débat de fond sur le problème de l’emploi des jeunes. un débat de société : large débat dans lequel de nombreuses personnes prennent position Le reportage a provoqué un véritable débat de société sur les conditions de vie dans les prisons…
42 1b un débat est une rencontre d’hommes politiques, d’invités pendant laquelle ils échangent des arguments pour et contre un plan, une proposition, un problème de société [> debates] N Seuls quelques parlementaires ont participé au débat. N sur N3 Le débat sur l’euthanasie a attiré la foule au parlement…
43 débattre (verbe) **
44
1 lorsque des personnes débattent, elles donnent, elles confrontent leurs idées concernant un problème particulier [> to discuss, to debate]
N1 V Au conseil municipal, les élus ont débattu pendant des heures sans résultat. N1 V sur N3 Les candidats à l’élection présidentielle débattent sur la politique étrangère. N1 V de N3 Le jury débat longuement de la responsabilité des accusés. N1 V avec N3 Cela fait trois fois qu’il débat avec son principal concurrent.
2 lorsqu’une personne ou un animal se débat, il bouge violemment dans tous les sens, il lutte pour se libérer [> to struggle, to put up a struggle]
N1 se V Je me suis débattu. Mais comme il était trop fort pour moi, je n’ai pas réussi à me libérer.
Notes
-
[1]
En ce moment, seules un certain nombre de traductions en néerlandais, en anglais et en espagnol sont disponibles.
-
[2]
La description lexicographique du Dafles est consignée dans une base de données relationnelle MySQL que l’on interroge en ligne. Les écrans avec les résultats des requêtes sont construits à l’aide de scripts PHP.
-
[3]
Cf. Verlinde & Selva (2002) pour plus de détails sur ce corpus. La lemmatisation du corpus a été effectuée à l’aide du logiciel Cordial analyseur ; le dépouillement du corpus et les comptages à l’aide du logiciel Wordcruncher. Nous tenons à remercier Lise Duquette, grâce à qui nous avons pu partager le corpus du quotidien Le Devoir dans le cadre du projet Didalect, financé par le Conseil de recherches en sciences humaines du Canada (numéro de subvention : 501-202-0169).
-
[4]
Le sens « combat intérieur, psychologique, d’arguments qui s’opposent », cité dans le PR, est marginal et n’a pas sa place dans un dictionnaire d’apprentissage.
-
[5]
L’espace sémantique de débat généré par le dictionnaire des synonymes de l’Université de Caen (elsap1.unicaen.fr) confirme grosso modo cet état de fait.
-
[6]
En fonction des mises à jour effectuées, il se peut que les écrans présentés dans cet article ne correspondent plus entièrement à ceux de la version en accès libre du Dafles.
-
[7]
Les collocations forment un ensemble flou, situé entre les combinaisons libres de mots (une voiture, un pull, une feuille, … blanc/blanche opposé à une nuit blanche) et les expressions et autres syntagmes figés (faire d’une pierre deux coups).
-
[8]
On notera ici les efforts fournis dans le Cobuild pour isoler les propriétés syntaxiques d’un mot dans une colonne supplémentaire en marge des articles. Dans le DEC, Mel’ãuk explicite ces propriétés dans le régime.
-
[9]
Les actants nominaux des verbes sont numérotés de 1 (N1 = sujet) à 4 (N4 = deuxième complément prépositionnel : N1 transférer N2 de N3 à N4). Dans le cas des noms, le nom de tête ne porte pas d’indice. Les noms en dépendance du nom de tête ont les mêmes indices que les compléments verbaux : N3 (premier complément prépositionnel) et N4 (deuxième complément prépositionnel). Dans la plupart des cas, les indices des compléments prépositionnels verbaux et nominaux se correspondent (N sur N3 : un débat sur qqch. ; N1 V sur N3 : des personnes débattent sur qqch.).
-
[10]
Dans une version en ligne, on pourrait encore pousser davantage l’identification des différents compléments dans les exemples par un jeu de couleurs. Pour un exemple de ce type de visualisation, cf. le site du Elektronisches Lernerwörterbuch Deutsch-Italienisch (ELDIT).
-
[11]
Grossmann & Tutin (2003 : 6) soulignent à juste titre qu’elles ont été beaucoup moins étudiées que les expressions et locutions figées, malgré leur fréquence souvent très élevée.
-
[12]
Au rang des projets en cours dans ce domaine, on retiendra tout particulièrement le Lexique actif du français (Polguère 2000), un produit dérivé du DEC et qui se veut accessible à tout public et le Dictionnaire des collocations des noms français, un projet mené conjointement par Peter Blumenthal et l’Atilf de Nancy (http://www.romanistik.uni-koeln.de/home/blumenthal/colloc-fr.shtml).
Pour le français sur objectifs spécifiques, on notera, pour le français des affaires, les ouvrages de Cohen (1986), le DICOFE et le DAFA. Il convient également ici de mentionner les travaux de Descamps et al. (1976-1977 et 1992) et de Lainé (1993). -
[13]
Lea & Runcie (2002), par exemple, montrent que le Oxford Collocations Dictionary for Students of English s’inspire aussi des fonctions lexicales pour classer les collocations, mais qu’il évite tout métalangage et donc tout renvoi explicite à l’un ou l’autre principe de classement.
-
[14]
Face à face est donné sans traits d’union. Dans le corpus, il est plus fréquent avec trait d’union. Vu sa fréquence limitée, il n’apparaît toutefois pas dans la nomenclature du DAFLES.
-
[15]
Pour l’antonymie, nous distinguons les antonymes exclusifs (mort vs vivant), gradables (tiède < chaud < bouillant) et conversifs (vendre vs acheter). Jusqu’à présent, nous n’avons pas intégré les antonymes contextuels (un vin rouge vs un vin blanc).
-
[16]
Dans ce sens, le nom est souvent employé au pluriel.
-
[17]
Les synonymes partiels ou intersectifs (Selva 1999 : 96) sont regroupés dans les cadres à ligne pleine à l’aide du symbole ?. La relation d’hyperonymie/hyponymie est identifiée à l’aide du symbole ?. Les mots entre lesquels cette relation opère sont regroupés à l’aide d’une ligne pointillée s’il y a lieu de préciser. La gradation est visualisée par le symbole ?.
Les indices renvoient aux numéros de sens dans le Dafles. -
[18]
Le symbole ? relie des synonymes approximatifs, à sens très proche : l’un peut se substituer à l’autre sans que le sens de l’énoncé soit fondamentalement différent.