Couverture de LF_150

Article de revue

Dérivations sémantiques et collocations dans le DiCo/LAF

Pages 66 à 83

Notes

  • [1]
    Pour une définition rigoureuse, faite dans le cadre de la théorie Sens-Texte, cf. Mel’ãuk (1995 : 182 sq), Mel’ãuk (2003a : 23 sq) ou Mel’ãuk (2003b : 24 sq).
  • [2]
    Les trois autres acceptions sont : bouilliei.1 [Il mange une bouillie d’avoine.], bouilliei.2 [Il marchait dans une sorte de bouillie d’argile.] et bouillieiii [Sa thèse est nulle; c’est une bouillie d’idées incohérentes.]
  • [3]
    On peut télécharger à cette adresse une documentation détaillée présentant le DiCo, sa structure compilée et l’interface DiCouèbe : Jousse & Polguère (2005).
  • [4]
    Il s’agit d’une façon volontairement naïve de présenter les choses. On pourrait tout à fait percevoir que l’on a affaire à deux situations concrètes différentes, et ensuite se rendre compte, à l’examen du comportement linguistique de débat, que le français ne dispose ici que d’une lexie vague, qui permet de désigner les deux situations en question.
  • [5]
    Un projet de construction de base de définitions formelles – la BDéf – est en cours à l’OLST. Ce projet n’a pas atteint la maturité du projet DiCo, mais notre but ultime est d’intégrer au DiCo de véritables définitions lexicographiques construites selon les principes de la lexicologie explicative et combinatoire. Pour une présentation du projet BDéf, cf. Altman & Polguère (2003).
  • [6]
    En d’autres termes, débat inutile n’est pas une expression aussi « innocente » que chaise inutile, fatigue inutile… ; elle doit être considérée comme une collocation malgré son faible degré d’idiomaticité.

1 – Introduction

1Au moins deux questions se posent à qui veut décrire les collocations d’une langue : comment les collecter et comment les décrire ? Afin de répondre à ces deux questions, nous allons présenter l’approche originale adoptée dans le projet lexicographique DiCo/LAF (Polguère 2000). Pour la collecte des collocations, nous utilisons la grille d’analyse fournie par les fonctions lexicales (dorénavant FL) de la théorie Sens-Texte. Le système des FL standard nous sert de guide pour la recherche des principales collocations contrôlées par chaque lexie décrite. Bien entendu, cette approche issue de la théorie s’accompagne aussi du recours à l’observation directe sur corpus. La réponse à la deuxième question… encore les FL. Nous utilisons un double encodage des liens collocationnels. Il est basé, d’une part, sur des formules du langage formel des FL, et d’autre part, sur des « vulgarisations » (c’est-à-dire des francisations) de ces formules. Ces vulgarisations sont particulièrement intéressantes puisque, fondées sur un métalangage contrôlé, elles sont directement interprétables par toute personne possédant une connaissance approximative du français, sans qu’aucune connaissance du modèle linguistique sous-jacent ne soit nécessaire.

2Le DiCo est une base lexicale centrée sur la modélisation des liens lexicaux du français ; le LAF (acronyme de Lexique actif du français) est un dictionnaire grand public entièrement produit par extraction et formatage des données du DiCo. Après avoir résumé le travail sur le DiCo/LAF, nous nous concentrerons sur deux points méthodologiques :

  1. la nécessité de modéliser les liens collocationnels contrôlés par les lexies en tenant compte de la structure actancielle de ces lexies ainsi que de leur combinatoire syntaxique ;
  2. la nécessité d’une approche « globale » de la modélisation des liens lexicaux, approche qui s’intéresse simultanément aux liens syntagmatiques collocationnels et aux liens paradigmatiques contrôlés par chaque lexie.
Nous illustrerons notre propos en présentant la modélisation DiCo des différentes acceptions du vocable débat.

3Rappelons que, dans la terminologie Sens-Texte, une lexie est une unité lexicale, c’est-à-dire un « mot » associé à un sens bien spécifique et devant être décrit par un article de dictionnaire ; un vocable est un regroupement de lexies formellement identiques qui se distinguent sémantiquement, tout en partageant une composante de sens non triviale. Chaque lexie d’un vocable correspond donc à une acception d’un mot polysémique.

2 – Le projet lexicographique DiCo/LAF

2.1 – Base lexicale DiCo et produits dérivés du DiCo

4Le projet lexicographique DiCo/LAF se distingue d’autres projets de lexicographie informatisée, tel WordNet (Fellbaum 1998), du point de vue des phénomènes linguistiques décrits et du point de vue des structures de données qu’il vise à produire. Nous allons commencer par expliciter ces deux aspects de notre travail. Même s’il pourrait sembler que nous dévions ici du thème à traiter – les collocations –, il est essentiel de partir du contexte plus général du projet DiCo/LAF pour faire apparaître la particularité de notre modélisation lexicographique des phénomènes collocationnels.

5Nous ferons dorénavant référence au DiCo et au LAF comme à des modélisations uniques, clairement spécifiées dans leurs formats et leur mode de présentation des données. Cependant, il s’agit en fait de deux cas particuliers de produits lexicographiques. Le DiCo nous intéressera en tant que type particulier de base de données représentative de ce que doit être une base lexicale fondée sur les principes de la lexicologie explicative et combinatoire (Mel’ãuk et al. 1995) ; le LAF n’est qu’un type particulier de produit dérivé d’une telle base (Polguère 2000). La principale distinction entre ces deux produits est que le premier relève du travail du lexicographe comme tel, alors que le second est extrait du premier pour une utilisation autre que l’activité lexicographique : la consultation. Dans ce qui suit, nous désignerons par DiCo la base de données lexicale développée selon nos principes, par LAF, un produit dictionnairique grand public dérivé d’une telle base, et par DiCo/LAF, le projet lexicographique visant la production d’un DiCo et d’un LAF.

6Nous commencerons par présenter les deux familles de phénomènes linguistiques visés par le DiCo : les dérivations sémantiques et les collocations. Nous expliquerons ensuite pourquoi, selon nous, ces deux phénomènes doivent être considérés simultanément en lexicologie et lexicographie. Finalement, nous présenterons les autres propriétés des unités lexicales qui sont prises en compte dans la base de données DiCo, de façon périphérique à la modélisation des dérivations sémantiques et des collocations.

2.2 – Phénomènes linguistiques visés par le DiCo

7Les projets lexicographiques « traditionnels » visent la production de dictionnaires dont les articles tournent autour d’un type de donnée bien spécifique : la définition lexicographique. On peut ainsi immédiatement identifier un dictionnaire « spécial » par le fait que la définition n’est pas au cœur de ses articles : dictionnaires de prononciation, de dérivations, de synonymes, de collocations, etc. Le DiCo/LAF est un projet lexicographique spécial puisqu’il vise avant tout la modélisation des dérivations sémantiques et des collocations du français. Attention cependant : contrairement aux autres dictionnaires spéciaux, et notamment aux dictionnaires de collocations, le DiCo présuppose dans chacun de ses articles une définition rigoureuse (sinon complète) des lexies. Cela deviendra clair à la toute fin de notre exposé (section 4.).
Dans cette section, nous allons préciser les notions de dérivation sémantique et de collocation, telles qu’elles doivent être comprises dans le cadre de la lexicologie explicative et combinatoire.

2.2.1 – Les dérivations sémantiques

8La notion traditionnelle de dérivation est bien connue. Elle correspond à des relations sémantiques et formelles entre deux lexies, relations du type fumer ? fumeur (nom d’agent), compter ? comptage (nom d’action), noir ? noircir (verbe causatif), etc. Le DiCo s’attache à une notion de dérivation plus large, à savoir la dérivation sémantique.

9Une dérivation sémantique est une relation entre deux lexies basée sur une parenté de sens. Plus précisément, une lexie L2 est dite sémantiquement dérivée d’une lexie L1 si et seulement si les trois conditions suivantes sont satisfaites :

  • L2 entretient une relation sémantique avec La. Dans le cas plus typique, L2 se définit en terme de L1.
    Par exemple, la lexie hache [= L2] est définie en terme de couper [= L1], car le sens ‘hache’ = ‘artefact servant à couper…’.
  • La relation sémantique entre L2 et L1 est récurrente dans la langue.
    Par exemple, la relation entre hache et couper, ‘artefact servant à…’, est récurrente en français : frapper ? marteau, ouvrir [une porte] ? clé, fumer ? pipe, etc.
  • La relation entre L1 et L2 s’exprime fréquemment de façon morphologique.
    Par exemple, pour la relation ‘artefact servant à…’, on trouve en français les dérivations suffixales suivantes : bouch(-er) ? bouch+on, ras(-er) ? ras+oir, décapsul(-er) ? décapsul+eur, etc.
Puisque la relation sémantique qui lie hache à couper satisfait les trois conditions ci-dessus, nous pouvons dire que la lexie hache est sémantiquement dérivée de couper.

10Remarquons qu’un lien de dérivation sémantique qui est marqué explicitement par un moyen morphologique correspond à une dérivation au sens traditionnel. La dérivation au sens traditionnel est donc un cas particulier de dérivation sémantique.

11On peut identifier trois grandes familles de dérivations sémantiques correspondant aux trois cas de figure ci-dessous.

  1. Les deux lexies possèdent (approximativement) le même sens. Il s’agit ici d’une dérivation sémantique (quasi) vide, qui correspond aux cas bien connus suivants :
    • synonymie exacte ou approximative (bicyclette ? vélo ; interdire ? défendre) ;
    • conversion exacte ou approximative (X précède Y ? Y suit X ; X donne Y à Z ? Z reçoit Y de X) ;
    • changement de partie du discours (marchander ? marchandage, vendre ? vente, frapper ? coup ; terrestre est l’adjectif pour [relatif à la] terre, paternel pour [relatif au] père, urbain pour [relatif à la] ville).
    Par convention, on inclut également dans cette première famille les termes génériques (cours d’eau pour rivière, légume pour haricot…).
  2. Les deux lexies possèdent des sens opposés (interdire et autoriser, petit et grand…). Il s’agit ici de l’antonymie exacte ou approximative.
  3. Une des deux lexies désigne un élément de la situation désignée par l’autre. Il peut s’agir d’un participant (nager ? nageur, envoyer [qqch. par la poste] ? destinataire, accident ? victime…), d’un circonstant (dormir ? lit, patiner ? patinoire…) ou d’une caractéristique d’un participant ou circonstant (s’irriter ? irritable, comprendre ? compréhensible…).

2.2.2 – Les collocations

12La notion de collocation, telle que nous l’entendons, correspond à celle présentée dans Hausmann (1979), et qui a été clairement mise en avant sous le nom de série phraséologique dans Bally (1909) [1]. Elle est au centre du présent numéro de Langue française et notre perspective sur cette notion n’est pas radicalement différente de celle de la plupart des auteurs qui participent à cette publication. Nous allons néanmoins présenter la collocation selon nos propres termes, notamment afin de mieux établir la connexion théorique et descriptive entre le phénomène des collocations et celui des dérivations sémantiques, qui vient juste d’être examiné.

13Pour expliciter la notion de « collocation », nous commencerons par quelques exemples. Supposons qu’afin de caractériser une entité physique quelconque un locuteur cherche à exprimer le sens ‘dont le volume physique est plus important que la moyenne’. Pour exprimer le sens en question, le locuteur a à sa disposition l’adjectif gros. Peu importe l’entité, il pourra presque toujours utiliser gros : un gros cheval, une grosse mouche, un gros sandwich… Si une lexie française sert à désigner une entité physique ayant un volume, elle peut toujours être modifiée par gros (ou grosse). Les combinaisons gros cheval, grosse mouche, gros sandwich… sont, donc, des combinaisons « libres » de lexies. Pour les construire, le locuteur se contente de sélectionner des lexies exprimant chacune un sens donné, puis de les combiner en se conformant simplement aux règles grammaticales de la langue.
Examinons maintenant un cas de figure tout différent. Supposons que le locuteur veuille exprimer auprès d’un sens lexical donné un sens beaucoup plus vague comme ‘très, intense, important’, c’est-à-dire l’intensification. Il existe une foule de lexies pouvant exprimer ce sens, mais le choix de la lexie appropriée n’est pas libre : il dépend de la lexie dont le locuteur veut intensifier le sens. Ainsi, il dira

14

  • pour argument : argument massue, de poids… ;
  • pour brouillard : brouillard dense, épais, opaque, à couper au couteau ;
  • pour méchant : méchant comme la gale, comme une teigne ;
  • pour dormir : dormir comme un loir, à poings fermés
Ce sont ces expressions que nous appelons collocations et qui, avec les dérivations sémantiques, sont au cœur de la description lexicographique du DiCo. De façon non formelle, on pourrait définir la collocation de la façon suivante :

15

Une collocation est une combinaison de lexies qui est construite en fonction de contraintes bien particulières : elle est constituée d’une base, que le locuteur choisit librement en fonction de ce qu’il veut exprimer (argument, brouillard, méchant…), et d’un collocatif (massue pour argument, dense pour brouillard, comme une teigne pour méchant…), choisi pour exprimer un sens donné (ici, ‘intense’) en fonction de la base.

16Notons qu’un collocatif n’est pas nécessairement un lexème (lexie monolexicale). Il peut être une locution (à couper au couteau, comme une teigne…) ; cela est même très souvent le cas, notamment pour les collocatifs à valeur métaphorique.
Les collocations décrites dans le DiCo peuvent correspondre à l’expression de sens aussi variés que, par exemple :

17

  • l’atténuation (c’est-à-dire, l’opposé de l’intensification) : un sommeilléger ;
  • l’évaluation positive : une phrase bien faite, bien tournée, élégante ;
  • l’évaluation négative : une phrase mal faite, mal tournée, maladroite.
Dans un nombre élevé de collocations d’un type fort différent – collocations de verbes supports – le collocatif ne sert pas à exprimer un sens donné mais à « supporter syntaxiquement » le nom qui est la base de la collocation. Ainsi, pour exprimer verbalement le groupe nominal la résistance de Jean face à Pierre on peut dire Jean oppose une résistance à Pierre. Si l’on veut un verbe support qui prenne Pierre, et non Jean, comme sujet grammatical, on dira Pierre se heurte à la résistance de Jean.

18Voici deux autres exemples présentant le même type de contraste :

19

Jean apporte son aide à Pierre. ~ Pierre reçoit de l’aide de Jean.
Jean donne un cours à Pierre. ~ Pierre suit un cours de Jean.

20Ces exemples donnent une idée intuitive de ce que recouvre la notion de « collocation », dans notre perspective. C’est un phénomène omniprésent dans la langue. Il relève, en outre, d’une compétence linguistique difficile à acquérir. En effet, pour un grand nombre de lexies de la langue, le locuteur est amené à mémoriser des séries de collocatifs, qui s’opposent parfois par des distinctions sémantiques fines et qui ont des comportements syntaxiques très spécifiques. Ainsi, pour le nom fortune, il est possible de dire faire fortune, sans article, alors que l’article est obligatoire lorsque l’on utilise le verbe accumuler : accumuler une fortune vs * accumuler fortune.
Nous allons maintenant aborder l’aspect véritablement original de la modélisation des collocations faite dans le DiCo (et dans toute modélisation explicative et combinatoire) en explicitant ce qui réunit logiquement les deux notions de « dérivation sémantique » et de « collocation ».

2.3 – Dérivations sémantiques et collocations comme manifestations d’un même phénomène conceptuel

21Ce qui caractérise véritablement la modélisation d’une base lexicale du type DiCo est le fait que les notions en question sont vues comme reposant toutes deux sur la notion beaucoup plus générale de lien lexical orienté.

  • Une dérivation sémantique est une relation particulière entre deux lexies : une lexie de départ et une lexie « sémantiquement construite » à partir de celle-ci. Il s’agit donc d’un lien lexical orienté : de la base de la dérivation vers le dérivé.
  • Une collocation est une expression linguistique constituée de deux lexies, dont l’une – la base – contrôle l’emploi de l’autre – le collocatif. Une collocation n’est donc pas une relation. Cependant, chaque collocation présuppose une relation particulière de « contrôle » entre les deux lexies qui la constituent : la base contrôle le choix du collocatif. Ce contrôle est également un lien lexical orienté : de la base de la collocation vers le collocatif.
Puisque dans les deux cas nous sommes en présence de liens lexicaux orientés, il est possible de modéliser les deux phénomènes au moyen d’un même outil descriptif. Il s’agit de pointeurs qui, pour chaque lexie décrite dans un article de dictionnaire, spécifient ses dérivés sémantiques et ses collocatifs ; par exemple :

22

couperinstrument ? hache
méchantintensificateur ? comme la gale
méchantintensificateur? comme une teigne

23La description des liens lexicaux offerte par le DiCo – comme par toute modélisation du type Dictionnaire explicatif et combinatoire (Mel’ãuk et al. 1984, 1988, 1992, 1999) – s’appuie sur un ensemble restreint de patrons de liens lexicaux dérivationnels et collocationnels, qui sont des liens lexicaux standard. Chaque lien lexical standard est modélisé comme une « fonction », au sens mathématique, qui s’applique aux lexies pour retourner la liste de leurs dérivés sémantiques ou de leurs collocatifs. On peut donc écrire, en s’inspirant du formalisme mathématique f (x) = y :

Lien lexical (lexie) = expressions possibles du lien
Pour reprendre les séries d’exemples ci-dessus :
Instrument (couper) = hache
Intensificateur(méchant) = comme la gale, comme une teigne
Chaque FL standard modélisant un type de lien particulier porte un nom spécifique, que l’on retrouvera dans l’encodage du lien en question quelle que soit la langue décrite par le dictionnaire explicatif et combinatoire. Ainsi, la fonction retournant les noms d’instruments s’appelle Sinstr ; celle retournant les collocatifs intensificateurs s’appelle Magn. Les formules ci-dessus peuvent donc se réécrire :
Sinstr(couper) = hache
Magn(méchant) = comme la gale, comme une teigne
Tout lecteur connaissant les principes de base de la lexicologie explicative et combinatoire reconnaîtra ici les formules d’encodage faisant appel aux FL. Rappelons que la lexie apparaissant entre parenthèses dans de telles formules (couper, méchant…) est appelée l’argument de la FL, et la liste de lexies ou de locutions qui suit le signe d’égalité est appelée la valeur retournée par l’application de la FL à l’argument en question. Les FL standard forment un véritable système, à la structure très riche, qu’il ne nous appartient pas d’introduire ici – pour une courte introduction, cf. notamment Polguère (2003a : 129-142), et pour une présentation détaillée, cf. Mel’ãuk et al. (1995 : 125-152).

24Le système des FL est particulièrement puissant puisqu’il offre un même outil formel pour modéliser tous les types de liens lexicaux contrôlés par les lexies, et cela pour n’importe quelle langue. Il permet de réunir des phénomènes qui sont la plupart du temps considérés séparément – autant en linguistique qu’en lexicographie ou en linguistique appliquée à l’enseignement -alors qu’en fait ils relèvent tous « en profondeur » de la notion de lien lexical. On remarque que, lorsque les dérivations sémantiques et les contrôles collocationnels sont réunis dans la littérature linguistique sous la même notion de lien lexical, c’est pour être traités séparément en tant que liens lexicaux para-digmatiques vs liens lexicaux syntagmatiques. Or, si nous adhérons à cette distinction fondamentale (cf. les FL paradigmatiques vs syntagmatiques), nous sommes convaincus que la frontière entre les deux types de liens n’est pas étanche par nature, et cela, pour au moins deux raisons.

25Premièrement, l’activation des liens lexicaux en parole est au cœur du fonctionnement de la paraphrase linguistique – Mel’ãuk (1992), Miliçeviç (2003). Or, les liens de paraphrase reposent très souvent sur des égalités de structures qui mettent en jeu des FL paradigmatiques et syntagmatiques. Par exemple, l’équivalence très générale suivante démontre le lien profond qui unit la notion de verbe support et celle de dérivation sémantique vide de type verbal :

Oper1(L) + L ? v0(L)
Cette « règle de paraphrasage » très simple permet de rendre compte des équivalences sémantiques suivantes :
pousser[= Oper1(L)] un soupir[= L] ? soupirer[= V0(soupir)]
commettre[= Oper1(L)] un assassinat[= L] ? assassiner [= V0(assassinat)]
Deuxièmement, le contenu d’un collocatif, d’un Magn par exemple, peut tout à fait s’exprimer de façon fusionnée, c’est-à-dire au moyen d’une lexie qui n’est pas un collocatif de l’argument de Magn mais plutôt un synonyme plus spécifique, incluant le sens d’intensification. Dans nos descriptions, nous indiquons une valeur fusionnée au moyen de l’opérateur //. Comparons, par exemple, les différentes valeurs de Magn de l’acception de base de pauvreté ci-dessous, que nous avons extraites du DiCo :

26

grande | antépos < absolue, extrême // misère.
Contrairement aux adjectifs grande, profonde, etc., le nom misère n’est pas un collocatif de pauvreté, mais un « substitut ». Il s’agit d’une lexie qui entretient un lien paradigmatique de quasi-synonymie avec PAUVRETÉ, tout en étant un Magn de cette lexie !

27On voit à quel point le système des FL, appliqué à la lettre, nous force à considérer ensemble les notions de liens paradigmatiques et de liens syntagmatiques. Pour qui croit en la séparation profonde, conceptuelle, de ces deux notions, c’est clairement une tare du système en question. Mais pour celui qui, au contraire, pense que ces deux types de liens sont intrinsèquement liés du point de vue de l’utilisation du code linguistique par le locuteur, c’est un bénéfice considérable. Cette remarque nous permet d’avancer ce qui est peut-être notre slogan quant à la modélisation des collocations et des dérivations sémantiques.

28

Le système des FL standard, plus qu’un outil d’encodage, est un outil d’exploration et de modélisation des liens lexicaux paradigmatiques et syntagmatiques, ces deux types de liens devant être considérés simultanément.
Une telle approche distingue radicalement le DiCo des dictionnaires de collocations proprement dits, même lorsqu’il s’agit de dictionnaires conçus selon une perspective très « linguistique » comme Benson et al. (1997) ou Crowther et al. (2002), pour l’anglais.

2.4 – Autres propriétés lexicales décrites dans le DiCo

29Le DiCo n’est pas un simple répertoire de dérivations sémantiques et de collocations. Il s’agit véritablement d’une base lexicographique décrivant les lexies du français. Même si cette base se focalise sur la description des liens de FL contrôlés par les lexies, elle vise une modélisation de toutes leurs propriétés de combinatoire. À cette fin, on trouve dans le DiCo, outre les liens de FL, quatre autres types de propriétés associées à chaque lexie : ses caractéristiques grammaticales, son étiquette sémantique, sa forme propositionnelle et son régime syntaxique.

Caractéristiques grammaticales

30Il s’agit des propriétés de combinatoire qui sont avant tout d’ordre grammatical comme la partie du discours, le genre grammatical (pour les noms), les restrictions liées à l’emploi du défini/indéfini ou du nombre (pour les noms), etc. On considère ici aussi les contraintes d’emploi de nature plus pragmatique, comme celles dont rendent compte les marques d’usage (formel, familier, vulgaire, etc.).

Étiquette sémantique

31L’étiquette sémantique d’une lexie est un lexème ou un syntagme qui fonctionne comme genre prochain de sa définition lexicographique – cf. Polguère (2003b). Les étiquettes sont souvent utiles pour distinguer les différentes acceptions d’un vocable. Cependant, leur intérêt va bien au-delà. En effet, l’étiquette sémantique résume la « quintessence sémantique » de la lexie et permet donc d’effectuer des prédictions très fortes quant aux liens de FL que celle-ci peut contrôler. De plus, parce qu’il engendre une classification des unités lexicales, le système d’étiquetage du DiCo permet au lexicographe (comme à l’usager) de facilement récupérer les données sur les lexies ayant une forte parenté de sens.

Structure actancielle

32La structure actancielle de la lexie est sa caractérisation en tant que prédicat sémantique. Il existe bien entendu une forte corrélation entre structure actancielle et étiquette sémantique. Par exemple, toute lexie étiquetée sentiment possédera au moins un premier actant correspondant à l’être animé éprouvant le sentiment en question ; dans de très nombreux cas, il y aura aussi un deuxième actant, correspondant à la source du sentiment. Autre exemple : les lexies étiquetées confrontations d’idées – comme débat1 [Un débat entre partisans et adversaires de la peine capitale agite la société.], dont il sera question plus loin – ont typiquement une structure actancielle à trois actants ‘~ entre X et Y à propos de Z’.

Régime syntaxique

33Le régime syntaxique de la lexie est la correspondance entre ses actants sémantiques, syntaxiques profonds, syntaxiques de surface et leurs expressions dans la phrase. Il s’agit donc de la façon dont une lexie contrôle l’expression de sa structure actancielle.

34L’approche descriptive du DiCo et, plus généralement, de la lexicologie explicative et combinatoire repose sur le postulat que toutes les propriétés qui viennent d’être énumérées sont interconnectées et doivent être considérées simultanément dans le cadre de l’activité lexicographique. En fait, le travail sur un vocable particulier commence par une première hypothèse faite sur la structure polysémique du vocable, qui s’accompagne d’une ébauche rapide de caractérisation de chaque acception en termes de propriétés grammaticales, étiquette sémantique, structure actancielle et régime. On commence ensuite à réunir autour de chaque lexie un premier ensemble de liens de FL qu’elle contrôle. Cela nous amène souvent à revenir sur nos hypothèses premières, et la suite du travail va se faire par affinements successifs et corrections sur les hypothèses de départ. On peut considérer qu’il s’établit une sorte de dialogue entre toutes les caractéristiques d’une lexie décrite, qui fait qu’il est pratiquement impossible de considérer une caractéristique spécifique de façon isolée.

3 – Encodage des données dans le DiCo

3.1 – Structure des fiches lexicographiques du DiCo

35Chaque lexie est décrite dans le DiCo au moyen d’une fiche lexicographique subdivisée en champs. La lexie décrite dans une fiche est appelée le mot-vedette de la fiche, et chaque champ contient un type d’information bien spécifique associé au mot-vedette.

36Pour illustrer la structure et le contenu d’une fiche DiCo, nous utiliserons la fiche de bouillieii [Avec la chaleur, nos jolies pêches ne sont plus que de la bouillie.], une des quatre acceptions du vocable bouillie identifiée dans le DiCo [2]. Nous remettons à plus tard l’examen des données sur débat dans la mesure où les lexies de ce dernier vocable ont des fiches très riches et complexes, qu’il serait difficile d’utiliser pour simplement illustrer notre approche. Voici donc le contenu des principaux champs de données lexicographiques de la fiche de bouillieii, telle qu’elle a été construite par les lexicographes du DiCo.
Il est intéressant de s’arrêter brièvement sur le contenu du dernier champ (ph) de la fiche de bouillieii. On voit que nous avons considéré qu’il existe une locution |?en bouillie?|. C’est cette locution qui est employée, par exemple, dans une phrase comme :

[1]
Ce fut un horrible accident : on l’a retrouvé en bouillie sur le bord de la route.
La modélisation de l’emploi de l’expression en bouillie dans la phrase ci-dessus ne relève pas de la fiche DiCo de bouillieii, mais bien de celle de |?en bouillie?| (qui a d’ailleurs été rédigée dans le DiCo). L’expression en bouillie apparaissant en (1) ne doit pas être confondue avec celle apparaissant dans la phrase ci-dessous qui, elle, relève bien de la combinatoire de bouillieii :
[2]
Réduisez tout d’abord les haricots rouges en une épaisse bouillie.
Le contenu de chacun des champs de la Figure 1 ainsi que le mode d’encodage utilisé mériteraient d’être examinés en détail. Néanmoins, dans le cadre du présent article, nous devons nous concentrer sur la modélisation des liens de FL, c’est-à-dire sur le contenu des champs Syn et fl.

Figure 1

Fiche DiCo de la lexie BOUILLIEII

Figure 1

Fiche DiCo de la lexie BOUILLIEII

3.2 – Encodage des liens lexicaux

37Les liens dérivationnels et collocationnels sont encodés dans le DiCo selon le schéma suivant :

/*<Formule de vulgarisation du lien de fonction lexicale> */{< Lien de fonction lexicale> } <Valeur>
Comme on peut le constater dans la Figure 1 ci-dessus, les formules de vulgarisation décrivant les liens lexicaux sont basées sur un métalangage compréhensible par tous – une sorte de français standardisé. Commentons un peu plus en détail le contenu des champs Syn et fl de la Figure 1, en examinant l’encodage de chaque lien de FL à tour de rôle.

38Le premier lien encodé correspond à la quasi-synonymie :

{QSyn} masse informe
On notera que ce lien se présente sans formule de vulgarisation. En effet, nous ne vulgarisons pas les liens auxquels un dictionnaire grand public dérivé du DiCo associerait toujours un même encodage vulgarisé, quelle que soit la lexie. Par exemple, dans le LAF, les FL Syn et QSyn sont toujours transcrites par le symbole « figure im2 ».

39Nous quittons maintenant le champ des liens de nature synonymique, pour entrer dans celui contenant l’essentiel des liens de FL.

{Epit} informe | postpos
Epit désigne un modificateur redondant qui est un cliché langagier reprenant une composante sémantique du mot-vedette. En effet, bouillie informe est un pléonasme, qui est pourtant souvent utilisé et ne doit aucunement être considéré comme une erreur.
{Telle que X est une partie du corps
ensanglantée} sanglante, sanguinolente | postpos
Nous avons ici un lien de FL non standard qui encode une combinatoire courante du mot-vedette. Les expressions bouillie sanglante et bouillie sanguinolente, bien que sémantiquement transparentes au niveau du décodage linguistique, doivent être consignées dans le dictionnaire du fait de leur nature collocationnelle. Elles représentent des clichés propres au français, que le locuteur doit avoir appris.

40

/*[X] être une B.*/
{Oper1} être [ART ~], n’être que [ART ~]
/*[Qqn./Qqch.] causer que X soit de la B.*/
{CausOper1} réduire [N=X en ART ~]
La FL Oper1 représente les verbes supports qui prennent le mot-vedette comme complément et l’expression du premier actant de celui-ci comme sujet. CausOper1 encode un collocatif causatif, pour le même type de structure syntaxique. On voit que les formules de vulgarisation qui précèdent les encodages formels permettent de « court-circuiter » le recours aux formules de FL en paraphrasant les expressions décrites.

41La technique de la vulgarisation des liens de FL, outre qu’elle facilite l’accès aux données par le non-spécialiste, ouvre la voie à nombre de recherches sur le système des FL lui-même. En effet, les formules de vulgarisation, du fait qu’elles varient – pour une même FL – selon l’étiquette sémantique du mot-vedette, permettent de mettre en évidence les différentes facettes sémantiques de chaque lien paradigmatique ou syntagmatique standard. Ce type d’information est très utile, notamment, lorsqu’on explore les possibles connexions entre les FL et la définition lexicographique des lexies auxquelles ces fonctions s’appliquent – cf. Kahane (2003) et Iordanskaja & Polguère (2005).
Notons, pour conclure sur le sujet, que les liens de FL non standard sont traditionnellement encodés dans les dictionnaires explicatifs et combinatoires au moyen d’expressions non formalisées, qui fonctionnent comme des paraphrases du lien en question. Ces expressions n’ont pas besoin d’être vulgarisées puisqu’elles sont immédiatement interprétables sans connaissance du système des FL standard. On trouve par exemple les liens non standard suivants dans la fiche DiCo de débat2 [Elle participe à un débat télévisé sur le rôle de Y école dans la société.] :

42

{[Qqn.] contrôler le déroulement d’un D.} animer, diriger [ART ~]
{Individu qui contrôle le déroulement d’un D.} animateur [de ART ~]
{Événement social N
qui comprend un D.} N– ~ | D. en apposition [“— Nous vous convions à un dîner-débat.”]
Le lecteur aura remarqué que nous avons saupoudré notre présentation de références à DEBAT, qui est le vocable que plusieurs auteurs du présent volume ont décidé de prendre comme point de référence pour comparer leurs approches. Avant de passer à l’application de nos méthodes au cas spécifique de ce vocable, nous allons brièvement aborder deux aspects essentiels de l’organisation du projet DiCo/LAF : la modélisation des liens lexicaux fondée sur une stricte division des mots polysémiques en unités lexicales (section 3.3.) et l’extraction de nouvelles structures de données à partir du DiCo (section 3.4.).

3.3 – Division des mots polysémiques en unités lexicales

43C’est un fait bien connu qu’un mot polysémique (un vocable, dans notre jargon) doit être divisé, pour fins de description lexicographique, en acceptions correspondant chacune à une unité lexicale spécifique. Une unité de description lexicographique correspond donc à la modélisation d’une unité lexicale, pas à celle d’un mot polysémique. Cependant, lorsqu’il est question de la description des dérivations sémantiques ou des collocations, on a tendance à oublier cette vérité banale et à réunir dans une même énumération les dérivations et les collocations de toutes les acceptions d’un vocable. C’est le défaut principal de plusieurs dictionnaires de collocations, qui les invalide à un degré significatif. Cela s’explique par le fait que la division d’un vocable en unités lexicales, c’est-à-dire la résolution de la polysémie, est une des tâches les plus difficiles que doit affronter le lexicographe.

44Cependant, les dérivations et les collocations sont très sensibles à la polysémie. Tel dérivé ou telle collocation sera possible pour telle acception d’un mot polysémique, mais pas pour une autre. Ainsi, élévation est dérivé d’élever ‘porter à un rang supérieur’, tandis que élevage vient d’élever ‘s’occuper des animaux’ ; attaquer ‘commencer le combat’ a le nom d’action attaque (une attaque des blindés), mais pas attaquer ‘détruire la substance de qqch.’ (*une attaque de l’acide) ; on dit que l’armée bat en retraite, mais on dit que l’employé en fin de carrière part à la retraite. Nous pourrions continuer à citer des exemples de ce type par milliers, mais point n’est besoin de le faire : en théorie, tout le monde ou presque est d’accord sur la nécessité de résoudre la polysémie, même si en pratique on néglige souvent de le faire.
Dans notre projet DiCo/LAF, une bonne division du vocable en unités lexicales est une condition sine qua non à une présentation valide des liens lexicaux. Nous ne nous permettons jamais de réunir dérivés sémantiques et collocations sous un même mot-vedette sans égard pour sa polysémie éventuelle. Plus que cela, la différence des dérivés et des collocations sert souvent d’indicateur sûr pour la distinction des acceptions.

3.4 – Extraction de nouvelles structures de données à partir du DiCo

45La problématique de l’extraction de données et de produits lexicographiques du DiCo a été au cœur de nos préoccupations depuis le début du projet. Nous avons commencé par mettre au point un format possible de dictionnaire pédagogique dérivé de la base, le LAF, que nous avons développé graduellement par transformation et reformatage manuels des fiches DiCo –cf. Polguère (2000).

46Grâce à une Chaire Blaise Pascal accordée à I. Mel’ãuk et à une collaboration avec J. Steinlin (Paris 7) et S. Kahane (Paris 10), nous disposons depuis tout récemment d’un « transmuteur » de DiCo qui compile l’ensemble de fiches DiCo en un ensemble de tables de données interrogeables au moyen de requêtes SQL – cf. Steinlin et al. (2004). L’interface DiCouèbe est accessible sur le site de l’Observatoire de linguistique Sens-Texte (OLST) à l’adresse suivante [3] : http://www.olst.umontreal.ca/dicouebe. Le DiCo compilé n’est plus véritablement un ensemble de fiches lexicographiques, un dictionnaire sur support informatique. Sa structure interne ressemble plutôt à la structure de bases lexicales du type WordNet (même si l’information qu’il contient est beaucoup plus riche que celle que l’on trouve habituellement dans ces bases). Le lexique y est modélisé comme un gigantesque réseau fait de connexions étiquetées entre « entités lexicales ». Alors que le DiCo en fiches correspond à une structure de données adaptée à l’activité de rédaction lexicographique, la structure en réseau vise la consultation automatique et, de façon plus générale, le traitement informatique.
Nous allons maintenant, dans la dernière section, appliquer l’approche du DiCo/LAF au cas particulier du vocable débat.

4 – Méthodologie lexicographique : application au vocable débat

4.1 – Résumé du travail lexicographique effectué sur débat

47La construction des fiches DiCo pour le vocable débat s’est faite en trois étapes principales :

  1. ébauche de la structure du vocable ;
  2. recherche d’exemples d’emplois de chaque acception ;
  3. élaboration des fiches complètes (en commençant par l’unité lexicale de base du vocable).
Nous examinons maintenant brièvement ce qui caractérise chacune de ces étapes.

4.1.1 – Ébauche de la structure du vocable

48Avant même d’entamer le véritable travail lexicographique sur débat, on peut se rendre compte que l’on est en présence d’un vocable polysémique : le débat qui « agite la société » n’est pas perçu comme étant le même débat que celui qu’on organise à la fin d’une conférence [4]. Il faut donc commencer par faire une ébauche de la structure polysémique du vocable.

49Bien entendu, nous ne pouvons pas expliquer ici exactement quelles ont été toutes nos réflexions et discussions ; contentons-nous de dire qu’elles nous ont conduits à la structure suivante, où chaque acception est caractérisée sémantiquement de façon très approximative et illustrée par un exemple :

tableau im3
DÉBAT1 ‘confrontation d’idées ayant lieu entre différents membres d’un groupe social du fait d’un désaccord sur un sujet donné’ [Ex. Un débat agite la société.]
tableau im4
DÉBAT2 ‘discussion organisée entre différents participants à un événement social’ [Ex. La conférence sera suivie d’un débat.] DÉBAT3a ‘discussion organisée dans un corps législatif’ [Ex. Les députés se sont mis d’accord au terme d’un interminable débat.] DÉBAT3b ‘discussion organisée durant une séance de tribunal’ [Ex. L’affaire fera l’objet d’un débat contradictoire devant le tribunal correctionnel.]

50L’acception choisie comme unité lexicale de base – debat1 – a « mérité » cette position dans notre description à cause de tout un faisceau d’indices lexicographiques de sa prédominance. Citons notamment les trois indices suivants :

51

  1. Il s’agit du sens le plus général. Ainsi, un débat2 peut être vu comme une concrétisation, ou spécialisation, du débat1.
  2. La lexie débat1 semblait a priori contrôler plus de liens lexicaux que les autres, même si débat2 paraissait elle aussi très riche de ce point de vue. Cette dernière intuition a été confirmée au cours des étapes de traitement subséquentes, puisque notre fiche finale de DiCo pour débat1 contient environ un tiers de liens de FL de plus que celle pour débat2.
  3. Les deux dernières lexies du vocable, débat3a et débat3b, relèvent de domaines de l’activité humaine très spécifiques (domaine parlementaire et domaine juridique). Il était d’ailleurs clair dès le début que dans le cas de débat3b, au moins, nous étions en présence d’une lexie « terminologique » et qu’il nous serait impossible de la décrire de façon satisfaisante sans consulter de la documentation sur le domaine juridique.
Arrivés à ce niveau de description de débat, nous avons en fait construit cinq fiches DiCo pratiquement vides : une fiche pour chacune des quatre acceptions et une fiche additionnelle, numérotée 0, qui contient toute l’information pouvant être factorisée au niveau du vocable lui-même ; le champ cg de la fiche débat #0 contient l’indication que toutes les lexies du vocable sont des noms masculins.
Nous consultons ensuite la hiérarchie d’étiquettes sémantiques du DiCo (Polguère 2003b) afin d’effectuer l’étiquetage sémantique de chaque acception. L’identification des étiquettes va éventuellement nous permettre de repérer des lexies sémantiquement proches déjà décrites dans la base. À la fin de cette première étape de travail, nous avons obtenu la structure suivante :

figure im5

52Nous indiquons ci-dessus en gras les lexies déjà décrites dans le DiCo, que l’on utilisera comme points de départ pour la description des acceptions de débat dont elles sont des quasi-synonymes.

4.1.2 – Recherche d’exemples dans les corpus (et ailleurs)

53Il est essentiel à ce niveau de plonger dans les données linguistiques pour récolter un maximum d’exemples d’emplois des acceptions que nous avons postulées. Pour cela, nous avons bien entendu recours à des corpus électroniques, notamment des corpus journalistiques. Nous utilisons aussi la recherche sur Internet, avec toutes les précautions d’usage. Notons à ce propos que tout corpus est potentiellement dangereux s’il est utilisé sans discernement. Le but du travail lexicographique est de construire une modélisation des connaissances linguistiques d’un locuteur idéalisé et non de construire une représentation du contenu d’un corpus donné, aussi large et général soit-il.

54L’examen des données, allié au recours à notre propre intuition linguistique, nous permet de collectionner un ensemble important d’exemples qui, une fois ajustés et triés, vont être intégrés dans les champs ex des différentes fiches. Nous en profitons également pour « grappiller » les liens de FL que nous rencontrons en chemin. Cela nous permet de valider ou invalider nos hypothèses de départ quant à la structure du vocable et à l’étiquetage sémantique des acceptions. En effet, les différents contextes d’emploi rencontrés dans les corpus sont des indicateurs très forts du contenu sémantique d’une lexie et donc, par conséquent, des indicateurs de ce que doit être son étiquette sémantique.

4.1.3 – Élaboration des fiches détaillées

55Nous pouvons maintenant commencer le travail de description méthodique des acceptions, en commençant par l’unité lexicale de base du vocable. Il est important de commencer par cette lexie car, si notre hypothèse de départ est exacte, il sera ensuite plus facile de décrire les autres acceptions relativement à celle-ci. Les étiquetages sémantiques nous indiquent en effet que les écarts sémantiques entre acceptions sont somme toute assez faibles ; notamment, le vocable ne semble contenir aucune acception de nature métaphorique.

56Remarquons qu’il est beaucoup plus difficile d’effectuer la description d’un vocable de ce type. En règle générale, plus les écarts sémantiques entre acceptions sont grands, plus il est aisé d’identifier, répartir et décrire les propriétés de chaque acception. Dans le cas d’un vocable comme débat, au contraire, on trouvera dans les corpus beaucoup d’interférences et, notamment, de « greffes collocationnelles » effectuées sur une acception donnée à partir de la combinatoire d’une autre acception – sur la notion de « greffe collocationnelle », cf. Polguère (à paraître).

57Pour la description de la lexie de base, nous avons eu la chance de disposer d’une fiche DiCo finalisée pour une lexie possédant la même étiquette sémantique (confrontation d’ idées), la même structure actancielle et le même régime syntaxique que débat1 : dialogue2 [Rien n’indique que toutes les parties accepteront de reprendre le dialogue.]. Nous nous sommes donc fortement inspirés de la description de cette dernière lexie pour développer notre nouvelle fiche.

58Faute de place, nous ne pouvons présenter ici le contenu des fiches décrivant les lexies de débat. La modélisation DiCo de ce vocable est cependant accessible en ligne via l’interface DiCouèbe (mentionné plus haut). Si l’on consulte les données sur débat1, on notera que le champ ph de sa fiche DiCo contient l’énumération des phrasèmes complets (= des locutions) |?débat de conscience?| et |?débat intérieur?|. Cette information est très importante car elle indique que, selon nous, il n’existe pas d’autres acceptions de débat qui correspondraient aux exemples ci-dessous :

59

[3]
a. Gide n’a pas publié son ouvrage sans un cruel débat de conscience.
b. Racine a distribué sur deux personnages les pôles du débat intérieur.
Ces exemples mettent en effet en jeu des locutions du français, locutions qui doivent être décrites dans leurs propres fiches de DiCo. On pourra rapprocher cette remarque de ce qui a été dit à la section 3.1. à propos de bouillieii vs |?en bouillie?|.
Nous n’avons pas la place de commenter ici la description des trois autres lexies de débat. On notera simplement que débat2 se construit d’une part à partir de débat1, dont elle emprunte nombre de liens lexicaux, et d’autre part à partir de la fiche de dialogue1a [C’était clairement un dialogue entre deux amants éperdument amoureux.], déjà disponible dans le DiCo. Notons que nous nous sommes volontairement abstenus, dans le cadre du présent exercice, de faire des recherches dans des dictionnaires et répertoires de dérivations sémantiques et collocations pour compléter nos données.

4.2 – Quelques remarques pour conclure sur l’approche DiCo/LAF

60Nous avons déjà insisté en début d’article sur le fait que notre approche du traitement des collocations se caractérise par sa nature « globale » : les liens collocationnels sont un des axes d’analyse de la lexie, tous les axes d’analyse étant interconnectés. Il convient d’insister, pour conclure, sur l’omniprésence de la caractérisation sémantique de la lexie dans notre approche. Même si le DiCo ne contient pas, à proprement parler, de définition lexicographique, nous ne pouvons faire l’économie du recours à la définition pour effectuer l’encodage des liens paradigmatiques et syntagmatiques.

61Le couple formé par l’étiquette sémantique et la forme propositionnelle (décrivant la structure actancielle) nous procure un squelette de définition auquel nous avons sans cesse recours pour encoder les liens de FL (formellement et au moyen des formules de vulgarisation). De plus, les encodages du champ fl de chaque fiche contiennent en filigrane le renvoi à des composantes de la définition, clairement identifiées au cours du travail lexicographique, et qui n’attendent que de trouver leur place dans une définition du type de celles du Dictionnaire explicatif et combinatoire[5].

62Pour illustrer ces propos par un exemple concret, examinons l’extrait de la fiche de DÉBAT1 reproduit ci-dessous, qui concerne la zone du champ fl relevant des FL de « réalisation » Reali, Facti et Labrealij.

figure im6

63Les collocations encodées ci-dessus relèvent clairement de la famille des FL de réalisation. Elles sont un indice très fort de la présence, dans la définition de la base, d’une composante de sens liée à la finalité de la situation de débat1. Si l’on peut dire, par exemple, trancher le débat pour signifier ‘faire en sorte que le débat1 mène à un résultat’, c’est parce qu’il est sémantiquement encodé dans la langue qu’un débat1 a une finalité, un but que cherchent à atteindre les participants (X et Y) de la situation en question. Cette observation est d’ailleurs corroborée par la présence de collocatifs de type Ver (FL associée au sens très général ‘tel qu’il doit être’) ou AntiVer qui sont directement liés à la notion de finalité :

/*Utile*/
{Ver-finalité} concluant | postpos, fructueux, utile
/*Inutile*/
{AntiVer-finalité} inutile, stérile, vain
L’existence d’une collocation comme débat stérile, parce qu’elle s’encastre parfaitement dans la grille d’analyse des FL standard, nous permet de tisser notre toile sémantique autour du mot-vedette. On voit aussi qu’elle nous pousse à décrire des expressions qui ne sont pas des collocations très typiques, comme débat inutile. Cette dernière, que l’on pourrait à première vue considérer comme sémantiquement compositionnelle, entre dans le champ de gravité des collocations apparentées du fait des propriétés sémantiques et de combinatoire du mot-vedette. Il est donc justifié de l’inclure dans notre fiche [6].

64Nous espérons avoir démontré que le DiCo n’est pas un dictionnaire de collocations, mais bien un dictionnaire explicatif et combinatoire à part entière. Il est vrai que le nom DiCo trouve son origine dans l’expression dictionnaire de cooccurrences, car la modélisation des collocations était au centre de nos préoccupations lorsque nous nous sommes lancés dans cette entreprise. Très vite, cependant, il est devenu évident que les collocations devaient être au DiCo ce que la crème frangipane est à la galette des Rois : la partie la plus savoureuse, peut-être, mais qui est difficilement mangeable sans le reste.


Date de mise en ligne : 01/06/2010

https://doi.org/10.3917/lf.150.0066

Notes

  • [1]
    Pour une définition rigoureuse, faite dans le cadre de la théorie Sens-Texte, cf. Mel’ãuk (1995 : 182 sq), Mel’ãuk (2003a : 23 sq) ou Mel’ãuk (2003b : 24 sq).
  • [2]
    Les trois autres acceptions sont : bouilliei.1 [Il mange une bouillie d’avoine.], bouilliei.2 [Il marchait dans une sorte de bouillie d’argile.] et bouillieiii [Sa thèse est nulle; c’est une bouillie d’idées incohérentes.]
  • [3]
    On peut télécharger à cette adresse une documentation détaillée présentant le DiCo, sa structure compilée et l’interface DiCouèbe : Jousse & Polguère (2005).
  • [4]
    Il s’agit d’une façon volontairement naïve de présenter les choses. On pourrait tout à fait percevoir que l’on a affaire à deux situations concrètes différentes, et ensuite se rendre compte, à l’examen du comportement linguistique de débat, que le français ne dispose ici que d’une lexie vague, qui permet de désigner les deux situations en question.
  • [5]
    Un projet de construction de base de définitions formelles – la BDéf – est en cours à l’OLST. Ce projet n’a pas atteint la maturité du projet DiCo, mais notre but ultime est d’intégrer au DiCo de véritables définitions lexicographiques construites selon les principes de la lexicologie explicative et combinatoire. Pour une présentation du projet BDéf, cf. Altman & Polguère (2003).
  • [6]
    En d’autres termes, débat inutile n’est pas une expression aussi « innocente » que chaise inutile, fatigue inutile… ; elle doit être considérée comme une collocation malgré son faible degré d’idiomaticité.

Domaines

Sciences Humaines et Sociales

Sciences, techniques et médecine

Droit et Administration

bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Retrouvez Cairn.info sur

Avec le soutien de

18.97.14.85

Accès institutions

Rechercher

Toutes les institutions