Couverture de ELA_185

Article de revue

Système linguistique et calculabilité des langues slaves de l’ouest (nord et sud) : approches d’une complexité comparée

Pages 35 à 50

Notes

  • [1]
    Ces travaux sont conduits dans le cadre de plusieurs contrats : 1.- Travaux sur la morphologie polonaise soutenus par le projet LINDAT/CLARIN No. LM2010013 -MEYS CR. 2.- Contrat GAČR n° 16-18177S « An Integrated Approach to Derivational and Inflectional Morphology of Czech ». 3.- PHC Barrande n° 35637ZF « Approche contrastive de la morphologie tchèque à l’attention des locuteurs francophones ». 4.- PHC Proteus n° 35257ZD « Morphologie dérivationnelle du slovène en vue de son traitement automatique ».
  • [2]
    « Pour comprendre le problème de la complexité, il faut savoir d’abord qu’il y a un paradigme de la simplicité. » (Morin, 2005 : 79).
  • [3]
    « t » + jer mou devient « Ś » en bas-sorabe, reste « ть » en russe et « ť » en slovaque et en tchèque. Mais, en tchèque, la majorité des « ť » a perdu sa mouillure se rapprochant ainsi du slovène qui n’a pratiquement plus de mouillure.
  • [4]
    Le slave possède deux niveaux de diminutifs. Il arrive que le premier diminutif ait un sens qui diverge du sens primitif qui demeure dans le second. Tout le monde connaît la vodka ! Elle se trouve dans la suite voda (eau) - vodka - vodička ((petite) eau). Ici, nous avons « děd » (honorifique, ancêtre) - « dědek » (péjoratif, vieux machin) - « dědeček » (normal, grand-père).
  • [5]
    Ce passage est réalisé à partir de notes transmises par Mojca Schlamberger Brezar dans le cadre d’un PHC Proteus 2012 n° 26947TD « grammaire du slovène à l’usage des Francophones - morphologie ».
  • [6]
    Nous trouvons également en haut-sorabe ce type de formation : la capitale Bautzen se dit en slave « Budyšin » et celui qui y habite est un « Budyšan ». S’ils sont plusieurs (au nominatif pluriel), ces habitants seront des « Budyšenjo ».
  • [7]
    Professeur émérite à l’Institut National des Langues et Civilisations Orientales (tchèque), membre des équipes PLIDAM, STIH à l’Université de Paris Sorbonne et ÚFAL à l’Université Charles de Prague.
English version

1 Le lien constant entre nos activités de recherche (analyse automatique du tchèque) et nos activités d’enseignement (langue et grammaire du tchèque) a permis d’évoluer lentement depuis une vision synchronique vers la grammaire historique du tchèque, puis vers une connaissance progressive des autres langues slaves de l’Ouest au sens traditionnel du terme (slovaque, polonais, bas-sorabe, haut-sorabe) et enfin des langues slaves du Sud-Ouest (slovène et variante croate du BCMS).

2 C’est cet ensemble, désigné pour la première fois par Starostin (Blažek, 2005) comme langues slaves de l’Ouest et que nous reprenons à notre compte, qui offrira le cadre de la présente réflexion.

3 Une vision globale des langues slaves est utile à leur traitement automatique, à leur enseignement (en tant que langue maternelle ou étrangère) et à leur comparaison. La connaissance du système linguistique du groupe, connaissance de ce qui est commun et connaissance de ce qui est divergent, permet une bien meilleure compréhension de chaque langue du groupe, des phénomènes ténus dans une langue pouvant être éclairés par la présence massive de ce même phénomène dans une autre langue. Elle est également un apport notable en faveur de l’intercompréhension.

4 Inversement, le traitement automatique des langues (TAL) permet de mieux appréhender le système linguistique en apportant des points de vue que l’on ne peut acquérir autrement. Notre conception du TAL est liée étroitement à l’automatisation de la grammaire et au concept de calculabilité de la langue qui en découle. La calculabilité donne des critères formels de comparaison des langues. Le TAL peut ainsi, par l’intermédiaire de la calculabilité et par sa puissance de calcul sur des masses importantes de données, vérifier si la conception que l’on se construit du système linguistique est homogène, c’est-à-dire ne conduit pas à des contradictions.

5 Nous comprenons le système linguistique comme la conjonction d’un axe spatial (études synchroniques comparées) et d’un axe temporel (études diachroniques comparées). C’est l’ensemble des faits ainsi rassemblés qui constitue le système d’une famille ou d’un groupe de langues. Nous citons en annexe celles de nos publications (de 2001 à 2015) qui tentent d’appréhender le système linguistique des langues slaves de l’Ouest.

1. Comprendre et s’approprier le paradigme de complexité ?

6 Pour introduire le paradigme de complexité, nous nous appuyons sur deux sources essentielles :

7

  • au plan d’une conception générale, philosophique et épistémologique, nous considérons essentiellement les travaux d’Edgar Morin, notamment son exposé sur le paradigme de complexité (Morin, 2005 : 73-104) et ceux de son groupe (Morin, 1999)
  • et pour une vision adaptée aux sciences du langage, l’article d’Ibrahim (2013) et celui de Do-Hurinville (2013) nous fournissent un cadre de réflexion adéquat.

8 Il semble que le concept de complexité soit ancien :

9

« Dans sa thèse de doctorat, Nathalie Glaudert précise que “La complexité est un problème très ancien, aussi vieux que l’analyse des systèmes quels qu’ils soient, mais aussi un problème très actuel, notamment dansl’analyse des langues […]” ». (Do-Hurinville, 2013 : 239)

10 Mais :

11

« c’est avec Wiener, Ashby, les fondateurs de la cybernétique, que la complexité entre véritablement en scène dans la science. C’est avec von Neumann que, pour la première fois, le caractère fondamental du concept de complexité apparaît dans sa liaison avec les phénomènes d’auto-organisation. » (Morin, 2005 : 48)

12 Ce sont des sciences telles que la physique, notamment les sciences de l’Univers et les sciences de la vie qui sont confrontées le plus massivement aux questions de complexité, en particulier dans leur quête de simplicité [2]. Mais le problème de la complexité est beaucoup plus général et concerne non seulement les activités scientifiques et techniques de l’homme (sciences de l’information, sciences humaines et sociales, ingénierie), mais aussi tout simplement la vie de l’individu comme le roman (Balzac, Dickens) a pu la dépeindre (Morin, 2005 : 77-78).

13 Reconnaître la complexité et plus encore savoir la définir n’est pas sans difficultés. La diversité des définitions en fonction des domaines en est peut-être une conséquence. Cela peut expliquer aussi pourquoi un spécialiste de la pensée complexe comme Edgar Morin a mis des décennies à construire son œuvre, notamment « la Méthode » :

14

« Dès mes premiers livres, je me suis affronté à la complexité, qui est devenue le dénominateur commun à tant de travaux divers qui ont semblé à beaucoup dispersés. Mais le mot même de complexité ne me venait pas à l’esprit, il a fallu qu’il m’arrive, vers la fin des années 1960, véhiculé par la théorie de l’information, la cybernétique, la théorie des systèmes, le concept de l’auto-organisation, pour qu’il émerge sous ma plume, ou plutôt sur mon clavier. Il s’est alors dégagé du sens banal (complication, confusion) pour lier en lui l’ordre, le désordre et l’organisation, et, au sein de l’organisation, l’un et le divers ; ces notions ont travaillé les unes avec les autres, de façon à la fois complémentaire et antagoniste ; elles se sont mises en interaction et en constellation. » (Morin, 2005 : 12)

15 Nous avons surligné dans cette présentation des concepts qui définissent ou qui organisent la complexité. Ordre, désordre et réorganisation semblent être l’essence même de tout ce qui vit que l’on soit dans du physique, du biologique ou même dans du social ou du linguistique. Que l’on soit dans l’expansion de l’univers, dans la régénérescence du vivant ou dans l’évolution des langues, on est en premier lieu concerné par des processus qui régénèrent le tout en faisant évoluer les parties, qui maintiennent le tout par substitution de parties - d’anciennes par de nouvelles. C’est le sens de « l’un et le divers » sachant qu’il n’y a complexité que si le tout est constitué non seulement d’un grand nombre de divers, mais que ces divers répondent à un grand nombre d’organisations et de fonctions. Un tout composé de nombreuses parties n’est pas complexe si toutes les parties fonctionnent suivant le même principe. C’est l’indépendance d’un grand nombre de parties qui fait la complexité d’un tout.

16 Morin cite Pascal à de nombreuses reprises :

17

« Je tiens impossible de connaître les parties sans connaître le tout, non plus de connaître le tout sans connaître les parties… »

18 ce qu’il considère comme l’un des principes de la complexité, la simplicité ne voyant que l’un ou le divers.

19 En linguistique, Stéphane Robert montre que l’un n’est pas la somme de ses divers (« le tout est plus que la somme des parties ») :

20

« … la signification du langage est un problème très complexe. D’abord parce que les unités de sens ne sont pas des concepts : les signifiés des mots ont une structure, une épaisseur, sur lesquelles il existe plusieurs théories : stéréotypes, prototypes, réseaux, etc. Ensuite, parce que le sens d’une séquence n’est pas l’addition du sens de ses parties : un « bel idiot » n’est pas un individu qui est beau et de surcroît idiot. Il y a aussi dans la parole humaine des phénomènes non linéaires. Un détail minime comme l’intonation peut changer le sens de toute la phrase “tu veux ma photo ?” ne signifie pas du tout la même chose que “tu veux ma photo !”. » (Stéphane Robert, s.d.).

21 Il existe une complexité linguistique liée à la « possibilité d’une succession de choix parmi un éventail de combinaisons possibles » qui donne au locuteur, conscient de ses/ces stratégies, un pouvoir énonciatif ciblé stratégiquement tout en restant dans un ensemble d’équivalences assez étroit. Ibrahim compare alors l’activité du locuteur à celle du joueur d’échecs.

22

« En plus de cette complexité explicite faite de choix, il y a dans la langue une deuxième forme de complexité dont le locuteur n’est le plus souvent pas conscient. Il s’agit d’une complexité pour ainsi dire préconstruite, sous-jacente aux formes plus ou moins fortement grammaticalisées de la langue et qui a généralement tous les dehors de la simplicité. » (Ibrahim, 2013 : 23)

23 Nous sommes alors confrontés aux difficultés qu’offre un système linguistique pris à une époque donnée et en lieu donné. Pour lever les incompréhensions face à un état synchronique, il nous semble nécessaire - dans la mesure où cela est possible (il existe des langues comme le berbère où cette possibilité est quasi inexistante) - de recourir à l’éclairage apporté par un maximum d’états antérieurs (diachronie). Par « lieu donné », nous entendons une entité linguistique qui a des parents au sein du même système linguistique (multilinguisme). Nos travaux montrent, dans le cadre des langues slaves de l’Ouest, l’importance des apports de la diachronie et du multilinguisme à l’explicitation de phénomènes incompris qui, sinon, resteraient des boîtes noires devenues inertes.

24 Existe-t-il un moyen de mesurer la complexité d’un phénomène linguistique ? La piste proposée par Ibrahim nous semble pleine de bon sens :

25

« … la mesure de la levée ordonnée des contraintes grammaticales est aussi une mesure de la complexité ou, si l’on préfère, du nombre et de la nature des opérations nécessaires pour passer d’une forme complexe à une forme simple… » (Ibrahim, 2013 : 20)

26 Mais ici aussi la comparaison temporelle et la comparaison spatiale nous semblent essentielles pour dégager cette mécanique des opérations nécessaires !

27 Comparer la complexité de langues pour tel ou tel phénomène reviendra à apprécier que :

28

« … le parcours d’une langue pour rendre compte d’une représentation particulière est plus complexe que le parcours d’une autre pour rendre compte de la même représentation. » (Ibrahim, 2013, p. 17)

2. Essai d’une complexité comparée des langues slaves de l’ouest

29 Les langues slaves de l’Ouest et du Sud-Ouest, comme toutes les langues slaves, sauf le bulgare et le macédonien devenus isolants, sont des langues à flexion externe.

30 Nous y étudierons des phénomènes relevant de la graphotaxe et de la morphologie. Dans ces deux situations, le tchèque joue le rôle de ce que l’intercompréhension appelle une « langue-pont », c’est-à-dire la langue qui nous permet, par la connaissance que nous en avons, de pouvoir examiner les langues voisines comme un quasi locuteur natif du tchèque.

31 Le regard que nous portons sur la complexité est particulier, parce qu’il est influencé par le paradigme de la calculabilité développé notamment dans nos analyses automatiques du tchèque, c’est-à-dire la possibilité de faire correspondre une forme et une valeur, forme graphique dans un texte d’une part et p. ex. valeur grammaticale, morphosyntaxique, mais aussi éventuellement morphosémantique d’autre part.

2. 1. Graphotaxe

32 Il convient, en premier lieu, de rappeler une évidence : l’indépendance de l’écriture, c’est-à-dire du code écrit, et de la langue. De nombreux exemples en attestent. Une même écriture peut servir à plusieurs langues. L’écriture cunéiforme de la Mésopotamie a même servi à écrire des langues appartenant à des familles différentes : indo-européennes (vieux perse, hittite - aussi écrit en hiéroglyphes), sémitiques (akkadien, assyro-babylonien, éblaïte, ougaritique), mais aussi des langues diverses (sumérien, élamite, hourrite). À l’inverse, une même langue peut être représentée à l’aide de plusieurs écritures. C’est le cas du serbe écrit en cyrillique, mais qui a aussi une longue tradition d’écriture latine tout en ayant été consigné en caractères arabes pendant l’occupation turque.

33 Il en résulte que les systèmes d’écriture ne sont pas préexistants, donnés, mais sont des codes qui seront plus ou moins adéquats à rendre à l’écrit les caractéristiques de la langue. Ils devraient donc être élaborés avec une parfaite méticulosité.

34 Les langues slaves de l’Ouest représentent l’aire latine des langues slaves. L’écriture glagolitique inventée par Constantin/Cyrille (caractères issus de l’onciale grecque et caractères propres au slave forgés par Constantin lui-même) était l’écriture slave de l’Empire de Grande Moravie (IXe siècle, disparu en 907 écrasé par les Magyars). Les successeurs de Méthode, bannis de Moravie, emportèrent avec eux le rite slave et l’écriture glagolitique, d’une part vers la Macédoine et la Bulgarie où elle laisse ensuite la place au cyrillique et d’autre part vers la Croatie où elle survit avec la liturgie slave tout en évoluant dans sa forme (écriture plus carrée). Le cyrillique n’a jamais été attesté dans l’aire slave de l’Ouest, latine.

35 Le tchèque, ensuite sous influence germanique, connaît plusieurs types d’écriture, une écriture « simple » et deux écritures avec digraphes qui se côtoient jusqu’à la réforme de Jan Hus (Pleskalová, 2001). Jan Hus (traité « Ortographia Bohemica », 1412) marque la longueur des voyelles par un accent aigu sur le graphème représentant la voyelle et surmonte les consonnes molles d’un point qui deviendra plus tard le « háček ». Hus, excellent linguiste, connaissait l’écriture glagolitique et en a retenu le principe d’univocité entre graphie et phonie à l’exception près du digraphe « ch ». L’écriture diacritée du tchèque a été largement reprise par les Slaves écrivant en caractères latins (en polonais, les caractères diacrités : ó et les nasales ą, ę pour les voyelles, ć, ń, Ś, ź, ż et ł pour les consonnes ne couvrent pas l’ensemble des besoins), mais également les Baltes (Lituaniens, Lettons) (Pognan, 2001).

36 Sur la base du même système d’écriture, des codes différents sont adoptés par les différentes langues slaves. Il conviendra de distinguer diverses tendances : écriture phonologique face à écriture phonétique, notation dans l’écriture des longueurs et des tons ou non. Ce sont des éléments qui ont un effet sur la calculabilité et sur la complexité.

37 Nous avons présenté dans (Pognan, 1999) une histoire de la graphie, puis de l’orthographe tchèque ainsi qu’un inventaire de la correspondance graphie – phonie. Il met en évidence le caractère phonologique du code écrit qui permet de garder une relation à l’étymologie, une relation au système, notamment dérivationnel, au prix de l’application de deux lois phonétiques : assourdissement en fin de mot et assimilation régressive dans les groupes consonantiques. Une exception visible à la bi-univocité phonie - graphie est la prononciation simple des géminées.

38 L’autre avantage, considérable, de l’écriture tchèque est d’avoir su conserver sous forme de diacritiques la marque de la longueur vocalique issue du phénomène historique de contraction et la marque de mouillure pour les consonnes molles, mais aussi pour le « e ». Ces caractéristiques sont issues de la réforme de Jan Hus et fournissent au tchèque un degré très élevé de calculabilité.

39 Nous comparerons la complexité des phénomènes relevant des codes graphiques slaves de l’Ouest d’après « l’étalon » tchèque.

40 2. 1. 1. Une première question qui se pose est la complexité comparée d’un système à diacritiques (tchèque) et d’un système à multigraphes (polonais). Pour ce faire, nous allons mettre face à face quelques mots sous les deux formes tchèque - polonais.

41 Le système linguistique des langues slaves possède une opposition entre dures et molles exprimée dans les langues slaves de l’Ouest essentiellement au niveau des consonnes (en tchèque, la voyelle « ě » est molle). En tchèque, « t » (dur) devient « ť » (mou), « d » (dur) devient « ď » (mou). Au niveau typographique, nous avons un seul caractère, mais sur le plan linguistique, nous devons considérer qu’il y a deux éléments : la consonne « t » ou « d » et la mouillure marquée par le diacritique (« háček » petit crochet). En association avec « e », « ť » et « ď » se réécrivent respectivement en « tě » et « dě », c’est-à-dire 2 caractères typographiques, (« t » ou « d » et « ě »), mais 3 éléments graphiques (« t » ou « d », « e » et háček) pour 3 éléments linguistiques (1 consonne, 1 voyelle et 1 mouillure), d’où l’équivalence háček = mouillure.

42 En polonais, les formes dures « t » et « d » ne posent aucun problème. Les formes mouillées correspondantes sont respectivement « ć » et « dź » (plus complexe que « ď »). Le « ć » est la forme graphique palatalisée de « t » pour le polonais et le haut-sorabe issue de la disparition du jer mou impair [3], ce qui nous renvoie à la loi de Havlík qui traite élégamment de la question historique de disparition et de vocalisation des jers, éléments du vieux-slave de nature vocalique. La loi de Havlík permet d’expliquer clairement les questions de voyelles épenthétiques dans les langues slaves actuelles. La série polonaise « ć » et « dź » possède la forme « ci » et « dzi » devant voyelle. La mise en parallèle de ces deux séries a le mérite de mettre en lumière l’autonomie de la mouillure et l’équivalence entre le diacritique et le « i » (i mou). Il s’agit d’un phénomène tectonique, plus ou moins représenté, mais commun à toutes les langues slaves du Nord-Ouest.

43 Examinons la série těsto - ciasto (pâte), dědek [4] - dziadek (vieux machin - grand-père) :

Tchèque polonais
mot segment car/élém. ling. mot segment car/élém. ling.
těsto 2/3 3 ciasto cia 3/3 3
dědek 2/3 3 dziadek dzia 4/4 3
figure im1

44 La série čest - czeŚć (honneur), den - dzień (jour), budeš - będziesz (tu seras) présente la situation inverse de la précédente (ce sont les mots polonais qui possèdent les diacritiques et les mots tchèques ont perdu la mouillure des labiales et des dentales) :

Tchèque polonais
mot segment car/élém. ling. mot segment car/élém. ling.
čest st 2/2 2 czeŚć Ść 2/4 4
den de 2/2 2 dzień dzie 4/4 3
n 1/1 1 ń 1/2 2
budeš de 2/2 2 będziesz dzie 4/4 3
š 1/2 2 sz 2/2 2
figure im2

45 Nous avons recherché un mode de représentation commun à ces deux types d’écriture illustré par quelques exemples dont certains contiennent le cluster « szcz » (Swan, 2002) :

figure im3

46 Ces schémas montrent, qu’en fait, le nombre d’éléments graphiques, en dehors de la palatalisation de « d » en polonais (« dź/dzi »), est le même pour les deux langues. La seule différence est qu’une suite est d’une longueur moindre lorsqu’elle contient des caractères diacrités. Cette longueur moindre permet-elle une lecture plus rapide, plus facile ? Nous n’avons pas les moyens de le vérifier (il faudrait des études telles que celles conduites par Henri Hécaen pour pouvoir en décider). Il est intéressant de constater que, lorsqu’on leur pose la question de savoir quel système d’écriture permet de lire le plus facilement, unanimement Tchèques et Polonais répondent que c’est le leur ! La force de l’habitude ou une réelle équivalence ?

47 2. 1. 2. Nous souhaiterions montrer en quelques exemples qu’un système graphique plus simple entraîne un complexification du traitement des niveaux ultérieurs, morphologie et syntaxe.

48 Le premier exemple est celui de la représentation des phonèmes « i ». Le tchèque possède un i dur et un i mou, chacun d’entre eux pouvant être bref ou long, ce qui est marqué dans l’écriture : « i, í, y, ý ». Le polonais ne possède pas de longueur, soit l’opposition « i, y » et le slovène ne possède qu’un seul « i ». Cette situation qui semble simple rend l’analyse automatique morphosyntaxique du slovène bien plus complexe.

49 Le deuxième exemple sera celui du slovaque appartenant au même sous-système linguistique que celui du tchèque, mais en ayant simplifié la graphie de « dě », « tě », « ně » en « de », « te », « ne ». De plus, le slovaque possède une loi de rythme qui empêche la succession de deux syllabes longues (la seconde est abrégée) quelle que soit la valeur de la longueur, par exemple valeur de désinence d’adjectif.

50 Ces phénomènes nous mènent à la situation suivante :

adj. masculin adj. féminin adjectif neutre adverbe
tchèque krásný krásná krásné krásně
slovaque krásny krásna krásne krásne
beau belle beau de belle manière
figure im4

51 Alors qu’en tchèque la graphie est classificatoire, en slovaque la « calculabilité » n’est plus assurée. Ici aussi la simplicité graphique engendre la complexité au plan morphosyntaxique.

52 Le troisième exemple est celui du slovène qui possède des voyelles longues accentuées (á, é, ê, í, ó, ô, ú), des voyelles brèves accentuées (à, è, e, ì, ò, ù) et des voyelles inaccentuées (a, e, i, o, u). Les tableaux de phonétique du slovène donnent donc des caractères diacrités, présents dans les manuels didactiques et dans les dictionnaires (monolingues ou bilingues), mais dans ce cas seulement au niveau de la syllabe accentuée.

53 Le slovène possède 3 « e » comme dans êna (un) où se trouve un « e » ouvert, pét (cinq) qui a un « e » fermé et « pès » (chien) qui possède un « e » muet. Les textes slovènes étant sans diacritiques, le graphème « e » y possède 3 valeurs phonétiques (1 forme pour 3 valeurs). On peut se trouver dans une situation où l’on ne peut pas lire correctement à haute voix et où la non-distinction des valeurs de « e » entraîne des ambiguïtés difficiles à lever : le substantif verbal « vedenje » peut être « védenje » (savoir) ou « vedênje » (comportement).

54 Beaucoup plus graves sont les conséquences sur le savoir dans le domaine de la morphologie flexionnelle, notamment nominale, et cela tant pour les humains que pour une génération automatique de formes. Nous en donnerons une illustration avec les substantifs masculins terminés en « consonne-er », suite dans laquelle le « e » est fluctuant, c’est-à-dire susceptible de demeurer dans la flexion à tous les cas ou, au contraire, de n’être présent qu’au nominatif singulier et éventuellement à l’accusatif singulier si le substantif est un masculin inanimé.

55 Correspondant exactement aux 3 natures de « e », les substantifs terminés en « -er » connaissent 3 types de flexion [5] :

56

  1. le « e » est muet, en dehors du nominatif singulier et éventuellement de l’accusatif inanimé, tous les cas perdent le « e » : p. ex. « poper » [popǝr] (poivre) donnera « popra » au génitif singulier.
  2. le « e » est fermé (« -ér »), nous avons alors une flexion dure qui conserve le « e » à tous les cas : p. ex. « primer » [primér] (exemple) aura pour génitif singulier la forme « primera ».
  3. le « e » est ouvert (« êr »), la flexion est molle et conserve aussi le « e » à tous les cas : p. ex. « šofer » [šofêr] (chauffeur) a pour génitif singulier « šoferja ».

57 Dans ce type de situation, la simplicité d’un « e » unique entraîne la complexité d’une ambiguïté insoluble au niveau de la morphologie alors que les 3 caractères diacrités, complexes, face à 3 valeurs permettraient la calculabilité et un ordre systémique.

58 2. 1. 3. Le haut-sorabe, très intéressant au niveau morphologique, se caractérise par la complexité de son code graphique qui vient du non-parallélisme de la chaîne orale et de la chaîne écrite (Schuster-Šewc, 1984 : 45). Par exemple, il existe constamment une ambiguïté dans l’écriture des molles non diacritées entre la consonne seule ou la consonne suivie du « j » (yod), l’expression même de la mouillure.

59 Le manque de parallélisme est ressenti p. ex. dans la prononciation de « ě » qui peut être [ě], [e] ou [i] dans respectivement « chěža », « jěd » et « rewěr » (secteur, zone, bassin) et dans celle de « ch » qui peut être prononcé en tant que [ch] ou [k] respectivement dans « chata » (chalet) ou dans « chěža » (maison).

60 Contrairement au tchèque qui écrit « jed » (poison), le haut-sorabe, sans différence de prononciation, écrit « jěd », avec deux mouillures (« j » et le háček) au lieu d’une. Le haut-sorabe est, pour ce phénomène plus complexe que le tchèque et le surplus de formes est inopérant. Cependant, ce phénomène a attiré notre attention sur l’impossibilité de la double mouillure en tchèque, ce qui est confirmé par l’évolution historique de « duša » (âme) à « dušě », puis à « duše ».

61 Nous avons tenté de décrire quelques cas de complexité touchant l’organisation du système graphique des langues slaves de l’Ouest (Nord et Sud) qui partagent toutes l’usage de l’alphabet latin revu par la réforme de Jan Hus. Malgré l’unicité du système, la diversité y est grande et l’efficacité des différentes solutions adoptées très variable.

62 Les langues slaves de l’Ouest sont des langues à flexion externe qui peut se révéler complexe par le nombre de cas, mais surtout par le nombre de paradigmes. Mais la complexité n’y est pas seulement liée à la seule morphologie. Dans les questions de morphologie, par exemple en analyse automatique, le système graphique projette ses caractéristiques propres dans le système morphologique, facilitant ou complexifiant cette analyse.

2. 2. Morphologie

63 Nous allons examiner quelques cas de complexité en morphologie ainsi que des phénomènes, actuellement à l’œuvre en morphologie, qui modifient le système linguistique.

64 Notre premier exemple demeure dans la question du choix entre une représentation phonologique ou phonétique de l’écriture et de l’influence induite du système graphique sur la calculabilité de la morphologie.

65 Afin de développer ce point (et quelques autres), nous devons présenter un phénomène propre au système linguistique slave, l’opposition dure/molle. Les 4 règles ci-dessous gèrent les suites consonnes - voyelles (l’ordre inverse est dénué de signification) :

66

1. CD + VD⇨ CD + VD
2. CM + VM⇨ CM + VM
3. CD + VM⇨ CM + VM palatalisations
4. CM + VD⇨ CM + VM

67 Les deux premières règles montrent que des successions consonne - voyelle de même nature demeurent des états stables. Par contre, une succession de valeurs hétérogènes provoque toujours la transformation de l’élément dur (qu’il soit consonne ou voyelle) en élément mou. La règle 3 concerne les palatalisations, c’est-à-dire des alternances consonantiques d’une consonne dure à deux types possibles de consonnes molles. La règle 4 est concernée essentiellement en tchèque par des transformations historiques comme celle qui, p. ex. a transformé « duša » (âme) en « duše » (dont le résultat est une forme particulière au seul tchèque).

68 2. 2. 1. Nous souhaitons donner un premier exemple de complexité engendrée par un code graphique phonétique, complexité qui se reflète tant dans le traitement automatique que dans l’apprentissage d’un enfant ou d’un étranger. Là où le tchèque conserve la forme originelle des mots, p. ex. (proche) « blízký, blízká, blízké, blížší » (adj) et « blízko, blíže » (adv) où nous avons clairement un « z » étymologique à l’écrit prononcé « s » à l’oral (loi d’assimilation régressive), nous avons en croate « blizak, bliska, blisko » (adj) et en polonais « bliski, bliska, bliskie, bliższy » (adj) et « blisko, bliżej ». Nous avons l’adjectif au masculin, féminin et neutre nominatif singulier, puis la forme de comparatif de l’adjectif, plus loin la forme d’adverbe (en « -ko ») et la forme de comparatif qui en découle en ce qui concerne le tchèque et le polonais. Nous avons donné également l’adjectif correspondant en croate pour montrer les formes induites par la forme courte de l’adjectif et une situation intermédiaire entre tchèque et polonais. Le masculin se trouvant sans désinence, le second jer situé entre « z » et « k » (le premier était derrière « k ») est vocalisé en « a » (vocalisation propre au BCMS), d’où maintien du « z » alors que dans le contexte sourd de « k » au féminin et au neutre, il est écrit « s ». Etant données les lois de palatalisation découlant de la règle 3 ci-dessus, il est impossible de dériver « ż » de « s » et donc comment calculer les différentes formes en polonais et comment les enseigner ! L’écriture phonétique provoque une forte complexité aux niveaux ultérieurs.

69 2. 2. 2. Dans les langues slaves, un nombre important de paradigmes pour une catégorie flexionnelle peut constituer une source de complexité. Un bon exemple de cette complexité est donné par la conjugaison en polonais. Là où le tchèque possède 2 sous-classes « minout » (passer à côté) et « tisknout » (imprimer), le polonais présente, selon la conception que l’on a des alternances consonantiques (palatalisations) de 2 à 3 sous-classes face à « minout » et de 5 à 11 sous-classes face à « tisknout ».

70 Dans le cas de ces verbes, nous rencontrons une deuxième source de complexité : les alternances p. ex. dans la formation du passé. À partir d’un principe de base identique :

71

  • passé en -l directement sur le radical pour « tisknout » : « tiskl », nous avons différentes réalisations du passé p. ex de l’infinitif « klęsnąć » (descendre, tendre vers le bas) le passé « kląsł », pluriel humain « klęŚli » et de « rosnąć » (croître) le passé « rósł » et le pluriel humain « roŚli »
  • et passé en « -nul » pour « minout », nous avons « ciagnąć » (tirer, traîner) avec les formes de passé « ciagnął » et « ciagnęli ».

72 Quelle que soit la complexité des paradigmes de flexion, tant que la variété est due à une variété de formes qui lui correspond, le calcul se fait et l’apprentissage en bénéficie. Par contre, s’il y a des ambiguïtés, la calculabilité n’est plus assurée et il n’y a plus non plus d’appui à l’apprentissage. C’est le cas ici pour le choix en polonais de l’un des deux types principaux de passé, tous les verbes gardant « -ną- » au passé n’étant pas reconnaissables par la forme (c’est le cas de « ciagnąć » contrairement à « chłonąć » (absorber)).

73 2. 2. 3. La flexion nominale du polonais présente de nombreuses transformations qui se prêtent parfaitement à l’appréciation de la complexité comparée entre tchèque et polonais.

74 Nous choisirons à titre d’illustration la construction du locatif pour le substantif « miasto » (ville), neutre dur terminé en « -o » et « gwiazda » (étoile), féminin dur en « -a ».

Tchèque polonais
Město miasto
měst-o miast-o
miast
měst ě t → ć → ci e
st → Ść → Ści ast → eŚć → eŚci
Městě mieŚcie
figure im5
Tchèque polonais
Hvězda gwiazda
hvězd-a gwiazd-a
hvězd ě gwiazd d → dź → dzi zd → źdź → ździ azd → eźdź → eździ e
Hvězdě gwieździe
figure im6

75 En tchèque, par simple permutation de désinence (remplacement de « o » ou « a » par « ě »), nous obtenons la forme correcte de locatif avec, pour le segment « tě » ou « dě », 2 caractères, 3 segments graphiques (« t » ou « d », « e » et háček) pour 3 éléments linguistiques (« t » ou « d », « e » et mouillure).

76 En polonais, la désinence « ě » du tchèque sera représentée aussi par deux éléments graphiques, mais « horizontaux »« ie ». Dans le cadre de la transformation « t → ć » qui constitue une première opération au sens où Ibrahim les considère dans le calcul de la complexité, le caractère « ć » devient « ci » devant « e ». De même pour le féminin (« d → dź → dzi »). Mais nous avons ici un groupe consonantique « st » qui donne « Ść » ou « Ści » ou « zd » qui donne « źdź » ou « ździ » devant « e ».

77 Nous sommes en droit de considérer cette double transformation comme une seule opération. Mais la vraie complexité de ce modèle est ensuite une opération supplémentaire de type « harmonie vocalique [6] » (dénommée généralement « apophonie ») qui, en présence de la désinence « ie » provoque la transformation du « a » de la racine en « e » !

78 Nous avons dans les deux cas affectation d’une désinence qui provoque la palatalisation, mais pour arriver à la forme de locatif le polonais a besoin de 2 opérations (complexes) : une palatalisation de groupe et une apophonie. Dans le cas présent, le polonais est plus complexe que le tchèque en nombre d’opérations, mais aussi en nombre d’éléments graphiques (5 « Ście » au lieu de 4 en tchèque « stě » pour le neutre et 6 « ździe » au lieu de 4 en tchèque « zdě » pour le féminin).

79 Nous pouvons donc conclure à une complexité plus élevée en polonais qu’en tchèque pour ces modèles de flexion nominale. On pourrait également penser que l’apprentissage du polonais sera encore plus complexe que celui du tchèque. Mais ceci doit être amendé par le fait que si on enseigne correctement le système linguistique et sa calculabilité, les processus de calculabilité sont un appui très efficace à la compréhension des phénomènes et à leur domination tant pour la compréhension des formes que pour leur production.

80 2. 2. 4. Nous souhaitons également considérer les questions d’agglutination.

81 Nous allons comparer la formation des passés par agglutination avec le verbe « mieć » (avoir) en polonais face à une formation en lexème verbal (participe en -l) associé à l’auxiliaire, verbe « mít » en tchèque, tous les deux au passé masculin et féminin :

Masculin féminin
tchèque polonais tchèque polonais
1re p. měl jsem miałem měla jsem miałam
2e p. měl jsi miałeŚ měla jsi miałaŚ
3e p. měl Miał měla miała
1re p. měli jsme mieliŚmy měly jsme miałyŚmy
2e p. měli jste mieliŚcie měly jste miałyŚcie
3e p. měli Mieli měly miały
figure im7

82 Ces deux langues ont une absence d’auxiliaire à la 3e personne.

83 À la 1re et à la 2e personnes, le tchèque détermine la personne et le nombre à l’aide de l’auxiliaire (forme du verbe être au présent : « jsem », « jsi », « jsme », « jste ») et le genre et le nombre par la désinence du lexème verbal (pas de désinence pour un masculin singulier, « a » pour un féminin singulier – mais aussi pour un neutre pluriel, « i » pour un masculin animé au pluriel et « y » pour un masculin inanimé ou un féminin au pluriel). On remarquera qu’il y a une définition redondante du nombre.

84 Face à cela, le polonais compose le passé par agglutination : au lexème du verbe à la forme du participe en « -l » du passé, il ajoute la voyelle désinentielle, y compris une voyelle « e » pour le masculin singulier, à laquelle est ajoutée une forme embryonnaire de l’auxiliaire, à savoir « m » (1re pers. du singulier), « -Ś » (2e pers. du singulier), « -Śmy » (1re pers. du pluriel) et « -Ście » (2e pers. du pluriel).

85 Il est difficile de décider de la complexité comparée pour un phénomène de ce type. En effet, la forme agglutinée est plus complexe au niveau de la morphologie, mais la forme libre peut se révéler plus complexe au niveau de la syntaxe. On retrouve là des remarques déjà formulées (Danh Do-Hurinville, 2013 : 242).

86 Par contre, le polonais est plus complexe dans la formation du masculin humain (masculin animé réservé aux substantifs représentant un humain face à un masculin animé (animal) réservé à la dénomination des animaux mâles). En effet, ce masculin qui s’oppose à tous les autres genres (masculin animal, masculin inanimé, féminin et neutre) prend la désinence « -i » (i mou), ce qui fait adopter le « l mou » à la place du « l dur » (« ł ») et met en route le phénomène d’harmonie vocalique qui apporte le remplacement de « a » par « e », donc une forme en « mieli » au lieu de « miały » pour les autres genres.

87 2. 2. 5. Nous souhaitons enfin jeter un regard sur le phénomène d’analogie qui modifie profondément les modèles flexionnels.

88 Nous prendrons comme exemple le verbe « moci »/ « móc » (pouvoir). Le polonais conserve à la 1re pers du singulier et à la 3e pers du pluriel la forme originelle de la racine (« MoG ») et palatalise aux 4 autres personnes, ce qui est le fonctionnement slave originel. La transformation en tchèque est légèrement plus complexe du fait de l’opposition de longueur « o »/ « ó » (→ « ů ») maintenue en tchèque.

tchèque polonais
MoH U mohu můžu figure im8 mogę
MoH ┃┃
MůŽ
můžeš możesz
E může może
Eme můžeme figure im9 możemy
Été můžete możecie
MoH Ou mohou můžou mogą
figure im10

89 Le tchèque a tendance actuellement à faire jouer l’analogie pour une impression de plus grande simplicité, mais ce faisant perd le système primitif calculable pour un modèle sans calcul, par simple concaténation. La présence simultanée des deux systèmes est source de complexification.

3. Conclusion

90 La dimension accordée à cet article ne permettait qu’une première approche de la complexité dont nous souhaitons retenir qu’en général elle permet d’assurer la calculabilité quand la forme d’origine et les différentes étapes peuvent être déterminées, et ceci quelle que soit le degré de complexité. À la lumière de notre expérience en matière de calculabilité, la situation optimale est une correspondance une forme - une valeur. À l’inverse, la « simplification » supprime de la calculabilité, voire la calculabilité. Une étude sur l’agglutination et l’analogie en tchèque, qui apportent de dramatiques simplifications, reste à faire. Pour nous, la vraie complexité est l’indétermination qui apporte l’ambiguïté contre laquelle il existe bien peu de solutions.

Bibliographie

RÉFÉRENCES BIBLIOGRAPHIQUES ET SITOGRAPHIQUES

  • ARDOINO, J. 1999. « La complexité », Le défi du XXIe siècle. Relier les connaissances. Seuil, Paris.
  • BLAŽEK, V. 2005. « On the internal classification of Indo-European languages : survey », Linguistica ONLINE, ISSN 1801-5336. http://www.phil.muni.cz/linguistica/art/blazek/bla-003.pdf.
  • DO-HURINVILLE, D.T. 2013. « Complexité dans une langue isolante : exemple du vietnamien ». Nouvelles perspectives en sciences sociales, Revue Internationale de systémique complexe et d’études relationnelles, Volume 9, numéro 1.
  • ESCUDÉ, P. 2015. L’intercompréhension intégrée : apprendre en apprenant par les langues, Enseignement/apprentissage des langues et pratiques numériques émergentes, Eds. : Pottolia et Lemay, Editions des Archives Contemporaines, Paris.
  • IBRAHIM, A.-H. 2013. « Une mesure unifiée de la complexité linguistique : l’analyse matricielle définitoire ». Nouvelles perspectives en sciences sociales, Revue Internationale de systémique complexe et d’études relationnelles, Volume 9, numéro 1.
  • MORIN, E. 1999. « Les défis de la complexité », Le défi du XXIe siècle. Relier les connaissances. Seuil, Paris.
  • — . 1999. Le défi du XXIe siècle. Relier les connaissances. Seuil, Paris.
  • — . 2005. Introduction à la pensée complexe. Seuil, coll. Points - Essais, Paris.
  • — . 2015. L’aventure de la Méthode. Seuil, Paris.
  • PLESKALOVÁ J. 2001. Stará čeština pro nefilology. Filozofická fakulta Masarykovy Univerzity. Brno.
  • POGNAN P. 1999. Histoire de l’écriture et de l’orthographe tchèques. Histoire, Épistémologie et Langage. Paris.
  • — . 2001. Introduction aux systèmes d’écriture des langues slaves de l’Ouest (polonais, bas-sorabe, haut-sorabe, tchèque, slovaque). Slavica occitania, Toulouse.
  • SCHLAMBERGER BREZAR, M., PERKO, G., POGNAN, P. 2015. Les bases de la morphologie du slovène pour locuteurs francophones. Ljubljana : Filosofska Fakulteta, Univerza v Ljubljani.
  • SCHUSTER-ŠEWC H. 1984. Gramatika hornjoserbskeje rěče. Ludowe nakładnistwo Domowina. Bautzen/Budyšin.
  • SWAN, O. E., 2002. A Grammar of Contemporary Polish. Slavica, Bloomington.
  • Sitographie

    • « Une linguiste chez les neurologues. Rencontre avec Stéphane ROBERT », propos recueillies par JOURNET N. (s.d.) pour Sciences Humaines, journal en ligne, http://www.scienceshumaines.com

Notes

  • [1]
    Ces travaux sont conduits dans le cadre de plusieurs contrats : 1.- Travaux sur la morphologie polonaise soutenus par le projet LINDAT/CLARIN No. LM2010013 -MEYS CR. 2.- Contrat GAČR n° 16-18177S « An Integrated Approach to Derivational and Inflectional Morphology of Czech ». 3.- PHC Barrande n° 35637ZF « Approche contrastive de la morphologie tchèque à l’attention des locuteurs francophones ». 4.- PHC Proteus n° 35257ZD « Morphologie dérivationnelle du slovène en vue de son traitement automatique ».
  • [2]
    « Pour comprendre le problème de la complexité, il faut savoir d’abord qu’il y a un paradigme de la simplicité. » (Morin, 2005 : 79).
  • [3]
    « t » + jer mou devient « Ś » en bas-sorabe, reste « ть » en russe et « ť » en slovaque et en tchèque. Mais, en tchèque, la majorité des « ť » a perdu sa mouillure se rapprochant ainsi du slovène qui n’a pratiquement plus de mouillure.
  • [4]
    Le slave possède deux niveaux de diminutifs. Il arrive que le premier diminutif ait un sens qui diverge du sens primitif qui demeure dans le second. Tout le monde connaît la vodka ! Elle se trouve dans la suite voda (eau) - vodka - vodička ((petite) eau). Ici, nous avons « děd » (honorifique, ancêtre) - « dědek » (péjoratif, vieux machin) - « dědeček » (normal, grand-père).
  • [5]
    Ce passage est réalisé à partir de notes transmises par Mojca Schlamberger Brezar dans le cadre d’un PHC Proteus 2012 n° 26947TD « grammaire du slovène à l’usage des Francophones - morphologie ».
  • [6]
    Nous trouvons également en haut-sorabe ce type de formation : la capitale Bautzen se dit en slave « Budyšin » et celui qui y habite est un « Budyšan ». S’ils sont plusieurs (au nominatif pluriel), ces habitants seront des « Budyšenjo ».
  • [7]
    Professeur émérite à l’Institut National des Langues et Civilisations Orientales (tchèque), membre des équipes PLIDAM, STIH à l’Université de Paris Sorbonne et ÚFAL à l’Université Charles de Prague.
bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Avec le soutien de

Retrouvez Cairn.info sur

18.97.14.87

Accès institutions

Rechercher

Toutes les institutions