Maschinelle Verarbeitung altdeutscher Texte V, Beiträge zum fünften Internationalen Symposium Würzburg 4.-6. März 1997, éd. S. MOSER, P. STAHL, W. WEGSTEIN et N. WOLF, Tübingen, Niemeyer, 2001 ; 1 vol., 320 p. ISBN : 3-484-10832-0. Prix : € 85,90, CHF 144.
- Par Astrid Guillaume
Page XI
Citer cet article
- GUILLAUME, Astrid,
- Guillaume, Astrid.
- Guillaume, A.
Citer cet article
- Guillaume, A.
- Guillaume, Astrid.
- GUILLAUME, Astrid,
1 Ce recueil d’actes sur le traitement informatique des textes allemands anciens est divisé en quatre parties : questions de corpus, lexicographie, emploi des nouveaux médias et ateliers de travail de traitement de données textuelles ; il rassemble vingt articles. Dans l’introduction, C.M. Sperberg-Macqueen développe le rôle de la technique dans le traitement des données philologiques et propose un « modèle formel » fondé sur une typologie et une hiérarchisation des textes.
2 Cette introduction sur la recherche automatisée sur les textes anciens est étrangement suivie d’un article sur les actualités télévisuelles allemandes et russes ! La présence d’une telle étude dans un volume consacré aux textes anciens a de quoi surprendre. C. Pankow y expose les problèmes qu’elle a rencontrés avec son corpus : choix des actualités, transcription, segmentation, etc. L. Burnard s’intéresse au British National Corpus, corpus de référence, en ce sens qu’il a subi un pré-traitement sur les catégories grammaticales, ce qui en fait un outil utile pour les linguistes et les comparatistes, il regroupe des textes de divers types, englobant pas moins de 100 millions de mots. L’A. s’attache aux aspects techniques du traitement : marquage et analyse grâce au langage SGML, recherche à l’aide de l’index SARA, etc. Avec l’article de H. Hettrich, le lecteur aborde enfin les textes anciens grâce au Véda, hymnes sacrés, rédigés dans un sanskrit archaïque. Stockés sous format électronique, ces hymnes ont été utilisés pour élaborer une « syntaxe de cas » dans le sillage de la conception Fillmorienne du langage. L’étude de T. Klein repose sur un « index lemmatisé » ce qui permet de mettre en évidence les traits distinctifs de la rime dans son corpus et de tirer des conclusions sur la syntaxe et la phonétique.
3 Y. Koga traite de la lexicographie moyen haut-allemande au Japon, expose l’historique des recherches et l’intérêt d’un dictionnaire bilingue moyen haut-allemand/japonais. Mais, à part l’utilisation de l’Internet, rien n’est dit des moyens techniques susceptibles d’aider à l’élaboration de ce dictionnaire. F. Debus tente de déterminer les critères nécessaires à la réalisation d’un répertoire des noms des textes littéraires médiévaux allemands. L’étude est réalisée à partir d’exemples issus du dictionnaire allemand dont l’A. expose les possibilités d’interrogation électronique. I. Lemberg s’attache au traitement des banques de données lexicographiques du dictionnaire de droit allemand qui reprend le vocabulaire juridique du Ve au XIXe siècle. P. Sappler aborde les problèmes historico-littéraires qui se posent dans la réalisation d’un index offrant un répertoire d’entrées lexicales issues de textes s’échelonnant du XIIe au XVIIIe siècles. La contribution de Y. Yokoyama présente un exemple d’application au Wigalois de Wirnt qui vise à réaliser informatiquement une lemmatisation des références verbales du corpus, en s’attachant à la fréquence des formes, mais une prise en compte du contexte des occurrences s’avère nécessaire et interdit l’automatisation de la totalité de la tâche. R. Plate et U. Recker expliquent l’apport des nouvelles techniques d’archivage pour élaborer un dictionnaire moyen haut-allemand. Dans le même cadre théorique, S. Moser présente, à partir des dérivations substantivales en allemand moderne précoce, comment se fait le traitement des informations lexicales dans une banque de données terminologiques.
4 U. Müller et A. Weiss travaillent sur l’édition scientifique de textes anciens et expliquent comment l’ordinateur a été utilisé dans l’édition électronique du Neidhard. Pour R.A. Boggs, l’avenir du multimédia dans le monde de l’édition s’annonce brillant dans « les cent prochaines années », témoin le projet Hartmann 2000 dont l’A. présente les aspects théoriques et les applications possibles à l’étude des manuscrits médiévaux. H. Korten et M. Prinz abordent l’onomastique assistée par ordinateur : l’idée est de mettre à la disposition du chercheur un répertoire de noms de cités accessible sous un format flexible et modulable. A. Rapp revient sur la question de l’édition assistée par ordinateur de manuscrits anciens, en élargissant l’étude aux problèmes de recensement et de catalogage à partir d’un corpus de documents des XIIIe et XIVe siècles.
5 En fin d’ouvrage sont regroupés les trois articles de W. Ott, D. Lewis/P. Stahl et W. Schneider-Lastin et exposés les outils de traitement des données textuelles et philologiques du Moyen Âge. Une attention particulière est accordée au logiciel TUSTEP, élaboré à Tübingen, dont les A. expliquent le fonctionnement et les développements envisagés. Des exemples d’applications sont présentés : l’évaluation d’une traduction littéraire, la gestion des données structurées ou le recensement et le traitement du lexique pour la critique ou l’édition de textes anciens.
6 En somme, ce recueil présente un ensemble hétéroclite d’études qui s’inscrivent certes dans le cadre général du traitement automatique des textes anciens, mais dont les postulats théoriques et les objectifs sont éloignés, parfois antagonistes : les « lexicographes » traitent les textes médiévaux comme une simple base de données dans laquelle ils puisent pour former lexiques, dictionnaires et index, alors que les « littéraires » prêtent attention au contexte historique des œuvres et au sens des mots anciens. Cette divergence en cache une autre concernant la place de la « machine » (l’ordinateur) dans le cadre des études médiévales : certains A. lui accordent ici une place centrale, lui donnant la prééminence sur les textes eux-mêmes alors qu’elle n’est qu’un simple outil, un adjuvant.
Astrid GUILLAUME