Notes
-
[1]
Le recours systématique à l’intuition du sujet parlant, voire du linguiste lui-même, la reproduction inconsciente de la norme notamment dans les jugements de grammaticalité de gradience fine, et les jugements de grammaticalité eux-mêmes ont fait l’objet d’une très abondante littérature critique, tant psycholinguistique, sociologique, empirique que proprement méthodologique (Keller 1998 ; Le Prieult 2006 ; Schütze 1996). Ces critiques, et la dénonciation de très nombreux biais, n’ont pas conduit à réviser une approche que j’ai analysée comme correspondant en propre à l’idéologie grammaticale (Laks 2008).
-
[2]
On notera au passage que même ce qui est tenu pour le parangon de la grammaire française (Damourette & Pichon 1911-1927) se fonde sur une très large collection de faits et d’usages variés patiemment relevés dans toutes les couches de la communauté linguistique. Plus récemment, Gaatone (1971) propose une analyse de la négation en français sur corpus d’exemples attestés.
-
[3]
De ce point de vue, la sociolinguistique n’est qu’une linguistique de corpus particulière, celle dont le corpus est construit via une enquête sociologiquement contrôlée. Elle trouve historiquement sa source chez Currie (1952) qui le premier lie l’enquête linguistique et l’enquête sociologique portant sur le statut social des formes collectées. Telle est bien la leçon magistrale de Labov (1972) et de Weinreich, Labov & Herzog (1968) : la sociolinguistique est une linguistique de corpus qui prend au sérieux l’organisation sociale interne de la communauté linguistique considérée.
-
[4]
Après avoir ironisé sur telle phonologue étonnée de constater ex post que les formes dont elle accréditait l’existence par un recensement sous Google étaient en fait attestées par la seule prise en compte de ses propres articles antérieurs, Scheer (2004 : 137) écrit justement : « Fonder des raisonnements qui donnent lieu à des conclusions théoriques majeures sur quelques mots d’une langue dont on ne connaît rien et qu’on a repris de seconde ou troisième main rappelle une pratique de la phonologie générative naissante ».
-
[5]
Même Sapir (1933) s’appuie sur cinq enquêtes de terrain où la taxinomie résultante se voit éclairée par les remarques de ses informateurs païute, sarsi et nootka.
-
[6]
D’où la grammaticalité de « d’incroyables idées vertes dorment furieusement » vs l’agrammaticalité de « Jean rase Jean chaque matin ».
-
[7]
Merci à Jacques Durand pour une discussion de ce point. Les positions exprimées ici sont les miennes.
-
[8]
Notons au passage que la notion de parallélisme a pour Saussure deux acceptions : celle du linguiste qui les décrit et les formalise et celle de la conscience collective des sujets parlants qui y fonde la grammaire. La notion de parallélisme est pour Saussure un opérateur cognitif (Laks à par.).
-
[9]
Soit 26 exemples pour la troncation et l’élision, 14 pour les consonnes finales fixes et les adjectifs numéraux, 3 pour le H aspiré, 2 pour le hiatus, 20 pour les jonctures internes au groupe verbal et les inversions, et 8 pour les pronoms postposés. On y ajoutera 22 exemples supplémentaires cités dans les notes.
-
[10]
C’est le cas pour Schane qui s’appuie le plus souvent sur Fouché (1959), Grammont (1914), Grevisse (1993). Dell (1973) dit faire appel à son intuition de locuteur natif (lettré et linguiste). Cette intuition est le plus souvent cohérente avec les recommandations orthoépiques de Fouché (Ibid.).
-
[11]
On oublie trop souvent que le traité de Fouché s’appuie sur une collection de faits recueillis pour partie à l’occasion de son émission de radio « Monsieur Jourdain chez les speakers » ainsi que sur une recension des ouvrages qui l’ont précédé. Cela n’enlève rien au caractère prescriptif et orthoépique de son ouvrage, tout au contraire, le mode de recollection des données l’induisant très largement.
-
[12]
Thurot limite son corpus de références à ceux qu’il qualifie de grammairiens. Les ouvrages considérés vont du traité complet au court chapitre consacré au français oral au sein d’une grammaire plus générale.
-
[13]
La Renaissance reprend ainsi la tradition latine d’Horace à Cicéron qui fait de l’usage le fondement de la langue : « On a toujours eu, on aura toujours la liberté de mettre en circulation un mot marqué au coin de l’année. Beaucoup renaîtront, qui ont aujourd’hui disparu, beaucoup tomberont, qui sont actuellement en honneur, si l’exige l’usage, ce maître absolu, légitime, régulier de la langue » (Horace, 457 [1944] : 58-59).
-
[14]
« Le peuple est souverain de sa langue et la tient comme un fief de franc alleu, et n’en doit reconnaissance a aucun seigneur. L’école de cette doctrine n’est point es auditoires des professeurs hébreux, grecs et latins en l’Université de Paris ; elle est au Louvre, au Palais, aux Halles, en Greve, à la place Maubert » (Ramus, 1562 : 3). On se souvient également que Malherbe tenait les crocheteurs du port aux foins pour ses maîtres en langue.
-
[15]
« De ce grand principe, que le bon usage est le Maitre de notre langue, il s’ensuit que ceux-là se trompent, qui en donnent toute la juridiction au peuple [...]. C’est la façon de parler de la plus saine partie de la Cour, conformément à la façon d’écrire de la plus saine partie des auteurs du temps. Toutefois quelque avantage que nous donnions à la Cour, elle n’est pas suffisante toute seule de servir de règle, il faut que la Cour et les bons auteurs y concourent, et ce n’est que de cette conformité qui se trouve entre les deux, que l’usage s’établit. » (Vaugelas, 1647 [1934] : 1)
-
[16]
Sur la relation entre description de l’oral et forme orthographique, cf. Brunot (1905), Catach (1968).
-
[17]
En complément du soutien constant des universités des trois directeurs, le programme PFC a bénéficié de nombreux soutiens financiers : Délégation Générale à la Langue Française et aux Langues de France (DGLFLF), Centre National de la Recherche Scientifique (CNRS), Agence Nationale de la Recherche (ANR), Institut de Linguistique Française (ILF), Center for Advanced Studies in Theoretical Linguistics (Norvège), Centre de Coopération Franco-Norvégienne en Sciences Sociales et Humaines, Région Midi-Pyrénées et, au titre des chaires de Jacques Durand et de Bernard Laks, Institut Universitaire de France (IUF).
-
[18]
Pour des présentations détaillées, cf. Durand, Laks & Lyche (2002, 2005).
-
[19]
En sus de la France, PFC couvre la Belgique, la Suisse, le Canada, la Louisiane, le Maghreb, le Proche et Moyen Orient, l’Afrique, les Antilles, l’Océan indien, le Pacifique. Toutes les informations, données, protocoles, liste des chercheurs et équipes impliquées, ainsi que les résultats, sont accessibles à partir du site du programme.
-
[20]
On trouvera sur le site du programme de nombreuses informations sur les projets connexes qui sont venus se greffer sur PFC : Interphonologie du Français Contemporain (IPFC) consacré aux corpus d’apprenants ; Phonologie du Français Contemporain, Enseignement du Français (PFC-EF) consacré à la didactique du français oral. Des programmes ‘frères’ ont été développés pour d’autres langues (Phonologie de l’Anglais Contemporain (PAC), etc.). Ils sont coordonnés au sein du groupe CORPHO soutenu par la Fondation Européenne pour la Science (ESF).
-
[21]
La méthodologie est proche de celle adoptée récemment par Labov dans la construction de son atlas de l’anglais parlé en Amérique du Nord (Labov, Ash & Boberg 2006).
-
[22]
PFC n’est donc pas un corpus sociologiquement construit pour être représentatif. Son extension à la francophonie et surtout le caractère coopératif et cumulatif du travail d’enquête qui voit un très grand nombre d’enquêteurs travailler en des points très différents interdisaient de viser une telle représentativité par quota. PFC vise ainsi à rendre compte de la diversité des usages sans en pondérer le poids les uns par rapports aux autres. La progressivité du travail d’enquête mené sur dix années et la taille même du programme étaient à ce prix. Néanmoins, PFC fournit pour chaque enquête et pour chaque locuteur des données sociologiques précises qui permettent des exploitations sociolinguistiques secondes.
-
[23]
Tous les protocoles sont présentés et discutés sur le site du programme. On consultera Durand, Laks & Lyche (2002, 2005, 2009) pour des mises au point successives sur PFC.
-
[24]
Le programme respecte les directives « Informatique et libertés ». Un consentement est signé par chaque enquêté qui voit toute trace d’information personnelle effacée de la base. La base PFC et l’ensemble de la documentation sont en cours de dépôt au département audio-visuel de la Bibliothèque Nationale de France. Une partie du corpus est également visible sur le portail internet de la DGLFLF.
-
[25]
Une couche de transcription et de codage prosodiques, rythmiques et accentuels est en cours de développement.
-
[26]
PFC est à l’heure actuelle la seule base de données audio-orale offrant ce type de fonctionnalités, quelle que soit la langue considérée.
1. EXEMPLUM ET DATUM
1 Que la phonologie d’une langue vivante doive se fonder sur une description et une analyse des usages réels, tels qu’exhibés par les locuteurs de cette langue, peut sembler l’évidence. À l’époque contemporaine pourtant, rien n’est moins sûr et la phonologie de corpus reste une orientation de recherche encore minoritaire. Certes, comme je l’ai montré ailleurs (Laks 2008, 2010), la linguistique du datum est aussi ancienne que la linguistique de l’exemplum, mais force est de constater que depuis ce que F. Newmeyer (1988) a nommé « le tournant chomskyen », la linguistique dominante se confond encore avec une construction grammaticale basée sur un petit nombre d’exemples, plus ou moins récurrents, dont les principes de construction et de recollection restent scientifiquement non fondés [1].
2 La linguistique structurale pourtant, dans sa version américaine comme dans sa version européenne, restait profondément liée à la notion de corpus. L’origine peut en être recherchée, après W. Whitney, chez F. de Saussure lui-même, dans le primat absolu qu’il confère, méthodologiquement et conceptuellement, à la linguistique de la parole sur la linguistique de la langue (Bouquet 1997 ; Béguelin 1990 ; Laks à par.). Ainsi, jusque dans les années 60, une analyse linguistique structurale n’était pas possible sans que fût préalablement construit et exposé un large corpus de faits observés, quels qu’en soient la méthodologie et le mode deconstruction. Les modes de recollection pouvaient varier considérablement, de l’échantillonnage le plus simple et le plus direct à la Sapir-Bloomfield [2] jusqu’à l’enquête la plus sociologiquement contrôlée [3], il restait que l’analyse était fondamentalement gagée sur un ensemble de faits de parole observés (Harris 1951).
3 Avec la critique chomskyenne de la finitude des corpus et celle des limites du modèle syntagmatique (Chomsky 1957, 1965), la situation s’inverse et, dorénavant, un habitus grammatical qui interroge les faits linguistiques à partir d’une posture strictement réflexive et introspective se trouve légitimé. Les critiques pointant l’inadéquation de l’instrumentalisation du théorème de M. Gold (1967) appliqué à la question de l’apprenabilité, l’incompréhension profonde de la conception taxinomiste du structuralisme harrissien (Goldsmith à par.) ou l’inadéquation empirique des données manipulées n’y changeront rien : le paradigme de l’exemplum domine le champ pour une période de plus de trente ans. Quelle que soit la question traitée, il suffit de citer un petit nombre d’exemples jugés pertinents, voire cruciaux, exemples repris de la littérature circulante ou produits par un exercice personnel et quasi kantien de la faculté de juger, pour fonder et justifier telle analyse ou telle innovation théorique majeure [4].
4 Au tournant du siècle pourtant, la situation s’inverse à nouveau. La montée en puissance des bases et banques de données linguistiques et le développement d’outils de fouille particulièrement puissants et efficaces liés au développement de la linguistique computationnelle rendent disponibles des données linguistiques toujours plus massives et variées. Parallèlement, dans tous les champs de la linguistique – phonologie, morphologie, syntaxe ou sémantique – la critique du modèle chomskyen se développe, jusqu’à marginaliser à nouveau l’approche grammaticale générative. Le constat lucide, sinon désabusé, en est dressé par un chomskyen inconditionnel de la première heure (Newmeyer 2003 ; cf. également Laks 2008). Au début du 21e siècle, le caractère empirique de la science linguistique (Goldsmith à par. 2010) se voit réaffirmé dans tous les domaines, des Grammaires de Constructions (Goldberg 2006) aux Grammaires d’Usages (Langacker 2000) en passant par les modèles exemplaristes ouoccurrentialistes (Bybee 2006). La psycholinguistique, comme l’acquisition, sont directement concernées (Tomasello 2003, 2008) et de nouvelles approches acquisitionnelles, basées uniquement sur les données disponibles, sont proposées (Goldsmith & Aris 2009). Après 40 ans de domination de l’exemplum, le datumfait enfin retour sur la scène méthodologique. La science du langage redécouvre l’enquête et la description systématique et raisonnée des faits linguistiques.
2. LA PHONOLOGIE ET LES CORPUS
5 S’il est un domaine où la description des usages est nécessairement dominante et où le raisonnement à partir d’exemples choisis est plus que marginal, c’est bien celui de la phonologie. Depuis l’origine de la discipline, la phonologie suppose la construction de vastes corpus de formes sur lesquels s’érigent descriptions systématiques, taxinomies raisonnées et analyses formalisées. Que la langue considérée soit morte (langues classiques) ou qu’elle corresponde à une langue régionale ou minoritaire, à un dialecte ou à un parler local, le phonologue commence toujours par dresser un relevé le plus exhaustif possible des formes d’usage attestées. Puis, il en construit une taxinomie et en propose une analyse descriptive. Des philologues du 19e siècle aux phonologues structuralistes en passant par les néogrammairiens, la méthode est constante. Elle a été magistralement illustrée par F. de Saussure (1878) qui reste un modèle méthodologique pour la phonologie de corpus (Laks à par.) : recollection des faits, classement systématique, taxinomie et établissement des parallélismes, dégagement des processus phonologiques sous-jacents, formalisation.
6 La phonologie structurale, qu’elle soit européenne (Troubetzkoy 1939 ; Jakobson 1979 ; Martinet 1956) ou américaine (Sapir 1921 ; Bloomfield 1933 ; Harris 1951) ne procède pas autrement. Certes, compte tenu de la question posée et de la langue visée, les méthodes d’enquête, on l’a dit, peuvent être très différentes. De la présentation d’un vaste compendium de formes reçues pour les langues éteintes (Saussure), à l’enquête encyclopédique par cumul de descriptions publiées (Troubetzkoy, Jakobson), à la recension systématique des travaux antérieurs (Martinet) et jusqu’à l’enquête ethnographique originale (Sapir, Bloomfield), ou proprement sociale (Labov 1966), les méthodes d’investigation varient énormément. Il reste qu’elles produisent toujours un corpus, exhaustif ou limité à un phénomène, clos ou ouvert, et que c’est sur la base de ce corpus construit que s’érige l’analyse.
7 Au-delà même de toutes les critiques déjà exposées, le recours à l’intuition du sujet parlant est ici de peu de recours [5]. En effet, en phonologie la question de la grammaticalité n’a pas le sens qu’elle peut avoir en syntaxe. Dans le cadre chomskyen, le jugement de grammaticalité évalue, on le sait, non le sens ou lapossibilité d’occurrence de telle forme, mais strictement la bonne formation de la structure syntaxique interne de l’exemple soumis [6]. Dans le domaine phonique, ce ne peut être le cas, même en phonotactique où la notion de ‘structure de mot possible’ renvoie au savoir lexical ou à l’attestation. N. Chomsky l’avait lui-même souligné. Dans son cadre, seule la composante syntaxique est générative, les autres composantes sont périphériques, de surface et interprétatives. D’où le privilège et la limitation syntaxique du jugement de grammaticalité.
8 Ainsi donc, en phonologie, ce n’est jamais la structure compositionnelle interne d’une occurrence qui est évaluée, mais toujours l’existence possible d’une forme phonique. La question « la forme X est-elle grammaticale ? » ne peut s’y interpréter autrement que « la forme X est-elle possible ? ». Autrement dit, lors même qu’on l’interroge sur le degré de grammaticalité d’une forme phonologique, le locuteur interroge lui l’existence de cette forme comme un usage particulier possible : « Cette forme s’entend-elle ?, correspond-elle à un usage possible ? ». C’est dire que la réponse est tributaire de son expérience proprement sociolinguistique, de sa sensibilité sociale à la variation des usages : « Cette forme est possible car je l’ai entendue, certains locuteurs prononcent ainsi ». La seule alternative est celle constituée par le jugement orthoépique : « Il est recommandé (prohibé) de prononcer ainsi ». Hors d’un tel jugement normatif ou prescriptif, l’interrogation phonologique renvoie donc toujours à une expérience du possible que seule l’enquête, c’est-à-dire la recollection systématique des usages, peut réellement attester [7].
9 En matière de forme phonique, la notion d’agrammaticalité au sens strict n’a donc pas de statut et l’introspection du locuteur natif ne peut exclure telle forme qu’au motif résiduel d’un écart à la norme ou à celui d’un impossible putatif. Dans les deux cas, la forme visée ne peut donc être saisie, positivement ou négativement comme un exemple paradigmatique (i.e. un exemplum), mais est toujours constituée comme un fait, de norme ou d’usage (i.e. un datum). Il s’ensuit que la phonologie ne peut jamais se construire sur des listes d’exemples possiblement paradigmatiques, mais a toujours à voir avec la construction de corpus de formes prescrites (phonologie normative) ou d’usages (phonologie descriptive). De ce point de vue, il n’y a pas de différence entre phonologie normative et phonologie descriptive. Comme le montre l’exemple du français orthoépique (cf. infra), on se fonde toujours sur la recollection d’usages, explicitement recommandés par l’orthoépie ou seulement constatés par la description. En ce sens, la phonologie est toujours de corpus.
10 Le second argument qui forclôt la possibilité d’une phonologie construite sur des exemples concerne les règles qu’ils permettraient d’inférer. Depuis la philologie jusqu’à la phonologie structurale, la méthode d’analyse est celle del’établissement des parallélismes : parallélismes de formes et/ou parallélismes de procès. C’est cette méthode proprement taxinomique que F. de Saussure (1878) a appliquée à l’état chimiquement pur dans le Mémoire, et c’est cette méthode des parallélismes qui est restée constante jusqu’à Z. Harris (1951) au moins. L’établissement des parallélismes, en synchronie comme en diachronie, est fille de la taxinomie raisonnée [8]. Elle suppose un corpus suffisamment large et représentatif de la langue pour précisément exhiber ces similitudes de formes ou de procès. Fonder des parallélismes sur une série d’exemples choisis ne présente, en effet, aucune garantie de pertinence linguistique.
11 Prenons-en un exemple. On sait que la matrice même de la phonologie générative standard, The Sound Pattern of English (SPE) (Chomsky & Halle 1968), fonde son modèle sur l’exposé d’une analyse générative de la phonologie accentuelle de l’anglais. Aucun corpus particulier n’est présenté, mais un assez petit nombre d’exemples et d’analyses antérieures sont convoquées. L’enthousiasme formaliste qui accueillit la publication de SPE a rendu inaudible la pointe critique de L. Guierre (1970, 1979) qui, entre autres, ruinait cette phonologie accentuelle de l’anglais. Opposant aux quelques exemples traités par SPE l’un des premiers corpus informatisés de l’anglais fort de 40 000 formes environ, L. Guierre montrait que l’appareil formel de SPE traitait majoritairement comme des règles les cas marginaux ou exceptionnels et considérait comme des exceptions ce qui correspondait en réalité aux régularités profondes de la langue tel qu’un corpus permettait de les établir.
12 La phonologie du français n’échappe pas à cette dérive générative. Dès avant la publication de SPE, la première thèse doctorale appliquant le cadre et les méthodes de SPE lui est consacrée. S. Schane (1965) consacre ainsi un chapitre de 45 pages à l’analyse de l’élision de schwa, de la liaison des consonnes, du H aspiré, des liaisons internes au groupe verbal et des inversions, ainsi que des consonnes finales fixes. Nonobstant la complexité des phénomènes abordés, ce court chapitre s’appuie pour ces 6 questions sur un total de 73 exemples. La thèse proposant un total de 41 règles ordonnées, chacun jugera du ratio règles/exemples [9]. On verra dans ce numéro de Langue française ce qu’un corpus qui expose plus de 190 000 occurrences concernant le schwa et plus de 47 500 sites de liaison permet de dire de ces deux seuls phénomènes.
13 En fait, l’exposé génératif standard cache mal sous la présentation de quelques exemples sa véritable méthode : le travail de seconde main. Comme cela a souvent été noté (Scheer 2004 ; Laks 2008), la phonologie générative standard se fonde, en effet, très généralement sur l’exploitation seconde d’analysesstructuralistes précédentes qu’elle se contente de formaliser dans le nouveau cadre. Lorsqu’il s’agit d’une langue peu décrite, pour laquelle il existe un seul corpus et une seule analyse structurale méthodiquement construits, on reste dans une certaine cohérence de l’empirie, même si le datum n’est pas traité comme tel dans toute son expansion. Mais lorsqu’il s’agit d’une langue comme le français où descriptions et analyses, relevés et corpus sont surabondants, la phonologie de l’exemple court rapidement le risque de l’incohérence. La solution consiste alors, par choix des références, sélection des exempla ou recours à l’intuition d’un habitus lettré, à retrouver la cohérence limitée de la phonologie orthoépique [10]. La phonologie de corpus, au contraire, inscrit sa cohérence dans la comparaison des corpus et dans la cumulation des descriptions. Cela est plus particulièrement vrai pour la phonologie du français.
3. LA PHONOLOGIE DU FRANÇAIS ET LES CORPUS
14 Dès avant 1539 et le décret de Villers-Cotterêts qui marque la naissance politique du français comme langue de l’état royal puis républicain, les parlers de France sont abondamment décrits et commentés. Pendant quatre siècles se sont accumulés les traités et commentaires. Depuis J. Palsgrave (1530) qui produit pour Marie Tudor, future reine de France et sœur d’Henri VIII, le premier manuel de français langue étrangère jusqu’à M. Grammont (1894), P. Fouché (1959) [11] ou l’enquête de A. Martinet (1945) au sein de la communauté des officiers français prisonniers avec lui dans l’oflag de Weinsberg, la phonologie du français a été analysée dans toutes ses dimensions et toutes ses variétés. La recension des descriptions, analyses, systèmes de transcription graphiques, prescriptions, cacologies, relevés de pratiques, corpus populaires ou savants, régionaux ou dialectaux, constitue à soi seule un champ scientifique. Pour la période qui va de 1521 à 1878, C. Thurot (1881-1883), dans les deux volumes de son monumental ouvrage, cite, commente et analyse ainsi les textes de 200 grammairiens de l’oral [12]. Inscrivant explicitement son ouvrage dans les pas de C. Thurot, A. Morrison (1968) y ajoute, pour la période récente (1805 à 1967), 200 autres études portant spécifiquement sur la liaison.
15 On voit que la phonologie de corpus du français est particulièrement riche. Elle permet et impose une approche réellement cumulative (Durand &Laks 1996). Même si jusqu’au 20e siècle, la grande majorité des recueils et relevés est à vocation normative et orthoépique, il n’empêche qu’ils constituent des témoignages extrêmement précieux pour le phonologue contemporain comme pour l’historien de la langue. Rédigés sur le mode célèbre de l’Appendix Probi, ils attestent d’usages, ne serait-ce que pour les condamner, et offrent ainsi un témoignage irremplaçable sur les parlers populaires du temps. Les corpus accumulés autorisent des analyses nouvelles de matériaux anciennement collectés, comme ce fut le cas par exemple pour G. Vaudelin (1713) dont le témoignage est repris par M. Cohen (1946) et A. Martinet (1947), ou pour J.-A. de Baïf (1574) très souvent réanalysé (cf. Morin 2000).
16 Le caractère généralement normatif de ce matériel ne fait pas obstacle au travail phonologique. En effet, la norme orthoépique ne se décrète pas ex cathedra. Comme on le voit bien dans l’histoire du français, la recommandation en matière orale se fonde sur la sélection d’un usage particulier : « Les règles sont dressées sur l’usage et façons de parler lesquels ont toute puissance, autorité et liberté » (Meigret 1542) [13]. Le débat visant à sélectionner l’usage légitime, celui du peuple ou celui de la Cour, peut être particulièrement vif comme on le voit avec P. Ramus (1562) d’un côté [14], C. Vaugelas (1647 [1934]) de l’autre [15]. Il se double du débat sur l’orthographe et l’oral : faut-il écrire comme on parle ou parler comme on écrit ? [16] Il reste néanmoins que la prescription normative est construite et légitimée par la recollection d’un usage et que cette collection justement fait corpus.
17 Au total, comme on vient de le voir, que cela soit synchroniquement ou diachroniquement, la phonologie, et singulièrement celle du français, se construit comme une linguistique de corpus.
4. LE PROGRAMME « PHONOLOGIE DU FRANÇAIS : USAGES, VARIÉTÉS ET STRUCTURES »
4.1. Les objectifs de PFC
18 C’est dans le contexte théorique et empirique de la linguistique de corpus que le programme « Phonologie du Français Contemporain : usages variétés et structures » [17] (PFC ; http://www.projet-pfc.net) a été construit et s’est développé depuis 1999 sous la direction de J. Durand (Université de Toulouse II), B. Laks (Université de Paris Ouest Nanterre La Défense) et C. Lyche (Université d’Oslo et de Tromsö) [18]. PFC se donne pour objectif de construire un important corpus de référence permettant de rendre compte de la diversité des usages oraux du français sur le territoire national, mais aussi dans l’ensemble de la francophonie [19]. La construction d’une très grande base de données formatées, étiquetées et standardisées autorisant le plus grand nombre possible d’analyses secondaires, spécifiques ou particulières, est au cœur du programme dont les objectifs initiaux sont les suivants :
- fournir une image linguistiquement fiable et scientifiquement construite du français parlé dans son unité et sa diversité, sociale, stylistique et géographique ;
- permettre une mise à l’épreuve des hypothèses et des modèles phonologiques, anciens ou nouveaux, proposés pour le français, tant au plan synchronique que diachronique ;
- constituer une base de données représentative de la diversité des usages oraux à partir d’une méthodologie commune et standardisée autorisant tous les types d’interrogation et de fouille afin de garantir la possibilité d’analyses secondaires couchées dans des cadres théoriques différents ;
- fournir des données de référence pour les outils de traitement automatique de la parole ;
- élargir et renouveler les données pour l’enseignement du français oral, de la linguistique française et de la didactique du français langue étrangère et langue seconde [20].
4.2. Les enquêtes de PFC
20 PFC propose un ensemble de données phonétiques, phonologiques, lexicales et discursives recueillies lors d’enquêtes de type labovien conduites chacune en un point géographique particulier de la francophonie [21]. Afin de permettre l’intégration des données dans la base et pour garantir leur exploitation future, chaque enquête suit un protocole très standardisé. L’enquêteur, qui a une bonne connaissance du lieu, sélectionne une dizaine de locuteurs par la technique des réseaux denses de Milroy. Il équilibre au mieux les sexes, les âges et les catégories socioprofessionnelles [22]. Pour chaque locuteur il fournit, outre le talon sociologique, quatre enregistrements oraux : la lecture d’une liste de mots et la lecture d’un texte, identiques en tous points, et une conversation guidée en tête à tête suivie d’une conversation libre du locuteur avec des pairs.
21 La liste de mots, constituée de paires minimales, est construite pour tester le système phonologique et les oppositions pertinentes actives pour le locuteur considéré. Le texte simple et court accumule les contextes reconnus phonologiquement pertinents pour les processus centraux de la phonologie du français : liaison, E muet, H aspiré, prosodie, etc. Dans la construction du texte comme de la liste de mots, on a veillé à reprendre les hypothèses anciennes ou plus modernes des phonologues du français, permettant ainsi, dans la perspective cumulative qui est celle de la phonologie de corpus, de tester divers modèles et d’en additionner les apports tout en offrant une profondeur historique et inter-théorique à la base de données constituée. Au total, PFC propose donc pour chaque point d’enquête soixante à quatre-vingt-dix minutes d’enregistrement organisées selon quatre registres stylistiques : lecture de mots, lecture suivie, conversation guidée et conversation libre [23].
4.3. Les ressources phonologiques de PFC
22 Chaque enquête subit un traitement en vue de son intégration dans la base de données PFC. L’ensemble des données sociologiques et contextuelles est formatéet anonymisé [24] afin de permettre une fouille aisée et directe. La totalité des enregistrements est numérisée et organisée en fichiers consultables depuis le site du projet. Pour chacun des quatre registres de parole, une transcription alignée sur le signal oral est fournie. La transcription et l’alignement sur le signal visualisé et analysé sous PRAAT (Boersma & Weenink 2009) concernent la totalité de la liste de mots et du texte « Le premier ministre ira-t-il à Beaulieu ? » ainsi qu’un extrait de cinq minutes de la conversation guidée et de cinq minutes de la conversation libre.
23 Les transcriptions sont de type orthographique afin de rester aussi neutres que possible par rapport aux différentes hypothèses phonologiques et pour permettre un alignement transparent sur le signal. Un ensemble de conventions de transcription a été mis au point qui permet de minimiser les erreurs. Avec une double correction des transcriptions et de l’alignement sur le signal, ce dispositif garantit pour PFC un taux d’erreur ou d’inconsistance particulièrement bas comparé aux autres bases audio-orales existantes.
24 Deux points spécialement importants de la phonologie du français font l’objet d’un prétraitement approfondi. L’ensemble des sites pertinents des extraits transcrits est ainsi analysé pour ce qui concerne la liaison et schwa [25]. Deux systèmes de codage ont été mis au point et appliqués à l’ensemble des extraits. Ils codent les informations segmentales, contextuelles et comportementales reconnues pertinentes par les phonologues ayant abordé ces questions. Ils fournissent un accès direct, avec divers tris possibles, aux données concernant schwa et la liaison, données qui sont ainsi directement mises en forme et exploitables [26].
25 Le format des données collectées, indexées, codées et stockées permet un accès direct, simple et aisé aux enregistrements. Le phonologue du français, comme le didacticien, pourra facilement construire un jeu d’hypothèses ou de processus analytiques lui permettant d’intégrer rapidement tout ou partie des données à son propre cadre théorique ou pratique. PFC fournit ainsi la plus importante base de données directement ré-exploitable existante à ce jour pour le français. Un ensemble d’outils de fouille très sophistiqués permettant une interrogation rapide est également disponible en ligne. Cette organisation précise et très standardisée de la base de données en fait un outil particulièrement souple et adaptable. Divers dispositifs comme un analyseur syntaxique, un analyseur syllabique ou d’autres systèmes de type parseur sont également applicables,permettant l’adjonction de couches d’analyse complémentaires, morphologiques, lexicales, syntaxiques, ou prosodiques.
4.4. Le programme PFC aujourd’hui
26 Au cours des dix années écoulées, 169 chercheurs ont collaboré au programme PFC à des titres divers (enquêteur, transcripteur, codeur, développeur, etc.). Le programme lui-même est lié à 12 équipes de recherche différentes et a bénéficié de nombreux soutiens financiers (cf. note 17). Une dizaine de doctorats ont été réalisés en tout ou partie au sein du programme et 5 sont encore en cours. Le programme couvre, en 2010, 33 régions géographiques de la francophonie et répertorie 76 points d’enquête. Parmi ceux-ci, 33 enquêtes sont achevées et disponibles dans la base PFC, 33 sont en cours de traitement (transcription, codage, etc.) et 10 sont en cours d’achèvement.
27 Au total, la base PFC regroupe aujourd’hui les enregistrements de 489 locuteurs francophones, soit environ 730 heures de parole numérisée et indexée accessible en ligne. Pour chaque locuteur, quatre registres différents de parole sont documentés et on dispose au total de 41 heures de son transcrit, aligné sur le signal et codé pour la liaison et le schwa. Cela offre au phonologue du français la possibilité de travailler directement sur plus de 47 500 sites de liaison potentiels et plus de 190 300 sites pour schwa.
28 Avec une taille actuelle de plus de 900 000 mots, PFC correspond à l’une des bases de données audio-orales les plus importantes au monde. Son caractère cumulatif et inter-théorique, sa structure interne, la richesse et la souplesse de ses indexations, de ses transcriptions et de ses codages alignés sur le signal digitalisé et visualisé en font un instrument de recherche pour la linguistique du français particulièrement puissant et accessible.
29 Dans la dernière période, de nombreuses recherches phonologiques se sont appuyées sur une exploitation totale ou partielle de la base PFC. Ces recherches, menées dans des cadres théoriques différents et avec des objectifs différents, ont permis de renouveler profondément notre approche du système phonologique du français contemporain en l’adossant à une empirie nouvelle, rigoureusement construite et formatée. Ce numéro de Langue française se donne pour objectif d’illustrer le renouveau de la linguistique de corpus en présentant six études de phonologie du français conduites dans le cadre du programme PFC.
5. PRÉSENTATION DU NUMÉRO
30 Les grands thèmes de la phonologie du français sont successivement abordés dans ce numéro à partir de préoccupations théoriques, d’objectifs descriptifs ou de cadres argumentatifs assez différents. Deux articles abordent la question de la liaison, un la question de l’élision des consonnes liquides et trois la question de schwa, dont un plus particulièrement dans un cadre prosodique.
31 Dans « Que savons-nous de la liaison aujourd’hui ? », Jacques Durand et Bernard Laks se proposent de donner un éclairage quantitatif et qualitatif précis sur le phénomène de la liaison tel que la base PFC permet de l’envisager. La liaison, un temps considérée comme un phénomène phonologique simple dans le cadre des phonologies génératives et post-génératives, apparaît comme un phénomène très complexe dans son conditionnement morphologique et lexical. L’étude quantitative et contextuelle précise démontre, outre la quasi-inexistence de la liaison non enchaînée, un fonctionnement lexical très contraint qui conduit à déplacer le phénomène du terrain phonologique à celui des répertoires, individuels et collectifs, dans une approche renouvelée du stockage lexical.
32 La question du conditionnement morphologique de la liaison est reprise par Julien Eychenne dans « La liaison en français et la théorie de l’optimalité », mais dans un cadre théorique très différent. Exploitant de façon détaillée sept enquêtes de PFC, J. Eychenne adopte un cadre optimaliste à contraintes. Sans recourir à des dispositifs représentationnels complexes, il formalise le statut morphologique particulier des consonnes de liaison. Adoptant un cadre constructiviste et émergentiel, il rend compte de l’apparition, de l’acquisition et de la stabilisation des liaisons réalisées en recourant à l’interaction de contraintes optimalistes hiérarchisées.
33 Le comportement des liquides présente une variation importante et constitue une question épineuse de la phonologie du français. Dans « Le conditionnement lexical de l’élision des liquides en contexte post-consonantique final », Elissa Putska analyse six des enquêtes PFC menées à Paris, en Guadeloupe et en Aveyron. Elle confirme le fort conditionnement lexical du phénomène et montre l’importance de la cohésion syntaxique et prosodique. S’interrogeant sur le contact entre variétés différentes de français au sein de la même communauté et sur les dynamiques de changement conditionnées par les identités des locuteurs, E. Putska démontre l’existence de plusieurs types de changements en cours.
34 Dans « Ch(e) va : schwa français en syllabe initiale », Twan Geerts propose une nouvelle définition, beaucoup plus stricte, de ce qu’il convient de considérer comme schwa en français. Cette nouvelle définition, assez proche des définitions classiques pré-génératives, est confrontée aux données issues de cinq enquêtes PFC en France métropolitaine. Exploitant les codages contextuels fins, T. Geerts analyse la variation interne au comportement de schwa en syllabe initiale pour conclure à la nature proprement phonologique, rythmique et syllabique du conditionnement, minimisant ainsi le conditionnement morphologique.
35 Helene Andreassen s’intéresse également au comportement de schwa, mais à partir d’une hypothèse différente. Dans « La recherche de régularités distributionnelles pour la catégorisation du schwa en français », elle analyse l’alternance entre schwa et la voyelle stable [œ] dont le timbre est précisément l’un de ceux avec lesquels schwa est prononcé lorsqu’il est réalisé. Posant une seule alternance schwa vs [œ], elle interroge la catégorisation de ce segment en analysantles régularités distributionnelles qui émergent. Des jugements perceptifs et des données d’acquisition issus de travaux antérieurs sont confrontés aux données et régularités extraites d’une enquête PFC pour conforter l’hypothèse de départ.
36 Enfin, dans « Schwa et position initiale revisitée : l’éclairage de la prosodie dans les corpus PFC », Anne Lacheret, Chantal Lyche et Atanas Tchobanov illustrent les développements récents du programme PFC sur le terrain prosodique en analysant les données issues de quatre enquêtes PFC à la lumière des informations contextuelles de type prosodique fournies par la base sonore, notamment ceux concernant la position de la proéminence accentuelle.
Références bibliographiques
- BAÏF J.-A. de (1574), Étrénes de poézie fransoêze an vers mesurés, Paris.
- BÉGUELIN M.-J. (1990), « Conscience du sujet parlant et savoir du linguiste », in R. Liver, I. Werlen & P. Wunderli (dir.), Sprachtheorie und Theorie der Sprachwissenschaft. Festschrift für Rudolf Engler, Tübingen : Gunter Narr, 208-220.
- BLOOMFIELD L. (1933), Language, New York : H. Holt and Company.
- BOERSMA P. & WEENINK D. (2009), Praat : doing phonetics by computer. [en ligne : http://www.fon.hum.uva.nl/praat/]
- BOUQUET S. (1997), Introduction à la lecture de Saussure, Paris : Payot.
- BRUNOT F. (1905), La réforme de l’orthographe – Lettre ouverte à Monsieur le Ministre de l’Instruction publique, Paris : Armand Colin.
- BYBEE J. (2006), “From usage to grammar : the mind’s response to repetition”, Language 82 (4), 529-551.
- CATACH N. (1968), L’orthographe française à l’époque de la Renaissance, Genève : Droz.
- CHOMSKY N. (1957), Syntactic structures, La Haye : Mouton.
- CHOMSKY N. (1965), Aspects of the Theory of Syntax, Cambridge (MA) : M.I.T. Press.
- CHOMSKY N. & HALLE M. (1968), The Sound Pattern of English, New York : Harper and Row.
- COHEN M. (1946), Le français en 1700 d’après le témoignage de Gile Vaudelin, Paris : H. Champion.
- CURRIE H.C. (1952), “A Projection of Sociolinguistics : The Relationship of Speech to Social Status”, Southern Speech Journal 18, 28-37.
- DAMOURETTE J. & PICHON É. (1911-1927), Des mots à la pensée. Essai de grammaire de la Langue française, Paris : D’Artrey.
- DELL F. (1973), Les règles et les sons : introduction à la phonologie générative, Paris : Hermann.
- DURAND J. & LAKS B. (1996), “Why phonology is one ?”, in J. Durand & B. Laks (dirs), Current Trends in Phonology : models and methods, vol. 1, ESRI : University of Salford, 1-15.
- DURAND J., LAKS B. & LYCHE C. (2002), « La phonologie du français contemporain : usages, variétés et structures », in C.D. Pusch & W. Raible (dir.), Romanistische Korpuslinguistik : Korpora und gesprochene Sprache / Romance Corpus Linguistics : Corpora and Spoken Language, Tübingen : Narr, 93-106.
- DURAND J., LAKS B. & LYCHE C. (2005), « Un corpus numérisé pour la phonologie du français »,in G. Williams (dir.), La linguistique de corpus, Rennes : Presses Universitaires de Rennes, 205-217.
- DURAND J., LAKS B. & LYCHE C. (2009), « Le projet PFC : une source de données primaires structurées », in J. Durand, B. Laks & C. Lyche (dir.), Phonologie, variation et accents du français, Paris : Hermès, 19-61.
- FOUCHÉ P. (1959), Traité de prononciation française, Paris : Klincksieck.
- GAATONE D. (1971), Étude descriptive du système de la négation en français contemporain, Genève : Droz.
- GOLD M. (1967), “Language identification in the limit”, Information and Control 16, 447-474.
- GOLDBERG A.E. (2006), Constructions at Work : The nature of generalization in language, Oxford : Oxford University Press.
- GOLDSMITH J. (à par.), Towards a new empiricism for linguistics.
- GOLDSMITH J. & ARIS X. (2009), “Learning phonological categories”, Language 85 (1), 4-39.
- GRAMMONT M. (1894), « Le patois de la Franche-Montagne et en particulier de Damprichard (Franche-Comté). IV : La loi des trois consonnes », Mémoires de la Société de linguistique de Paris 8, 53-90.
- GRAMMONT M. (1914), Traité pratique de prononciation française, Paris : Delagrave.
- GREVISSE M. (1993), Le Bon Usage, Paris : Duculot.
- GUIERRE L. (1970), Drills in English Stress-Patterns – Ear and Speech Training Drills and Tests for Students of English as a Foreign Language, Paris : Longman France.
- GUIERRE L. (1979), Essai sur l’accentuation en anglais contemporain, Thèse de l’Université Paris VII.
- HARRIS Z. (1951), Methods in Structural Linguistics, Chicago : University of Chicago Press.
- HORACE (457 [1944]), L’Art poétique ou Épître aux Pisons, Paris : Garnier.
- JAKOBSON R. (1979), Selected Writings II, La Haye : Mouton.
- KELLER F. (1998), Grammaticality Judgments and Linguistic Methodology, Edimbourg. [ftp://ftp.cogsci.ed.ac.uk/pub/CCS/RP/1998/EUCCS-RP-1998-3.ps.gz]
- LABOV W. (1966), The Social Stratification of English in New York City, Washington : Center for Applied Linguistics.
- LABOV W. (1972), Sociolinguistic patterns, Philadelphia : University of Pennsylvania Press.
- LABOV W., ASH S. & BOBERG C. (2006), Atlas of North American English : Phonology and Phonetics, Berlin : Mouton de Gruyter.
- LAKS B. (2008), « Pour une phonologie de corpus », Journal of French Language Studies 18 (1), 3-32.
- LAKS B. (2010), « La linguistique des usages : de l’exemplum au datum », in P. Cappeau, H. Chuquet & F. Valetoupolos (dir.), L’exemple et le corpus : quel statut, Rennes : Presses Universitaires de Rennes, 13-29.
- LAKS B. (à par.), « La phonotactique saussurienne : Système et loi de la valeur », Langages, Paris : Armand Colin.
- LANGACKER R. (2000), “A Dynamic Usage-Based Model”, in M. Barlow & S. Kemmer (dir.), Usage Based Models of Language, Standford : CSLI, Standford University, 1-65.
- LE PRIEULT H. (2006), Grammaticalité : Traditions et modernité, Toulouse : Presses Universitaires du Mirail.
- MARTINET A. (1945), La prononciation du français contemporain : témoignages recueillis en 1941 dans un camp d’officiers prisonniers, Genève : Droz.
- MARTINET A. (1947), « Notes sur la phonologie du français vers 1700 », Bulletin de la Société de Linguistique de Paris, XLIII (1), 13-23.
- MARTINET A. (1956), La description phonologique : avec application au parler franco-provençal d’Hauteville (Savoie), Genève : Droz.
- MEIGRET L. (1542), Traité touchant le commun usage de l’écriture françoise, Lyon. Republications Genève : Slatkine, 1972.
- MORIN Y.C. (2000), « La prononciation et la prosodie du français du XVIe siècle selon le témoignage de Jean-Antoine de Baïf », Langue française 126, 9-28.
- MORRISON A.S. (1968), A critical bibliography of studies of liaison in French speech since 1800, Phd, Columbia University.
- NEWMEYER F.J. (1988), Linguistics : the Cambridge survey, Cambridge : Cambridge University Press.
- NEWMEYER F.J. (2003), “Grammar is grammar and usage is usage”, Language 79 (4), 682-797.
- PALSGRAVE J. (1530 [2003]), L’esclarcissement de la langue françoyse, composé par maistre Jehan Palsgrave, Angloys, natyf de Londres et gradué de Paris, Paris : Honoré Champion.
- RAMUS P. (1562), Gramère, Paris : André Wechel.
- SAPIR E. (1921), Language, an introduction to the study of speech, New York : Harcourt Brace and Company.
- SAPIR E. (1933), « La réalité psychologique des phonèmes », Journal de psychologie normale et pathologique 30, 247-265.
- SAUSSURE F. DE (1878), Mémoire sur le système primitif des voyelles dans les langues indo-européennes, Leipzig : B.G. Teubner.
- SCHANE S.A. (1965), The phonological and morphological structure of French, Phd, MIT.
- SCHEER T. (2004), « Usage des corpus en phonologie », Corpus 3, 5-84.
- SCHÜTZE C.T. (1996), The Empirical Base of Linguistics : Grammaticality Judgments and Linguistic Methology, Chicago : University of Chicago Press.
- THUROT C. (1881-1883), De la prononciation française depuis le commencement du XVIe siècle, d’après les témoignages des grammairiens, Paris : Imprimerie Nationale.
- TOMASELLO M. (2003), Constructing a language : A usage based theory of language acquisition, Cambridge (MA) : Harvard University Press.
- TOMASELLO M. (2008), Origins of Human Cognition, Cambridge (MA) : MIT Press.
- TROUBETZKOY N.S. (1939), Grundzüge der Phonologie, Prague : Travaux du Cercle Linguistique de Prague. Traduction française par J. Cantineau (1947), Principe de Phonologie, Paris : Klincksieck.
- VAUDELIN G. (1713), Nouvelle maniere d’ecrire comme on parle en France ; suivi de Instructions cretiennes, mises en ortografe naturelle pour faciliter au peuple la lecture de la sience du salut, Paris : Cot & Lamesle.
- VAUGELAS C. FAVRE DE (1647 [1934]), Remarques svr la langue françoise, utiles à ceux qui veulent bien parler et bien escrire, Paris : Droz.
- WEINREICH U., LABOV W. & HERZOG M. (1968), “Empirical Foundations for a Theory of Language Change”, in W. Lehmann & Y. Malkiel (dir.), Directions for Historical Linguistics, Austin : University of Texas Press, 95-188.
Notes
-
[1]
Le recours systématique à l’intuition du sujet parlant, voire du linguiste lui-même, la reproduction inconsciente de la norme notamment dans les jugements de grammaticalité de gradience fine, et les jugements de grammaticalité eux-mêmes ont fait l’objet d’une très abondante littérature critique, tant psycholinguistique, sociologique, empirique que proprement méthodologique (Keller 1998 ; Le Prieult 2006 ; Schütze 1996). Ces critiques, et la dénonciation de très nombreux biais, n’ont pas conduit à réviser une approche que j’ai analysée comme correspondant en propre à l’idéologie grammaticale (Laks 2008).
-
[2]
On notera au passage que même ce qui est tenu pour le parangon de la grammaire française (Damourette & Pichon 1911-1927) se fonde sur une très large collection de faits et d’usages variés patiemment relevés dans toutes les couches de la communauté linguistique. Plus récemment, Gaatone (1971) propose une analyse de la négation en français sur corpus d’exemples attestés.
-
[3]
De ce point de vue, la sociolinguistique n’est qu’une linguistique de corpus particulière, celle dont le corpus est construit via une enquête sociologiquement contrôlée. Elle trouve historiquement sa source chez Currie (1952) qui le premier lie l’enquête linguistique et l’enquête sociologique portant sur le statut social des formes collectées. Telle est bien la leçon magistrale de Labov (1972) et de Weinreich, Labov & Herzog (1968) : la sociolinguistique est une linguistique de corpus qui prend au sérieux l’organisation sociale interne de la communauté linguistique considérée.
-
[4]
Après avoir ironisé sur telle phonologue étonnée de constater ex post que les formes dont elle accréditait l’existence par un recensement sous Google étaient en fait attestées par la seule prise en compte de ses propres articles antérieurs, Scheer (2004 : 137) écrit justement : « Fonder des raisonnements qui donnent lieu à des conclusions théoriques majeures sur quelques mots d’une langue dont on ne connaît rien et qu’on a repris de seconde ou troisième main rappelle une pratique de la phonologie générative naissante ».
-
[5]
Même Sapir (1933) s’appuie sur cinq enquêtes de terrain où la taxinomie résultante se voit éclairée par les remarques de ses informateurs païute, sarsi et nootka.
-
[6]
D’où la grammaticalité de « d’incroyables idées vertes dorment furieusement » vs l’agrammaticalité de « Jean rase Jean chaque matin ».
-
[7]
Merci à Jacques Durand pour une discussion de ce point. Les positions exprimées ici sont les miennes.
-
[8]
Notons au passage que la notion de parallélisme a pour Saussure deux acceptions : celle du linguiste qui les décrit et les formalise et celle de la conscience collective des sujets parlants qui y fonde la grammaire. La notion de parallélisme est pour Saussure un opérateur cognitif (Laks à par.).
-
[9]
Soit 26 exemples pour la troncation et l’élision, 14 pour les consonnes finales fixes et les adjectifs numéraux, 3 pour le H aspiré, 2 pour le hiatus, 20 pour les jonctures internes au groupe verbal et les inversions, et 8 pour les pronoms postposés. On y ajoutera 22 exemples supplémentaires cités dans les notes.
-
[10]
C’est le cas pour Schane qui s’appuie le plus souvent sur Fouché (1959), Grammont (1914), Grevisse (1993). Dell (1973) dit faire appel à son intuition de locuteur natif (lettré et linguiste). Cette intuition est le plus souvent cohérente avec les recommandations orthoépiques de Fouché (Ibid.).
-
[11]
On oublie trop souvent que le traité de Fouché s’appuie sur une collection de faits recueillis pour partie à l’occasion de son émission de radio « Monsieur Jourdain chez les speakers » ainsi que sur une recension des ouvrages qui l’ont précédé. Cela n’enlève rien au caractère prescriptif et orthoépique de son ouvrage, tout au contraire, le mode de recollection des données l’induisant très largement.
-
[12]
Thurot limite son corpus de références à ceux qu’il qualifie de grammairiens. Les ouvrages considérés vont du traité complet au court chapitre consacré au français oral au sein d’une grammaire plus générale.
-
[13]
La Renaissance reprend ainsi la tradition latine d’Horace à Cicéron qui fait de l’usage le fondement de la langue : « On a toujours eu, on aura toujours la liberté de mettre en circulation un mot marqué au coin de l’année. Beaucoup renaîtront, qui ont aujourd’hui disparu, beaucoup tomberont, qui sont actuellement en honneur, si l’exige l’usage, ce maître absolu, légitime, régulier de la langue » (Horace, 457 [1944] : 58-59).
-
[14]
« Le peuple est souverain de sa langue et la tient comme un fief de franc alleu, et n’en doit reconnaissance a aucun seigneur. L’école de cette doctrine n’est point es auditoires des professeurs hébreux, grecs et latins en l’Université de Paris ; elle est au Louvre, au Palais, aux Halles, en Greve, à la place Maubert » (Ramus, 1562 : 3). On se souvient également que Malherbe tenait les crocheteurs du port aux foins pour ses maîtres en langue.
-
[15]
« De ce grand principe, que le bon usage est le Maitre de notre langue, il s’ensuit que ceux-là se trompent, qui en donnent toute la juridiction au peuple [...]. C’est la façon de parler de la plus saine partie de la Cour, conformément à la façon d’écrire de la plus saine partie des auteurs du temps. Toutefois quelque avantage que nous donnions à la Cour, elle n’est pas suffisante toute seule de servir de règle, il faut que la Cour et les bons auteurs y concourent, et ce n’est que de cette conformité qui se trouve entre les deux, que l’usage s’établit. » (Vaugelas, 1647 [1934] : 1)
-
[16]
Sur la relation entre description de l’oral et forme orthographique, cf. Brunot (1905), Catach (1968).
-
[17]
En complément du soutien constant des universités des trois directeurs, le programme PFC a bénéficié de nombreux soutiens financiers : Délégation Générale à la Langue Française et aux Langues de France (DGLFLF), Centre National de la Recherche Scientifique (CNRS), Agence Nationale de la Recherche (ANR), Institut de Linguistique Française (ILF), Center for Advanced Studies in Theoretical Linguistics (Norvège), Centre de Coopération Franco-Norvégienne en Sciences Sociales et Humaines, Région Midi-Pyrénées et, au titre des chaires de Jacques Durand et de Bernard Laks, Institut Universitaire de France (IUF).
-
[18]
Pour des présentations détaillées, cf. Durand, Laks & Lyche (2002, 2005).
-
[19]
En sus de la France, PFC couvre la Belgique, la Suisse, le Canada, la Louisiane, le Maghreb, le Proche et Moyen Orient, l’Afrique, les Antilles, l’Océan indien, le Pacifique. Toutes les informations, données, protocoles, liste des chercheurs et équipes impliquées, ainsi que les résultats, sont accessibles à partir du site du programme.
-
[20]
On trouvera sur le site du programme de nombreuses informations sur les projets connexes qui sont venus se greffer sur PFC : Interphonologie du Français Contemporain (IPFC) consacré aux corpus d’apprenants ; Phonologie du Français Contemporain, Enseignement du Français (PFC-EF) consacré à la didactique du français oral. Des programmes ‘frères’ ont été développés pour d’autres langues (Phonologie de l’Anglais Contemporain (PAC), etc.). Ils sont coordonnés au sein du groupe CORPHO soutenu par la Fondation Européenne pour la Science (ESF).
-
[21]
La méthodologie est proche de celle adoptée récemment par Labov dans la construction de son atlas de l’anglais parlé en Amérique du Nord (Labov, Ash & Boberg 2006).
-
[22]
PFC n’est donc pas un corpus sociologiquement construit pour être représentatif. Son extension à la francophonie et surtout le caractère coopératif et cumulatif du travail d’enquête qui voit un très grand nombre d’enquêteurs travailler en des points très différents interdisaient de viser une telle représentativité par quota. PFC vise ainsi à rendre compte de la diversité des usages sans en pondérer le poids les uns par rapports aux autres. La progressivité du travail d’enquête mené sur dix années et la taille même du programme étaient à ce prix. Néanmoins, PFC fournit pour chaque enquête et pour chaque locuteur des données sociologiques précises qui permettent des exploitations sociolinguistiques secondes.
-
[23]
Tous les protocoles sont présentés et discutés sur le site du programme. On consultera Durand, Laks & Lyche (2002, 2005, 2009) pour des mises au point successives sur PFC.
-
[24]
Le programme respecte les directives « Informatique et libertés ». Un consentement est signé par chaque enquêté qui voit toute trace d’information personnelle effacée de la base. La base PFC et l’ensemble de la documentation sont en cours de dépôt au département audio-visuel de la Bibliothèque Nationale de France. Une partie du corpus est également visible sur le portail internet de la DGLFLF.
-
[25]
Une couche de transcription et de codage prosodiques, rythmiques et accentuels est en cours de développement.
-
[26]
PFC est à l’heure actuelle la seule base de données audio-orale offrant ce type de fonctionnalités, quelle que soit la langue considérée.