Couverture de RFLA_152

Article de revue

L'apprentissage de l'écriture en langue seconde à l'aide d'un corpus spécialisé

Pages 9 à 20

Notes

  • [1]
    Pour certains domaines scientifiques, à savoir les sciences économiques, la linguistique et la médecine, un enseignant et ses apprenants pourraient consulter le corpus KIAP (Fløttum, Dahl & Kinn 2006).
  • [2]
    Le logiciel employé pour l’analyse du corpus dans cette étude est Wordsmith Tools (Scott 1999).
  • [3]
    Puisque la quasi-totalité des articles dans le corpus sont le travail d’un seul auteur (et non pas de multiples auteurs), il est facile de montrer aux apprenants que nous est employé plutôt que je. Il n’est donc pas nécéssaire de créer un sous-corpus des articles d’un seul auteur.
  • [4]
    Tim John’s Data-driven Learning page : <http://www.ecml.at/projects/voll/our_resources/ graz_2002/ ddrivenlrning/whatisddl/resources/tim_ddl_learning_page.htm> [Page consultée le 16 août 2010].
  • [5]
    Le logiciel permet aussi de sélectionner au hasard un nombre plus limité d’occurrences, ce qui peut créer une ressource qu’un enseignant ou un apprenant peut analyser sans difficulté.

1 – Introduction

1L’apprentissage de l’écriture implique une bonne maîtrise des spécificités du genre discursif auquel appartient le texte à écrire. Les analyses de discours spécialisés (Beacco 1995 ; Hyland 1998 ; Swales 1990) révèlent les systématicités au niveau de la structure des articles scientifiques, ainsi que l’existence de structures lexico-grammaticales récurrentes. D’autre part, les recherches acquisitionnalistes ont montré que le transfert de stratégies d’écriture en L1 vers L2 est tout sauf évident. Des chercheurs dans le domaine de l’apprentissage des langues assisté par ordinateur reconnaissent les ressemblances entre l’écriture en L1 et en L2. Ils soulignent que la surcharge cognitive guette le scripteur en L2 plus encore qu’en L1 et que les facilitations procédurales seront d’autant mieux venues (Mangenot 2000, 190). Les chercheurs en apprentissage des langues assisté par ordinateur n’ont donc pas tardé à réaliser de telles facilitations procédurales en ayant recours à des corpus de textes. En effet, des projets ont vu le jour dans lesquels un corpus sert de base à des exercices de reconstitution (Mangenot 2000) ou à la révision d’un texte écrit par l’apprenant (O’Sullivan & Chambers 2006).

2Cette étude tente de répondre à un certain nombre de questions que la consultation d’un corpus spécialisé peut poser à un enseignant, ou à un apprenant voulant maîtriser l’écriture d’une dissertation, d’une thèse, ou d’articles scientifiques en français, c’est-à-dire un apprenant de niveau avancé en langue. Se pose d’abord la question de savoir pourquoi choisir un corpus plutôt que les ressources disponibles sur internet ? Comment délimiter le choix de textes ? Pour Cappeau et Gadet (2007, 103), il faut délimiter des portions de […] petite taille pour dégager un ensemble homogène. Nous prendrons comme exemple un corpus d’un million de mots d’articles scientifiques en français (Chambers & Le Baron 2007). Comme nous le verrons dans la deuxième partie de notre contribution, les chercheurs qui se sont penchés sur cette question ont souvent créé des corpus de textes d’un seul genre ou d’un nombre limité de genres qu’ils jugent pertinents, pour permettre à leurs étudiants de consulter ces ressources comme support à leur apprentissage. Nous résumerons brièvement les recherches quantitatives et qualitatives dans ce domaine. La plupart de ces corpus, cependant, ne sont pas accessibles aux enseignants, ce qui limite l’application des résultats à ceux qui peuvent se permettre de créer leur propre corpus. Dans une troisième partie, nous verrons que les enseignants-chercheurs dans ce domaine proposent à leurs apprenants deux types d’interactions, à savoir la consultation de concordances déjà préparées par le professeur, ou bien la consultation en accès direct par les apprenants eux-mêmes, ce qui encourage l’apprentissage autonome. Des exemples de l’emploi de nous dans le corpus serviront à illustrer les types d’activités pédagogiques rendues possibles par la consultation du corpus. Nous proposerons des activités susceptibles d’améliorer la production et la révision des textes des apprenants. Ceci nous permettra, en guise de conclusion, d’évaluer le potentiel de corpus spécialisés pour l’enseignement/apprentissage des langues.

2 – Les corpus spécialisés

3Les chercheurs dans le domaine de l’apprentissage de l’écriture reconnaissent unanimement le rôle primordial joué par la lecture (Peytard & Moirand 1992, 50 ; Hyland 2002, 82). Comme le soulignent Cobb (1997, 303) dans le contexte de l’acquisition du lexique, et Gaskell et Cobb (2004, 304) par rapport à la grammaire, les apprenants sont trop peu confrontés à L2 dans la vie quotidienne pour permettre une acquisition satisfaisante. Pour les apprenants de niveau avancé qui produisent des textes spécialisés dans la langue cible, il s’agit de trouver un moyen d’accélérer le passage des connaissances acquises par la lecture à l’activité d’écriture, d’acquérir les compétences et les stratégies du scripteur telles que les maîtrise le locuteur natif. L’enjeu pour l’enseignant de la langue de spécialité est donc d’accompagner en quelque sorte cette activité de lecture. Bref, il s’agit de trouver un moyen de fournir à l’apprenant plusieurs exemples à la fois, et des exemples tirés de textes authentiques, qui ne sont donc pas inventés par le professeur, qu’il soit locuteur natif de la langue ou non, ce que Cobb (1997, 303) appelle l’apprentissage multi-contextuel, multicontextual learning. Ces exemples servent de modèle, non pas au sens prescriptif, mais plutôt dans un contexte constructiviste où l’apprenant consulte plusieurs modèles avant de choisir le mot ou de construire la phrase qui convienne le mieux dans le texte qu’il est en train d’écrire. Les millions de textes disponibles sur internet forment une ressource facile d’accès que la plupart des apprenants ont déjà l’habitude de consulter. Il n’est donc pas surprenant que certains chercheurs comme Rundell (2000) apprécient le potentiel de cette ressource et traitent les questions pédagogiques que soulève ce nouvel environnement d’apprentissage. Cependant, la qualité peu fiable de cette ressource (due notamment aux erreurs d’orthographe ou de grammaire largement répandues) et l’impossibilité d’opérer une sélection judicieuse des textes à consulter lorsqu’on lance des recherches avec des moteurs de recherche, amènent d’autres chercheurs et enseignants à choisir comme ressource un corpus composé de textes déjà sélectionnés selon certains critères bien définis.

4Pour ceux donc qui préfèrent exercer un certain contrôle de qualité sur les ressources utilisées par les apprenants et qui veulent les faire travailler par exemple sur des types de textes bien particuliers, un corpus permet de recueillir un nombre considérable de textes écrits par des locuteurs natifs ou bien par des personnes qui maîtrisent assez bien la langue pour servir de modèle aux apprenants. Pour les chercheurs en linguistique, plus un corpus est grand, plus il est susceptible de produire des résultats intéressants en réponse aux questions posées par les chercheurs (Sinclair 1991) ; mais les besoins des apprenants ne correspondent pas toujours à ceux des chercheurs. Pour justifier le choix entre un grand corpus de textes de plusieurs genres et un corpus restreint spécialisé, il faut avoir recours à quelques principes énoncés dans le contexte des recherches en analyse de discours. Cette démarche correspond à ce que Peytard et Moirand appellent cette montée du discursif en didactique (1992, 40), c’est-à-dire l’influence croissante depuis le début des années 1970 des recherches en analyse du discours sur les recherches en acquisition des langues étrangères. Un corpus de référence, composé de plusieurs millions, voire de centaines de millions de mots, et de textes de plusieurs genres, présentera à l’apprenant des milliers d’exemples tirés de genres qui ne correspondent pas à la tâche qu’il entreprend. Comme le rappelle Maingueneau (1984, 104), lorsqu’on écrit un texte, il ne s’agit pas seulement de maîtriser le lexique pertinent et les règles générales de la grammaire de la langue :

5

Du mode de cohésion relèvent aussi à un niveau plus superficiel les modes d’enchaînement du discours. C’est là un domaine mal connu mais d’une grande importance. Chaque formation discursive possède une manière qui lui est propre de construire ses paragraphes, ses chapitres, d’argumenter, de passer d’un sujet à un autre… Toutes ces jointures d’unités petites ou grandes ne sauraient échapper à la portée de la sémantique globale.

6La maîtrise de cet enchaînement du discours présente néanmoins un défi considérable à un apprenant d’une langue, même ou peut-être surtout de niveau avancé. Le scripteur de niveau avancé, comme l’est par exemple l’étudiant de troisième cycle dans une Faculté de Lettres, doit produire ce que les analystes du discours appellent des textes monologaux qui correspondent aux normes d’une certaine communauté discursive. Beacco (1988, 27-28) note déjà la pertinence de son analyse du discours typique de l’article scientifique pour l’apprentissage de la lecture :

7

Une connaissance du fonctionnement linguistique des textes constitue un préalable nécessaire à l’établissement, en didactique des langues étrangères par exemple, de stratégies de lecture et à la détermination d’objectifs linguistiques d’apprentissage.

8Comme nous l’avons déjà vu, l’apprentissage de la lecture et de l’écriture sont étroitement liés. Beacco lui-même (1995, 135) souligne l’importance pour l’apprenant de l’écriture des descriptions linguistiques des textes monologaux qui caractérisent des communautés discursives particulières. Citant Maingueneau (1992, 117), il note que la production d’un texte écrit implique la maîtrise des rites langagiers qui caractérisent une communauté et des modes de gestion de l’intertexte propre à la communauté (Beacco 1995, 136). Il met l’accent plus particulièrement sur l’intérêt porté à des communautés discursives restreintes existant à l’intérieur de communautés plus larges (1995, 137).

9Dans le domaine de la linguistique de corpus, la création d’un corpus restreint spécialisé permet de fournir aux apprenants de niveau avancé des ressources composées de textes dont la discipline et le genre correspondent plus ou moins parfaitement à l’activité qu’ils entreprennent. Un tel corpus pourrait donc permettre l’accès à des exemples qui sont susceptibles d’être pertinents. Pour Habert & al. (1997, 9), lorsqu’il s’agit de langues de spécialité, l’examen des régularités rencontrées au sein du corpus est alors un moyen, parfois le seul, de reconstituer la grammaire sous-jacente. Les chercheurs en apprentissage des langues se servent des corpus spécialisés depuis 1969 (McEnery & Wilson 1997, 12), mais ce n’est que depuis le début des années 1990 que l’on trouve des études quantitatives aussi bien que qualitatives des effets de cette nouvelle ressource pédagogique sur l’apprenant (Stevens 1991 ; Cobb 1997 ; St. John 2001 ; Kennedy & Miceli 2001, 2002 ; O’Sullivan & Chambers 2006). Bien que la majorité de ces études porte sur l’anglais, nous citons ici également des études qui portent sur l’allemand, le français ou l’italien, langues qui ne sont pas absentes des projets de recherche actuels. Les termes langue de spécialité et corpus spécialisé sont employés ici pour désigner non pas des domaines appartenant aux sciences de la vie ou aux sciences technologiques, comme c’est souvent le cas, mais pour désigner toute activité linguistique qui ne peut pas être considérée comme appartenant à la langue générale. Comme nous le verrons, les articles scientifiques dans le corpus que nous examinerons appartiennent au domaine des études françaises, tel que ce domaine est défini dans plusieurs universités en dehors de la France, englobant en général la littérature, l’apprentissage de la langue, la culture, et l’étude de la société française et francophone dans une perspective à la fois historique et contemporaine. Ce corpus a pour but de servir de ressource pour la production et la rédaction de genres textuels tels que la dissertation de niveau avancé (licence, master, DEA) ou l’article scientifique.

10Si pour l’anglais il existe bel et bien des corpus de discours académique, comme par exemple le BNC Baby (Burnard 2004), un corpus de quatre millions de mots, dont un million de mots de discours académique extraits du British National Corpus, tel n’est pas le cas pour le français. Voilà pourquoi nous avons créé un corpus d’un million de mots, confié à l’Université d’Oxford (Chambers & Le Baron 2007) [1]. Le Corpus Chambers-Le Baron d’articles de recherche en français compte 1 045 872 mots et se compose de 159 articles scientifiques extraits de 20 revues disponibles sur Internet et incorporés dans le corpus avec la permission des auteurs et des éditeurs. Les articles, qui ont été publiés entre 1993 et 2007, appartiennent aux dix domaines suivants : média/culture, littérature, linguistique et apprentissage des langues, ethnologie, droit, sciences économiques, sociologie et les sciences sociales, philosophie, histoire, et sciences de l’information et de la communication. Selon Dodd (1997, 131), un tel corpus est assez grand pour servir de modèle aux apprenants, même dans un contexte général. Dans un corpus spécialisé, comme le souligne Aston (1997, 55), il est beaucoup plus facile de repérer des structures lexico-grammaticales récurrentes. Par exemple, l’analyse des 81 occurrences de connaître dans ce corpus révèle qu’il ne s’agit pas de la connaissance d’une personne ou d’une ville [2]. Dans toutes les occurrences il s’agit de faire une expérience plutôt que d’avoir des connaissances particulières.

11

La conception de produits connaît des transformations sociotechniques importantes, dont la plus marquante est l’augmentation de la coopération entre les acteurs du cycle de vie du produit (Darses 2002).
Le tournant en faveur de la délibération qu’a connu la philosophie politique récente a ses racines tant dans la théorie que la pratique
Depuis la chute du mur de Berlin en novembre 1989, les politiques d’asile des Etats membres de l’Union européenne ont connu d’importantes mutations.
La Pologne et la Hongrie ont obtenu, à partir de 1993, des taux de croissance positifs et élevés alors que la République tchèque a connu des taux moyens et quelquefois négatifs.
Au cours des années quatre-vingt-dix, les modalités de financement international des pays émergents ont connu un certain nombre de mutations.

12La fréquence de cette structure lexico-grammaticale dans ce corpus peut encourager un enseignant de langue à souligner l’importance de celle-ci lorsqu’il rencontre une occurrence dans un texte qu’il étudie avec ses apprenants.

13Le choix de textes à inclure dans le corpus soulève un certain nombre de questions.

14- Tout d’abord, les articles scientifiques, qui ont beaucoup d’intérêt pour ceux qui veulent eux-mêmes écrire de tels articles, représentent-ils un modèle susceptible d’être utile aux étudiants ? Un corpus de dissertations d’étudiants correspondrait peut-être mieux au genre de texte qu’ils veulent produire. Les articles de recherche ont pourtant beaucoup de points en commun avec les dissertations (structure, citations, emploi de nous, etc.), et ils ont l’avantage d’avoir été évalués par des pairs et d’être plus faciles d’accès que les dissertations. Il serait néanmoins intéressant de pouvoir comparer l’utilité des corpus de ces deux genres comme modèles pour des étudiants qui écrivent des dissertations. Il est important de souligner que le terme modèle est employé ici dans le sens d’une source d’exemples de l’usage des locuteurs natifs qui sont experts dans un certain domaine, et non pas dans un sens prescriptif.

15- Deuxièmement, en créant un corpus, faut-il essayer de choisir des articles scientifiques prototypiques, dont les introductions, par exemple, correspondent à la structure identifiée par Swales (1990, 141) ? D’autres chercheurs (Fløttum 2006 ; Ozturk 2007) soulignent l’existence de la variation dans les articles scientifiques. Nous avons décidé de ne pas exercer de contrôle trop prononcé sur le choix des articles, c’est-à-dire de permettre aux utilisateurs du corpus de découvrir par la suite les caractéristiques des articles plutôt que d’imposer des critères de sélection. Il est pourtant facile de trouver des articles dans ce corpus qui correspondent aux caractéristiques identifiées par Swales.

16- Troisièmement, les textes dans ce corpus sont écrits par des locuteurs natifs de français. Or, puisque les recherches de Seidlhofer (2001) dans le domaine de l’anglais langue internationale remettent en question l’importance du locuteur natif comme modèle pour l’apprenant d’une langue, il est important de noter que nous aurions pu ajouter à ce corpus des articles écrits par des chercheurs qui ne sont pas des locuteurs natifs de français, mais qui correspondent parfaitement à ce que Tribble (1997, 109), citant Bazerman (1994, 131), décrit comme des exemples de textes écrits par des personnes qui maîtrisent bien un genre pertinent pour les études que font les apprenants.

3 – Des corpus spécialisés à l’apprentissage de l’écriture

17La plupart des enseignants-chercheurs qui ont étudié l’emploi de corpus par leurs étudiants se sont concentrés sur l’apprentissage des langues en général plutôt que sur l’apprentissage de la compétence plus spécifique qu’est l’écriture. Si nous privilégions ici bien évidemment les études qui se concentrent sur l’expression écrite, nous ne saurions pour autant négliger les études plus générales. Plusieurs publications sont néanmoins pertinentes dans le contexte de l’apprentissage de l’écriture, nous en ferons mention, tout en mettant l’accent sur celles qui s’occupent de l’écriture. Johns (1986) et Tribble & Jones (1990) ont été parmi les premiers à souligner la plus-value didactique de l’utilisation de concordances dans l’enseignement/ apprentissage des langues. Johns (1986, 161) propose par exemple de mettre un C dans la marge de la copie de l’étudiant pour indiquer que celui-ci pourrait améliorer sa production en consultant un corpus. L’étude quantitative et qualitative de Yoon & Hirvela (2004, 268), qui examine les réactions des apprenants d’anglais à la consultation de corpus comme support pédagogique dans le cadre d’une activité d’écriture, a rapporté des résultats positifs. Les apprenants avouaient que la consultation de corpus était bénéfique pour l’acquisition du vocabulaire, des expressions (phrases en anglais), et des compétences en écriture. Gaskell et Cobb (2004, 315) ont entrepris une étude quantitative de la consultation des concordances par leurs apprenants d’anglais comme moyen de corriger les erreurs dans les textes qu’ils avaient écrits, montrant aussi des résultats positifs. Ils soulignent cependant la difficulté de ce genre de recherche. Ayant calculé la correction des erreurs par les apprenants, ils en arrivent à la conclusion suivante :

18

Are these error change rates normal or abnormal? A fact about our field of applied linguistics that is difficult to explain to an engineer or sales executive is that we do not really have usable base rates for error attrition, even within an overall framework of non-linearity. Our purpose in this project was not to discover a miracle cure for sentence errors but to see whether learners could enjoy and use networked concordancing as a learning tool, and this seems to have been borne out.

19L’analyse qualitative d’O’Sullivan et Chambers (2006), qui concerne aussi la consultation d’un corpus spécialisé par des apprenants universitaires de français pour corriger des erreurs, a également donné des résultats positifs. Selon les apprenants, l’analyse des concordances avait amélioré leur compétence en écriture (Gaskell & Cobb 2004, 311 ; O’Sullivan & Chambers 2006, 62). Ils appréciaient la présence de multiples exemples authentiques (Yoon & Hirvela 2004, 275 ; O’Sullivan & Chambers 2006, 62) et avouaient avoir gagné en confiance lorsqu’ils écrivaient (Yoon & Hirvela 2004, 268).

20La consultation de corpus a aussi provoqué des réactions négatives auprès des apprenants et des chercheurs en linguistique appliquée. Pour certains apprenants, l’analyse d’un nombre considérable d’exemples est perçue comme un travail laborieux, qui prend beaucoup de temps (Yoon & Hirvela 2004, 274 ; Chambers 2005, 120). Pour certains chercheurs, les lignes discontinues des concordances ont le désavantage d’offrir trop peu de contexte (Widdowson 2000, 7), surtout dans de vastes corpus de référence.

21

Le corpus, dès qu’il dépasse une certaine taille, est rarement connu en profondeur. Ce qui est utilisé se limite souvent à des ensembles de lignes qui sont le produit de requêtes formulées. Le plaidoyer en faveur des données réelles et contextualisées débouche de fait sur une vision fragmentée, partielle, de suites de lignes discontinues. (Cappeau & Gadet 2007, 102)

22Dans un corpus limité où les textes appartiennent à un seul genre familier aux apprenants, le contexte n’est pas totalement absent. Dans la concordance des 74 occurrences de comme nous, par exemple, il est clair que, dans la plupart de celles-ci, l’auteur signale au lecteur qu’il a déjà traité du thème ou qu’il a l’intention de l’examiner plus loin [3]. Nous citons quelques exemples pour montrer la variété des expressions employées par les différents auteurs des articles dans le corpus.

23

Comme nous l’avons souligné précédemment à propos des Etats-Unis
comme nous le verrons par la suite,
comme nous venons de le décrire.
Comme nous l’avons indiqué plus haut,
Comme nous l’avons mentionné plus haut,
comme nous l’avons vu
comme nous le verrons plus loin.
Comme nous l’avons constaté,
Comme nous allons tenter de le montrer dans la suite de ce texte,
comme nous le montrerons dans les pages qui suivent
Comme nous l’avons expliqué dans le paragraphe précédent,
comme nous l’avons montré dans la deuxième partie,

24En employant comme nous, les apprenants anglophones ont tendance à produire des phrases comme comme nous avons vu plus tôt, une traduction littérale de la phrase équivalente anglaise qui reproduit l’emploi en anglais d’expressions non pas spatiales mais temporelles comme earlier and later. Ces exemples illustrent plusieurs aspects de l’emploi de comme nous, et, comme nous le verrons plus loin, cette concordance de 74 occurrences peut être exploitée de plusieurs façons dans un contexte pédagogique.

25La connaissance du contexte est beaucoup plus poussée si l’étudiant ou le chercheur a créé le corpus lui-même. Ainsi, les doctorants de Lee et Swales (2006) ont suivi un cours qui leur permettait de créer chacun deux corpus, un premier corpus avec leurs propres textes et un autre corpus avec des publications scientifiques dans le même domaine, ce que Lee et Swales appellent expert writing. Il s’agissait de consulter le corpus à un niveau très avancé, d’explorer le discours du domaine de recherche pour permettre au scripteur de perfectionner ses compétences en écriture en comparant les textes qu’il avait écrits avec les publications des experts. Encore une fois, il s’agit d’un nombre de participants très limité : sur les 12 doctorants qui ont commencé le cours, il n’en restait que quatre à la fin. Comme les apprenants de Yoon et Hirvela (2004), les doctorants rapportaient qu’ils avaient gagné en confiance, et qu’ils appréciaient que les exemples qu’ils trouvaient dans les concordances appartiennent à leur propre domaine de recherche (Lee & Swales 2006, 71).

4 – L’exploitation pédagogique d’un corpus d’articles scientifiques

26L’intégration des corpus dans l’enseignement des langues vise non seulement l’utilisation de ressources linguistiques à la fois authentiques et pertinentes, mais passe aussi par la mise au point d’une nouvelle approche pédagogique. Pour Johns (1986, 160), l’apprenant qui analyse des concordances devient chercheur plutôt qu’apprenant passif. Johns se servira plus tard (1997, 101) de la métaphore du détective Sherlock Holmes pour souligner le rôle plus actif et plus autonome de l’apprenant dans cette nouvelle approche, qu’il appelle Data-Driven Learning. Le corpus sert de ressource pour deux types d’activité, qui diffèrent en fonction du mode de consultation du corpus, à savoir la consultation directe et la consultation indirecte. La consultation directe permet à l’apprenant de faire lui-même des recherches de mots ou d’expressions dans le corpus et de créer des concordances. Lors de la consultation indirecte, l’apprenant n’a pas accès au corpus lui-même, mais il consulte des concordances créées par l’enseignant. Dans une approche de l’apprentissage des langues qui s’inscrit dans les théories constructivistes et le développement de l’autonomie, cette consultation indirecte peut être considérée comme moins fructueuse que la consultation directe, mais elle possède néanmoins plusieurs avantages par rapport à la consultation directe. Tout d’abord elle rend possible l’apprentissage multicontextuel (Cobb 1997, 303) sans les ressources considérables que nécessite la consultation directe. Pour permettre la consultation directe, il faut non seulement une salle multimédia équipée d’ordinateurs et de logiciels de concordance, mais aussi un système qui permette de former les apprenants à la consultation de corpus et à l’analyse de concordances. Deuxièmement, la consultation indirecte peut servir d’introduction à la consultation directe, permettant à l’apprenant d’analyser des concordances avant d’être obligé de maîtriser l’outil qu’est le logiciel de concordance. Troisièmement, comme le soulignent McEnery et Wilson (1997, 6), l’enseignant peut préparer des exercices qui encouragent une forme constructiviste d’apprentissage. Le site web de Tim Johns illustre bien une telle approche [4].

27Un corpus d’un million de mots permet donc à l’enseignant de produire des exempliers basés sur des concordances de mots et de phrases qui, selon lui, sont problématiques pour plusieurs étudiants. Ces problèmes ne se limitent pas aux erreurs purement grammaticales, mais concernent aussi ou même plutôt les modes d’enchaînement du discours dont parle Maingueneau (1984, 104), et l’emploi des mots et des phrases qui caractérisent ces textes monologaux au sein de la communauté discursive à laquelle appartiennent – ou veulent appartenir – les étudiants. L’enseignant peut donc créer des concordances à partir de recherches de mots et de phrases qui avaient posé problème aux étudiants qui ont suivi ce programme d’études dans le passé. Dans le cas de l’emploi des 74 occurrences de comme nous, par exemple, l’enseignant peut tout simplement choisir une cinquantaine d’exemples comme ceux que nous avons sélectionnés plus haut, et demander aux apprenants de noter la variété de verbes et adverbes employés, ainsi que la présence obligatoire du pronom complément d’objet direct. L’enseignant qui veut former les apprenants à la consultation de corpus pourrait leur demander de classer les 74 occurrences, en supprimant d’abord celles où il ne s’agit pas de signaler au lecteur que l’auteur a déjà abordé le thème ou qu’il a l’intention de l’examiner plus loin (c’est-à-dire 17 occurrences), comme par exemple : Comme nous le dit cet interviewé. Les 57 occurrences restantes peuvent ensuite être classées en fonction du verbe choisi par l’auteur. Cette analyse révèle que voir est le verbe le plus fréquent avec 17 occurrences, mais que les auteurs des articles dans le corpus emploient aussi une variété d’autres verbes tels que souligner, indiquer, signaler, observer, préciser, expliquer et constater. Le corpus peut également servir de ressource pour identifier les verbes utilisés pour désigner le travail de recherche de l’auteur, souvent évoqué dans l’introduction. Analyser les 3 326 occurrences de nous dans le corpus serait un travail trop laborieux, mais, puisque l’auteur d’un article de recherche emploie souvent le futur pour exposer le plan de l’article, la recherche des mots qui se terminent en -rons révèle la variété de verbes employés par les auteurs dans le métalangage de l’article pour décrire leur travail (ces exemples sont présentés dans l’Annexe) [5].

28L’emploi de nous dans les articles de recherche est bien sûr beaucoup plus complexe que ne le suggère l’analyse des expressions que nous venons de proposer. La plus grande catégorie des occurrences est composée de références à l’auteur lui-même, comme dans les expressions suivantes :

29

pp. 1113-1115 (souligné par nous)
C’est sur ce second intérêt que nous mettrons plus particulièrement l’accent
Notre connaissance insuffisante de l’anglo-américain ne nous a pas permis de noter si l’intervenant anglophone utilisait ce modèle.

30Dans d’autres cas, il s’agit d’un nous inclusif, qui renvoie tant à l’auteur qu’aux lecteurs, comme dans des phrases telles que :

31

comme nous l’avons vu
Si nous acceptons que l’information est insérée dans un système fondé sur les principes
Il nous faut donc nous demander ce que cette linguistique dominante nous dit d’elle-même

32Dans une troisième catégorie d’occurrences, plus rare, il s’agit d’un emploi plus générique, comme par exemple, une référence au chercheur et à ses collègues :

33

Nous avons, depuis Vion 1992, pris l’habitude de distinguer la modalisation de la modulation

34une référence aux lecteurs de Hegel :

35

Hegel veut nous faire voir que ceux qui envisagent le divin ainsi ne le connaissent pas vraiment

36ou bien une référence encore plus générique :

37

on peut même oser se demander dans quelle mesure la crise politico-médiatique que nous connaissons n’a pas été déclenchée plus ou moins consciemment
C’est là, certainement, l’un des plus précieux enseignements que nous devons à la pensée hégélienne
Mais si l’art ne copie pas la réalité, il la réinvente, nous dit François Dagognet
Chacun d’entre nous a sa définition de la justice.

38Il est parfois difficile de décider à quelle catégorie appartient une occurrence, comme par exemple

39

Penser la mondialisation dont l’origine est liée au transport, peut-il nous aider à comprendre l’Internet et les autres formes de télécommunication ?

40S’agit-il d’un nous inclusif ou d’un nous générique ?

41Une étude détaillée de l’emploi de nous dans ce corpus prendrait beaucoup de temps et ne répondrait pas aux besoins de la plupart des apprenants. Dans ce cas, la consultation indirecte permettra aux apprenants d’étudier un nombre d’occurrences plus limité. Le professeur peut préparer une concordance d’une cinquantaine d’occurrences, mélangeant les catégories que nous venons de décrire, et demander aux étudiants ou aux chercheurs de les classer et de réfléchir à l’emploi de nous dans les articles de recherche scientifique. L’enseignant qui préfère la consultation directe – et qui dispose des ressources nécessaires – peut montrer aux apprenants comment employer le concordancier pour réduire le nombre d’occurrences à étudier. De tels exercices peuvent accompagner l’étude d’un texte où l’emploi de nous correspond aux catégories que nous avons identifiées, et le professeur pourrait aussi préparer de courts extraits où le contexte de certains emplois de nous serait plus évident que dans les concordances. L’analyse des concordances peut donc encourager la réflexion de l’apprenant sur certains aspects de l’écriture, allant d’expressions simples comme comme nous le verrons jusqu’à une analyse de la rhétorique de l’auteur à travers laquelle il persuade le lecteur d’accepter son argumentation.

42L’étude de beaucoup de concordances pourrait bien sûr devenir ennuyeuse pour les apprenants (Swales 2004, 144). Il s’agit plutôt d’intégrer les concordances dans un cours où les apprenants étudient un texte ou des textes, ce qui permet à l’apprenant de voir de multiples exemples de l’usage plutôt qu’une seule occurrence. Un enseignant qui formule des recommandations sur l’écriture de dissertations pourrait leur demander de lire une dissertation ou un article de recherche, et illustrer son cours à l’aide de concordances fournissant des exemples supplémentaires d’expressions issues du texte original. Dans cette approche, le corpus est consulté avant l’écriture du texte par l’apprenant. Il manque cependant des études qui valident cette approche. Comme nous l’avons vu dans les publications de Gaskell et Cobb (2004) et de O’Sullivan et Chambers (2006), la consultation du corpus peut aussi avoir lieu après l’écriture pour permettre aux apprenants de corriger eux-mêmes leurs erreurs. L’emploi du corpus pendant l’écriture, comme dans l’étude de Lee et Swales (2006), crée un environnement où cette ressource accompagne l’emploi du dictionnaire, permettant aux scripteurs de trouver de multiples exemples d’expressions dans un contexte pertinent. Il va sans dire que ces trois approches ne s’excluent pas mutuellement.

5 – Conclusion

43En guise de conclusion, cette étude de nous illustre un aspect fondamental du rôle du corpus et du logiciel de concordance dans l’apprentissage des langues. La démarche de l’apprenant ne consiste plus en une simple consultation de livres de grammaire ou de livres qui donnent des conseils sur l’écriture et des modèles à suivre. Il s’agit plutôt d’un travail d’exploration, de découverte d’exemples et de structures syntaxiques qui dans ce cas ne fournissent pas la bonne réponse. Au contraire, en analysant les occurrences de nous dans ce corpus restreint, l’apprenant se trouve confronté à un choix, puisque les auteurs, tout en employant certains mots et certaines phrases similaires, ont aussi à leur disposition une grande variété de termes et d’expressions. Il s’agit donc d’un travail créateur. La consultation du corpus encourage donc l’apprentissage autodirigé où l’apprenant prend lui-même les décisions concernant son apprentissage, bénéficiant de ressources comme les corpus et d’outils comme les concordanciers. Mais cette image de l’apprenant qui choisit un corpus d’un million de mots dans son domaine d’études dans la langue cible et qui le consulte pour améliorer son écriture, ne correspond pas à la réalité dans la quasi-totalité des universités. Puisque les travaux de recherche dans ce domaine, comme ceux qui ont déjà été cités dans cette étude, se concentrent pour la plupart sur la consultation de corpus dans la salle de classe, il manque des études qui pourraient servir de modèle à ceux qui veulent intégrer ces ressources et cet outil dans un environnement multimédia axé sur l’apprentissage autodirigé. Il manque aussi, bien sûr, des ressources créées pour répondre aux besoins des apprenants plutôt qu’à ceux des chercheurs. BNC Baby (Burnard 2004) représente une initiative en langue anglaise qui vise à fournir une telle ressource. Créé à partir du British National Corpus pour un projet concernant l’apprentissage des langues, ce corpus de quatre millions de mots est composé de quatre corpus d’un million de mots consacrés aux discours journalistique, littéraire et académique, et d’un million de mots de langue parlée. Mais de telles initiatives sont rares. S’il est donc difficile de conclure de façon définitive que la consultation de corpus représente un développement majeur dans l’apprentissage de l’écriture, les études publiées jusqu’à présent démontrent néanmoins le potentiel de cette nouvelle activité.


Annexe

Emploi de nous auprès d’un verbe se terminant en -rons dans notre corpus d’articles scientifiques

1.Dans un premier temps, nous aborderons brièvement la notion d’égalité
2.Pour concrétiser notre propos, nous nous appuierons sur deux logiciels réalisés dans le cadre de programmes financés
3.Pour ce faire, nous nous attacherons tout d’abord à mettre en évidence l’altérité de la pensée
4.Puis, nous nous attarderons sur trois facteurs qui, au sein de ce régime pédagogique, permettent
5.Ensuite, nous exposerons les grandes lignes d’un nouveau régime pédagogique que nous avons conçu et implanté en milieu scolaire canadien, le français intensif
6.Nous nous bornerons pour notre propos actuel à souligner la présence réelle
7.En comparant ces différents moments de l’histoire régionale, nous chercherons dans un deuxième temps à mettre en évidence les composantes
8.Dans cet article, nous nous concentrerons sur la question de l’autonomie de l’apprenant,
9.nous constaterons que c’est à bon droit que les magistrats ont rejeté les arguments
10.nous décrirons comment nous avons réalisé cette analyse
11.Nous nous intéresserons d’abord aux différentes facettes de la crise, puis nous essaierons d’en repérer les manifestations concrètes dans le milieu scientifique
12.nous présenterons le cadre théorique qui servira à l’analyse de notre cas, puis nous évoquerons l’histoire de la convergence des radiocommunications
13.Finalement nous examinerons les trois initiatives de diffusion de l’art contemporain
14.Dans un deuxième temps, nous exposerons les problèmes rencontrés aujourd’hui du fait de cette approche
15.Nous nous intéresserons notamment aux cas d’ATTAC et de SalAMI,
16.nous commencerons par essayer d’en démêler les nombreux fils.
17.nous nous limiterons à l’examen des auteurs qui se positionnent résolument
18.C’est sur ce second intérêt que nous mettrons plus particulièrement l’accent.
19.Nous mettrons en particulier en avant le fait que l’appartenance à la zone euro
20.nous montrerons l’intérêt d’étudier les interactions en contexte,
21.Nous nous contenterons donc ici d’exposer rapidement les principaux resultats
22.nous prendrons les exemples de la Pologne, de la République tchèque et de la Hongrie
23.nous proposerons une lecture plus anthropologique du lien existant
24.De ce fait, nous nous permettrons de nous référer ici simplement à la dernière expression de cette théorie
25.A un détail près, sur lequel nous reviendrons, cette relation est donc unique.
26.Pour cette raison, pas plus qu’il n’a de sujet (nous y reviendrons), l’amour n’a d’objet.
27.Nous tenterons de répondre à ces questions dans la prochaine partie.
28.Nous tenterons dans une dernière partie de faire la synthèse des deux
29.nous tenterons de comprendre les liens entre culture antillaise et adventisme

Emploi de nous auprès d’un verbe se terminant en -rons dans notre corpus d’articles scientifiques

Bibliographie

Références

  • Aston, G. (1997). Small and large corpora in language learning. In Lewandowska-Tomaszczyk, B. & Melia, J.P. (eds), 51-62.
  • Aston, G. (2001). Text categories and corpus users: A response to David Lee. Language Learning and Technology, 3-1, 73-76.
  • Bazerman, C. (1994). Constructing Experience. Carbondale, Southern Illinois University Press.
  • Beacco, J.C. (1988). La rhétorique de l’historien. Une analyse linguistique du discours. Berne, Peter Lang.
  • Beacco, J.C. (1995). A propos de la structuration des communautés discursives : beaux-arts et appréciatif. In Beacco, J.C. & Moirand, S. (éds), Les enjeux des discours spécialisés. Paris, Presses de la Sorbonne Nouvelle, 135-153.
  • Burnard, L. (ed.) (2004). BNC Baby [CD-Rom]. Oxford, Research and Technology Service, Oxford University.
  • Cappeau, P. & Gadet, F. (2007). L’exploitation sociolinguistique des grands corpus : maître-mot et pierre philosophale. Revue française de linguistique appliquée, 12-1, 99-110.
  • Chambers, A. (2005). Integrating corpus consultation in language studies. Language Learning & Technology, 2005, 9-2, 111-125.
  • Chambers, A. & Le Baron, F. (eds) (2007). Le Corpus Chambers-Le Baron d’articles de recherche en français / The Chambers-Le Baron Corpus of Research Articles in French. Oxford, Oxford Text Archive. <http://ota.ahds.ac.uk/headers/2527.xml> [Page consultée le 21 février 2010].
  • Cobb, T. (1997). Is there any measurable learning from hands on concordancing? System, 25-3, 301-315.
  • Dodd, B. (1997). Exploiting a corpus of written German for advanced language learning. In Wichmann, A. & al. (eds), Teaching and Language Corpora, Londres-New York, Longman, 131-145.
  • Fløttum, K. (2006). The typical research article – does it exist? In Suomela-Salmi, E. (ed.), Perspectives inter-culturelles et inter-linguistiques sur le discours académique. Cross-cultural and Cross-linguistic Perspectives on Academic Discourse, Vol. 1. Finland, Department of French Studies, University of Turku, 16-44.
  • Fløttum, K., Dahl, T. & Kinn, T. (eds) (2006). Academic Voices: Across Languages and Disciplines. Amsterdam, Benjamins.
  • Gaskell, D. & Cobb, T. (2004). Can learners use concordance feedback for writing errors ? System, 32-3, 301-319.
  • Habert, B., Nazarenko, A. & Salem, A. (1997). Les Linguistiques de corpus. Paris, Armand Colin.
  • Hyland, K. (1998). Hedging in Scientific Research Articles. Amsterdam, Benjamins.
  • Hyland, K. (2002). Teaching and Researching Writing. Harlow, Pearson Education Ltd.
  • Johns, T. (1986). Micro-concord: A language learner’s research tool. System, 14-2, 151-162.
  • Johns, T. (1997). Contexts: The background, development, and trialling of a concordance-based CALL program. In Wichmann, A. & al. (eds), Teaching and Language Corpora, London-New York, Longman, 100-115.
  • Kennedy, C. & Miceli, T. (2001). An evaluation of intermediate students’ approaches to corpus investigation. Language Learning and Technology, 5-3, 77-90.
  • Kennedy, C. & Miceli, T. (2002). The CWIC project: Developing and using a corpus for intermediate Italian students. In Kettemann, B. & Marko, G. (eds), Teaching and Learning by Doing Corpus Analysis, Amsterdam, Rodopi, 183-192.
  • Lee, D. & Swales, J. (2006). A corpus-based EAP course for NNS doctoral students: Moving from available specialized corpora to self-compiled corpora. English for Specific Purposes, 25-1, 56-75.
  • Lewandowska-Tomaszczyk, B. & Melia, J.P. (eds) (1997). Practical Applications in Language Corpora. Lodz, Lodz University Press.
  • Maingueneau, D. (1984). Genèses du discours. 2e éd. Bruxelles, Mardaga.
  • Maingueneau, D. (1992). Le ‘tour’ ethnolinguistique et l’analyse du discours. Langages, 105.
  • Mangenot, F. (2000). Contexte et conditions pour une réelle production d’écrits en ALAO. ALSIC, 3-2, 187-206.
  • McEnery, T. & Wilson, A. (1997). Teaching and language corpora. ReCALL, 9-1, 5-14.
  • O’Sullivan, Í. & Chambers, A. (2006). Learners’ writing skills in French: Corpus consultation and learner evaluation. Journal of Second Language Writing, 15-1, 49-68.
  • Ozturk, I. (2007). The textual organization of research article introductions in Applied Linguistics: Variability within a single discipline. English for Specific Purposes, 26-1, 25-38.
  • Peytard, J. & Moirand, S. (1992). Discours et enseignement du français. Paris, Hachette.
  • Rundell, M. (2000). The biggest corpus of all. Humanising Language Teaching, 2-3. <http://www.hltmag.co.uk/may00/idea.htm> [Page consultée le 21 février 2010].
  • Scott, M. (1999). Wordsmith Tools version 3. Oxford, Oxford University Press.
  • Seidlhofer, B. (2001). Closing a conceptual gap: The case for a description of English as a lingua franca. International Journal of Applied Linguistics, 11, 133–158.
  • Sinclair, J. McH. (1991). Corpus, Concordance, Collocation. Oxford, Oxford University Press.
  • Stevens, V. (1991). Concordance-based vocabulary exercises: a viable alternative to gap-fillers. In Johns, T. & King, P. (eds), Classroom Concordancing. English Language Research 4, Centre for English Language Studies, University of Birmingham, 47-63.
  • St. John, E. (2001). A case for using a parallel corpus and concordancer for beginners of a foreign language. Language Learning and Technology, 5-3, 185-203.
  • Sun, Y.C. (2003). Learning process, strategies and web-based concordancers: A case-study. British Journal of Educational Technology, 34-5, 601-613.
  • Swales, J. (1990). Genre Analysis: English in Academic and Research Settings. Cambridge, Cambridge University Press.
  • Swales, J. (2004). Research Genres: Explorations and Applications. Cambridge, Cambridge University Press.
  • Tribble, C. (1997). Improvising corpora for ELT: Quick-and-dirty ways of developing corpora for language teaching. In Lewandowska-Tomaszczyk, B. & Melia, J.P. (eds), PALC ’97 (Practical Applications in Language Corpora) Proceedings, Lodz, Lodz University Press, 106-117.
  • Tribble, C. & Jones, G. (1990). Concordances in the Classroom: A Resource Book for Teachers. Harlow, Longman.
  • Widdowson, H.G. (2000). On the limitations of linguistics applied. Applied Linguistics, 21-1, 3-25.
  • Yoon, H. & Hirvela, A. (2004). ESL student attitudes towards corpus use in L2 writing. Journal of Second Language Writing, 13, 257-283.

Notes

  • [1]
    Pour certains domaines scientifiques, à savoir les sciences économiques, la linguistique et la médecine, un enseignant et ses apprenants pourraient consulter le corpus KIAP (Fløttum, Dahl & Kinn 2006).
  • [2]
    Le logiciel employé pour l’analyse du corpus dans cette étude est Wordsmith Tools (Scott 1999).
  • [3]
    Puisque la quasi-totalité des articles dans le corpus sont le travail d’un seul auteur (et non pas de multiples auteurs), il est facile de montrer aux apprenants que nous est employé plutôt que je. Il n’est donc pas nécéssaire de créer un sous-corpus des articles d’un seul auteur.
  • [4]
    Tim John’s Data-driven Learning page : <http://www.ecml.at/projects/voll/our_resources/ graz_2002/ ddrivenlrning/whatisddl/resources/tim_ddl_learning_page.htm> [Page consultée le 16 août 2010].
  • [5]
    Le logiciel permet aussi de sélectionner au hasard un nombre plus limité d’occurrences, ce qui peut créer une ressource qu’un enseignant ou un apprenant peut analyser sans difficulté.
bb.footer.alt.logo.cairn

Cairn.info, plateforme de référence pour les publications scientifiques francophones, vise à favoriser la découverte d’une recherche de qualité tout en cultivant l’indépendance et la diversité des acteurs de l’écosystème du savoir.

Avec le soutien de

Retrouvez Cairn.info sur

18.97.9.174

Accès institutions

Rechercher

Toutes les institutions