Marie-Noëlle ROUBAUD. Principes méthodologiques pour l’établissement d’un corpus de textes scolaires

Page 1

Principes méthodologiques pour l’établissement d’un corpus de textes scolaires Marie-Noëlle ROUBAUD Aix Marseille Université, ADEF EA 4671


Questionnement « Mais qui s’intéresse au français parlé ? Par certains côtés, tout le monde s’y intéresse ; mais peu de gens y voient un objet légitime d’étude, même chez les linguistes. » (Blanche- Benveniste & Jeanjean, 1987, p.1)

Mais qui s’intéresse aux textes scolaires ?


Un intérêt certain « L’appui sur des données attestées reste une voie d‘approche irremplaçable des faits de langue. » (Cappeau, 2007, p. 36) Ce qu’il faut savoir: On ne décrit pas la langue écrite mais on décrit un corpus écrit.


Constituer un corpus

de textes scolaires


Corpus et objectifs de travail Les objectifs de travail déterminent le choix des données et les méthodes d’analyse: Étude de la variation

Étude des interactions Étude phonologique et prosodique Étude lexicale Étude morphosyntaxique Étude des genres


Le recueil de données • Taille et variation (Habert, 2000)

• Notion de « genre » (Biber, 1991)


Distribution des situations de parole dans le Corpus de Référence du Français Parlé (équipe DELIC, 2004) Types Privé Professionnel Public

Pourcentages 64,5% 17% 18,5%


Distribution des situations d’Êcriture dans mon corpus de textes scolaires (corpus Roubaud)


Textes descriptifs (décrire) Textes injonctifs (prescrire) - fréquence de structures en il y - fréquence des structures en a « celui/ce qui » : - fréquence des listes

celui qui n’a plus de carte a perdu ce que vous gagnez vous le mettez de côté

- fréquence des adjectifs dans - fréquence des structures les SN impersonnelles (il faut, il suffit, il y a) il n’y a pas que des montres il y a aussi des sorcières, araignées géantes […] grenouilles baveuses (Thomas, 10 ans)

il sufit d’avoir une carte comme l’as, le roi, la reine […] c’est celui qui a le plus de cartes qui a gagner. (Thomas, 10 ans)


Textes argumentatifs (argumenter) Textes narratifs (raconter) - fréquence des sujets je - des parallélismes le fermier passe par là la - fréquence de structures en parce fermière aussi (7 ans) des fois on perd des fois on que gagne (7 ans)

- fréquence des enchâssements à - des participes droite (sur les deux axes) détachés

passés

Moi, je suis contre la voiture parce - des parenthèses qu’elle polu les planètes mais elle peut nous déposé ou on le veut surtout dans - 1 sujet pour plusieurs les pays très lointains. (Thomas, 10 ans) verbes Et soudain la machine approche et libère Porculus (7 ans)


Le rangement des données Comment organiser la base de données ? Importance du recueil de métadonnées


Le recueil de métadonnées Propositions La fiche signalétique - nom et code du corpus - date d’écriture du texte et nom des transcripteurs - l’élève (Prénom, date de naissance, âge, classe, profil) - l’école (contexte scolaire) - la longueur des textes (phrase, texte court, texte long) Les conditions d’écriture - consigne - grilles proposées (écriture, réécriture) - modèles fournis aux élèves (texte d’auteur…) - aides (phrase écrite au tableau, cahier de vocabulaire…)


Les mĂŠthodes


La transcription • Lisibilité et fidélité

• Travail long et coûteux Oral : 1mn d’enregistrement / 30 mn de transcription Écrit : Temps de transcription ?

• Un travail peu reconnu or c’est un travail réflexif


Versions et transcriptions Version 1

Version brute (scann)

Version 2

Version retranscrite (informatisée)

Version 3

Version retranscrite corrigée (selon les conventions)

Version 4

Version dépouillée (jusqu’où aller dans le dépouillement?)


Élaboration d’un guide du transcripteur pour l’oral (équipe DELIC, 2004)


Les notations graphiques (corpus Roubaud)

va ranger le bazard [basre]


Les notations graphiques

(corpus Roubaud)

il pensa que [pansace]

demande [de mande] le loup [poul]


Traitement des amorces (corpus Roubaud)

la fĂŠe a transformĂŠ en crapaud [crap].


Les mots absents (corpus Roubaud)

dans (la) neige


Les syllabes incompréhensibles (corpus Roubaud)

et il les emmène alors papa et maman les *** [réfamis]


Les multi-transcriptions (corpus Roubaud)

et un 창ne pour /venir, vivre/.


Les erreurs syntaxiques (corpus Roubaud)

Version 2: la maitrĂŠse lui gronde Version 3: Que doit-on transcrire ? la ou lui gronde


Les modes de production de l’écrit (corpus Roubaud)


Les modes de production de l’écrit (corpus Roubaud)

et

et

Le python le python

ouvrit grand la bouche

l’étrangla

Zékéyé


Un guide du transcripteur

Un guide du transcripteur à élaborer ensemble à partir des questions des transcripteurs lors

de leur travail et des réponses qu’ils ont apportées.


Conclusion

La route est longue … pour constituer un corpus de textes scolaires à destination de la communauté scientifique.


Éléments de bibliographie • Baude, Olivier (coord.). (2006). Corpus oraux. Guide des bonnes pratiques. Paris, CNRS Éditions. • Biber, Douglas. (1991). Variation across speech and writing. Cambridge, Cambridge University Press. • Blanche-Benveniste, Claire & Jeanjean, Colette. (1987). Le français parlé. Transcription et édition. Paris, Didier Érudition, Institut national de la Langue française. • Cappeau, Paul. (2007). De la constitution à l’exploitation des données : Réflexions et illustrations. Habilitation à Diriger des Recherches, sous le parrainage de Mme le Professeur Françoise Gadet. Paris : Université Paris XNanterre [non publié]. • David, Jacques. (2000). Étudier les textes d’enfants : revue de travaux. In Claudine Fabre-Cols (éd.), Apprendre à lire des textes d’enfants. Bruxelles : De Boeck Duculot, 274-288. • Elalouf, Marie-Laure & Boré, Catherine. (2007). Construction et exploitation de corpus d’écrits scolaires. Revue française de linguistique appliquée, vol. XII-1 : 53-70.


Éléments de bibliographie • Équipe DELIC. (2004). Présentation du « Corpus de référence du français parlé », Recherches Sur le Français Parlé, 18 : 11-42. • Fabre-Cols, Claudine. (2000). Apprendre à lire des textes d’enfants. Bruxelles, De Boeck-Duculot, 19-55. • Habert, Benoit. (2000). Des corpus représentatifs : de quoi, pour quoi, comment ? In Mireille Bilger (coord.), Linguistique sur corpus. Études et réflexions. Perpignan, Presses Universitaires de Perpignan, 11-58. • Masseron, Caroline. (2011). L’analyse linguistique des écrits scolaires, Pratiques, 149/150 : 129-162. • Rastier, François. (2005). Enjeux épistémologiques de la linguistique de corpus. In Geoffrey Williams (Dir.), La linguistique de corpus, Rennes, Presses Universitaires de Rennes (Coll. « Rivages linguistiques »), 31-45. • Roubaud, Marie-Noëlle. (2014). De la description de la langue à son enseignement. Habilitation à Diriger des Recherches, sous le parrainage de Mme le Professeur Catherine Brissaud, Grenoble, Université de Stendhal Grenoble 3.


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.