Pour une textométrie opérationnelle Keyser Söze-Duval1 Réseau ATONET – ANR Textométrie soze-duval@free.fr Résumé : Les procédures informatisées, réunies en combinaisons variables au sein des logiciels de textométrie, réalisent des traitements souvent analogues. Cependant, les résultats produits par ces traitements sont difficilement comparables du fait qu’ils reposent sur des décomptes et sur des calculs qui ne sont pas toujours explicites (§1). On introduit une architecture trame/cadre qui permet de décrire et de transmettre la segmentation systématique du texte et les partitions du corpus nécessaires aux comparaisons textométriques (§2). L’utilisation de cette architecture permet en outre d’organiser la description des séquences de traitements textométriques qui respectent cette organisation des données textuelles (§3). Abstract : Les différentes procédures textométriques effectuent des traitements analogues ;. cependant, les résultats produits par ces traitements sont difficilement comparables du fait qu’ils reposent sur des décomptes et des procédures qui ne sont pas toujours explicites (§1). On introduit une architecture trame/cadre qui permet d’expliciter à la fois les résultats de la segmentation du texte et les découpages du texte (§2). L’utilisation de cette architecture de stockage des données, permet d’organiser une description de séquences de traitements textométriques qui respectent cette architecture(§3).
Dans les dernières décennies, l’apparition de l’ordinateur a profondément modifié les objectifs et les pratiques de larges communautés de chercheurs confrontés, chacun dans leur discipline, à la constitution et à l’exploration de corpus textuels. Les transformations les plus remarquables se sont produites dans deux directions principales. En premier lieu, est apparue la possibilité d’automatiser, et par suite d’appliquer sur une échelle incomparablement plus vaste, des méthodes d’analyse textuelle couramment utilisées avant l’avènement de l’ordinateur sur des corpus restreints (recherches d’attestations, établissement de concordances etc.). Parallèlement, l’ordinateur a permis, par la prise en charge efficace de calculs fastidieux, de banaliser l’emploi de procédures d’exploration et de comparaison statistiques des corpus de textes. 1 L’approche textométrique La démarche textométrique repose sur l’hypothèse, vérifiée à partir de très nombreuses expériences, que pour comparer les différentes parties d’un ensemble de textes, que l’on peut considérer comme autant de contenants, il est utile d’observer, au sein de ces textes, les variations de fréquence de systèmes d’unités textuelles : lexèmes, graphèmes, etc., que l’on peut considérer comme des contenus. L’analyse de ces variations constatées au plan statistique fournit, en général, un éclairage précieux sur les ressemblances et les oppositions pouvant exister entre ces textes sur des plans d’analyse qui intéressent plus directement les
1 Ce pseudonyme rassemble un collectif qui s’est rassemblé dans le cadre du réseau ATONET (Canada-France) et de l’ANR Textométrie. Ont notamment participé à ces échanges : Lou Burnard, François Daoust, Serge Fleury, Serge Heiden, Michel Jacobson, Cédric Lamalle, William Martinez,Bénédicte Pincemin et André Salem.
1