Page 278

Chapitre 8

Analyse discriminante textuelle

AXE 2

3-4

5-9

1

257

22.3 %

.25 60-79

*Marl *Mids *Tayl 2

10-19 -.30

-.15 *Phen

*Cymb 40-59

.00 20-29

*Sonn 30-39 .15

AXE 1 42.3 %

+100

*BenJ *Donn

-.25 80-99

Figure 8.1 Premier plan factoriel de l'A.C. de la table 12 x 8 Classes de fréquence x Poèmes (tableau 8.2) La zone ombrée contient les poèmes attribués à Shakespeare et le poème Taylor

The Phoenix, qui a été rejeté comme non-shakespearien par les tests issus du modèle poissonien, est effectivement assez périphérique, entre Marlowe et Donne, dans une zone riche en mots nouveaux (fréquence "0" chez Shakespeare) et en fréquences "2" et "10-19". A l'opposé, l'extrait de Midsummer est anormalement pauvre en formes nouvelles (exclusives). Cette visualisation nuancée, fondée sur des comptages n'ayant subi aucune transformation, donne l'idée d'une approche empirique élargie, qui consisterait à multiplier les poèmes analysés (aussi bien de Shakespeare que d'autres auteurs élisabéthains) de façon à pouvoir déterminer des zones de rejets dans un plan factoriel analogue à celui de la figure 8.1. Ces zones seraient fondées sur des variations de densité dans le plan, et non sur un tout petit nombre de jalons. Il s'agit là d'une approche voisines de l'analyse discriminante telle qu'elle sera évoquée dans la section suivante, à ceci près que les variables de bases utilisées jusqu'à présent (répartition des formes selon des classes de fréquence pour un auteur donné) sont réputées indépendantes du contenu.

Statistique Textuelle. Lebart & Salem, 1994  

Ce livre, illustré d'exemples nombreux, présente les concepts de base et les fondements des méthodes de la statistique textuelle. Il combine...

Statistique Textuelle. Lebart & Salem, 1994  

Ce livre, illustré d'exemples nombreux, présente les concepts de base et les fondements des méthodes de la statistique textuelle. Il combine...

Advertisement