La numerisation d archives des fondamentaux techniques aux programmes de numerisation

Page 1

Des fondamentaux techniques aux programmes de numérisation La numérisation est un procédé aujourd'hui familier, qui masque pourtant une révolution dont toutes les implications ne nous apparaissent pas encore. Particuliers et secteur privé, services administratifs et fonds d'archives lui accordent logiquement un intérêt croissant. L'État ne s'y est pas trompé, en soutenant de nombreuses initiatives. Le principe technique est relativement simple, mais les applications sont extrêmement variées. Un projet de numérisation d'archives est en réalité chose complexe et ne doit pas être improvisé. Cet ouvrage a pour ambition d'aider responsables et agents à clarifier les objectifs qu'ils se fixent et les moyens qu'ils doivent mobiliser. Il détaille la technique de numérisation et les thèmes connexes, tels le montage du projet, le traitement des images produites, l'exploitation et la gestion des données. Enfin, l'ouvrage donne des clés pour appréhender les sujets délicats comme l'environnement juridique et ses zones d'ombre, les coûts, les arbitrages techniques à opérer, la vulnérabilité de l'archivage numérique, mais aussi les questions techniques de pointe comme la reconnaissance de caractères (OCR), et il propose une structure de cahier des charges en dix chapitres.

Baptiste Essevaz-Roulet, docteur ès sciences et directeur associé à PMP Conseil, est spécialisé dans les politiques publiques du numérique. Il accompagne depuis 2002 de nombreuses collectivités départementales et régionales dans leurs projets et réalisations d'aménagements numériques du territoire. Ses missions incluent la définition de stratégie en matière de déploiement d'infrastructures à haut et très haut débit, l'assistance à maîtrise d'ouvrage dans leur mise en œuvre et la définition de politiques de développement des services et usages numériques.

d’EXPERTS

La numérisation d'archives - Des fondamentaux techniques aux programmes de numérisation

La numérisation d'archives -

La numérisation d'archives Des fondamentaux techniques aux programmes de numérisation

d’EXPERTS

Baptiste Essevaz-Roulet [Dessin Une : Patrick Lestienne] www.territorial.fr ISSN : 1623-8869 – ISBN : 978-2-8186-1042-8



La numérisation d'archives -

Des fondamentaux techniques aux programmes de numérisation Baptiste Essevaz-Roulet Docteur ès sciences, directeur associé à PMP Conseil, expert en politiques publiques du numérique

Groupe Territorial CS 40215 - 38516 Voiron Cedex Tél. : 04 76 65 87 17 - Fax : 04 76 05 01 63 Retrouvez tous nos ouvrages sur www.territorial-editions.fr

d’EXPERTS

Référence DE 655 Avril 2016


L’auteur remercie chaleureusement PMP Conseil, Michel Essevaz-Roulet, Paul David et Karim Benseradj pour leurs contributions, ainsi que Manuel David pour la relecture du manuscrit.

Vous souhaitez être informé de la prochaine actualisation de cet ouvrage ?

C’est simple ! Il vous suffit d’envoyer un mail nous le demandant à : jessica.ott@territorial.fr Au moment de la sortie de la nouvelle édition de l’ouvrage, nous vous ferons une offre commerciale préférentielle.

Avertissement de l’éditeur : La lecture de cet ouvrage ne peut en aucun cas dispenser le lecteur de recourir à un professionnel du droit.

Ce pictogramme mérite une explication. Son objet est d’alerter le lecteur sur la menace que représente pour l’auteur de l’écrit, particulièrement dans le domaine de l’édition technique, le développement massif du photocopillage.

Nous rappelons donc que toute reproduction, partielle ou totale, de la présente publication est interdite sans autorisation du Centre français d’exploitation du droit de copie (CFC, 20 rue des Grands-Augustins, 75006 Paris).

© Groupe Territorial, Voiron ISBN : 978-2-8186-1042-8 ISBN version numérique : 978-2-8186-1043-5 Imprimé par Reprotechnic, à Bourgoin Jallieu (38) - Mai 2016 Dépôt légal à parution


Sommaire Introduction. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.7

Partie 1 Les enjeux de la numérisation d’archives Chapitre I L’actualité de la numérisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.12 Chapitre II Archives et gestionnaires de fonds concernés. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.14 A - La numérisation patrimoniale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.15 B - La numérisation de production. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.17 C - Numérisation de bureautique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.19

Chapitre III Les différents objectifs d’un projet de numérisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.20 A - Numériser pour partager et exploiter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.20 1. Le partage de documents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.20

2. L’exploitation de données. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.20

3. La réédition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.21

4. La mise à disposition du public . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.21

5. La mission des centres documentaires. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.22

6. La mise en valeur d’un fonds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.22

7. Les archives administratives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.22

8. L’extraction de l’information « dormante ». . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.22

B - Numériser pour substituer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.23 1. Quand les archives prennent trop de place… . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.23

2. Versement à un fonds d’archives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.23

3. Cas des archives publiques avant destruction, tri ou élimination. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.23

4. Fonds appartenant à un tiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.24

C - Numériser pour préserver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.24 1. Archives fréquemment consultées. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.24

2. Quand les archives se dégradent…. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.24

D - Quand ne pas numériser ?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.24

Chapitre IV Aspects financiers de la numérisation d’archives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.27

A - Documents soumis aux droits d’auteurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.28 B - Documents tombés dans le domaine public. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.30 C - Respect de la vie privée. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.32 D - Valeur légale des copies numériques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.32

Sommaire

La numérisation d’archives

Chapitre V Aspects juridiques de la numérisation d’archives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.28

3


Partie 2 Numériser Chapitre I Le document numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.37 Chapitre II L’image numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.39 A - Taille et résolution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.40 1. Nombre de pixels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.40

2. Unités de longueur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.40

B - Poids et compression d’un fichier numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.44 1. Le poids d’un fichier numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.44

2. La compression d’un fichier numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.44

C - Profondeur des couleurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.47 D - Modèle colorimétrique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.48 E - Formats d’image. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.48 1. Les formats matriciels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.48

2. Les formats vectoriels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.50

Chapitre III Le scanneur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.52 A - Scanneur à plat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.54 B - Scanneur de production. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.54 C - Scanneur à transparents (négatifs, diapositives, microformes…) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.55 D - Scanneur de livres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.55 E - Scanneur de plans. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.57

Chapitre IV Numériser un support physique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.58 A - Préparation des documents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.58 B - Numérisation des documents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.59 C - Contrôle de la numérisation et suivi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.60

Partie 3 La gestion des données numérisées

La numérisation d’archives

Chapitre I Traitements après-scan. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.63

4

A - Traitement après-scan des documents iconographiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.63 B - Traitement après-scan des documents textuels. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.64 C - Précautions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.67

Chapitre II Traitement OCR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.68

Sommaire


Chapitre III Gestion électronique des documents et accès à l’information. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.72 A - La GED (gestion électronique de documents) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.72 B - Les métadonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.72 C - Nommage des fichiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.74 D - Accessibilité publique, publication sur Internet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.74

Chapitre IV L’archivage numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.76 A - Définition de l’archivage numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.76 B - Normes et modèles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.77 C - Prévention des destructions matérielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.79 D - Choix des supports matériels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.80 E - Choix des formats de fichiers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.82 F - Traçabilité de l’archive numérique. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.82 G - Stratégies d’archivage numérique à long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.83 1. Migration des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.83

2. Définition des modalités de stockage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.84

H - Plaidoyer pour une plateforme nationale d’archivage numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.85

Partie 4 Conduire un projet de numérisation Chapitre I Prendre la décision. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.89 A - Évaluer le potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.89 1. L’intérêt des archives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.89

2. Organisation du projet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.89

3. Volume d’archives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.90

B - Modérer les enthousiasmes et vaincre les résistances . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.90 C - Définir les objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.92

Chapitre II Caractériser les archives à numériser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.93 A - Tri et sélection des documents à scanner. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.93 1. Inventaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.93

2. Caractérisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

p.94

Chapitre III Le cahier des charges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.96 Chapitre IV La prestation de numérisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.98 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.99

Sommaire

La numérisation d’archives

B - Inventaire et caractérisation physique des documents. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.93

5


Annexes Annexe I Quelques illustrations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.103 A - Google Books . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.103 B - État civil d’Angoulême. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.104 C - Association Henri Wallon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.105 D - Kyoto University Library . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.106 E - Projet SIG Alpage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.107 F - Numérisation des plans de bâtiments. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.107

Annexe II Repères : optimisation de la recherche dans un document avec OCR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.110 Annexe III Repères : numérisation d’un négatif ou d’une diapositive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.113 Annexe IV Repères : résolution optique ou résolution extrapolée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.114 Annexe V Repères : photographie numérique contre scanneur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.115

La numérisation d’archives

Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p.117

6

Sommaire


Introduction En quelques années, la numérisation est devenue un outil numérique familier, les scanneurs rentrant dans de nombreux foyers et entreprises. Si le procédé est parfois devenu banal, il cache une révolution dans l’approche de la gestion des archives et de leur exploitation. La numérisation s’inscrit désormais dans la dynamique des communications électroniques et engendre des gains considérables de productivité pour les entreprises et l’amélioration spectaculaire des conditions de consultation et de diffusion des archives pour les fonds qui les gèrent. Particuliers et professionnels, services administratifs et fonds d’archives ont logiquement intégré ce type de solution à leur stratégie. Cette révolution est en cours et toutes les applications du monde numérique ne nous apparaissent pas encore. Les données analogiques, qu’elles proviennent de documents anciens, archives modernes ou récentes, sont souvent considérées comme figées, difficilement exploitables, et leurs supports physiques comme encombrants, fragiles ou inadaptés. La numérisation de ces supports permet de transcrire ces archives en information numérique souple, éditable, présentable et facilement partageable, souvent plus aisément qu’avec le document original. En ce sens, elle marque « la fin de l’indissociabilité entre le support d’information et son contenu »1, elle redonne vie aux écrits anciens, transforme en profondeur la diffusion des collections iconographiques, sert de base à la relecture des travaux historiques antérieurs, facilite la vie de l’entreprise, etc. Comme l’a écrit Yves Le Guillou, « l’image numérique possède des avantages que les images sur support n’ont pas. Si la matrice [numérique] est de qualité suffisante, elle répond à tous les usages : de la consultation sur écran à la reproduction en imprimerie »2. Si la technique n’est pas nouvelle, elle n’a explosé que grâce à l’amélioration continue des capacités de stockage et de transmission des données numériques. Il n’y a pas si longtemps en effet, il n’était simplement pas envisageable de scanner un vieil album de photos tant l’espace requis par les images numérisées était important en regard de la capacité des disques durs d’alors. Aujourd’hui, alors que cette capacité dépasse le téraoctet et que des abonnements Internet à 1 Gb/s3 sont disponibles commercialement, la numérisation d’archives personnelles, patrimoniales ou administratives a trouvé sa pertinence. Le principe de la numérisation est relativement simple, mais les applications sont extrêmement variées. En conséquence, il existe un grand nombre d’appareils ayant chacun sa spécialité. L’utilisateur peut ainsi se retrouver dans une véritable jungle technique dans laquelle il est facile de se perdre ou de renoncer. La numérisation d’archives est un sujet en soi, mais il ne peut pas être dissocié des questions amont et aval : comment préparer les archives ? Numériser comment et pour quoi faire ? Quelle résolution utiliser ? Comment sauvegarder les fichiers créés ? Quel budget prévoir ? Combien de temps est nécessaire ? Quels sont les coûts ? Comment conserver les images numérisées ? Comment partager et donner accès aux données produites ? La numérisation d’archives et la gestion des données qui en sont issues sont en réalité un travail complexe qui ne peut pas être improvisé. La numérisation n’est pas non plus exempte de défauts. Tous les documents d’archives ne peuvent pas être numérisés et la conservation des fichiers numériques est problématique : « Les seuls inconvénients de l’image numérique tiennent à l’absence de recul quant à la pérennité des données et au coût élevé des matériels informatiques, qui, par ailleurs, connaissent une obsolescence rapide »4. La littérature sur le sujet n’est pas abondante ou s’adresse à un public de spécialistes. Signe de la jeunesse de cette discipline, les sources d’information sont encore éparses, manquent parfois de cohérence et la législation commence tout juste à prendre en compte la numérisation dans ses textes. Pour qui a le courage de se pencher sur plusieurs dizaines de sources différentes, l’Internet est un bon fournisseur d’informations. Retenons notamment le site Internet de la direction des Archives de France, qui « diffuse les normes professionnelles en matière de numérisation, assure une veille technologique, fournit des conseils sur les politiques de numérisation et leur mise en œuvre technique, assiste les services d’archives qui souhaitent obtenir des crédits du plan national de numérisation ». À consulter Direction des Archives de France : http://www.archivesdefrance.culture.gouv.fr/

1. Françoise Banat-Berger, Laurent Duplouy et Claude Huc, L’archivage numérique à long terme, La Documentation française, Paris, 2009. 2. Yves Le Guillou, La reproduction des documents graphiques – Usages et enjeux, L’Harmattan, Paris, 2008. 3. Gb/s = gigabit par seconde. 4. Yves Le Guillou, op. cit.

Introduction

La numérisation d’archives

7


Cet ouvrage a pour ambition d’aborder toutes les questions qui peuvent se poser, de la conception d’un projet de numérisation à sa réalisation. Il se veut être la synthèse de l’expérience de ses auteurs et de la littérature professionnelle disponible sur les sujets abordés. Il s’adresse aussi bien aux agents confrontés aux difficultés de la gestion de leurs archives qu’aux conservateurs ou documentalistes désireux d’améliorer la diffusion de leur fonds ou de le faire connaître, et enfin aux responsables confrontés aux questions évoquées ci-avant. Le livre est organisé en quatre parties principales.

La numérisation d’archives

Figure 1 : Représentation schématique des thèmes connexes à la numérisation qui seront abordés dans cet ouvrage

8

Dans la première partie, nous définirons le type d’archives et les gestionnaires de fonds qui peuvent être concernés par la numérisation. Nous proposerons une liste non exhaustive de différents objectifs pouvant être recherchés dans un projet de numérisation. Elle doit permettre au lecteur de situer dans quel cas il se trouve et vérifier, le cas échéant, le bien-fondé de sa démarche. Nous aborderons ensuite les questions financières permettant d’évaluer les coûts générés par des campagnes de numérisation. Nous verrons enfin l’état de la législation, notamment en termes de droits d’auteur et de droits de reproduction. Nous constaterons à ce sujet que la numérisation pose de véritables problèmes juridiques non clarifiés à l’heure actuelle. La deuxième partie sera consacrée aux aspects techniques de la numérisation d’archives. Son objectif est de donner au lecteur les éléments nécessaires à la compréhension de l’ensemble des aspects relatifs à la chaîne de numérisation. Nous expliquerons les différentes notions de base : document numérique, résolution, compression, format d’image, etc. Nous passerons en revue les différents types de scanneurs, leurs techniques, leurs applications et leurs coûts. Enfin, nous détaillerons le processus de numérisation, de la préparation des documents au contrôle de conformité. Dans la troisième partie, nous irons plus loin en détaillant les procédures de traitement « après-scan », c’est-àdire destinées à optimiser la qualité de l’image ou son exploitation. Nous consacrerons une section importante du chapitre à la reconnaissance automatique de caractères, aussi appelée OCR, ses principes, ses applications et ses limites. Au-delà des traitements appliqués aux images numériques, nous aborderons la gestion électronique des documents numériques produits. Nous approfondirons davantage les questions relatives à l’archivage numérique et aux stratégies à adopter pour pérenniser la conservation des fichiers numériques. Enfin, nous verrons dans la quatrième partie comment organiser le projet de numérisation d’archives : prise de décision, définition des objectifs, organisation, etc. Nous proposerons un plan de cahier des charges synthétisant tous les aspects de la numérisation qui doivent être abordés, que ce soit pour lancer une consultation d’assistance à maîtrise d’ouvrage, un appel d’offres pour sélectionner un prestataire extérieur ou pour préparer l’organisation en interne de la numérisation des archives. En fin d’ouvrage, le lecteur trouvera une sélection de sources bibliographiques ou électroniques qui pourra lui servir à approfondir le sujet, quelques expériences de numérisation d’archives ainsi que quelques fiches pratiques.

Introduction


La numérisation d’archives

Partie 1 Les enjeux de la numérisation d’archives

Partie 1 - Les enjeux de la numérisation d’archives

9



Avant l’ère informatique, l’histoire de la reproduction technique de documents se confond avec celle de la photographie. La technique inventée au début du XIXe siècle se prête bien à la copie d’illustrations, mais la lenteur et les coûts de développement des films argentiques et du tirage sur papier photographique en bornent naturellement l’usage. Inventés au tout début du XXe, les microfilms, dérivés de la photographie, sont dédiés à la reproduction de documents textuels. La première révolution en matière de reproduction vient de l’invention de la photocopieuse, commercialisée à partir de la fin des années 1950. Le principe du scanneur, enfin, est inventé dans les années 1970. La numérisation se distingue des autres techniques de reproduction par le degré de qualité et de fidélité de la copie par rapport à l’original, mais aussi par le fait qu’elle permet d’associer la souplesse de l’outil informatique à des documents physiques. Norme NF Z42-013:2009 La numérisation est la « conversion de documents (support papier, microforme ou enregistrement audiovisuel analogique) en représentation codée numériquement dans le but de conservation ou de traitement de ces représentations ».

Ces dernières années, la numérisation d’archives a souvent été sous le feu des projecteurs, que ce soit pour en dénoncer les abus et faiblesses ou pour en souligner l’énorme potentiel en matière d’exploitation et de valorisation des données. Il existe en effet un nombre infini de raisons de numériser et autant de contextes radicalement différents.Tout peut être variable : la qualité et la quantité d’archives à numériser, les ressources humaines et matérielles disponibles, le temps affectable aux opérations, les objectifs à atteindre… Nous aborderons dans cette partie la structuration de la démarche de numérisation en termes de classes d’archives et d’objectifs recherchés. Tableau 1 : Classes d’archives et objectifs qui seront développés dans cette partie

Classes d’archives

Objectifs recherchés

Archives patrimoniales et instruments de recherche

Transmettre et partager les documents

Archives de production

Conserver, préserver

Archives de bureautique, personnelles et loisirs

Extraire l’information et diffuser Loisirs

La numérisation d’archives

Du point de vue juridique, la numérisation d’archives, en tant que moyen de reproduction et de copie, est régie par la loi sur la propriété intellectuelle, mais on verra que de nombreux aspects ne sont pas encore tout à fait clairs. La législation mériterait notamment d’être revue sur les questions de valeur juridique des copies numériques et sur les droits de diffusion des documents libres de droits, mais contrôlés par les collectivités locales.

Partie 1 - Les enjeux de la numérisation d’archives

11


Chapitre I L’actualité de la numérisation En 2009-2010, la numérisation d’archives a bénéficié d’un remarquable enthousiasme et d’un soutien politique fort. En 2009, le ministre de la Culture et de la Communication de l’époque, Frédéric Mitterrand, affirmait ainsi sa volonté d’« intensifier » la politique de numérisation des biens culturels en France. Il rappelait que 85 % des collections des grands musées étaient numérisées et accessibles en ligne, se félicitait du « patrimoine absolument considérable » détenu par les institutions qui souhaitaient voir leurs fonds numérisés, et appelait de ses vœux la poursuite de la numérisation de l’état civil.

La numérisation d’archives

Attention Ne pas confondre numérisation d’archives et archivage électronique. L’archivage électronique est le nom donné à la conservation pérenne de documents électroniques (voir partie 3, chapitre IV qui lui est consacrée). Il concerne tous les documents électroniques, qu’ils soient natifs (traitement de texte, courriels…) ou issus de la numérisation. La conservation pérenne des données numériques constitue un vaste sujet de réflexion dont les enjeux sont considérables. Concrètement, il s’agit de tout un processus incluant la réflexion, la conception d’un plan d’archivage, la mise en place d’un (sous)-système d’information idoine, des procédures de gestion, et bien entendu des tâches de numérisation.

12

En 2010, le Rapport sur la numérisation du patrimoine remis par Marc Tessier au ministre de la Culture et de la Communication de l’époque analysait « le cadre technique, économique et juridique dans lequel s’inscrivent les accords et projets d’accords passés entre la société Google et les bibliothèques. Cette analyse a été conduite dans une perspective de renforcement de la présence et de l’accessibilité des œuvres du patrimoine écrit sur l’Internet ». Ce rapport, accessible en ligne, dresse un état des lieux des principales bibliothèques numériques et analyse les accords passés entre les bibliothèques et Google et les pistes d’action tenant compte des plateformes numériques existantes, telles que Google, Gallica et Europeana. Le rapport estime que la perspective de numérisation de masse des ouvrages imprimés « constitue une chance pour le rayonnement de la culture française ». Il met en garde cependant contre les limites du programme engagé par Google et estime qu’il est nécessaire « pour la France de conserver la maîtrise du processus de numérisation et surtout de diffusion des contenus numériques ». Le rapport propose de s’appuyer sur les trois plateformes existantes en réformant le pilotage et les fonctionnalités de Gallica, en proposant un partenariat avec Google basé sur l’échange équilibré de fichiers numérisés, sans clause d’exclusivité, et de relancer le projet Europeana. Enfin, la secrétaire d’État à l’économie numérique, Nathalie Kosciusko-Morizet, a présenté début juin 2010 le programme « Développement de l’économie numérique » et a ouvert une consultation publique, notamment sur la numérisation des contenus. Le programme énumère en substance les différentes perspectives de valorisation directe et indirecte de la numérisation du patrimoine culturel, éducatif et scientifique français. Il en va du développement de nouveaux services et de « l’accroissement du rayonnement culturel de la France ». Un des objectifs du programme est de constituer un « patrimoine numérique » français important. Les axes d’interventions envisagés par l’État sont présentés sous forme de deux volets complémentaires. Le premier consisterait à soutenir les actions de numérisation du patrimoine et leur valorisation. Compte tenu de la lourdeur des investissements à prévoir et de la durée des projets, la consultation vise à déterminer les contenus à numériser en priorité et ceux dont on peut envisager l’exploitation commerciale ou permettant de développer certains secteurs d’activités spécifiques (industries culturelles, industrie du jeu vidéo, tourisme et e-tourisme, éducation, communication, urbanisme, etc.). Le second volet serait un soutien à l’innovation technologique. Dans ce registre, la consultation pose la question de l’identification et du développement des techniques les plus pertinentes en termes de numérisation, de traitement, de contrôle des droits, des modes de diffusion et de valorisation, et enfin d’archivage numérique. Pour matérialiser sa volonté politique, l’État a alors réservé 750 millions d’euros issus du Programme investissements d’avenir pour favoriser les projets relatifs à la numérisation du patrimoine culturel. Depuis 2010, la numérisation d’archives a été intégrée à des stratégies plus larges. Incités par l’État à diversifier leurs sources de financement, plusieurs établissements publics ont cherché à valoriser leurs archives. La BnF a ainsi créé fin 2011 BNF-Partenariats, qui a conclu des accords de numérisation de son

Partie 1 - Les enjeux de la numérisation d’archives


patrimoine, notamment avec l’éditeur américain ProQuest, qui doit permettre la numérisation, aux deux tiers aux frais du partenaire privé, d’environ 70 000 ouvrages anciens des XVe, XVIe et XVIIe siècles. En contrepartie, ProQuest bénéficie d’une exclusivité de 10 ans pour exploiter commercialement les documents numérisés. D’autres fonds d’archives se sont lancés dans des programmes ambitieux, notamment les archives départementales dont 94 avaient, en 2015, numérisé et mis en ligne tout ou partie de leurs documents. L’objectif, plus que de le valoriser commercialement, est de donner une dimension nouvelle au service public dont ils sont investis. Outre la mise à disposition des archives sur Internet, les fonds ont de plus en plus souvent recours à l’indexation collaborative, qui décuple l’accessibilité de l’information contenue. En 2015, en revanche, le projet de bibliothèque universelle de Google a été abandonné après la numérisation de 10 millions d’ouvrages provenant de 29 bibliothèques américaines et européennes. Aujourd’hui, les réflexions se poursuivent, mais moins sous l’angle technique que sous celui de la valorisation des données. La plupart des fonds d’archives s’interrogent sur le potentiel commercial de leurs documents ou la justification économique des investissements consentis. Le modèle économique de la BnF a été contesté et n’est en effet que peu réplicable. Néanmoins, toutes les pistes n’ont pas encore été explorées et il reste de gros chantiers à mener. L’accès public aux archives numériques doit par exemple être largement amélioré, standardisé pour faciliter les recherches, par exemple au moyen d’un unique moteur de recherche dédié. Le recours à l’indexation collaborative doit être massifié, pour rendre mémoire et intelligence aux documents numérisés. Enfin, ce qu’on appelle le big data promet des développements difficiles à cerner aujourd’hui, lorsque les logiciels sauront brasser des bases de données constituées à partir des archives accessibles en ligne, pour donner des réponses à des questions historiques, documenter les recoins inconnus du passé d’un ancêtre, etc. Nous ne sommes donc encore qu’à l’aube de ce que la numérisation d’archives nous réserve : il y aura un « avant » et un « après la numérisation ». Pour accéder aux accords conclus par BnF-Partenariats : http://www.bnf.fr/fr/la_bnf/anx_actu_bib/a.partenariats_numerisation_bnf.html - SHDC__Attribute_ BlocArticle23BnF Pour télécharger le rapport sur la numérisation du patrimoine écrit : http://www.ladocumentationfrancaise.fr/rapports-publics/104000016/index.shtml Pour télécharger le programme « Développement de l’économie numérique » : http://www.prospective-numerique.gouv.fr Les plateformes numériques citées : http://books.google.fr/ http://gallica.bnf.fr/ http://www.europeana.eu/portal/

La numérisation d’archives

Partie 1 - Les enjeux de la numérisation d’archives

13


Chapitre II Archives et gestionnaires de fonds concernés Qu’appelons-nous « archives » ? Par « archives », nous entendons tout document qui mérite d’être préservé pour des raisons administratives, de mémoire, d’intérêt artistique ou de conservation patrimoniale. Nous retenons ce terme très générique pour embrasser finalement la grande majorité des documents qui peuvent être scannés. En principe, le terme d’archives englobe aussi les documents sonores, audiovisuels ou informatiques, mais ceux-ci ne seront que peu traités dans cet ouvrage. Les archives ainsi définies décrivent donc des catégories aussi variées qu’un tirage photographique, une facture, un livre ou un plan industriel. Nous pouvons tenter de les classer en deux catégories : les documents iconographiques ou figurés et les documents textuels. Il n’y a pas de frontière nette entre les deux puisque l’on peut trouver sur un même support des images et du texte. On pourra alors distinguer les documents qui contiennent une majorité d’images de ceux qui contiennent une majorité de texte. Bien que peu nette, cette séparation est pertinente dans le contexte de la numérisation puisque les spécifications techniques, mais surtout les objectifs, diffèrent. Exemples de documents figurés et textuels Documents iconographiques ou figurés : dessins, estampes, photographies, gravures, lithographies, affiches, cartes générales, géographiques, administratives, militaires, plans d’architecte… Documents textuels : livres, publications en général, presse, correspondance, documents administratifs, commerciaux, comptables.

De manière sans doute un peu simplifiée, l’information, c’est-à-dire « la connaissance qui peut être échangée et qui est perçue »5, contenue dans un document iconographique tient au document dans son ensemble. Lorsqu’il est numérisé, il s’agit donc d’en produire une copie la plus fidèle et la plus complète possible. Nous en verrons au cours de cet ouvrage les différentes implications. Au contraire du document iconographique, dans un document textuel, l’information correspond aux caractères qui composent le texte. L’intérêt d’un tel document n’est pas son image, mais la capacité qu’il offre à lire et à interpréter l’information portée. La numérisation de documents textuels a pour objectif de conserver cette lisibilité, voire de l’améliorer. Elle ne subit pas les mêmes contraintes que pour la numérisation d’une image, nous y reviendrons également plus loin.

Attention Ne pas confondre numérisation et dématérialisation : la numérisation est l’opération de transfert d’un document physique en un document électronique ; la dématérialisation est le projet plus global qui tend à systématiser les échanges au format numérique au sein d’une organisation (entreprise, collectivité…). La dématérialisation est donc en partie basée sur la numérisation, notamment des courriers, mais elle inclut aussi la production de documents numériques « natifs » qui ne sont pas appelés à être imprimés. Elle se fonde sur une architecture informatique de gestion de bases de données et une série de processus à respecter par les utilisateurs du système, notamment en matière de sécurité. La dématérialisation est donc un projet d’ampleur qui comprend machine, logiciel et processus, mais qui n’est pas traité dans cet ouvrage. La dématérialisation concerne notamment la publication des marchés publics, les échanges de données comptables, etc.

La numérisation d’archives

Par ailleurs, il existe plusieurs classes d’application de la numérisation qui ne recouvrent que partiellement la distinction image/texte décrite à l’instant. Pour chacune d’entre elles, la numérisation diffère complètement, que ce soit dans les matériels et les paramètres utilisés ou l’organisation du travail. On distingue ainsi trois grandes classes d’archives à numériser : - n umérisation patrimoniale, qui consiste à numériser des fonds d’archives ayant une valeur documentaire ; - numérisation de production, qui concerne la numérisation automatisée et massive d’archives administratives notamment ; - numérisation de bureautique, qui est celle du tout-venant, des besoins d’un secrétariat aux applications personnelles.

14

5. Françoise Banat-Berger, Laurent Duplouy et Claude Huc, op. cit.

Partie 1 - Les enjeux de la numérisation d’archives


A - La numérisation patrimoniale La numérisation patrimoniale concerne les fonds de documents écrits, plans, livres, presse, fonds photographique, œuvres artistiques… dont le gestionnaire est un particulier, une association, une entreprise ou une collectivité territoriale, etc. La particularité de la numérisation patrimoniale consiste en la qualité requise du travail plutôt qu’en la quantité et la rapidité de traitement. La copie numérique doit être aussi fidèle à l’original que possible de façon à pouvoir lui être substituée autant que de besoin. Figure 2 : Un exemple d’archives patrimoniales conservées aux Archives nationales (photo : Baptiste Essevaz-Roulet)

Les raisons qui peuvent pousser les gestionnaires d’un fonds à le numériser sont diverses (voir chapitre III de cette partie). Le plus souvent, il s’agit de le préserver et de le valoriser en le faisant connaître au plus grand nombre grâce à un accès via un réseau informatique interne (Intranet) ou ouvert (Internet). Ce ne sont pas forcément les chercheurs qui entraînent le développement de la numérisation des archives patrimoniales ; ce sont les particuliers – le grand public – qui génèrent la plus forte demande. L’engouement pour la généalogie a amené un public nouveau aux archives. Les sociétés d’histoire locale témoignent aussi de l’intérêt du plus grand nombre qui se déplace de la grande histoire à la petite histoire. On est curieux de l’histoire de son village, de son nom de famille, de sa rue… En rendant accessibles au public des documents qui peuvent satisfaire sa curiosité, les gestionnaires de fonds d’archives sensibilisent à l’histoire une nouvelle tranche de la population dont il résulte une augmentation de la demande : « La mise à disposition des sceaux et des registres paroissiaux et d’état civil a engendré une demande que nous n’avions pas estimée et qui pourtant existait déjà avec la technique de microfilmage »6.

Nota D’après le Guide des bonnes pratiques TGE ADONIS7 : « Le passage au numérique est devenu une priorité et souvent même une nécessité dans le paysage actuel de la recherche et de sa patrimonialisation. Numériser afin de traiter et d’analyser autrement et plus en profondeur les données, afin d’archiver l’existant et de créer un patrimoine scientifique pour les générations à venir, afin d’être en phase avec les pratiques qui se généralisent ailleurs, afin de valoriser la production scientifique, afin de pouvoir travailler à distance et en collaboration sur des corpus ; voici, parmi bien d’autres, les objectifs qui motivent les laboratoires, chercheurs et enseignants-chercheurs d’effectuer ce passage ».

6. Vincent Doom, « La numérisation des collections iconographiques et textuelles. Stratégies, choix et compromis », La numérisation des textes et des images : techniques et réalisation, Université Charles-de-Gaulle, Lille, 2 003. 7. Document rédigé par le TGE Adonis sous l’impulsion de l’Institut des sciences humaines et sociales, du Bureau des très grands équipements du CNRS et du ministère de l’Enseignement supérieur et de la Recherche. Version du 1er décembre 2009.

Partie 1 - Les enjeux de la numérisation d’archives

La numérisation d’archives

15


Presque toutes les collectivités conservent des archives qui ont une valeur patrimoniale plus ou moins évidente. Ces archives, qu’elles soient conservées par la collectivité ou versées à un fonds, peuvent toutes être concernées par un projet de numérisation. Tableau 2 : Fonds patrimoniaux des collectivités territoriale

Collectivité territoriale

Type de fonds conservé

Archives municipales Elles demeurent la propriété de la commune, même si elles sont déposées aux archives départementales.

Cadastre (concerné même si propriété de l’État) État civil (concerné même si propriété de l’État) Bibliothèque-médiathèque avec souvent des archives historiques Archives administratives (courriers, délibérations, consultations…) Archives techniques et plans (1 grand plan papier pour 10 habitants, dossiers des ouvrages exécutés, plans des bâtiments communaux [3 m² par habitant])

Archives départementales et régionales

Idem communes sauf cadastre et état civil Archives historiques

Communautés et syndicats Au même titre que les entreprises

Archives techniques (gestion des réseaux d’eau, d’assainissement, d’électricité, des communications électroniques…) Archives administratives Archives historiques (photographies de chantiers…)

L’importance et l’intérêt des archives privées ne doivent pas être minimisés : « Il existe à l’échelon local des fonds privés tout à fait dignes d’intérêt dont les propriétaires ont des réticences à se départir »8. Elles peuvent émaner d’associations ou fondations gérant un fonds constitué selon leur objet, d’entreprises qui ont conservé leurs archives anciennes, ou encore de personnes privées, héritières des archives d’un personnage historique, d’un artiste, etc. Lorsque les détenteurs d’archives privées sont réticents à se séparer de leur fonds, la numérisation peut être une solution particulièrement adaptée. Elle permet de verser le fonds aux archives départementales tout en remettant aux propriétaires une copie numérique, soit au contraire, de laisser aux propriétaires leurs fonds, tout en récupérant la copie numérique. Dans le premier cas, le propriétaire peut continuer de jouir et d’exploiter les informations contenues dans le fonds, tout en n’ayant plus à en assumer la conservation ; dans le second cas, même si le fonds d’archives public ne conserve pas les documents physiques, il peut se charger de le répertorier, de le rendre accessible aux chercheurs, voire de le diffuser. La numérisation des documents sonores

La numérisation d’archives

Les documents sonores, tout comme les vidéogrammes, sont également des documents susceptibles d’être numérisés. Nombre de bibliothèques, musées et fonds d’archives disposent de disques, cassettes, disques tournant à 78 tours par minute et autres supports. Ces documents présentent souvent un intérêt historique ou artistique à l’instar des livres et ouvrages. Leur numérisation est utile pour faciliter la consultation par le public. La numérisation de ces documents sonores présente cependant trop de différences avec la numérisation des documents « papier » pour être traitée de façon détaillée dans le présent ouvrage. Sur le plan technique, la numérisation s’effectue à l’aide d’une « carte son » ou une interface similaire qui fait le lien entre l’ordinateur et un lecteur de bandes magnétiques ou un tourne-disque analogique. La carte son transforme la modulation musicale issue du tourne-disque en une description numérique des oscillations sonores, à l’instar de celle que l’on trouve sur un Compact Disc. Une fois numérisé, le document sonore apporte les mêmes facilités (classement, recherche, diffusion) et pose les mêmes problèmes de conservation que les autres documents électroniques. La réglementation concernant la reproduction de ces documents sonores présente quelques différences avec celle des documents « papier ». En simplifiant, les enregistrements (disques) sont admis dans le domaine public cinquante ans après leur première publication ou leur premier enregistrement.

16

Les instruments de recherche constituent un sous-ensemble important des archives patrimoniales. Ce sont « des outils, à usage interne ou mis à la disposition des chercheurs, permettant de connaître la composition des fonds, le

8. Christine Juge et Joël Clérembaux, La gestion des archives, Territorial Éditions, coll. « Dossiers d’experts » (réf. DE597), Voiron, 2009.

Partie 1 - Les enjeux de la numérisation d’archives


contenu des différentes séries ou de mener une étude thématique. (…) Élaborés de manière à orienter au mieux la recherche, ils constituent, en quelque sorte, la « boussole » des archives »9. Un instrument de recherche peut se présenter sous forme de fiches perforées, d’index reliés, d’inventaires ou encore de répertoires manuscrits comme ceux des études notariales. La numérisation d’instruments de recherche sert à faciliter le repérage et la consultation des documents conservés. Pour certains fonds, c’est un but en soi, avant même d’envisager la numérisation de leurs archives. C’est un premier pas important dans la facilitation de l’accès aux documents archivés. Il est en effet beaucoup plus simple de préparer à distance, depuis chez soi par exemple, une consultation de documents en identifiant les cotes des archives d’intérêt. Le fait que les archives elles-mêmes ne soient pas directement consultables en ligne est bien compréhensible, en tout cas pour l’instant. La numérisation des instruments de recherche peut déboucher soit sur la publication électronique des images elles-mêmes, soit sur la constitution de bases de données électroniques, plus faciles à interroger. La numérisation patrimoniale requiert du matériel et des méthodes très divers, nous y reviendrons ; tout juste pouvons-nous exclure l’utilisation des scanneurs de production (voir en partie 2, chapitre III-B). Le scanneur le plus fréquemment utilisé est le scanneur à plat dans lequel les documents sont insérés manuellement les uns après les autres. Le procédé est long, mais il est requis pour atteindre les objectifs de qualité énoncés plus haut. Le scanneur à plat peut avoir des caractéristiques différentes selon l’usage : taille maximale, résolution, qualité de numérisation plus ou moins élevées… Pour les fonds plus spécifiques, un scanneur dédié peut aussi être utilisé : scanneur de livres pour la numérisation des ouvrages reliés, scanneur de plan pour les documents grand format, scanneur de microfilm pour les fonds microfilmés, etc.

B - La numérisation de production La numérisation de production consiste à numériser des masses de documents administratifs ou comptables. Au contraire de la numérisation patrimoniale, on recherche avant tout l’efficacité et la rapidité. Elle concerne principalement les archives textuelles techniques, administratives, comptables ou commerciales à la condition qu’elles soient standard du point de vue du grammage et du format du papier. L’intérêt de numériser n’est ici pas de partager les documents avec le public, mais de conserver une copie des documents pour exploitation ou avant destruction ou délocalisation. Les organismes concernés sont les entreprises et les collectivités territoriales qui produisent beaucoup d’archives papier ou les institutions qui doivent gérer des milliers, voire des millions de formulaires ou autres dossiers.

Exemple L’entreprise X est courtier en assurances. Son activité la conduit à générer de très nombreux dossiers : prospection, clients, sinistres… En quelques années d’activité, ses locaux se sont remplis de près de 500 cartons d’archives qui sont stockés dans les couloirs, sur les étagères, voire sous les bureaux. Une grande partie de ces archives ne sont plus consultées, mais elles ne peuvent pas être purement et simplement jetées soit parce qu’elles conservent l’historique de clients, soit pour des raisons légales. L’entreprise envisage dans un premier temps de louer un espace de stockage, mais elle fait rapidement un calcul et constate que pour le prix de trois années de location, elle peut faire numériser l’intégralité de ses archives avant de les jeter. Le volume de ses cartons d’archives sera ainsi libéré alors que les dizaines de milliers de documents qu’ils contenaient rempliront à peine un disque dur externe de quelques centimètres cubes une fois numérisés.

La numérisation d’archives

9. Juge et Clérembaux, op. cit.

Partie 1 - Les enjeux de la numérisation d’archives

17


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.