Session : Que restera-t-il de nos archives numériques ?

Programme VITAM : Comment a-t-il séduit un tiers archiveur ?

Par Hervé STREIFF, Locarchives

Le programme VITAM porte ses fruits avec la première version dite « de production » livrée dans les temps. Après réalisation d’un prototype concluant, un tiers archiveur LOCARCHIVES a choisi VITAM pour sa nouvelle offre d’archivage électronique. Retour d’expérience sur cette implémentation privée de VITAM et éléments de décisions pour les modes d’exploitation du SAE (SaaS vs mutualisation vs intégration).


Transmettre la connaissance sur le (très) long terme: des manuscrits à l’âge moderne

Par Michel JACOBSON, CNRS et Nicolas LARROUSSE

L’IRHT, créé en 1937, associe à sa mission première de recherche sur les manuscrits, la préservation de ses objets de recherche. La technologie utilisée, qui au début du projet était le microfilm, a bien sûr changé et les données sont maintenant stockées sur des supports numériques. Ces données, accessibles par ailleurs dans un format plus léger via le site de l’IRHT, étaient stockées sur l’infrastructure de Huma-Num.

Compte-tenu de leur fort volume, 2 millions de fichiers, le risque de se transformer progressivement en « nécropole numérique » était important : un projet de préservation sur l’infrastructure du CINES a donc été lancé. Le volume atypique de données posait la question du financement de cette préservation, mais la possibilité de passer du format d’origine (TIFF) à un format plus léger (JPG2000) en tenant compte de l’expérience de la BnF a permis de lancer l’opération.

La description d’un point de vue technique des pages des manuscrits numérisés existait à l’IRHT, et s’accompagnait pour certains manuscrits de résultats d’études scientifiques. Logiquement, afin de préserver l’intelligibilité des données, il a été décidé de rassembler toutes ces informations.

Toutes les conditions semblaient réunies pour entamer le projet : nous disposions des ressources techniques nécessaires, les différents acteurs étaient motivés, etc.

La réalité nous a rattrapé rapidement, pas moins de deux ans ont été nécessaires pour préparer les données. Même si les données et les métadonnées étaient organisées, le temps de la collecte, sur plusieurs dizaines d’années, a produit des variations qui ne sont simples ni à identifier ni à corriger sur un tel volume de données. Il nous a fallu pour mener à bien ce projet réunir une équipe de personnes aux compétences très diverses et les faire travailler ensemble. Les aspects quantitatifs ont fortement conditionné les choix technologiques et les traitements ont dû être planifiés très finement. On ne pouvait pas utiliser la même approche avec ces volumes qu’avec des corpus de taille plus modeste. Enfin sans le souvenir encore vivant du projet de collecte, il aurait été impossible de prendre certaines décisions, dont certaines étaient irrévocables.