Événements

Que restera-t-il de nos archives numériques ?

La préservation numérique, un enjeu crucial de l’archivage à long-terme – table-ronde

Animée par Edouard VASSEUR, Programme Vitam

Participants à la table ronde : un représentant du CINES, Nicolas BEL (ministère des Armées), Marion HUMBERT (SIAF, ministère de la Culture)

L’intervention abordera les enjeux de pérennisation numérique, cette problématique devenant cruciale pour la profession : comment assurer la conservation et la lisibilité des archives numériques sur le temps long ?
De nombreuses actions sont actuellement entreprises afin de pouvoir assumer cet enjeu. Les intervenants de cette table ronde font partie des acteurs de la préservation et participent au Programme Vitam. En effet, les membres du Programme (équipe projet, ministères porteurs, partenaires) travaillent depuis mi-2017 sur le sujet dans le cadre d’un chantier fonctionnel dédié (travaux évoqués dans plusieurs articles de la revue Archivistes!).
Dans la continuité du chantier fonctionnel Vitam, des actions complémentaires ont été impulsées. Le ministère des Armées a lancé des ateliers sur la préservation qui ont déterminé des organisations, processus et outils. Le SIAF a piloté avec l’équipe VITAM, en partenariat avec les ministères porteurs, une AMO sur le sujet de la préservation des données numériques afin de faire un bilan de l’existant et de définir des pistes organisationnelles et stratégiques pour mettre en œuvre une politique sur le sujet.
Le CINES mène depuis plusieurs années des politiques de conservation et préservation numériques (liste de formats préconisés et acceptés…).
Les intervenants feront état de leur expérience et des leçons qu’ils en ont tiré. Ils s’interrogeront sur les mutations à mettre en œuvre pour les archivistes : les organisations à mettre en place, les savoir-faire et expertises à acquérir ou développer et les chantiers prioritaires à mettre en œuvre… Ils exposeront également la perspective d’une mise en réseau et la création d’une communauté d’experts sur le sujet.


Transmettre la connaissance sur le (très) long terme: des manuscrits à l’âge moderne

Par Michel JACOBSON, CNRS et Nicolas LARROUSSE

L’IRHT, créé en 1937, associe à sa mission première de recherche sur les manuscrits, la préservation de ses objets de recherche. La technologie utilisée, qui au début du projet était le microfilm, a bien sûr changé et les données sont maintenant stockées sur des supports numériques. Ces données, accessibles par ailleurs dans un format plus léger via le site de l’IRHT, étaient stockées sur l’infrastructure de Huma-Num.

Compte-tenu de leur fort volume, 2 millions de fichiers, le risque de se transformer progressivement en « nécropole numérique » était important : un projet de préservation sur l’infrastructure du CINES a donc été lancé. Le volume atypique de données posait la question du financement de cette préservation, mais la possibilité de passer du format d’origine (TIFF) à un format plus léger (JPG2000) en tenant compte de l’expérience de la BnF a permis de lancer l’opération.

La description d’un point de vue technique des pages des manuscrits numérisés existait à l’IRHT, et s’accompagnait pour certains manuscrits de résultats d’études scientifiques. Logiquement, afin de préserver l’intelligibilité des données, il a été décidé de rassembler toutes ces informations.

Toutes les conditions semblaient réunies pour entamer le projet : nous disposions des ressources techniques nécessaires, les différents acteurs étaient motivés, etc.

La réalité nous a rattrapé rapidement, pas moins de deux ans ont été nécessaires pour préparer les données. Même si les données et les métadonnées étaient organisées, le temps de la collecte, sur plusieurs dizaines d’années, a produit des variations qui ne sont simples ni à identifier ni à corriger sur un tel volume de données. Il nous a fallu pour mener à bien ce projet réunir une équipe de personnes aux compétences très diverses et les faire travailler ensemble. Les aspects quantitatifs ont fortement conditionné les choix technologiques et les traitements ont dû être planifiés très finement. On ne pouvait pas utiliser la même approche avec ces volumes qu’avec des corpus de taille plus modeste. Enfin sans le souvenir encore vivant du projet de collecte, il aurait été impossible de prendre certaines décisions, dont certaines étaient irrévocables.


L’accès aux bases de données : enjeux, orientations et expérimentations aux Archives nationales

Par Violette LEVY et Isabelle PEREZ-BASTIE, Archives nationales

Les Archives nationales ont acquis une expérience de 35 ans de conservation d’archives électroniques. Le principe retenu, en concertation avec les grands producteurs de données structurées comme l’INSEE et l’INED, a été celui d’un archivage des données à plat, liées aux métadonnées de représentation et à la documentation associée.
Cette méthodologie est actuellement questionnée, d’une part avec l’ouverture en novembre 2018 d’une nouvelle plateforme d’archivage électronique, d’autre part pour faire face à l’augmentation de la demande sociale en termes d’accès à ces archives. C’est pourquoi dans le cadre du projet ADAMANT, les Archives nationales ont lancé un chantier pour définir de grandes orientations en matière d’accès et de diffusion des archives numériques.
La table ronde présentera les enjeux spécifiques de l’accès aux bases de données et les pistes de réflexion des Archives nationales. Elle révélera les expérimentations en cours, à travers l’exemple du Fichier national des allocataires, base d’informations statistiques qui retrace l’historique de toutes les personnes inscrites comme demandeur d’emploi et de tous les bénéficiaires d’une allocation versée ou d’une aide accordée par le Pôle emploi (ex-Assédic/Anpe) depuis 1993. Elle fera également état des échanges fructueux que les Archives nationales ont initiés depuis l’été 2018 avec une communauté de chercheurs utilisateurs de données structurées.
L’intervention fera entendre la voix de l’archiviste responsable aux Archives nationales de la collecte et de la gestion de données structurées, et celle de l’archiviste responsable de l’accès et de la diffusion de ces archives.


Programme VITAM : Comment a-t-il séduit un tiers archiveur ?

Par Hervé STREIFF, Locarchives

Le programme VITAM porte ses fruits avec la première version dite « de production » livrée dans les temps. Après réalisation d’un prototype concluant, un tiers archiveur LOCARCHIVES a choisi VITAM pour sa nouvelle offre d’archivage électronique. Retour d’expérience sur cette implémentation privée de VITAM et éléments de décisions pour les modes d’exploitation du SAE (SaaS vs mutualisation vs intégration).


Le Cleaning Day dans l’univers numérique : une méthode partagée entre l’archiviste et l’informaticien

ParMartine FREVAL et Estelle BROSSET, Conseil départemental d’Indre-et-Loire

*Intervention proposée par la section des archivistes départementaux*

Dans le cadre du projet mis en place par au Conseil départemental d’Indre-et-Loire par la Direction des systèmes d’information et les Archives départementales sur l’accompagnement des services aux usages des outils numériques, des séances de cleaning days ont été programmées dans les services métier, afin de les aider à organiser leurs arborescences bureautiques, à mettre en place les bonnes pratiques au regard de la sécurité informatique et de la protection des données, et les aider à transposer au numérique les méthodes éprouvées pour la gestion du papier. Un an, 47 interventions et 400 interlocuteurs plus tard, il est possible de dresser un bilan de la démarche, tant sur les volumes de données et documents traités que sur la méthode de travail partagée entre les archivistes et les informaticiens, et le résultat de la sensibilisation des agents aux problématiques nouvelles de l’administration numérique.

Collecte et « archives essentielles »

Retour sur les questions aux Archivistes 2018 : synthèse de la question « Les archives essentielles : de la collecte généraliste à la macro-évaluation ? »
Par Lydiane GUEIT-MONTCHAL, présidente de la section des archivistes départementaux de l’AAF
*Intervention proposé par la Section des archivistes départementaux*

En 2017, l’AAF a initié un mode de travail associatif, « questions aux Archivistes », destiné à bâtir une large réflexion sur des problématiques liées au métier, à ses missions et à ses valeurs. Une des questions posées était inspirée par une des propositions du « Rapport Nougaret » de mars 2017, autour de la notion d’ « archives essentielles », dont l’AAF s’est emparée bien avant qu’elle surgisse dans le paysage médiatique et avant la consultation « Archives pour demain ».
Concept archivistique développé depuis une trentaine d’année, la notion d’archives essentielles a notamment été reprise par la normalisation sur le Records management (Norme ISO 15489).
Ce qui est nouveau, et qui constitue notamment une des propositions du rapport Nougaret, est l’idée de définir dans la pratique archivistique publique française, très en amont, le ou les périmètres relevant des « archives essentielles » : ils feraient l’objet d’une attention particulière, tandis que les autres ensembles pourraient être traités en procédures allégées.
Cette proposition a ouvert de larges pistes de réflexion dans toutes les instances de l’AAF, sur la méthodologie et les critères d’évaluation des documents, les conséquences sur les méthodes de travail avec les producteurs, la visibilité de l’archiviste, le traitement réservé aux « autres documents », etc.
Cette intervention permettra de faire une synthèse des débats et des conclusions telles qu’elles ont été finalisées ors de l’AG de mai 2018, en remettant en perspective ces éléments de réflexion avec les questions débattues dans la presse et la consultation « Archives pour demain ».


Évaluer et sélectionner les archives sous l’œil du citoyen

Par Catherine JUNGES, sous-directrice de la politique archivistique, Service interministériel des archives de France

De novembre 2017 au premier trimestre 2018, l’évaluation et la sélection des archives publiques sont devenues l’objet d’un débat public : pétition en ligne intitulée « Les archives ne sont pas des stocks à réduire », articles et tribunes dans la presse, prises de position sur les réseaux sociaux se sont succédés. L’inquiétude suscitée par la proposition faite dans le cadre de la réflexion préalable à l’élaboration du rapport Action publique 2022 de « limiter la collecte aux archives essentielles », est venue rencontrer celle engendrée par les opérations de réévaluation menées par les Archives nationales sur deux séries de documents touchant au dépôt légal d’une part, à l’exercice du droit à l’avortement d’autre part.
Porté au départ par des historiens, ce débat a trouvé un large écho auprès de l’ensemble des usagers des services d’archives et témoigne d’une forte attente de transparence de leur part quant aux pratiques d’évaluation et de sélection des archives publiques :
• Quels outils imaginer pour informer des règles et du processus d’évaluation et de sélection, ainsi que pour rendre compte de la façon dont il est appliqué et du résultat de la collecte aux usagers, aux citoyens, mais aussi aux producteurs et aux décideurs ?
• Faut-il aller plus loin et passer de la transparence à la participation en associant le citoyen, l’usager, et/ou l’administré au processus d’évaluation et de sélection des archives ?


Collecter mieux ? Retour sur une expérience prospective de collecte des archives de l’Agriculture

Par Anne MINGOUS, Archives du département du Rhône et de la Métropole de Lyon et Nicolas CORTESERO, Voies navigables de France

Les années 2016-2017 ont peut-être marqué le début d’un tournant dans la tradition française de collecte des archives publiques. Jamais le constat n’avait été si franchement posé, que les procédures classiques, suivi de circulaires ou d’instructions de tri, circuits de demandes d’élimination et de versement par les administrations, ne permettaient pas (plus ?) de faire rentrer dans les fonds publics les documents traduisant au mieux les réalités et les problématiques essentielles de la société contemporaine, et permettant également de répondre aux besoins actuels et futurs de matériaux historiques et mémoriels.
Partant de ce constat, les Archives du département du Rhône et de la métropole de Lyon ont souhaité expérimenter, sur plusieurs domaines majeurs de l’évolution sociale et de l’action publique contemporaines, une réflexion visant à identifier les archives majeures et leurs producteurs – publics, parapublics, associatifs, industriels ou individuels – afin d’entreprendre auprès de ceux-ci des démarches de collecte volontaristes. Cette réflexion a été menée en concertation avec des chercheurs spécialistes de chacun des thèmes considérés afin d’identifier leurs attentes d’aujourd’hui mais aussi, avec toute la modestie que cette spéculation suppose, celles de leurs successeurs de demain et d’après-demain.


L’archiviste et le secret du vote. La préservation des bulletins en question(s)

Par Jérémie MOUALEK, Université Paris Saclay

Cette communication traitera de l’archivage de données sensibles à travers l’exemple des bulletins annulés issus des scrutins politiques.

La présentation prendra appui sur des observations et des entretiens effectuées aux archives départementales de l’Oise entre 2012 et 2016, dans le cadre d’une recherche sociologique sur le vote blanc et nul.

Le total de bulletins s’élève à 15 683. Un ensemble de cette ampleur est inédit en France, l’archivage des bulletins annulés n’étant pas courant, surtout dans ces conditions. Cela peut s’expliquer, peut-être, par l’intérêt tardif suscité par la publication, en 1969, d’un article d’Yves-Marie Bercé dans La Gazette des Archives et dans lequel il prône la conservation des bulletins annulés. De même, la pluralité des pratiques d’archivage s’explique, notamment, par la faiblesse du cadre réglementaire qui régit la préservation potentielle des bulletins annulés. De fait, seule une circulaire interministérielle de 2004, relative aux élections politiques postérieures à 1945, stipule qu’à l’issue d’une conservation intégrale de quinze jours en Préfecture, « des échantillonnages peuvent être envisagés (pour certains scrutins ou certains bureaux de vote) selon l’intérêt des mentions portées sur les bulletins ».

Portant souvent des marques de reconnaissance (voire un nom et un prénom), ces bulletins posent question quant à la préservation de l’anonymat du votant et donc la diffusion de leur bulletin de vote au plus grand nombre. Ils nous poussent à nous interroger sur la liberté de l’archiviste : peut-il, en raison de l’intérêt important de ces bulletins pour la recherche sociologique/historique, se permettre de briser le secret du vote ?

Nous tenterons de répondre à cette question en détaillant la façon dont les archivistes de l’Oise ont procédé et en retraçant, notamment, les préoccupations qui ont guidées leurs choix. Certains extraits du film-documentaire réalisé dans le cadre de cette recherche pourront d’ailleurs être diffusés pendant la communication.

De nouvelles formes d’exploitation des archives

Naviguer dans les archives : panorama des stratégies pour simplifier l’accès aux instruments de recherche

Par Isabelle HOMER, vice-présidente de la section des archivistes départementaux

*Intervention proposé dans le cadre de la Section des archivistes départementaux*

La diffusion des instruments de recherche sur les sites internet et les portails des Archives départementales fait l’objet depuis quelques années de réflexions et d’expérimentation destinées à en faciliter l’accès au moyen de stratégies diversifiées, rendues possible par l’évolution des outils métier et l’appropriation des techniques du web documentaire. Le traditionnel cadre de classement, mal-aimé du public, est complété ou parfois remplacé par des accès thématiques, des formulaires de recherche avancé, des outils de navigation élaborés dans des arborescences complexes. Cette intervention a pour objet de dresser un panorama de ces différentes approches, résultat d’une enquête systématique sur les sites internet existant, et d’entretiens avec des archivistes chargés de leur élaboration. L’occasion de faire le point sur la faisabilité d’une mise à disposition « simple » d’un contenu riche et complexe.


Promouvoir l’accès aux archives sur internet : le rôle des portails agrégateurs

Par Manonmani RESTIF et Camille Monnier, Service interministériel des Archives de France

Ouvert en mars 2017 le portail interministériel FranceArchives a pour objectif de favoriser l’accès aux archives. Agrégateur national, son moteur permet une recherche transverse entre les services d’archives répartis sur l’ensemble du territoire et relie au sein d’un même environnement numérique des fonds géographiquement dispersés. Il donne accès à plus de 7 millions de notices d’éléments d’archives provenant des Archives nationales, des ministères des Armées et de l’Europe et des Affaires étrangères, d’archives départementales et communales, et autres établissements patrimoniaux (APHP, musée du Quai-Branly par exemple).
Le portail participe à la dissémination des métadonnées archivistiques sur le web. Les choix d’implémentations techniques ont été réalisés dans le but d’optimiser le référencement sur les moteurs généralistes, l’utilisation des technologies du web sémantique permet par ailleurs l’identification de concepts univoques pour les humains comme pour les machines. Le portail intègre les standards et référentiels actuellement utilisés dans le réseau des archives (EAD, EAC, Dublin Core) et les métadonnées archivistiques sont par ailleurs exposées en RDF. Aujourd’hui le portail développe des techniques d’alignement et d’enrichissement des données indexées vers des référentiels externes (GeoNames par exemple pour les indexations de lieux) afin de multiplier les portes d’entrée vers la donnée. L’efficacité des technologies employées est cependant conditionnée par les données reçues et exploitées. Ainsi, ce travail doit s’appuyer sur une participation active du réseau, détenteur des sources et rédacteur des instruments de recherche.
Portail fédérateur, FranceArchives doit également assurer la diffusion maximale des données et favoriser leur réutilisation. Il est ainsi moissonné par le portail européen des archives (APE) et diffuse en open data les données qui lui sont confiées par ses partenaires.


Collecte et analyse des données archivistiques : Penser S.I.G. !

Par Christian GRANGER, Association d’Études Historique et de Recherche de la Cavalerie Impériale

La création d’un Système d’information géographique (SIG) est de permettre des recherches plus aisées et plus fines et répondre aussi bien aux besoins des généalogistes qu‘aux collectivités et associations afin d’apporter une meilleure mutualisation des données enregistrées.

L’objectif est d’exploiter dans cet exemple les archives conservées au Service Historique de la Défense à Vincennes et de les faire connaître au plus grand nombre, par la création de relevés informatisés et la diffusion de ces travaux dans un but historique.

Notre ambition est donc de développer un portail afin de proposer une plateforme collaborative d’indexation de fonds d’archives des soldats du Premier Empire.


Le protocole IIIF, ou comment faciliter le partage et l’affichage des archives numérisées

Par Jean-François MOUFFLET et Dominique STUTZMANN, Archives nationales

Les Archives nationales ont participé de 2015 à 2017 au projet HIMANIS, sous l’égide de l’Institut de Recherche et d’Histoire des Textes (IRHT), et qui avait pour objet d’étude les registres de la chancellerie royale des XIVe et XVe siècles.
L’enjeu technologique majeur était de procéder à une reconnaissance par ordinateur des écritures médiévales qui soit suffisamment fiable pour offrir à la communauté un moteur de recherche en plein texte dans les registres, dont une partie n’est pas encore couverte par les inventaires ou les index.
Une interface de consultation des données, conjuguant un accès aux images, aux transcriptions et aux analyses archivistiques, a été également développée. Elle repose sur l’utilisation du protocole IIIF (International Image Interoperability Framework) : il s’agit d’un cadre technique international, permettant aux institutions détentrices d’images de partager celles-ci de façon standardisée au sein de sites Web partenaires. Dans le cas d’HIMANIS, les registres de la chancellerie française, qu’ils soient conservés aux Archives nationales ou à la Bibliothèque nationale de France, ont pu ainsi être réunis dans une interface commune.
Le protocole IIIF est en effet assorti d’applicatifs qui non seulement permettent d’appeler des images conservées dans différents silos, mais aussi de les manipuler avec une grande souplesse, avec de nombreuses possibilités d’affichage tant de l’image que de ses métadonnées. On peut par exemple modifier à la volée la taille, la colorimétrie, l’orientation de l’image, superposer des images différentes, les comparer, les annoter, rechercher du contenu océrisé, etc.
Couramment employé dans le monde des bibliothèques numériques, utilisé dans des projets d’envergure européenne, le protocole IIIF est encore méconnu dans la sphère des archives françaises. Son implémentation dans les logiciels d’archives faciliterait pourtant encore davantage le partage d’images et la constitution de portails associant plusieurs services culturels.
L’objectif de la présentation sera d’en présenter les grandes potentialités.


Explorer des données archivées avec des outils de data visualisation

Par Lourdes FUENTES-HASHIMOTO, Total

Les systèmes d’information permettant de gérer des archives, en particulier les systèmes dédiés au records management, ont été conçus pour administrer le cycle de vie des archives. Il n’est pas question ici des systèmes de description (y compris les instruments de recherche) des archives historiques. Les données descriptives disponibles dans un système de records management concernent d’abord le type de document, la durée de conservation et le sort final. A cela s’ajoutent les données d’identification des services versant et/ou propriétaire, les dates ainsi que les données de localisation. Ces systèmes sont axés principalement sur la gestion logistique pour permettre de trouver un dossier dans une boîte sur une tablette dans un magasin et leur équivalent électronique permettant de pointer vers le bon fichier. Cependant, les métadonnées sur le contenu sont souvent pauvres, limitées à un seul champ « description » qui étant généralement un champ libre ne permet pas d’exploiter les données a posteriori car il contient des informations très hétérogènes et qui ne sont pas normalisées. Il arrive qu’on ajoute des éléments d’indexation contrôlée avec des listes ou des thésaurus sans que cela soit systématique. Or, ce modèle de données conditionne l’accès aux archives. Il s’avère efficace pour gérer le cycle de vie (planifier des destructions par exemple) mais il ne permet pas d’exploiter réellement les données archivées à grande échelle. Ce modèle est obsolète en matière d’archives numériques dès lors que les usages ont changé radicalement et que l’on assiste à une forte demande de réutilisation voire d’ouverture des données. L’intérêt des systèmes d’information dédiés aux archives n’est pas seulement la protection juridique, le système doit permettre aussi toutes les recherches possibles en termes de contenu. Le Groupe Total a mené une expérience avec des outils de visualisation des données afin d’explorer les fonds archivés. Deux pilotes ont été réalisés en 2018 : un travail avec les fonds de photographies numériques et un travail d’exploration de métadonnées à des fins de pilotage du système d’archivage électronique. Ces expériences ont permis de tester une nouvelle démarche et de développer une stratégie d’accès aux données. L’accès est à la fois celui de l’usager et celui du service d’archives lui-même car il a besoin de bien connaître ses fonds pour piloter son activité. Comment articule-t-on dans une entreprise multinationale les enjeux juridiques complexes de plusieurs législations et le besoin de renouveler l’accès aux archives ?