Événements

Usages innovants

Retour sur le premier hackathon dans le monde des archives !

Par Pauline BERNI et Jean-François MOUFFLET, Archives nationales

Le hackathon organisé par les Archives nationales les 8 et 9 décembre est le premier événement de ce type dans la sphère des services d’archives en France.
Avec ce hackathon, les Archives nationales ont souhaité s’inscrire dans la logique d’ouverture mais aussi dans une démarche d’analyse de leurs pratiques professionnelles au regard des nouveaux usages qui se développent dans le monde des humanités numériques et dans le monde numérique en général.
Les résultats du hackathon leur permettent de confirmer et/ou orienter leurs stratégies archivistiques et leur choix d’outils informatiques pour les années à venir.
Nous expliquerons tout d’abord pourquoi les Archives nationales ont organisé un hackathon ? Comment cet événement a-t-il été préparé ? Puis, nous reviendrons sur la solution lauréate. Enfin, nous finirons en rappelant l’intérêt de la solution gagnante pour l’institution et les perspectives.
Intervention préparée par Pauline Berni et Gaetano Piraino, pilotes de l’événement et Jean-François Moufflet, mentor pour les jeux de données.


Retour d’expériences et perspectives, Archives départementales de l’Hérault et Wikimédia France

Par Carole RENARD, conservatrice-stagiaire du patrimoine et Xavier CAILLEAU, chargé de mission partenariats et GLAM au sein de Wikimédia France

Intervention type « retour d’expérience », où j’interviendrais sur la convention passée en 2016 entre les Archives de l’Hérault et Wikimédia France, les actions mises en place (mises à jour d’articles sur Wikipédia, ateliers de formation et de contribution, téléversement de données….), et le travail de diffusion et valorisation effectué sur les projets Wikimedia au sein des Archives départementales de l’Hérault.
Xavier Cailleau interviendrait quant à lui sur l’aspect projets Wikimedia, sur la construction d’un projet/réseau GLAM avec les institutions en reprenant les exemples de contributions déjà développés dans d’autres institutions patrimoniales ou culturelles.

Pour respecter le prisme de la transparence nous proposons en fil rouge l’aspect collaboratif des projets Wikimedia, la philosophie de transparence inhérente à ce mouvement (pages de discussion pour création d’articles, historique des modifications, etc.) et l’ouverture puis diffusion des richesses culturelles des Archives départementales, dont celles de l’Hérault, sur des projets numériques libres à très forte audience qui est à la fois une démarche de diffusion de valorisation et de transparence.


Vers une lecture automatique des répertoires de notaires des XIXe et XXe siècle? Le projet LECTAUREP

Par Marie-Françoise LIMONT-BONNET, Archives nationales

Dans le cadre d’un programme de recherche et développement soutenu par le département de l’innovation numérique du Ministère de la culture, les Archives nationales (Minutier central des notaires de Paris et département de la maîtrise d’ouvrage des systèmes d’information) se sont associées à INRIA pour explorer les possibilités de segmentation automatique et de reconnaissance d’écriture des répertoires de notaires, au moins pour les XIXe et XXe siècle, dans le but d’optimiser l’utilisation de ces derniers comme source d’accès aux actes notariés, bien sûr, mais aussi d’en permettre des exploitations nouvelles de type statistique ou autre. L’objectif de la communication est de présenter le projet dans son état d’avancement en avril 2019.


Une transformation numérique au service de l’usage : évolution du traitement des fonds de l’Ina

Par Eleonore ALQUIER, Institut national de l’audivisuel

Suivant un double régime de collecte (archivage des radios et télévisions publiques d’une part, et dépôt légal de la radio, de la télévision et d’une partie du web français, d’autre part), l’Institut national de l’audiovisuel enrichit aujourd’hui ses collections au rythme annuel d’un million d’heures nativement numériques. Mais disposer d’un fonds pléthorique n’a jamais suffi : il s’agit de proposer aux usagers le(s) contenu(s) précis les intéressant, du réalisateur en attente d’un gage d’authenticité dans une fiction historique, jusqu’au journaliste rêvant de l’illustration qui donnera un peu d’originalité aux « marronniers » annuels du JT, en passant par le grand-oncle dont on cherche le visage dans un jeu télévisé, ou encore l’étudiant souhaitant incarner sa problématique (historique, sociale, …) dans un corpus qu’il pourra décortiquer en quelques mois.

Les possibilités offertes par les outils numériques se situent en entrée et en sortie de chacun de ces usages. En aval, ils permettent d’interroger les métadonnées et de filtrer les résultats, jusqu’au visionnage « augmenté », qui permettra à l’usager de s’approprier le média (annotation personnalisée). En amont, les possibilités de transcription et de reconnaissance visuelle et vocale permettent d’envisager la production automatisée de métadonnées, sans qu’un professionnel n’ait eu à visionner ni à analyser « humainement » les contenus.

Quelle organisation, quelle place pour les contrôles de qualité, une fois que l’humain n’est plus le seul acteur à intervenir en production de métadonnées sur les archives dont il assure la conservation ? les modèles de description doivent-ils évoluer de manière à ne plus répondre forcément à des standards définis a priori, mais plutôt à des modes de consultation déterminés en aval par les moteurs d’interrogation ? C’est aux questions structurelles soulevées par le recours au numérique et à l’intelligence artificielle que cet exposé propose de s’intéresser, en partant des outils en vigueur et des projets en cours à l’Ina.


Comment, chez Vitam, réfléchit-on à construire l’atelier de l’archiviste dans le numérique ?

Par Mélanie REBOURS, Directrice de la Diffusion et des Partenariats, et Marion VILLE, Programme Vitam

Cette intervention est un retour d’expérience des archivistes de l’équipe Vitam sur la manière dont nous transposons l’atelier de l’archiviste dans le numérique. Ceci recouvre plusieurs aspects :

  • La méthode : Le programme Vitam est mené en « méthode Agile ». Cette méthode projet informatique impose de s’interroger de manière récurrente sur les besoins des utilisateurs, de décrire et transposer ces besoins sous forme de « user stories » compréhensibles et réalisables par des développeurs. Au vu de cette expérience, nous nous interrogerons sur la transposition, possible ou non de cette méthode dans le quotidien des archives.
  • Les processus métiers et leur transcription dans le numérique : nous ferons état de nos réflexions sur nos notions et pratiques métier existantes et les choix effectués pour les « digitaliser » : granularité plus fine de ce qu’est une archive, notions d’arborescence (plans de classement), vision métier sur les fonds numériques collectés, conservés et éliminés (registres des entrées), notion de service producteur face à celle d’application, gestion des métadonnées (riches, parfois mêmes foisonnantes), administration des référentiels, usage du SEDA (standard de données pour l’archivage), communication des archives conservées et contrôle des accès… Nous aborderons les difficultés rencontrées pour la transposition de certains processus métier dans le numérique, par exemple les éliminations.
  • L’innovation et l’expérimentation : Nous évoquerons ce que le numérique peut apporter à notre métier : recherches plus fines, meilleure vision des statistiques et des indicateurs…
  • Le savoir et le savoir-faire : Nous ferons état de constats issus de notre expérience pratique sur les compétences à acquérir pour les archivistes dans le monde du numérique.
  • La collaboration : Enfin, nous aborderons la question du travail collaboratif avec d’autres corps de métiers, les informaticiens ou les bibliothécaires par exemple, pour développer de nouvelles communautés archivistiques afin de définir nos besoins, de nouvelles pistes de collaboration et une vision prospective.

Archives et open data

La pensée archivistique au sein du mouvement international pour la transparence
Par James LOWRY, Liverpool University Centre for Archive Studies, et Céline FERNANDEZ

Sur le plan international, le mouvement de l’open government n’a pas reconnu l’importance de la gestion des documents pour la transparence et la responsabilité, entraînant des effets dommageables sur les plans stratégique et technique. Pour résoudre ce problème et améliorer la qualité des données ouvertes gouvernementales, les acteurs de la société civile ont travaillé sur plusieurs niveaux pour intégrer la prise de conscience de l’importance des archives dans ce mouvement d’ouverture.
Cette intervention présentera les travaux réalisés au niveau international pour mettre en évidence le rôle des documents et des archives dans l’ouverture du gouvernement, et notamment les efforts de la société civile au Royaume-Uni pour créer une place pour les archives dans le mouvement de l’open government, la collaboration avec le Conseil International des Archives et la Banque Mondiale pour inclure les questions liées aux archives dans les Plans d’Action Nationaux du Partenariat pour un Gouvernement Ouvert, les dialogues relatifs aux archives ouvertes dans les anciens pays soviétiques et la recherche sur les questions archivistiques techniques liées aux données ouvertes authentiques.
Cette perspective internationale donnera un contexte à de nombreuses discussions qui pourraient découler des thèmes du forum, socialement importants et opportuns.


De l’Open Data comme Commun : défi éthique et expérimentations en bibliothèques

Par Paul VILLA, ENSSIB

Cette communication est un exposé des conclusions de mon mémoire Enssib de Conservateur des bibliothèques portant sur l’Open Data au prisme des Communs. Ce mémoire, dirigé par Lionel Maurel, analyse les enjeux professionnels et éthiques qui apparaissent à partir de cette conception. La communication proposée aborde les profondes mutations de la notion de service public impliquées par l’Open Data et propose des pistes concernant des initiatives et des services émergents en bibliothèques centrés sur l’Open Data. Cette communication se veut un retour d’expériences et d’expérimentations permettant d’établir un panorama qui, espérons-le, rencontrera des échos dans le monde des archives.


Les services d’archives et l’Open data – table-ronde

Depuis le 7 octobre 2018, l’ouverture des données publiques est devenu une obligation pour toutes les institutions et collectivités locales de plus de 3500 habitants et 50 agents.   Selon l’observatoire open data des territoires de l’association OpenDataFrance, seules 343 collectivités locales avaient entrepris une démarche d’open data en octobre 2018 alors que 4150 collectivités sont concernées. Nombreux sont encore les territoires et les services qui ne répondent pas aux obligations liées à l’open data. Les archivistes peuvent pourtant une contribution majeure au développement de l’open data en France en s’appuyant sur leurs outils comme les tableaux de gestion qui fournissent un panorama des données indispensable à l’ouverture des données ou encore par leur culture de la donnée. Mais ces compétences sont encore peu reconnues des élus et des décideurs. Quelle place pourrait occuper les archivistes dans les projets open data ? Quels outils et compétences mobiliser dans l’ouverture des données ? Comment penser l’articulation entre le temps court voire l’instantanéité de l’open data avec le temps long de l’archivage ? Faut-il développer la médiation des données pour étendre l’open data au sein des services et aider le public à se saisir des données ? Voici quelques unes des questions qui seront évoquées dans cette table ronde animée par Samuel Goëta, chercheur en sociologie et co-fondateur de la coopérative Datactivist, où témoigneront :

  • Julien Benedetti, archiviste
  • Cyril Longin, directeur des archives de Saint-Etienne
  • Séverine Ménet, archiviste au Conseil Régional des Pays de la Loire

L’open data : source d’injonctions contradictoires pour le partage des données d’enquêtes en SHS?

Par Emilie FROMONT et Valentin BRUNEL, Centre de données socio-politiques (Sciences Po)

Le contexte d’open data initié, à la fois par les politiques gouvernementales et européennes, incite les institutions à rendre accessibles leurs données à différentes fins (transparence et validité des résultats scientifiques, réutilisation, etc.).
Le Centre de données socio-politiques (CDSP), unité mixte de service de Sciences Po et du CNRS, propose depuis 2006 à la communauté scientifique des services de documentation et de diffusion de matériaux d’enquêtes en sciences sociales (transcriptions d’entretiens, notes d’observations ethnographiques, brouillons de chercheurs, bases de données, résultats d’élections etc.). En 2012, le CDSP a étendu son offre de services avec l’équipement d’excellence DIME-SHS (Données Infrastructures et Méthodes d’Enquête en Sciences Humaines et Sociales) qui vise à doter la France d’une structure en matière de collecte, d’enrichissement et de diffusion des données pour la recherche en sciences humaines et sociales. DIME-SHS propose des ressources aux chercheurs pour produire ou réutiliser des sources dont la qualité repose sur une grande rigueur méthodologique.
Pour effectuer ce travail de documentation, de diffusion et d’archivage de ces archives d’enquêtes différents profils (archiviste, documentaliste, survey managers, data managers, développeurs) interviennent au cours du cycle de vie des données et tentent ainsi de répondre aux défis du numérique et de la mise à disposition.
Cette communication propose un retour d’expérience sur le travail commun effectué au CDSP afin de répondre aux défis de l’open data (rendre accessible à tous des données compréhensibles et intelligibles dans des formats pérennes) tout en respectant des injonctions pouvant parfois sembler contradictoires (mise en place du RGPD, protection des données personnelles ou sensibles).


Ouvrir les archives dans une perspective d’open data : le projet open archives

Par Guillaume LEBORGNE et Agnès D’ANGIO-BARROS, SNCF

Avec 212 jeux de données ouverts, SNCF est l’entreprise leader en matière d’open data en France. Lancée en 2014, la démarche de transparence SNCF vise à ouvrir le plus grand nombre de documents et données d’entreprise en open data, par esprit de redevabilité de grande entreprise publique, et surtout pour montrer la réalité de ce qu’est SNCF, et générer le changement.
Le site Open Archives a été lancé en septembre 2016 avec un millier de documents. Ce site permet un accès facilité, à une part des collections du services d’archives de la SNCF (SARDO) dont les archive historiques sont conservées au Mans et les images et vidéos à la Médiathèque à Saint Denis. La valorisation numérique des fonds du SARDO permet de montrer l’importance du travail de conservation et de rendre accessibles nos archives à un public de passionnés et de spécialistes du train.
En permettant l’accès en Open Data à une partie des fonds conservés par les Archives SNCF, le site Open archives accompagne la démarche de Transparence de l’entreprise et encourage les réutilisations. L’internaute peut en effet télécharger les documents et les réutiliser librement (à l’exception d’une utilisation commerciale).
Ce travail de valorisation a été mené de manière scrupuleuse, collaboration fructueuse entre archivistes, communiquants et spécialistes de l’ouverture des données.