Des nouvelles du projet (2/2) : l’entrepôt de données de Recherche Data Gouv

L'entrepôt de données de Recherche Data Gouv est développé par une équipe projet réunissant plusieurs établissements autour d’INRAE : Université Grenoble Alpes, Université de Lorraine, Université de Strasbourg, Université Paris-Nanterre, Université Paris Cité, CNRS et Université de Lille.

Cette équipe pluri-établissements a fait évoluer l’entrepôt INRAE vers un entrepôt national fédéré des données de la recherche. Les établissements d’enseignement supérieur et de recherche et organismes qui le souhaitent, pourront disposer d’un espace institutionnel pour ouvrir ou partager les données de leurs recherches. La fédération de ces espaces au sein d’un seul entrepôt offrira à chaque établissement son autonomie dans l’administration et la curation des données sans avoir la charge de l’administration technique de la solution Dataverse. Cet entrepôt fédéré permettra, dès l’été 2022 de publier et découvrir les données de recherche ouvertes ou partagées par les établissements. En 2023, il sera complété par un catalogue des données qui moissonnera et signalera les données publiées sur des entrepôts externes.

L’entrepôt fédéré des données est déjà fonctionnel et disponible pour les établissements participant au projet afin qu’ils déposent et publient leurs données en amont de l’inauguration officielle (annonce du save the date très prochainement dans une nouvelle actualité).

Que s’est-il passé depuis le début des travaux en septembre 2021 :

  • Un audit technique de l’infrastructure d’hébergement de l’entrepôt Dataverse INRAE a été réalisé. Les recommandations de cet audit ont été mises en œuvre afin de sécuriser la disponibilité et la préservation des données ;
  • L’entrepôt Dataverse a été conçu et développé afin de fédérer des espaces de données dont chaque établissement sera responsable de l'administration et de la curation des données de son espace ;
  • La saisie (dépôt) anticipée des données des partenaires actuels du projet dans leurs espaces de l’entrepôt ;
  • La préparation des guides, des supports de formations, des chartes pour accompagner les utilisateurs de l’entrepôt ;
  • L’organisation du centre de ressources Entrepôt qui développe et gère techniquement la solution, crée les espaces institutionnels, assiste et forme des administrateurs d’espaces institutionnels, cure les jeux de données de l’espace générique dans lequel les utilisateurs ne disposant pas d’un espace institutionnel pourront déposer et publier leurs données ;
  • Le développement du portail recherche.data.gouv.fr qui rassemble, décrit et donne accès à l'ensemble des modules de Recherche Data Gouv.

A partir de l’ouverture, les établissements qui le souhaiteront pour faire une demande de création d’espace de données.