Aller au contenu

Exigences minimales

Les jeux de données produits dans le cadre de Biblissima+ susceptible d’être déposés dans une plateforme de partage ou d’archivage de données suivent les consignes de gestion et de préparation des dépôts qui sont décrites ci-après.

Il est recommandé aux équipes partenaires de s’appuyer sur ces dispositions pour rédiger les PGDs particuliers de livrables.

Nommage des fichiers

Le nommage cohérent et signifiant des noms de fichiers facilite leur classement et permet d’appréhender leur contenu sans avoir à les ouvrir.

Les bonnes pratiques recommandées sont :

  • D’éviter les noms trop longs (tout en restant descriptif et clair) ;
  • D’éviter les espaces (en utilisant les tirets - et _ comme séparateurs) ;
  • D’éviter les caractères non alphanumériques (notamment : & / + > : ? % ( ] ) ;
  • De normaliser les dates dans le format recommandé par la norme internationale ISO 8601 : YYYY-MM-DD (year-month-day ou année-mois-jour) ;
  • D’indiquer la version .

Il est demandé de suivre le schéma de nommage ci-dessous, en particulier pour les jeux de données ayant vocation à être traités par l’équipe portail :

  • codeDuLivrable1_initiales2_dataset_version_dateDeDépôt

Un exemple de nom de jeu de données en suivant ce schéma pourrait être :

  • VB_67_CNRS_LM_reperageIntextualite_V1_2027-12-01

Préparation d’un dépôt

Un espace collaboratif Sharedocs Huma-Num sera ouvert pour chaque cluster qui le demande. L’usage d’un tel espace n’est pas obligatoire, mais il permet de travailler collectivement sur la préparation de sets de fichiers à déposer, pendant une période transitoire. Ils n’ont en effet pas vocation à assurer un stockage des données sur une longue durée. Sharedocs offre un espace sécurisé pour rassembler, documenter, tester et compléter les ensembles constitués spécifiquement pour les dépôts. Ces espaces peuvent être ouverts à des tiers.

Il est recommandé d’organiser les espaces des clusters sur le même modèle de structuration afin de faciliter les échanges avec l’équipe portail ou entre clusters.

Cluster-X
 |__ 1_depots_en_cours
 |__ 2_autres_activites
 |__ 3_ressources
 |__ 4_archives
Le répertoire « Ressources » permettra de partager des modèles, des gabarits de fichiers (README, LICENSES, dictionnaires de données, etc.) partageables pour les différents projets et livrables rattachés au cluster.

Description d’un jeu de données

  • Caractérisation des données (types, provenance, formats et standards) ;
  • Origine et finalité ;
  • Périmètre d’usage (nature, étendue…) ;
  • Lien avec des publications scientifiques de type communication, article, chapitre d’ouvrage, ouvrage ou datapaper ;
  • Potentiel d’intégration dans d’autres projets ou outils et de réutilisations en général.

Standards de données et de métadonnées

Citer les standards de données et de métadonnées utilisés.

Le cas échéant, expliquer l’absence de recours à des standards.

Partage de données

Indiquer comment les données seront partagées :

  • Comment est organisé l’accès (plateforme, protocole) ;
  • Périodes d’accès restreint avant diffusion ouverte (le cas échéant) ;
  • Mécanismes de dissémination ;
  • Outils nécessaires à l’exploitation des données (le cas échéant) ;
  • Désignation de la plateforme de dépôt.

Si le jeu de données n’est pas partagé, en expliquer les raisons (charte éthique, réglementation concernant la présence de données personnelles, propriété intellectuelle ou commerciale, données sensibles, confidentialité ou sécurité).

Archivage et préservation

Indiquer comment les données seront archivées et préservées à la fin du projet.

Si des procédures d’archivage à long terme sont mises en place (par exemple dans le cadre d’une convention avec Huma-Num et le CINES), spécifier la durée pendant laquelle les données devront être préservées, avec des indications sur les volumes à traiter et la manière dont les coûts seront pris en charge.

Publication des PGDs particuliers

Il est demandé de déposer les PGDs particuliers dans les communautés Zenodo de Biblissima+ (espace général et du cluster correspondant).

Il est recommandé de rendre le document public et de le mettre tous les deux ans, un mois avant la date de rendu du PGD principal à l’ANR avec possibilité d’accès en lecture pour l’équipe technique et le bureau exécutif.


  1. Pour la référence aux livrables, voir la table de référence dans l’annexe 

  2. Initiale du créateur du fichier ou du responsable technique et scientifique. 


Dernière mise à jour: October 20, 2023