Définition et objectifs d’un plan de gestion des données¶
Un plan de gestion des données (PGD) permet de consigner dans un document centralisé toutes les informations importantes sur les données d’un projet de recherche. Il décrit la manière dont elles seront traitées au long de leur cycle de vie, de l’étape initiale de collecte ou de production, à l’étape finale de publication ou d’archivage, en passant par les différents stades de gestion proprement dite comme le classement, la structuration, le stockage, le traitement ou analyse à l’aide d’outils numériques… Dans un contexte de généralisation du numérique au sein des activités de recherche, l’enjeu est de limiter les risques d’obsolescence technologique, de perte ou de gaspillage de ressources afin de garantir que les données sous-jacentes aux résultats scientifiques pourront être effectivement diffusées, partagées et réutilisées, que ce soit au bénéfice d’autres recherches ou de la société tout entière. Le but d’un PGD est avant tout de faciliter et d’optimiser cette gestion en permettant l’anticipation des actions de structuration et de description. Les données jouent en effet un rôle clé pour l’intégrité scientifique. Leur conservation sous une forme intelligible et exploitable numériquement requiert une planification d’actions concrètes qui est le but du PGD.
Au cours du projet de recherche, le PGD est actualisé en continu pour enregistrer les informations concrètes liées à la mise en œuvre des décisions. En conséquence, son rôle et ses utilisations évoluent dans le temps. Au début du projet, sa fonction principale est de fournir un outil de pilotage et d’aide à la décision. Il s’agit de guider les choix opérationnels de « curation », autrement dit la combinaison d’actions d’intendance et de documentation leur permettant de conserver leur intelligibilité et utilité, aussi longtemps que nécessaire. À la fin du projet de recherche, le PGD s’est enrichi de toutes les informations concrètes sur ce qui a été fait. Il prend aussi en compte les nécessaires adaptations ou réorientations par rapport à ce qui avait été prévu. Il devient alors un élément essentiel pour comprendre le contexte de production des données et en constitue l’historique documenté, afin de fournir les conditions nécessaires à la vérification de l’intégrité scientifique des résultats ou à la production de nouvelles recherches à partir d’elles.
Un PGD doit expliciter de manière synthétique les choix techniques, juridiques et organisationnels concernant les données. 6 dimensions principales sont à prendre en compte :
-
L’identification des principaux produits de recherche créés ou collectés durant le projet, principalement numériques : regroupements ou sets de données dits « jeux de données », codes sources de logiciels et scripts, protocoles, méthodes et procédures, etc. ;
-
La définition des modalités d’organisation et de description normalisées via des métadonnées ;
-
Le stockage et la sécurité des données ;
-
Les objectifs concernant la diffusion, le partage ou l’archivage final, en expliquant le degré d’ouverture choisi, les durées de rétention visées, la nécessité ou non d’un archivage numérique pérenne ;
-
Les informations sur les questions éthiques, la présence de données sensibles, la justification des restrictions à la diffusion ouverte (open data) ;
-
Les ressources prévues pour la mise en œuvre du plan (moyens financiers ou temps de travail des chercheurs et ingénieurs impliqués).
Un PGD est enfin le fruit d’une coopération inter-métiers entre scientifiques, informaticiens, documentalistes, archivistes et éditeurs qui peuvent participer à des degrés divers à son élaboration et à sa mise à jour. Quand elle est correctement mise en œuvre, cette dimension collaborative du PGD peut jouer un rôle particulièrement utile pour contribuer à forger une vision commune au sein d’une équipe. Le PGD offre en effet, sous l’angle spécifique des données et des procédures numériques, une vision d’ensemble du projet à la fois synthétique et concrète. Il peut ainsi faciliter grandement l’intégration des nouveaux collaborateurs ou collaboratrices. Il peut aussi servir de document de référence pour transmettre de manière efficace des informations clé pour comprendre le socle technique du projet.