Aller au contenu

Stockage et sauvegarde pendant le processus de recherche

A/ Stockage et politique de sauvegarde

Les données du périmètre P1 sont sauvegardées pendant le projet à différents niveaux1.

Cluster de données

Les serveurs qui hébergent l’infrastructure du portail et ses différentes applications font l’objet de snapshots (instantanés) automatiques journaliers.

Les bases de données sous-jacentes du portail (PostgreSQL) et de IIIF-Collections (ElasticSearch) ne sont pas sauvegardées automatiquement, les snapshots évoqués ci-avant étant jugés suffisants. De toute façon ces bases de données restent « statiques », en ce sens qu’elles n’évoluent que lorsque l’on décide d’une mise à jour. Ainsi la dernière version des données importées dans ces bases est toujours ce qui fait foi, et peut à tout moment être réimportée. Ces données (XML pour le portail, et CSV pour IIIF-Collections) sont stockées dans l’espace Seafile de l’équipe hébergée au Campus Condorcet.

Méthodes, protocoles et scripts utilisés pour la normalisation, l’alignement, l’ingestion des ressources dans le portail et l’enrichissement des référentiels

Les codes informatiques de logiciels et scripts sont gérés via la plateforme d’hébergement de code source Gitlab (sur l’instance proposée par Huma-Num). Une partie des dépôts est gérée et diffusée sur la plateforme Github afin d’augmenter leur visibilité et faciliter d’éventuelles contributions extérieures.

Les dépôts de codes et l’ensemble des répertoires de travail sont présents sur les ordinateurs professionnels des membres de l'équipe portail, qui sont au nombre de 3 : - MacBook Pro (chef de projet), - MacBook Air (responsable des référentiels d’autorité et des traitements), - MacBook Pro (développeur).

Chaque membre de l’équipe dispose d’un disque dur externe pour la sauvegarde de ses fichiers, mais en principe l’intégralité des fichiers est toujours stockée dans un espace partagé sur les serveurs de l’infrastructure numérique du Campus Condorcet au sein du service de Drive Seafile. Tous ces fichiers sont synchronisés et donc sauvegardés à distance chaque jour. La politique de sauvegarde du Campus Condorcet en ce qui concerne Seafile n’est pas connue.

B/ Mesures concernant la sécurité des données et la protection des données sensibles

Récupération des données en cas d’incident

En cas d’incident, les données seront récupérées avec l’aide du Pôle numérique du Campus Condorcet en charge de l’administration système, en s’appuyant sur les snapshots effectués chaque jour pour chacun des serveurs de Biblissima+.

Tous les codes sources hébergés dans Gitlab ou Github seront récupérés à partir des dépôts distants et réinstallés facilement selon les procédures communes de ce type d’outils de gestion de codes informatiques.

Sécurité et protection de données sensibles

Le cluster de données ne comporte pas de données sensibles : les informations collectées ou produites ne révèlent pas la prétendue origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques ou l'appartenance syndicale. Elles ne comportent pas de données génétiques, de données biométriques, de données concernant la santé, la vie sexuelle ou l'orientation sexuelle d'une personne physique.

Droits d’accès

Le tableau ci-dessous détaille l’organisation des répertoires où sont stockées les données sur les serveurs du Campus Condorcet (Drive Seafile).

Type Bibliothèque ou répertoire Seafile Droits d’accès et niveau de droits
Cluster de données bbma-data Équipe technique Biblissima+
Codes informatiques BB - Scripts Équipe technique Biblissima+
Plateforme de référentiels BB - Scripts/data.biblissima Équipe technique Biblissima+
IIIF-Collections BB - Scripts/iiif-index-data Équipe technique Biblissima+
Espaces de travail de l’équipe portail BB - Espace de travail Équipe technique Biblissima+

  1. L'hébergement de l’infrastructure technique est opéré par le Pôle Numérique de l'établissement public Campus Condorcet. 


Dernière mise à jour: October 13, 2023