Aller au contenu

1 – Infrastructure numérique

Produit de recherche Description Nature des données Formats / standards Volumétrie Politique de partage Politique de conservation à long terme Actions de Fairisation à mener
Cluster de données (Portail) Données importées dans le Portail (base Postgresql), publiées via l’application web CubicWeb (Python) Données textuelles formalisées MARC, XML, SQL, RDF 776 231 entités (25/10/2023), pour 1,5 Go de données XML Publication des données via le Portail, exposition de données dans le Web sémantique. Partage via les dépôts des jeux de données au format pivot et enrichis. Archivage en fin de projet d’un export des données au format RDF sur Zenodo. Les ressources issues des partenaires sont déposées de manière autonome par leur producteurs à chaque version majeure (cf. processus d’intégration de sources de données dans le portail). Préparer l’archivage final à la fin du projet en même temps que les spécifications des développements technologiques de l’infrastructure héritée de Biblissima 1. Sur les notices de ressources afficher les DOI des dépôts des jeux de données.
Cluster de données (IIIF-Collections) Données importées dans IIIF-Collections (ElasticSearch), publiées via une application PHP Données textuelles formalisées CSV, JSON 89 613 items (25/10/2023) Publication des données via le site IIIF-Collections Les données vont être transformées en XML et versées dans le Portail (cf. ligne ci-dessus) N / A
Interfaces et applications web Moteurs d’indexation et interfaces de recherche et de visualisation des données (Portail et IIIF-Collections), développées en interne et en lien avec des prestataires. Intégration de la recherche sur les matériaux dans l’interface du portail (avec CRC) Codes informatiques PHP, Python, JSON, Javascript Portail : ~500Mo de code + ~5.5Go de caches et tests d’import – IIF Collections (app web) : ~1Go Via Github / Gitlab et Zenodo pour les versions majeures Moissonnage par l’archive pérenne de logiciels Software Heritage. Les logiciels ou modules dotés d’un potentiel de réutilisation dans la communauté feront l’objet d’un dépôt avec métadonnées modéré via la voie couplée HAL + Software heritage N / A
Visualiseur d’images Mirador Version packagée du visualiseur (avec des plugins) pour le Portail Biblissima Codes informatiques Javascript, IIIF ~13 Mo Github / Gitlab N / A N / A
Plateforme des référentiels et ses API data.bilissima.fr Plateforme d’édition et d’exposition des référentiels d’autorités Codes informatiques Wikibase, PHP ~1.1Go Utilisationd de la technologie Wikibase afin de créer un “hub” d’identifiants et de données structurées, accessibles, interopérables et réutilisables. Le hub donne les PIDs des entités (URIs déréférençables) et de leur documentation pour les utilisateurs et via une API web et un Sparql endpoint pour l’accès distant à des programmes informatiques. N / A Non
Référentiels d’autorité et thésaurus iconographique Vocabulaires contrôlés pour lier entre elles les ressources du portail intégrées au cluster de données Données textuelles formalisées RDF, Json 5 Go pour l’ensemble Dépôt des versions majeures de dumps RDF par référentiel. Archivage en fin de projet d’un export des données au format RDF sur Zenodo. Rédaction d’un data paper par référentiel après dépôt.
Études, cahiers des charges, spécifications, documentation des processus, etc. Documentation interne des développements informatiques Données textuelles .docx, .pdf, .md N / A Non partagé a priori, peut être inclus dans les dépôts des codes sources si utile à l’intelligibilité des données. Non sauf si intégré à la documentation d’un dépôt archivé. N / A

Dernière mise à jour: October 23, 2023