4 – Chaînes d’outils logiciels¶
| Produit de recherche | Description | Équipe | Nature des données | Formats / standards | Volumétrie | Intégration | Politique de partage | Politique de conservation à long terme | Codes sources | Licence constatée |
|---|---|---|---|---|---|---|---|---|---|---|
| Collatinus | Lemmatiseur et analyseur morphologique de textes, version bureau latins (boîte à outils Baobab) | Développeur open source + Phlam | Codes informatiques | Qt (C++) | non connu | B1, référencé | Installateurs téléchargeables sur le site Baobab + paquet disponible dans les dépôts Debian – Code source disponible sur Github (GNU General Public License v3.0) | Software Heritage | https://github.com/biblissima/collatinus | - |
| Collatinus-web | Lemmatiseur et analyseur morphologique de textes latins, version web | Développeur open source + Phlam + Equipe Biblissima | Codes informatiques | Qt (C++), PHP, Javascript | non connu | B1, référencé | Démon C++ (partie serveur) disponible dans une branche du dépôt collatinus (cf. ci-dessus) – Application web (partie cliente) intégrée dans un conteneur Jekyll téléchargeable via Github | Software Heritage | https://github.com/biblissima/collatinus/tree/Daemon | - |
| Eulexis | Logiciel de lemmatisation de textes en grec ancien, version bureau | Phlam | Codes informatiques | Qt (C++) | non connu | B1, référencé | Installateurs téléchargeables sur le site Baobab – Code source disponible sur Github (GNU General Public License v3.0) | Software Heritage | https://github.com/PhVerkerk/Eulexis_off_line | - |
| Eulexis-web | Logiciel de lemmatisation de textes en grec ancien, version web | Phlam + Équipe Biblissima | Codes informatiques | PHP, Javascript | non connu | B1, référencé | Application PHP et Javascript, intégrée dans un conteneur Jekyll téléchargeable via Github | Software Heritage | https://gitlab.huma-num.fr/biblissima/outils.biblissima/-/tree/master/eulexis-web | - |
| Développement d’Eulexis | Intégration des données et fonctionnalités du lemmatiseur Hisoma dans Eulexis | HiSoMA, Phlam | Données textuelles | .csv | 50.000 couples lemmes-formes, et autres enrichissements | B+, à intégrer | Licence ouverte | via Eulexis | - | - |
| Praelector | Assistant de lecture du latin (version en test) | Développeur open source | Codes informatiques | Qt (C++) | 5 Mo | B1, référencé | Version à télécharger sur le site Biblissima, sources sur Debian Gitlab. Licence GNU GPL v3. | Software Heritage auto | https://salsa.debian.org/georgesk/praelector | - |
| Schémas reliures | Schéma d’encodage TEI formalisé et documenté pour les reliures de livres anciens | BNF - Réserve des livres rares | Données textuelles formalisées | ODD (XML-TEI) | 1 fichier source ODD + déclinaisons dans .xsd, .rng, etc. | B1, référencé | Présentation et lien de téléchargement publié sur le site de la BNF et sur le site Biblissima | Utilisation du format ODD (utilisé par le CINES pour traiter la TEI) | https://doi.org/10.5281/zenodo.14847308 | - |
| Outils d’édition XML | Environnement d’encodage via des interfaces conviviales - PDN Caen et Certic | PDN et Certic (Caen) | Données textuelles formalisées, codes informatiques | XML-TEI, XML-EAD, JAVA | non connu | B1, référencé | Diffusion au téléchargement sur le site des Presses Document numérique de l’université de Caen (PDN). Licences : Cecill (catalogage EAD) GNU GPL v3 (Inventaires anciens en XML-TEI) et Cecill-C (Pluco) | Non connu | https://mrsh.unicaen.fr/pluridisciplinaire/pole-document-numerique/outils/ | - |
| Outil Thecae | Application web MaX de publication de la collection La collection Thecae, Corpus d’inventaires anciens de livres manuscrits et imprimés | PDN de Caen | Codes informatiques | XQuery, XML, HTML, CSS, Javascript | non connu | B1, référencé | Non partagé | Non connu | - | - |
| MaX | Moteur d’affichage XML (application web BaseX préconfigurée et personnalisable) | PDN de la MRSH et Certic (Caen) | Codes informatiques | XQuery, XML, HTML, CSS, Javascript | 2 Mo | B1, référencé | Diffusion sur la plateforme Gitlab de l’Université de Caen, sous licence Cecill-B | Software Heritage | https://git.unicaen.fr/pdn-certic/MaX | - |
| Protocoles et outils pour les corpus et éditions XML | DoTS | CJM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | https://github.com/chartes/dots ; https://github.com/chartes/dots_documentation ; https://dots.chartes.psl.eu/vue-demo/ | - |
| Protocoles et outils pour les corpus et éditions XML | Développements pour TEI Publisher | HiSoMA | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Protocole d’encodage des citations de la Bible | HiSoMA, cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Nouveaux environnement de balisage et de publication | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Développement de configurations types pour le moteur d’affichage Max | IRHT, MRSH de Caen | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Configuration de pluCo pour Oxygen (manuel) | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Développement de configurations types pour le moteur d’affichage Max | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Développement d’une solution conviviale pour le travail collaboratif dans Oxygen | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Chaînage d’outils d’édition : développement applicatif | CJM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Protocoles et outils pour les corpus et éditions XML | Amélioration incrémentielle d’un plugin TEI pour un éditeur XML libre (JEdit) en lien avec le plugin pluCo | CIHAM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage | - | - |
| Portail du laboratoire d’édition et d’annotation de sources | Espace d’expérimentations et de développement d’interfaces d’encodage et de publication, | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques, données textuelles formalisées | XQuery, XML, HTML, CSS, Javascript, IIIF, DTS | non connu | B+, non intégré | à définir, le travail sur les sources reste travail sur les sources restera protégé par le droit d’auteur | Software Heritage | - | - |
| Portail du laboratoire d’édition et d’annotation de sources | tests sur les sources encodées en XML-TEI et réflexion avec le PDN et les autres partenaires sur l’outillage des sources, | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques, données textuelles formalisées | varia | non connu | N / A | N / A | N / A | - | - |
| Portail du laboratoire d’édition et d’annotation de sources | Réflexions communes sur les méthodologies d’encodage | IRHT | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | CC By à définir | non connu | - | - |
| Portail du laboratoire d’édition et d’annotation de sources | Protocole d’encodage des citations de la Bible | HiSoMA, cluster 5b | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | non connu | non connu | - | - |
| Portail du laboratoire d’édition et d’annotation de sources | Schémas documentés | CJM | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | non connu | non connu | - | - |
| Développement d’outils innovants pour les recherches de l’IRHT sur les textes latins et français | Classification des éléments graphiques (pages et zones de pages) – Catalogage automatique des manuscrits numérisés : identification des textes issus de HTR par comparaison avec référentiels textuels – Reconnaissance d’entités nommées et alignement sur des référentiels | IRHT - TEKLIA | données textuelles formalisées | non connu | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | - | - |
| Développement de TELMA-ANACLET | ANalyse Approfondie de Corpus éLEctroniques Textuels : traitement a posteriori des données par l’utilisateur | IRHT | codes informatiques | CMS ? | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | - | - |
| Développement de Kraken | Développement et maintenance de la suite d’outils Kraken (Cluster 3) | AOROC | codes informatiques | python | non connu | Voir le PGD particulier du livrable – Archive de modèles sur Zenodo | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | https://kraken.re/; https://github.com/mittagessen/kraken ; https://gitlab.com/scripta/escriptorium | - |
| Reconnaissance automatisée de coins monétaires | Réalisation d’un système automatique de reconnaissance des coins monétaires antiques (cluster X) | AOROC/Ecole des Mines de Paris | codes informatiques | non connu | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | - | - |
| Ressources computationnelles pour le traitement automatique des langues historiques à forte variation graphique | Mise à disposition d’outils et de modèles - utilisation de l’outil Pie pour entraîner les modèles | CJM | codes informatiques | python | non connu | Voir le PGD particulier du livrable | Github, CC By | Zenodo | - | - |
| DeNotEM | Reconnaissance automatique de la notation musicale ancienne dans les sources manuscrites du Moyen Âge et de la Renaissance | CESR | codes informatiques | python | non connu | B+, référencé | Github | Software Heritage | https://github.com/Biblissimacluster6/Beyond-DIAMMtoIIIF-DeNotEM | - |
| DIAMMtoIIIF | Génération de manifestes IIIF à partir des données de l’API de la base de données DIAMM (Digital Image Archive of Medieval Music) et des serveurs de plusieurs bibliothèques telles que la BnF et la Bayerische Staatsbibliothek | CESR | codes informatiques | python | non connu | B+, référencé | Github | Software Heritage | https://github.com/Biblissimacluster6/DIAMMtoIIIF | - |
Dernière mise à jour:
October 23, 2023