4 – Chaînes d’outils logiciels¶
Produit de recherche | Description | Équipe | Nature des données | Formats / standards | Volumétrie | Intégration | Politique de partage | Politique de conservation à long terme |
---|---|---|---|---|---|---|---|---|
Collatinus | Lemmatiseur et analyseur morphologique de textes, version bureau latins (boîte à outils Baobab) | Développeur open source + Phlam | Codes informatiques | Qt (C++) | non connu | B1, référencé | Installateurs téléchargeables sur le site Baobab + paquet disponible dans les dépôts Debian – Code source disponible sur Github (GNU General Public License v3.0) | Software Heritage |
Collatinus-web | Lemmatiseur et analyseur morphologique de textes latins, version web | Développeur open source + Phlam + Equipe Biblissima | Codes informatiques | Qt (C++), PHP, Javascript | non connu | B1, référencé | Démon C++ (partie serveur) disponible dans une branche du dépôt collatinus (cf. ci-dessus) – Application web (partie cliente) intégrée dans un conteneur Jekyll téléchargeable via Github | Software Heritage |
Eulexis | Logiciel de lemmatisation de textes en grec ancien, version bureau | Phlam | Codes informatiques | Qt (C++) | non connu | B1, référencé | Installateurs téléchargeables sur le site Baobab – Code source disponible sur Github (GNU General Public License v3.0) | Software Heritage |
Eulexis-web | Logiciel de lemmatisation de textes en grec ancien, version web | Phlam + Équipe Biblissima | Codes informatiques | PHP, Javascript | non connu | B1, référencé | Application PHP et Javascript, intégrée dans un conteneur Jekyll téléchargeable via Github | Software Heritage |
Développement d’Eulexis | Intégration des données et fonctionnalités du lemmatiseur Hisoma dans Eulexis | HiSoMA, Phlam | Données textuelles | .csv | 50.000 couples lemmes-formes, et autres enrichissements | B+, à intégrer | Licence ouverte | via Eulexis |
Praelector | Assistant de lecture du latin (version en test) | Développeur open source | Codes informatiques | Qt (C++) | 5 Mo | B1, référencé | Version à télécharger sur le site Biblissima, sources sur Debian Gitlab. Licence GNU GPL v3. | Software Heritage auto |
Schémas reliures | Schéma d’encodage TEI formalisé et documenté pour les reliures de livres anciens | BNF - Réserve des livres rares | Données textuelles formalisées | ODD (XML-TEI) | 1 fichier source ODD + déclinaisons dans .xsd, .rng, etc. | B1, référencé | Présentation et lien de téléchargement publié sur le site de la BNF et sur le site Biblissima | Utilisation du format ODD (utilisé par le CINES pour traiter la TEI) |
Outils d’édition XML | Environnement d’encodage via des interfaces conviviales - PDN Caen et Certic | PDN et Certic (Caen) | Données textuelles formalisées, codes informatiques | XML-TEI, XML-EAD, JAVA | non connu | B1, référencé | Diffusion au téléchargement sur le site des Presses Document numérique de l’université de Caen (PDN). Licences : Cecill (catalogage EAD) GNU GPL v3 (Inventaires anciens en XML-TEI) et Cecill-C (Pluco) | Non connu |
Outil Thecae | Application web MaX de publication de la collection La collection Thecae, Corpus d’inventaires anciens de livres manuscrits et imprimés | PDN de Caen | Codes informatiques | XQuery, XML, HTML, CSS, Javascript | non connu | B1, référencé | Non partagé | Non connu |
MaX | Moteur d’affichage XML (application web BaseX préconfigurée et personnalisable) | PDN de la MRSH et Certic (Caen) | Codes informatiques | XQuery, XML, HTML, CSS, Javascript | 2 Mo | B1, référencé | Diffusion sur la plateforme Gitlab de l’Université de Caen, sous licence Cecill-B | Non connu |
Protocoles et outils pour les corpus et éditions XML | Service de partage de textes DTS | CJM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Développements pour TEI Publisher | HiSoMA | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Protocole d’encodage des citations de la Bible | HiSoMA, cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Nouveaux environnement de balisage et de publication | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Développement de configurations types pour le moteur d’affichage Max | IRHT, MRSH de Caen | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Configuration de pluCo pour Oxygen (manuel) | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Développement de configurations types pour le moteur d’affichage Max | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Développement d’une solution conviviale pour le travail collaboratif dans Oxygen | IRHT cluster 5b | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Chaînage d’outils d’édition : développement applicatif | CJM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Protocoles et outils pour les corpus et éditions XML | Amélioration incrémentielle d’un plugin TEI pour un éditeur XML libre (JEdit) en lien avec le plugin pluCo | CIHAM | Codes informatiques | XQuery, XML, HTML, CSS, Javascript, JAVA | non connu | B+, non intégré | Diffusion sur Github, licences open source à définir au cas par cas (CC BY ou licence ouverte la plupart du temps) | Software Heritage |
Portail du laboratoire d’édition et d’annotation de sources | Espace d’expérimentations et de développement d’interfaces d’encodage et de publication, | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques, données textuelles formalisées | XQuery, XML, HTML, CSS, Javascript, IIIF, DTS | non connu | B+, non intégré | à définir, le travail sur les sources reste travail sur les sources restera protégé par le droit d’auteur | Software Heritage |
Portail du laboratoire d’édition et d’annotation de sources | tests sur les sources encodées en XML-TEI et réflexion avec le PDN et les autres partenaires sur l’outillage des sources, | PDN de la MRSH de Caen, CRAHAM, cluster 5b | Codes informatiques, données textuelles formalisées | varia | non connu | N / A | N / A | N / A |
Portail du laboratoire d’édition et d’annotation de sources | Réflexions communes sur les méthodologies d’encodage | IRHT | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | CC By à définir | non connu |
Portail du laboratoire d’édition et d’annotation de sources | Protocole d’encodage des citations de la Bible | HiSoMA, cluster 5b | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | non connu | non connu |
Portail du laboratoire d’édition et d’annotation de sources | Schémas documentés | CJM | Codes informatiques, données textuelles formalisées | XML/TEI, ODD | non connu | N / A | non connu | non connu |
Développement d’outils innovants pour les recherches de l’IRHT sur les textes latins et français | Classification des éléments graphiques (pages et zones de pages) – Catalogage automatique des manuscrits numérisés : identification des textes issus de HTR par comparaison avec référentiels textuels – Reconnaissance d’entités nommées et alignement sur des référentiels | IRHT - TEKLIA | données textuelles formalisées | non connu | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable |
Développement de TELMA-ANACLET | ANalyse Approfondie de Corpus éLEctroniques Textuels : traitement a posteriori des données par l’utilisateur | IRHT | codes informatiques | CMS ? | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable |
Développement de Kraken | Développement et maintenance de la suite d’outils Kraken (Cluster 3) | AOROC | codes informatiques | voir eScriptorium – Python ? XML ALTO ? | non connu | Voir le PGD particulier du livrable – Archive de modèles sur Zenodo | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable |
Reconnaissance automatisée de coins monétaires | Réalisation d’un système automatique de reconnaissance des coins monétaires antiques (cluster X) | AOROC/Ecole des Mines de Paris | codes informatiques | non connu | non connu | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable | Voir le PGD particulier du livrable |
Ressources computationnelles pour le traitement automatique des langues historiques à forte variation graphique | Mise à disposition d’outils et de modèles - utilisation de l’outil Pie pour entraîner les modèles | CJM | codes informatiques | python | non connu | Voir le PGD particulier du livrable | Github, CC By | Zenodo |
Dernière mise à jour:
October 23, 2023