Date limite de soumission : 15 avril 2026
Ces dernières années, le domaine des études manuscrites a été profondément transformé par le succès du deep learning. Des outils comme Transkribus, Arkindex, eScriptorium et divers autres moteurs OCR/HTR ont atteint un niveau de maturité tel que des transcriptions « quasi parfaites » d’écritures historiques complexes ne relèvent plus du rêve lointain, mais d’une réalité quotidienne et à toutes les échelles, depuis la transcription de documents isolés jusqu'à la création de corpus massifs. Après la phase héroïque de la reconnaissance automatique des écritures manuscrites, un changement de paradigme s'est fait jour et la question demeure : et après ?
Il ne s’agit plus seulement de transcrire mieux, mais de comprendre comment l’ATR transforme les régimes de preuve, d’autorité, d’éditorialisation et d’interprétation en sciences historiques. La généralisation de l’ATR à grande échelle ouvre un nouveau champ de recherche : celui des usages secondaires, critiques et épistémologiques des données produites par des modèles d’IA.
Une fois l’encre numérique séchée et des millions de tokens de texte interrogeable disponibles, comment cela transforme-t-il notre manière d’interagir avec le passé ? Cette conférence propose d’explorer la « vie après » des données ATR (Automatic Text Recognition). Nous souhaitons dépasser les obstacles techniques liés aux taux d’erreur de caractères pour entrer dans les domaines de l’analyse de données massives, du catalogage automatisé, des éditions numériques, de la découverte archivistique et des nouvelles méthodologies de recherche.
Le Cluster 3 de Biblissima+ invite chercheur:ses, bibliothécaires, informaticien:nes et spécialistes des humanités numériques à soumettre des propositions portant notamment sur les trois grandes thématiques suivantes :
(1) Les nouveaux usages du texte : Du texte au savoir (structuration, modélisation, interopérabilité) ; Post-traitement & LLMs ; Lecture distante et catalogage automatisé ; Éditions savantes et critique
(2) Matérialité et histoire des objets écrits : Nouvelle paléographie computationnelle ; Texte, matérialité et image
(3) Enjeux patrimoniaux, épistémologiques et éthiques : Épistémologie et éthique ; Une politique patrimoniale durable de l’ATR
En particulier, nous proposons d’explorer ces thématiques sous les angles suivants :
Les nouveaux usages du texte
- Du texte au savoir : structuration, modélisation, interopérabilité
Comment transformer une masse de texte brut en un écosystème de connaissances exploitables ?
Concepts associés
Extraction d’entités nommées (NER), désambiguïsation et alignement avec des référentiels existants ; Linked Open Data (LOD) sur les productions issues de l’ATR ; Construction de graphes de connaissances à partir de corpus ATR ; Interopérabilité avec protocoles et ontologies patrimoniales (IIIF, TEI, CIDOC-CRM) ; Passage du texte linéaire aux données relationnelles
- Post-traitement & LLMs
Comment utiliser les grands modèles de langage pour la correction automatique, la traduction ou le résumé de manuscrits historiques et où placer l’autorité savante dans l’articulation entre expertise humaine et puissance computationnelle ?
Concepts associés
Correction automatique guidée par modèles de langue ; Traduction automatique spécialisée pour langues anciennes ; Résumé, segmentation, détection de structure ; Annotation semi-automatique et validation collaborative (human-in-the-loop) ; Post-traitement avancé ; Hybridation humain-machine
- Lecture distante et catalogage automatisé
Que devient l’histoire culturelle lorsqu’elle s’appuie sur des millions de témoins interrogeables et comment intégrer les analyses quantitatives et tendances macro-historiques révélées par l’ATR à grande échelle ?
Concepts associés
Distant Reading et macro-histoire ; Sérialisation des données manuscrites ; Études de diffusion des textes et traditions manuscrites ; Réseaux intellectuels et circulation des savoirs ; Cartographie des pratiques scripturales ; Approches statistiques des transformations linguistiques ; Catalogage automatisé et expertise ; Génération automatique de notices descriptives ; Détection de fragments et recomposition virtuelle
- Éditions savantes : repenser l’édition critique à l’ère de l’abondance
L’édition critique est-elle appelée à devenir une infrastructure plutôt qu’un produit fini ?
Concepts associés
De l’édition critique unique aux éditions dynamiques ; Variants générés automatiquement ; Alignement multi-témoins à grande échelle ; Interfaces exploratoires plutôt que linéaires ; Nouvelles formes de publication scientifique
Matérialité et histoire des objets écrits
- Nouvelle paléographie computationnelle
Comment des corpus massifs de textes transcrits transforment notre compréhension des écritures et des scribes, et de leur évolution ?
Concepts associés
Études quantitatives des mains scribales ; Stylométrie graphique et évolution des écritures ; Attribution et identification de scribes ; Étude comparative interrégionale et interlinguistique ; Reconnaissance des pratiques d’atelier
- Texte, matérialité et image
Au-delà du texte ! Comment réintégrer la matérialité dans un environnement dominé par la textualisation ?
Concepts associés
Analyse conjointe texte-image ; Mise en relation ATR et analyse des supports (papier, parchemin, sceaux, monnaies) ; Détection de mise en page, marginalia, diagrammes ; Lien entre études matérielles (XRF, multispectrales, manuscrits endommagés, etc.) couplées à l’ATR
Enjeux patrimoniaux, épistémologiques et éthiques
- Épistémologie et éthique
Comment penser une critique savante de l’automatisation ?
Concepts associés
Biais linguistiques, géographiques, scripturaux ; Invisibilisation des écritures minoritaires ; Effets d’autorité des systèmes automatiques ; Transparence et explicabilité des modèles ; Redéfinition du geste scientifique
- Défis curatoriaux
Comment inscrire l’ATR dans une politique patrimoniale durable ?
Concepts associés
Infrastructures pour la gestion, l'archivage et la mise à disposition de données transcriptions automatisées « bruitées » ou de qualité intermédiaire (« silver standard ») ; Versionnement des transcriptions ; Traçabilité des corrections ; Pérennisation des modèles et dépendance technologique ; Coût écologique et computationnel des modèles ; Priorisation des campagnes de numérisation / conservation
Modalités de soumission
Nous accueillons des propositions issues des sciences archivistiques et bibliothéconomiques, des humanités numériques et computationnelles, de l’informatique, de la philosophie et de la philologie, pour :
- des communications individuelles (20 minutes de présentation / 10 minutes de discussion),
- des panels thématiques (3 communications),
- des communications éclair (lightning talks) ou posters.
Communications et publication
Les auteurs des communications acceptées seront invités et accueillis à Paris par Biblissima+.
Pour ceux qui souhaient, les articles acceptés seront publiés dans un numéro spécial du Journal of Data Mining and Digital Humanities.
Exigences pour les résumés
Communications individuelles : un résumé de 300 mots et une courte biographie (100 mots).
Panels : une présentation du panel (200 mots) ainsi que les résumés individuels de chaque intervenant:e.
Dates importantes
Date limite de soumission : 15 avril 2026
Notification d’acceptation : 21 avril 2026
Remise de l’article final : 15 mai 2026
Conférence : 15–17 juin 2026