Logo Sciencesconf

Date limite de soumission : 15 avril 2026

Ces dernières années, le domaine des études manuscrites a été profondément transformé par le succès du deep learning. Des outils comme Transkribus, Arkindex, eScriptorium et divers autres moteurs OCR/HTR ont atteint un niveau de maturité tel que des transcriptions « quasi parfaites » d’écritures historiques complexes ne relèvent plus du rêve lointain, mais d’une réalité quotidienne et à toutes les échelles, depuis la transcription de documents isolés jusqu'à la création de corpus massifs. Après la phase héroïque de la reconnaissance automatique des écritures manuscrites, un changement de paradigme s'est fait jour et la question demeure : et après ?

Il ne s’agit plus seulement de transcrire mieux, mais de comprendre comment l’ATR transforme les régimes de preuve, d’autorité, d’éditorialisation et d’interprétation en sciences historiques. La généralisation de l’ATR à grande échelle ouvre un nouveau champ de recherche : celui des usages secondaires, critiques et épistémologiques des données produites par des modèles d’IA.

Une fois l’encre numérique séchée et des millions de tokens de texte interrogeable disponibles, comment cela transforme-t-il notre manière d’interagir avec le passé ? Cette conférence propose d’explorer la « vie après » des données ATR (Automatic Text Recognition). Nous souhaitons dépasser les obstacles techniques liés aux taux d’erreur de caractères pour entrer dans les domaines de l’analyse de données massives, du catalogage automatisé, des éditions numériques, de la découverte archivistique et des nouvelles méthodologies de recherche.

Le Cluster 3 de Biblissima+ invite chercheur:ses, bibliothécaires, informaticien:nes et spécialistes des humanités numériques à soumettre des propositions portant notamment sur les trois grandes thématiques suivantes :

(1)   Les nouveaux usages du texte : Du texte au savoir (structuration, modélisation, interopérabilité) ; Post-traitement & LLMs ; Lecture distante et catalogage automatisé ; Éditions savantes et critique

(2)   Matérialité et histoire des objets écrits : Nouvelle paléographie computationnelle ; Texte, matérialité et image

(3)   Enjeux patrimoniaux, épistémologiques et éthiques : Épistémologie et éthique ; Une politique patrimoniale durable de l’ATR

 

En particulier, nous proposons d’explorer ces thématiques sous les angles suivants :

Les nouveaux usages du texte 

Comment transformer une masse de texte brut en un écosystème de connaissances exploitables ?

Concepts associés

Extraction d’entités nommées (NER), désambiguïsation et alignement avec des référentiels existants ; Linked Open Data (LOD) sur les productions issues de l’ATR ; Construction de graphes de connaissances à partir de corpus ATR ; Interopérabilité avec protocoles et ontologies patrimoniales (IIIF, TEI, CIDOC-CRM) ; Passage du texte linéaire aux données relationnelles

Comment utiliser les grands modèles de langage pour la correction automatique, la traduction ou le résumé de manuscrits historiques et où placer l’autorité savante dans l’articulation entre expertise humaine et puissance computationnelle ?

Concepts associés

Correction automatique guidée par modèles de langue ; Traduction automatique spécialisée pour langues anciennes ; Résumé, segmentation, détection de structure ; Annotation semi-automatique et validation collaborative (human-in-the-loop) ; Post-traitement avancé ; Hybridation humain-machine

Que devient l’histoire culturelle lorsqu’elle s’appuie sur des millions de témoins interrogeables et comment intégrer les analyses quantitatives et tendances macro-historiques révélées par l’ATR à grande échelle ? 

Concepts associés

Distant Reading et macro-histoire ; Sérialisation des données manuscrites ; Études de diffusion des textes et traditions manuscrites ; Réseaux intellectuels et circulation des savoirs ; Cartographie des pratiques scripturales ; Approches statistiques des transformations linguistiques ; Catalogage automatisé et expertise ; Génération automatique de notices descriptives ; Détection de fragments et recomposition virtuelle

L’édition critique est-elle appelée à devenir une infrastructure plutôt qu’un produit fini ?

Concepts associés

De l’édition critique unique aux éditions dynamiques ; Variants générés automatiquement ; Alignement multi-témoins à grande échelle ; Interfaces exploratoires plutôt que linéaires ; Nouvelles formes de publication scientifique

 

Matérialité et histoire des objets écrits

Comment des corpus massifs de textes transcrits transforment notre compréhension des écritures et des scribes, et de leur évolution ?

Concepts associés

Études quantitatives des mains scribales ; Stylométrie graphique et évolution des écritures ; Attribution et identification de scribes ; Étude comparative interrégionale et interlinguistique ; Reconnaissance des pratiques d’atelier

Au-delà du texte ! Comment réintégrer la matérialité dans un environnement dominé par la textualisation ?

Concepts associés

Analyse conjointe texte-image ; Mise en relation ATR et analyse des supports (papier, parchemin, sceaux, monnaies) ; Détection de mise en page, marginalia, diagrammes ; Lien entre études matérielles (XRF, multispectrales, manuscrits endommagés, etc.) couplées à l’ATR

 

Enjeux patrimoniaux, épistémologiques et éthiques

Comment penser une critique savante de l’automatisation ?

Concepts associés

Biais linguistiques, géographiques, scripturaux ; Invisibilisation des écritures minoritaires ; Effets d’autorité des systèmes automatiques ; Transparence et explicabilité des modèles ; Redéfinition du geste scientifique

Comment inscrire l’ATR dans une politique patrimoniale durable ?

Concepts associés

Infrastructures pour la gestion, l'archivage et la mise à disposition de données transcriptions automatisées « bruitées » ou de qualité intermédiaire (« silver standard ») ; Versionnement des transcriptions ; Traçabilité des corrections ; Pérennisation des modèles et dépendance technologique ; Coût écologique et computationnel des modèles ; Priorisation des campagnes de numérisation / conservation


Modalités de soumission

Nous accueillons des propositions issues des sciences archivistiques et bibliothéconomiques, des humanités numériques et computationnelles, de l’informatique, de la philosophie et de la philologie, pour :

Communications et publication

Les auteurs des communications acceptées seront invités et accueillis à Paris par Biblissima+.

Pour ceux qui souhaient, les articles acceptés seront publiés dans un numéro spécial du Journal of Data Mining and Digital Humanities.

Exigences pour les résumés

Communications individuelles : un résumé de 300 mots et une courte biographie (100 mots).

Panels : une présentation du panel (200 mots) ainsi que les résumés individuels de chaque intervenant:e.


Dates importantes


Date limite de soumission : 15 avril 2026

Notification d’acceptation : 21 avril 2026

Remise de l’article final : 15 mai 2026

Conférence : 15–17 juin 2026

 

Chargement... Chargement...