Ceci est une ancienne révision du document !
Revenir à la page d'accueil du Wiki de l'ARHN
Les séances du séminaire se déroulent en hybride et sont ouvertes à toutes et tous sur inscription préalable auprès de vincent.alamercery@ens-lyon.fr. Précisez lors de votre inscription si vous souhaitez suivre la séance en visio pour recevoir le lien.
Kraken, eScriptorium et l'ATR (automatic text recognition) : Naviguer dans les Océans de la Reconnaissance Automatique d’Écriture
L’émergence d’outils de reconnaissance automatique d’écriture avec une interface utilisateur de plus en plus intuitive, tels que Transkribus ou eScriptorium, ouvre aujoud’hui de nouvelles perspectives. De nombreuses équipes de recherche se sont lancées dans l'utilisation de l'ATR et l’entraînement de modèles de plus en plus performants sur les sources historiques, capables de reconnaître efficacement une grande variété de documents qu'ils présentent des écritures différentes, ou qu’ils proviennent de périodes historiques et d’ères linguistiques variées, modernes comme médiévales. Toutefois, malgré les progrès significatifs réalisés, des défis subsistent pour le traitement des documents historiques complexe ? Comment obtenir des transcriptions automatiques qui respectent des critères scientifiques ? Comment analyser la mise en page ? En conclusion, si la reconnaissance automatique d’écriture offre la possibilité d'explorer des tailles de corpus inédites, elle requiert toujours une certaine expertise pour relever les défis inhérents à la diversité et la complexité des documents médiévaux, limites et enjeux que nous aborderons dans cette présentation.
Extraire du texte des imprimés anciens : quels défis, quelles promesses ? Illustration par le projet AGODA