Période | 2025-2029 |
Promoteur | Sébastien de Valeriola |
Bailleur de fonds | FWB, Action de Recherche Concertée |
Ce projet vise à implémenter une chaîne de traitement et d’analyse quantitative permettant d’étudier la
littérature hagiographique de l’Occident médiéval latin de façon globale, en rassemblant, préparant et
analysant à l’aide de l’ordinateur un corpus de 4.373 textes. Des méthodes quantitatives poussées seront mises en œuvre pour ce faire, issues notamment de l’intelligence artificielle et appartenant à deux boîtes à outils clefs des humanités numériques, la fouille des textes et l’analyse des réseaux.
L’application de ces techniques à un corpus de cette envergure permettra d’étudier à une large échelle
plusieurs aspects de l’hagiographie médiévale qui n’ont souvent été analysés qu’en réunissant des résultats locaux et/ou chronologiquement isolés. Il s’agira ainsi d’apporter un éclairage global dans deux directions de recherche.
Il s’agit d’une part des topoï hagiographiques, c’est-à-dire des motifs récurrents propres à ce type de littérature (apparition, évolution, utilisation conjointe, etc.).

D’autre part, nous travaillerons sur les procédés de réécriture dont les textes font l’objet et leur diffusion au sein du réseau des institutions ecclésiastiques qui sont responsables de la copie des manuscrits relatifs aux saints.

Une étude de robustesse des méthodes mobilisées sera aussi effectuée, qui permettra d’évaluer leur fiabilité. Il s’agira de comparer les résultats obtenus en utilisant différentes éditions des mêmes textes (qui, datant de périodes différentes, sont de qualité inégale).
Nous alimenterons le corpus par l’extraction des éditions de textes qui sont données dans les nombreuses publications hagiographiques parues au cours des quatre derniers siècles, en les soumettant à un processus d’acquisition comprenant, chaque fois que cela s’avère nécessaire, des étapes de scan, d’OCRisation, de nettoyage automatique et de traitement linguistique. Les textes seront accompagnés de métadonnées et mis à disposition de la communauté scientifique en accès ouvert complet.