• Recherche

Lancement du projet ModERN : interview de Glenn Roe

Le chercheur Glenn Roe a obtenu, pour Sorbonne Université, un financement de l’ERC pour son projet ModERN, qui permettra d’étudier les textes des Lumières sous un jour encore inexploré.

Professeur de littérature française et humanités numériques à la Faculté des Lettres de Sorbonne Université, Glenn Roe est un chercheur du centre d’étude de la langue et des littératures françaises (CELLF) et le responsable de l’équipe-projet ObTIC. Il co-dirige également le Voltaire Lab de l’université d’Oxford. Ses recherches se situent à l’interface de l’histoire littéraire et intellectuelle des XVIIIe et XIXe siècles et de l’analyse et traitement informatique de données textuelles.

Le Conseil européen de la recherche (ERC) a sélectionné votre projet pour un financement important sur plusieurs années. En quoi consiste ce projet ?
Ce projet vient consolider des années de recherche autour de la numérisation massive de textes littéraires du XVIIIe siècle, le siècle des Lumières, mais également du XIXe siècle. Il vise à construire la plus grande base de données textuelles autour de ces siècles et à permettre une étude approfondie de la réception des idées philosophiques et politiques des Lumières à son époque jusqu’à l’avènement de la modernité. C’est un projet fédérateur car il va rassembler et exploiter un corpus de plusieurs milliers de textes numérisés issus de diverses sources :

  •     La base de données Frantext ainsi que d’autres bases du projet ARTFL de l’Université de Chicago, qui rassemblent des textes numérisés et retranscrits manuellement ;
  •     La très grande base (TGB) de la BNF qui contient essentiellement des textes numérisés automatiquement du projet Gallica ;
  •     D’autres bases de données françaises comme la bibliothèque « Critique » du Labex OBVIL, désormais numérisée ;
  •     Les collections numérique du Voltaire Lab, base de données de l’université d’Oxford, qui comprend l'intégralité de la production littéraire de Voltaire, y compris sa vaste correspondance ;
  •     Electronic Enlightenment, également à l’Université d’Oxford, qui contient une vaste collection des correspondances numérisées du XVIIIe siècle en plusieurs langues ;
  •     Une collection importante de plus 40 000 pamphlets en français autour de la période révolutionnaire de la Newberry Library à Chicago.

Regrouper tous ces textes avec une structuration commune et une normalisation des métadonnées permettra de constituer la plus grande base de données textuelles des études des XVIIIe-XIXe siècles.

 
Quels sont les objectifs attendus et les enjeux soulevés par une base de données de cette ampleur ?
Avec le regroupement de ces collections éphémères nous espérons trouver les contours d’une autre histoire littéraire. En effet notre perception actuelle du siècle des Lumières est largement héritée de la vision donnée au XIXe, voire au XXe siècle, mais quelle était la réception de ces textes par la société du XVIIIe elle-même ? quelles autres vérités peuvent surgir de l’étude de ces corpus de textes ? Quels sont les textes les plus cités ou les plus réutilisés à l’époque ? L’influence de Voltaire est-elle aussi importante que nous le pensions ?
En utilisant une méthodologie orientée sur les données (data-driven en anglais) sur des quantités aussi massives de textes, nous espérons mettre en évidence des liens jusqu’à maintenant imperceptibles pouvant permettre de préciser ces hypothèses. Nous nous attendons par exemple à voir surgir une meilleure représentation des textes religieux encore très prégnants à l’époque.
Pour y parvenir, nous essayons par exemple de détecter des passages cachés ou bien réemployés subtilement et de les classifier selon leurs usages, ce qui serait impossible avec des méthodes classiques sur de telles quantités de textes. Les nouveaux outils numériques développés pour ce projet auront vocation à devenir des outils partagés et exploitables par l’ensemble des chercheurs et chercheuses en littérature des XVIIIe et XIXe siècles.


Une équipe va vous accompagner dès la rentrée de septembre 2022. Comment va-t-elle être constituée ?
Une équipe va être recrutée et sera implantée à la Maison de la Recherche. Elle sera composée de trois contrats post-doctoraux, deux contrats doctoraux, deux ingénieures d’études, et un chef ou cheffe de projet.


Quels sont, selon vous, les enjeux de la recherche en Europe dans le champ des humanités numériques ?
En France et plus largement en Europe, c’est incontestablement la numérisation du patrimoine. Les premiers projets datent d’une trentaine d’années dans différents pays avec des critères variés. La difficulté étant que toutes ces données ne se parlent pas et ne peuvent pas interagir. Un des défis de mon projet est de rassembler ces données, de regrouper des textes en différentes langues, et d’avoir des schémas de métadonnées interopérables, ce qui permet une exploitation des données par d’autres équipes à l’échelle européenne. Dans les prochaines années il faut œuvrer à mettre en place des systèmes cohérents entre les différentes universités européennes pour le dépôt des données de la recherche afin de mieux pouvoir les réutiliser.

En chiffres

  • 5 : nombre d’années couvertes par la bourse ERC
  •  9 : nombre de personnes de l’équipe de recherche autour de Glenn Roe
  •  40 000 : nombre de pamphlets en français autour de la période révolutionnaire rassemblés à la Newberry Library de Chicago
  •  70 000 : nombre de lettres numérisées à Oxford comprenant la correspondance de Voltaire (21000) et Rousseau (8000) et des textes réunis par les chercheurs britanniques.
  • 130 000 : nombre de livres numérisés par la BNF pour constituer la TGB (très grande base) issue de la bibliothèque numérique Gallica.