Actualité - 22 juin 2021

#FocusProjet : le DIScours encyClOpédique

Vignette qui se trouve sur la page de titre de chaque volume de LGE où figure la devise « Donec totum impleat orbem »
Vignette qui se trouve sur la page de titre de chaque volume de LGE où figure la devise « Donec totum impleat orbem » | © ENS-Lyon
DISCO LGE - Le cas de La Grande Encyclopédie (1885-1902) - est un des projets lauréats des AAP CollEx-Persée 2018_19. Focus sur la fin de projet :

L’ouvrage auquel nous nous sommes intéressés dans le cadre du projet soutenu par CollEx-Persée est La Grande Encyclopédie. Inventaire raisonné des sciences, des lettres et des arts par une société de savants et de gens de lettres (désormais LGE) parue entre 1885-1922 en trente-et-un volumes d’environ mille deux-cents pages chacun.

Dans sa préface, l’œuvre est qualifiée « de haute vulgarisation : un grand ouvrage encyclopédique, populaire et cependant au courant des plus récents progrès de la science moderne ». S’inspirant de la classification historique des sciences par A. Comte telle qu’exposée dans son Cours de Philosophie Positive, LGE constitue un maillon essentiel dans la chaîne qui conduit de l’Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers, par une société de gens de Lettres de Diderot et d’Alembert (1751-1772) à nos encyclopédies contemporaines.

Voilà pourquoi notre équipe de linguistes, d’informaticiens, d’historiens et de géographes travaillant sur les changements intervenus dans les discours encyclopédiques entre le XVIIIe s. et nos jours a souhaité, grâce à CollEx-Persée, intégrer cette œuvre dans son corpus d’étude.

Nos principaux objectifs étaient les suivants :

– Rendre disponible au public et à la communauté scientifique une version numérisée, structurée et annotée de l’intégralité de La Grande Encyclopédie. C’est aujourd’hui chose faite puisqu’on trouvera les deux premières versions disponibles sur le serveur NAKALA (https://nakala.fr/10.34847/nkl.74eb1xfd)

– Proposer une chaîne de traitement expérimentale à même de permettre d’encoder en XML-TEI de façon la plus automatisée possible les textes océrisés issus de la BNF. On trouvera là aussi en téléchargement sur l’onglet « Production et résultats » deux outils dont les codes sources sont sous licence libre (BSD-3) pour un traitement séquentiel des textes avant annotation linguistique :

Une interface de visualisation et de correction du contenu des fichiers ALTO issus de la BNF : CHAOUI

Un logiciel permettant de filtrer les scories repérées dans CHAOUI, de corriger l’ordre des blocs de texte, de découper la séquence des pages en articles et d’encoder ces derniers en XML-TEI : SOPRANO

 

Afin de parvenir à ces résultats, nous avons travaillé en réseau avec les laboratoires et institutions suivantes : la BNF,  l’INRIA (équipe ALMAnaCH) et les laboratoires PRAXILING (Montpellier),  LITT&ARTS (Grenoble) et LATTICE (Paris)

L’information scientifique et technique (IST) et les préconisations relatives à la science ouverte ont été deux dimensions situées au cœur de notre projet : 

  • en termes d’accès aux documents scientifiques puisque nous donnons un accès ouvert à diverses versions structurées et annotées de l’ensemble des volumes de LGE ;
  • en termes de publications et de productions logicielles liées au projet enfin, puisqu’elles sont toutes visibles et téléchargeables sur le site de notre projet.

Toutes nos publications et communications liées au projet y sont aussi disponibles.

Denis Vigier
Enseignant-chercheur : Maître de conférences habilité à diriger des recherches, UMR 5191, ICAR, Université Lyon 2 – Lumière

Une actualité ou un événement à partager avec nous ?

Proposez vos actualités et événements afin qu'ils soient publiés sur le site du CollEx-Persée