L’objectif principal du projet est d'étudier l'interaction entre la langue et le savoir (scientifique) dans l'espace culturel roman du Moyen Âge, où entre environ 1100 et 1500, de nouveaux réseaux de savoirs en langues vernaculaires se développent, remplaçant de plus en plus le latin qui prévalait jusque-là. Le projet trace ce processus dans les variétés médiévales de la Galloromania - le français, l'occitan et le gascon - ainsi que dans l'Italoromania.
La croissance de la mise par écrit de nombreux aspects de la vie et l'émergence de nouvelles institutions éducatives dans les villes médiévales en expansion favorisent l'émergence de nouveaux groupes d'experts, de nouvelles voies de transmission et de génération de savoirs, et, par conséquent, le développement des langues vernaculaires en tant que moyen de communication écrite : Alors, jusqu’à environ 1150, on écrivait presque exclusivement en latin dans l'Europe occidentale, on observe désormais une transition de plus en plus marqué vers les langues vernaculaires. La transition linguistique n’est pas complète, car, pendant une période prolongée, le latin dominera les variétés vernaculaires en tant que langue administrative, éducative et scientifique. Les nouvelles formes vernaculaires de communication du savoir sont plus régionales, plus parcellisées et parfois faiblement liées les unes aux autres. Elles ne contribuent pas toujours au développement de bases de savoirs autonomes et innovantes. Ils continuent à dépendre de modèles latins et sont donc souvent épigones. La communication du savoir en langue vernaculaire reste néanmoins un facteur important dans le processus qui va continuer à développer ou même à éroder les bases de savoirs traditionnelles, canonisées et gérées de manière autoritaire de la tradition latine.
La transition linguistique n'est pas abrupte, mais se déroule en plusieurs étapes, et les différentes régions commencent à écrire dans la langue vernaculaire à des moments différents et avec une intensité variable. À première vue, le passage du (moyen) latin aux langues vernaculaires peut sembler être un phénomène de surface, un simple changement entre des formes linguistiques interchangeables. Cependant, d'un point de vue sociohistorique, culturel et générique, une telle évaluation est erronée, car le latin - au Moyen Âge - est associé à des groupes porteurs spécifiques et à des situations d'utilisation spécifiques qui ne correspondent pas à celles des langues vernaculaires. Lorsque les variétés vernaculaires deviennent également des moyens de transmission écrite du savoir, les réseaux de savoirs se modifient.
Le développement conceptuel des langues vernaculaires, un niveau d'analyse central du projet, est à la fois une indication et un stimulant du changement social, dans lequel se manifeste un renouvellement du paysage intellectuel sur la voie de la Renaissance. Avec les langues (techniques) de savoir, non seulement une partie importante de l'héritage culturel européen est mise en avant. Les langues romanes sont également des vecteurs importants des échanges culturels au Moyen Âge qui ont fondé l'identité européenne en tant que société du savoir.
Méthodologie
Le projet combine des méthodes de lexicologie et de lexicographie, de philologie textuelle et d'histoire du savoir et des sciences, avec des approches des humanités numériques, du Web sémantique et de l'ingénierie ontologique.
1. Éditions de texte et corpus : Analyse linguistique du corpus
ALMA explore, en utilisant des techniques numériques, la riche tradition romane dans le domaine de la communication des savoirs et le projet prépare deux corpus textuels exemplaires dans les domaines de la médecine et du droit pour la recherche historique. Ces corpus textuels translinguistiques explorent un espace culturel important de la Romania médiévale et servent de base pour la reconstruction des concepts centraux et des réseaux de concepts dans les domaines de savoirs. L'approche transculturelle de création de corpus parallèles spécifiques aux deux domaines représente un désidérat de la recherche jusqu'à présent.
Les corpus se composent d'éditions de texte numériques nouvellement créées par ALMA à partir de manuscrits jusqu'à présent non traités, ainsi que des rétro-numérisations d'éditions publiées sous forme de livres. Tous les textes sont convertis dans un format XML/TEI, puis tokenisés, annotés et lemmatisés. Les textes du corpus sont analysés à l'aide de méthodes quantitatives et empiriques de la linguistique de corpus (analyses de fréquence absolue et relative, analyse de co-occurrence), afin de générer des résultats préliminaires sur les termes techniques pertinents et les concepts clés.
Domaine de la médecine
Le domaine de la médecine joue un rôle important en mettant en jeu le contact avec la tradition gréco-arabe, introduisant de nouveaux groupes d'experts dans la communication écrite du savoir.
Un des exemples les plus importants des textes du corpus médical, on trouve les traductions vernaculaires de la Chirurgia magna (vers 1300-1368) [texte latin de 1363 ; le plus ancien manuscrit avec une traduction française date du deuxième tiers du XVe siècle], rédigé par Gui de Chauliac un médecin français au XIVe siècle et médecin personnel de trois papes. Contrairement à ce que son nom pourrait laisser penser, cette œuvre n'est pas limitée dans son importance scientifique au domaine de la chirurgie.
Au contraire, la Chirurgia magna représente un sommet de la médecine médiévale basée sur les savoirs de l’antiquité, marquant la transition vers la médecine moderne : en associant la chirurgie, considérée à l'époque comme un domaine distinct de la médecine, Gui de Chauliac annonce le début d'un concept médical plus vaste qui caractérise la modernité. En même temps, la Chirurgia magna représente une compilation de savoirs médico-chirurgicales complets de son époque. Il est également important de mentionner la discussion de la dissection de cadavres humains comme méthode d'enseignement médical, une pratique que beaucoup des contemporains de Guy de Chauliac n'utilisaient pas. Les autres innovations médicales enregistrées, telles que la classification de la peste pulmonaire et bubonique ou le développement des méthodes de guérison de fractures osseuses, ont permis à la Chirurgia magna de servir de manuel d'enseignement populaire jusqu'au XVIIe siècle, établissant ainsi un lien direct entre la médecine médiévale et moderne.
Domaine du droit
Le domaine du droit est particulièrement pertinent en raison de sa tradition séculaire de transmission de termes et de concepts juridiques en langue vernaculaire et en latin.
Deux des textes clés dans ce domaine sont les Assises de Jérusalem [avant 1266] de Jean d'Ibelin ainsi que le Grand coutumier de Normandie anonyme [fin du XIIIe siècle]. Les Assises de Jérusalem sont une compilation du droit coutumier du royaume chrétien de Jérusalem au milieu du XIIIe siècle. Son auteur était Jean d'Ibelin, comte de Jaffa et d'Ascalon, une figure politiquement très influente et l'un des nobles les plus éminents du Proche-Orient latin de son époque. L'œuvre est d'une importance particulière pour plusieurs raisons :
Premièrement, il s'agit du texte juridique le plus détaillé parmi plusieurs contemporains de son cercle culturel. Deuxièmement, les Assises de Jérusalem sont considérées comme l'une des œuvres les plus complètes, voire la plus exhaustive, sur le droit féodal chrétien-européen médiéval. De plus, il traite des questions formelles et substantielles de la cour royale ainsi que de la constitution du royaume et de sa structure de gouvernance. En plus, pour le projet ALMA, ce texte est particulièrement pertinent, car il a été rédigé en français sans modèle latin immédiat, offrant ainsi un aperçu de la portée impressionnante des nouveaux réseaux de savoirs vernaculaires jusqu'au Moyen-Orient.
2. Analyse linguistique
Les résultats statistiques de l'analyse linguistique de corpus - à l’aide des algorithmes - constituent la base pour une élaboration linguistique « manuelle » suivant l'approche qualitative et herméneutique de la linguistique historique. En partant des concepts et termes pertinents identifiés dans les textes à analyser, des études lexico-sémantiques sont élaborées avec une perspective onomasiologique et basée sur les concepts. Ces études analysent l'histoire des concepts (Begriffsgeschichte) ainsi que leur relation avec l'histoire des mots (Wortgeschichte), à travers les langues et dans le contexte de l'émergence de nouveaux réseaux de savoirs.
Ces études intègrent également les connaissances des disciplines voisines telles que l'astronomie, la botanique ou la pharmacologie. De plus, elles comparent les textes en langue vernaculaire avec les textes sources en latin médiéval ainsi qu'avec les corpus de textes déjà existants, en particulier ceux de l'espagnol et de catalan médiévaux. En plus, le travail lexicologique est contrôlé en se référant aux matériaux lexicographiques élaborés dans les dictionnaires historiques (lexicographie de la Galloromania et de l'Italoromania, notamment le Dictionnaire onomasiologique de l’ancien gascon - DAG (HAdW), Dictionnaire étymologique de l’ancien français - DEAF (HAdW), Dictionnaire de l’occitan medieval - DOM (BAdW) und Lessico etimologico italiano - LEI (AdW Mainz), Französisches etymologisches Wörterbuch - FEW und Dictionnaire du moyen francais - DMF, et aussi de l’Ibéroromania et du (moyen) latin).
3. Analyses transversales du développement des réseaux de savoirs
À partir des résultats de ces études lexico-sémantiques, des recherches transversales indépendantes examinent et décrivent le développement des réseaux de savoirs vernaculaires et l'évolution linguistique. Des exemples potentiels comprennent les contextes tels que la « Peste », l' « Anatomie », la « Pratique des donations », etc.
4. Humanités numériques, Web sémantique et ingénierie ontologique
Une valeur innovante du projet réside dans la combinaison de l’approche qui est basée sur les données linguistiques et translinguistique avec les outils de l'ingénierie ontologique : L'objectif principal est de traduire les résultats de recherche historico-philologique obtenus dans le projet en ontologies « historisées » (dans le sens de l’informatique ; en Web Ontology Language - OWL). Ces ontologies développent la structure conceptuelle des domaines de savoirs étudiés en « structured knowledge » (connaissances structurées). En tant qu'ontologies historiques, elles permettent de rendre compte des spécificités des modèles d'explication médiévaux : Elles permettent de mettre en évidence les ruptures de continuité entre les systèmes de savoirs (scientifiques) médiévaux et modernes, sans les dissimuler derrière des attributions anachroniques. Leur aspect extralinguistique et orientée vers les concepts en fait des nœuds pour la connexion de données de recherche. Cela élargit le cercle des utilisateurs des ontologies bien au-delà du domaine spécifique de la romanistique, vers toutes les sciences qui travaillent sur des sujets historiques.
Linked Open Data
Les textes de corpus, les études lexico-sémantiques ainsi qu'une bibliographie de recherche critique (ALMABibl) sont convertis en Linked Open Data dans le modèle de données Resource Description Framework (RDF), rendant ainsi ces données disponibles pour un accès basé sur des ontologies. Pour garantir l'interopérabilité, ALMA utilise pour la modélisation en Linked Open Data les ontologies, vocabulaires et dépôts établis comme des standards (de facto) pour la discipline et ses ressources linguistiques historiques :
- OntoLex-Lemon, Ontologies of Linguistic Annotation – OLiA pour décrire les termes techniques de la linguistique, le Model for Language Annotation - MoLA pour la description de la langue, etc.
- ainsi que des ontologies pour les noms de lieux (Geonames, Getty Thesaurus of Geographic Names – TGN), les noms de personnes (Virtual International Authority File – VIAF; Gemeinsame Normdatei – GND), etc.
Le projet utilisera également la modélisation en Linked-Open-Data et les ontologies de domaine historique pour une réutilisation innovante des ressources lexicographiques pertinentes des dictionnaires des académies DEAF, DOM et LEI (et peut-être DAG).
Publications
Les connaissances élaborées par ALMA sont rendues accessibles au public par divers moyens de publication : les synthèses des résultats de domaines de recherche spécifiques sont publiées sous forme de monographies, dans des actes de conférences ou d'articles dans des revues. Une grande partie des résultats de recherche sera publiée sur le portail en-ligne Open-Access du projet : les textes de corpus, les études lexico-sémantiques (en étroite liaison avec les versions en ligne des dictionnaires des académies DAG, DEAF, DOM et LEI ainsi que d'autres dictionnaires), la bibliographie ALMABibl ainsi que les ontologies historisées.
Les ressources de Linked-Open-Data seront accessibles via un triplestore.
Copyright:
1. Visualisation du TextFactory-Pipeline, ALMA.
2. “Trotula”, portant un urinal, manuscrit Wellcome Collection, London, MS. 544 [déb. 14e s.]. Miscellanea medica XVIII. CC BY 2.0
3. „Trotula de Salerno, De passionibus mulierum“, manuscrit Salerno [1544]“. Public domain.
4. Reproduction d’un texte dans eScriptorium.
5. données RDF.