Das Hauptanliegen des Projektes ist die Untersuchung der Wechselwirkung zwischen Sprache und Wissen(-schaft) im romanischen Kulturraum des Hoch- und Spätmittelalters, wo sich zwischen ca. 1100 und ca. 1500 neue volkssprachliche Wissensnetze entwickeln, die die bis dahin vorherrschenden lateinischen mehr und mehr abslösen. Das Projekt zeichnet diesen Prozess in den mittelalterlichen Varietäten der Galloromania – des Französischen, Okzitanischen und Gaskognischen – und der Italoromania nach.
Die zunehmende Verschriftlichung zahlreicher Lebensbereiche und die Entstehung neuer Bildungsinstitutionen in den wachsenden mittelalterlichen Städten etwa begünstigen die Entstehung neuer Expertengruppen, neuer Wege der Wissenstradierung und -generierung und damit den Ausbau der Volkssprachen als schriftliches Kommunikationsmedium: Während man im westeuropäischen Raum bis etwa 1150 fast ausschließlich lateinisch schrieb, wechselt man nun immer stärker zu den Vernakularsprachen. Der Sprachwechsel ist nicht vollständig, denn noch sehr lange wird Latein als Verwaltungs-, Bildungs- und Wissenschaftssprache die volkssprachlichen Varietäten dominieren. Die neuen volkssprachlichen Formen der Wissenskommunikation sind regionaler, stärker parzelliert und teilweise nur lose miteinander verknüpft. Sie tragen nicht immer dazu bei, eigenständige, innovative Wissensbestände zu entwickeln. Häufig sind sie weiterhin von lateinischen Vorbildern abhängig und daher oft epigonal. Die volkssprachliche Wissenskommunikation ist dennoch ein wichtiger Faktor in dem Prozess, der die traditionellen, kanonisierten und autoritativ verwalteten Wissensbestände der lateinischen Überlieferung weiterentwickeln oder gar aufweichen wird.
Der Sprachwechsel ist auch nicht abrupt, sondern vollzieht sich in mehreren Etappen, und die einzelnen Regionen beginnen zu unterschiedlichen Zeitpunkten und mit unterschiedlicher Intensität in der Vernakularsprache zu schreiben. Auf den ersten Blick mag es sich beim Übergang vom (Mittel-)Latein zu den Volkssprachen um ein Oberflächenphänomen handeln, um einen einfachen Wechsel zwischen gegenseitig austauschbaren Sprachformen. In sozialhistorischer, kultur- und gattungsgeschichtlicher Perspektive ist eine solche Einschätzung aber falsch, da das Lateinische im Mittelalter mit spezifischen Trägergruppen und spezifischen Gebrauchssituationen verknüpft ist, die nicht mit denen der Volkssprachen übereinstimmen. Wenn nun auch die volkssprachlichen Varietäten Mittel zur schriftlichen Vermittlung von Wissen werden, verändern sich die Wissensnetze.
Der konzeptuelle und damit verbundene begriffliche Ausbau der Volkssprachen, zwei zentrale Analyseebenen des Projekts, sind zugleich Indiz und Stimulans des sozialen Wandels, in dem sich eine Erneuerung der intellektuellen Landschaft auf dem Weg zur Renaissance manifestiert. Mit den Wissen(schaft)ssprachen wird nicht nur ein wichtiger Bestandteil des kulturellen Erbes Europas in den Fokus gerückt. Die romanischen Sprachen sind auch bedeutende Träger des kulturellen Austauschs, der im Mittelalter die europäische Identität als Wissensgesellschaft begründet.
Methodik
Das Projekt verschränkt gezielt Methoden der Lexikologie und Lexikographie, Textphilologie und Wissen(schaft)sgeschichte mit Herangehensweisen der Digital Humanities, des Semantic Web und des Ontology Engineering.
1. Texteditionen und Korpus: Korpuslinguistische Analyse
Mit neuesten digitalen Verfahren wird die reiche romanische Überlieferung im Bereich der Wissenskommunikation erschlossen und in zwei exemplarischen Textkorpora zu den Domänen der Medizin und des Rechts für die historisch ausgerichtete Forschung digital aufbereitet. Diese übereinzelsprachlichen Textkorpora erschließen einen bedeutenden Kulturraum der mittelalterlichen Romania und sind die Basis für die Rekonstruktion der zentralen Konzepte und Begriffsnetze der Wissensdomänen. Der sprachübergreifende Ansatz der Erstellung der domänenspezifischen Parallelkorpora stellt hierbei ein Desiderat der bisherigen Forschung dar.
Die Korpora setzen sich zusammen aus von ALMA neu erstellten digitalen Texteditionen bisher unbearbeiteter Handschriften und aus retrodigitalisierten, in Buchform publizierten Editionen. Sämtliche Texte werden in ein einheitliches XML/TEI-Format konvertiert, tokenisiert, annotiert und lemmatisiert. Die Korpustexte werden mit quantitativ-empiristischen Methoden der Korpuslinguistik ausgewertet (absolute und relative Frequenzanalysen, Kookkurrenzanalyse), um erste Erkenntnisse zu relevanten Fachtermini und Schlüsselbegriffen zu generieren.
Domäne ‚Medizin‘
Der Bereich der Medizin spielt eine wichtige Rolle, da in ihr der Kontakt mit der griechisch-arabischen Tradition zum Tragen kommt, der und der neue Expertengruppen an die schriftliche Wissenskommunikation heranführt.
Ein Beispiel für einen der bedeutendsten Texte des medizinischen Korpus sind die vernakularsprachlichen Übersetzungen der Chirurgia magna [lt. Text 1363, älteste Handschrift mit französischer Übersetzung, 2. Drittel 15. Jh.] des Gui de Chauliac (ca. 1300-1368), eines im Frankreich des 14. Jahrhunderts wirkenden Arztes, der Leibarzt dreier Päpste war. Dieses Werk ist, anders als sein Name vermuten lässt, in seiner wissenschaftlichen Bedeutung nicht auf den Bereich der Chirurgie beschränkt.
Stattdessen stellt die Chirurgia magna einen Höhepunkt der auf antikem Wissen basierenden mittelalterlichen Medizin dar, welcher den Übergang zur neuzeitlichen Medizin einläutet: Durch die Verflechtung von Chirurgie, zu dieser Zeit als von der Medizin separat aufgefasstes Gebiet, und Medizin steht Gui de Chauliac am Beginn eines für die Moderne kennzeichnenden, umfassenderen Medizinkonzeptes. Zugleich stellt die Chirurgia magna eine das vollständige medizinisch-chirurgische Wissen seiner Zeit darstellende Kompilation dar. Bedeutend ist hierbei auch die Diskussion der Sektion menschlicher Leichen als medizinische Lehrmethode, die viele von Guy de Chauliacs Zeitgenossen nicht einsetzten. Weiteren aufgezeichneten medizinischen Innovationen wie der Klassifizierung der Lungen- und Beulenpest oder der Weiterentwicklung bisheriger Wundheilungs- und Wundnahtmethoden ist es zu verdanken, dass die Chirurgia magna bis ins 17. Jahrhundert als beliebtes Lehr- und Handbuch eine direkte Brücke zwischen mittelalterlicher und neuzeitlicher Medizin bildete.
Domäne ‚Recht‘
Die Domäne des Rechts ist aufgrund seiner jahrhundertealten Tradition der Vermittlung von volkssprachlichen und lateinischen Rechtsbegriffen und -konzepten besonders relevant.
Zwei der Schlüsseltexte sind hier die Assises de Jérusalem [vor 1266] des Jean d’Ibelin sowie der anonyme Grand coutumier de Normandie [Ende 13. Jh.]. Bei den Assises de Jérusalem handelt es sich um eine Kompilation des Gewohnheitsrechtes im lateinisch-christlichen Königreiches Jerusalem aus der Mitte des dreizehnten Jahrhunderts. Sein Verfasser war der politisch äußerst einflussreiche Jean d’Ibelin, Graf von Jaffa und Aschkelon, einer der prominentesten Adligen des lateinischen Nahen Ostens seiner Zeit. Das Werk ist aus mehreren Gründen von herausgehobener Bedeutung:
Erstens handelt es sich bei ihm um den weitaus ausführlichsten von mehreren zeitgenössischen Rechtstexten seines Kulturkreises. Zweitens gelten die Assises de Jérusalem als eine der umfassendsten, wenn nicht gar als die umfassendste mittelalterliche Abhandlung über das christlich-europäische Lehensrecht. Außerdem behandelt es formale und inhaltliche Fragen des königlichen Hofgerichtes und der Verfassung des Königreiches und seiner Herrschaftsstruktur. Für das Projekt ALMA ist der Text zudem besonders relevant, da er ohne unmittelbare lateinische Vorlage auf Französisch verfasst wurde und zudem einen Einblick in die beeindruckende Reichweite neuer volkssprachlicher Wissensnetze bis in den Nahen Osten gibt.
2. Linguistische Auswertung
Die Ergebnisse der korpuslinguistischen, statistischen Auswertung bilden die Ausgangsbasis für die kompetenzlinguistische Ausarbeitung des Wortschatzes mit dem qualitativ-hermeneutischem Vorgehen der historischen Sprachwissenschaften. Ausgehend von den in den Texten erkannten relevanten, zu analysierenden Konzepten und Begriffen werden – mit onomasiologischem, konzeptbasiertem Blickwinkel – lexikalisch-semantische Studien erarbeitet. Diese analysieren die Begriffsgeschichte (histoire du concept) sowie ihre Verknüpfung mit der Wortgeschichte (histoire du mot), über die Sprachen hinweg und im Kontext der Entstehung neuer Wissensnetze (réseaux du savoir).
In diese Studien fließen außerdem die Erkenntnisse benachbarter Disziplinen wie der Astronomie, der Botanik oder der Pharmazeutik ein. Darüber hinaus gleichen sie die volkssprachlichen Schriften mit den mittellateinischen Ursprungstexten sowie bereits erschlossenen Textkorpora ab, vor allem für das mittelalterliche Spanisch und Katalanisch. Kontrolliert wird die lexikologische Arbeit außerdem durch den Rückgriff auf die in den historischen Wörterbüchern erarbeiteten lexikographischen Materialien (Lexikographie der Gallo- und Italoromania, insbesondere die Wörterbücher Dictionnaire onomasiologique de l’ancien gascon - DAG (HAdW), Dictionnaire étymologique de l’ancien français - DEAF (HAdW), Dictionnaire de l’occitan medieval - DOM (BAdW) und Lessico etimologico italiano - LEI (AdW Mainz), FEW und DMF, dazu Iberoromania und (Mittel-)Latein.
3. Übergreifende Analysen zur Entwicklung der Wissensnetze
Von diesen Erkenntnissen der lexikalisch-semantischen Studien ausgehend wird in separaten, übergreifenden Untersuchungen die Entwicklung der volkssprachlichen Wissensnetze und der Sprachausbau untersucht und beschrieben. Potenzielle Beispiele sind Kontexte ‚Pest‘, ‚Anatomie‘, ‚Schenkungspraxis‘ etc.
4. Digital Humanities, Semantic Web und Ontology Engineering
Ein Innovationswert des Vorhabens liegt in der Verbindung der sprachdatenbasierten und übereinzelsprachlich orientierten Herangehensweise mit den Mitteln des Ontology Engineering: Wesentliches Ziel ist es, die im Projekt ermittelten, historisch-philologischen Forschungsergebnisse in informatische domänenspezifische historisierte Ontologien (in Web Ontology Language – OWL) zu überführen. Diese entwickeln die begriffliche Gliederung der untersuchten Wissensdomänen zu informatisch strukturiertem Wissen weiter. Als historisierte Ontologien werden sie dabei der Spezifik mittelalterlicher Erklärungsmuster gerecht: Sie erlauben es, die Kontinuitätsbrüche zwischen mittelalterlichen und modernen Wissen(schaft)ssystemen sichtbar zu machen und nicht durch anachronistische Zuordnungen zu verdecken. Ihr sprachübergreifender und sachbezogener Ansatz macht sie zu Knotenpunkten für die inhaltlich ausgerichtete Verknüpfung von Forschungsdaten. Dies erweitert den Nutzerkreis der Ontologien weit über den speziellen Bereich der Romanistik hinaus auf alle historisch arbeitenden Wissenschaften.
Linked Open Data
Die lexikographischen Daten, Korpustexte, die lexikalisch-semantischen Studien ebenso wie eine kritische Forschungsbibliographie (ALMABibl) werden als Linked Open Data in das Datenmodell Resource Description Framework (RDF) überführt und stehen damit für ontologiegestützte Zugriffe bereit. Um Interoperabilität zu erreichen, setzt ALMA für das Modellieren als Linked Open Data die für die Disziplin und ihre historischen linguistischen Ressourcen als (De-facto-)Standards etablierten Ontologien, Vokabularien und Repositorien ein:
- OntoLex-Lemon, Ontologies of Linguistic Annotation – OLiA für die Beschreibung linguistischer Fachtermini, Model for Language Annotation - MoLA für die Sprachbeschreibung etc,
- zudem solche für Ortsnamen (Geonames, Getty Thesaurus of Geographic Names – TGN), Personennamen (Virtual International Authority File – VIAF; Gemeinsame Normdatei – GND) etc.
Die Linked-Open-Data-Modellierung und die historischen Domänenontologien wird das Projekt außerdem für die innovative Nachnutzung der einschlägigen lexikographischen Ressourcen der Wörterbücher der Akademien DAG, DEAF, DOM und LEI einsetzen.
Publikationen
Die von ALMA erarbeiteten Erkenntnisse werden durch verschiedene Publikationsarten der Öffentlichkeit zugänglich gemacht: Synthesen von Ergebnissen spezifischer Forschungsbereiche werden in Form von Monographien, Tagungsbänden oder Aufsätzen in Fachzeitschriften veröffentlicht. Ein großer Teil der Forschungsergebnisse erscheint im Open-Access Online-Portal des Projekts: die Korpustexte, die lexikalisch-semantischen Studien (in enger Verknüpfung mit den Online-Versionen der Akademiewörterbücher DAG, DEAF, DOM und LEI sowie weiteren Wörterbüchern), die Forschungsbibliographie ALMABibl sowie die Domänenontologien.
Die Linked-Open-Data-Ressourcen werden über einen Triplestore abfragbar gemacht.
Copyright:
1. Visualisierung der TextFactory-Pipeline, ALMA.
2. “Trotula”, Urinflasche haltend, Handschrift Wellcome Collection, London, MS. 544 [frühes 14. Jh.]. Miscellanea medica XVIII. CC BY 2.0
3. „Trotula de Salerno, De passionibus mulierum“, Handschrift Salerno [1544]“. Public domain.
4. Abb. eines Textes in eScriptorium.
5. RDF-Daten.