Den digitalen Weg zu einem alten Volk aus Anatolien ebnen

Die digitale Infrastruktur des Hethitologie-Portals Mainz (HPM) zu erweitern – darum kümmert sich nun ein Team der Julius-Maximilians-Universität Würzburg (JMU) im Rahmen des Projekts "Digital Pathways to the Hittite World". Federführend beteiligt sind Professor Daniel Schwemer, Leiter des Lehrstuhls für Altorientalistik, Stephanie Döpper, Juniorprofessorin für Digital Humanities für Vorderasiatische Archäologie und Altorientalistik, und Martin Gruber, Juniorprofessor für Vorderasiatische Archäologie, sowie Andreas Schachner vom Deutschen Archäologischen Institut (DAI, Abteilung Istanbul) und Leiter der Ausgrabungen in Boğazköy-Ḫattuša sowie außerplanmäßiger JMU-Professor. Das Zentrum für Philologie und Digitalität (ZPD) sowie das Center for Artificial Intelligence and Data Science (CAIDAS) unterstützen das Projekt auf technischer Seite.

Nachrichten durchblättern
Hethitologie Portal Mainz
Hethitologie Portal Mainz (Screenshot)

Obwohl sich im Hethitologie-Portal Digitalisate aller bekannten hethitischen Tontafel-Fragmente befinden, kann eine gezielte und strukturierte Suche mit Blick auf komplexe Fragestellungen oft schwierig sein und lange dauern. Deshalb bereinigt das Team im ersten Schritt die Daten. "Da bereits seit 1906 in Boğazköy-Ḫattuša gegraben wird, haben wir eine große Diskrepanz in der Datenqualität", meint Döpper. Details, die über den Textinhalt hinausgehen – wie beispielsweise der genaue Fundort –, helfen Forschenden genauere Analysen durchzuführen. Damit ersparen diese sich zeitaufwendige Recherchen.

Das Team möchte auch erweiterte Suchen ermöglichen, indem es Datensätze miteinander verknüpft. Nutzerinnen und Nutzer sollen so spezifische Inhalte einzelner Texte finden können. Ein Beispiel: "Auch Anfragen zu spezifischen Forschungsfeldern werden möglich. Wenn jemand beispielsweise zu hethitischen Ritualen forscht, kann die Person auch nach spezifischen Ritualwerkzeugen suchen und sich alle Fundobjekte anzeigen lassen, die darauf Bezug nehmen", erklärt die Juniorprofessorin.

Auch künstliche Intelligenz (KI) kommt zum Einsatz: Dafür kooperiert das Team mit dem CAIDAS zusammen – allen voran mit Professor Andreas Hotho, Leiter des Lehrstuhls für Data Science. Die Forschenden wollen mit LLäMmlein arbeiten – dem großen Sprachmodell des Zentrums, das als erstes seiner Art ausschließlich in Deutsch trainiert worden ist.

Die KI soll nun eine weitere Sprache lernen: Hethitisch. "LLäMmlein kann Linguistinnen und Linguisten bei der Arbeit helfen. Das Sprachtraining ermöglicht ihm, sprachliche Muster des Hethitischen schneller zu erkennen", so Döpper. Dies falle vor allem ins Gewicht, wenn es um nur in Fragmenten erhaltene Tontafeln geht. Das Sprachmodell könne vorhersagen, welcher Text am wahrscheinlichsten folgen dürfte und unterstütze so bei der Rekonstruktion von Sätzen sowie bei der Wiederherstellung vollständigerer Tafeln aus verschiedenen Fragmenten.

Wichtige Fragen, die sich Archäologinnen und Archäologen stellen, sind: Wo genau wurde ein Fragment gefunden? Wie viele Tafeln befanden sich dort? Früher führten Forschende Grabungstagebücher, um Informationen zu einer archäologischen Stätte festzuhalten. "Das Problem hierbei ist, dass jeder sein eigenes System und seine eigenen Abkürzungen verwendet hat. Was bei Forscher A als Fundort A bezeichnet wird, heißt bei Forscherin B Fundort B, und eigentlich meinen sie die gleiche Stelle", so Döpper. Das Ziel: Die Tagebücher auswerten und die daraus gewonnen Informationen im Portal digital vereinheitlichen. Nutzerinnen und Nutzer erhalten dadurch detailliertere Angaben zum Fundort von Tafeln.

Darüber hinaus will das Team die Zuordnung von Keramikscherben zu bestimmten Typen erleichtern. Die Form hilft, zeitlich einzuordnen, wann ein Gefäß entstanden ist. Üblich ist es, diesen Vorgang händisch vorzunehmen. "Auch wenn es bereits digitale Ansätze gibt, sind diese oft noch fehlerhaft. Beispielsweise nehmen manche Systeme die erhaltene Länge einer Scherbe als wichtigstes Merkmal für eine Klassifikation. Diese ist jedoch nur ein zufälliges Ergebnis der Erhaltung", so die Juniorprofessorin. Solche Defizite wollen die JMU-Forschenden beheben, um den Prozess der Typologisierung zu automatisieren.