"KI und alte Sprachen sind kein Widerspruch"

ÖAW entwickelt Altgriechisch-KI "Apollo" mit Mistral und Reply

Die Österreichische Akademie der Wissenschaften (ÖAW) arbeitet gemeinsam mit den KI-Unternehmen Mistral AI und Sail Reply an der Entwicklung eines Large Language Modells (LLM) für Altgriechisch: Apollo, benannt nach dem griechischen Gott des Lichts und Schutzgott der Künste und Wissenschaften, wird die Forschung an altgriechischen Texten vorantreiben. Das Modell wird fortschrittliche Textsuche und automatischen Lückenschluss in Hunderttausenden von bislang unerschlossenen Papyri und Inschriften unterstützen, sodass die präzise Erfassung von Inhalten in Stunden statt in Jahren möglich wird. Die ÖAW und ihre Partner leisten damit Pionierarbeit, denn LLMs befassten sich bislang noch nicht mit einer sich im Laufe der Zeit wandelnden historischen Sprache und der Rekonstruktion stark beschädigter antiker Texte.

Nachrichten durchblättern
Abschrift eines Prozessprotokolls mit Korrekturen in roter Tinte
Beglaubigte Abschrift eines Prozessprotokolls mit Korrekturen in roter Tinte, 124 n. Chr. Foto: © Österreichische Nationalbibliothek

Seitens der ÖAW leitet Anna Dolganov, Althistorikerin und Papyrologin am Österreichischen Archäologischen Institut der ÖAW, das Projekt. Sie koordiniert die fachliche Begleitung, sorgt für die Einbindung der relevanten Quellen und stellt die wissenschaftliche Qualität sicher. Durch ihre Expertise gewährleistet Dolganov, dass historische Kontextualisierung und methodische Standards eingehalten werden.

ÖAW-Präsident Heinz Faßmann sagt: "Alte Sprachen und Künstliche Intelligenz sind kein Widerspruch. Die Zusammenarbeit unseres Archäologischen Instituts mit Mistral und Reply zeigt, wie die KI auch die geisteswissenschaftliche Forschung vorantreibt. Apollo wird die Forschung beim besseren Verständnis von oft lückenhaften Texten unterstützen und damit zu einer besseren Kenntnis unserer gemeinsamen Geschichte beitragen."

Anna Dolganov: "Unser Projekt mit Mistral AI und Sail Reply entwickelt das weltweit erste fortschrittliche multimodale Large Language Modell für eine historische Sprache aus der Antike. Das LLM wird auf dem bislang größten digitalen Corpus historischer griechischer Quellen trainiert. Dieses KI-System kann in vielfältige Richtungen für eine Vielzahl von Forschungsaufgaben entwickelt werden, von der Rekonstruktion fragmentarischer Inschriften und Papyri über die Durchführung semantischer und thematischer Suchen in der gesamten griechischen Textüberlieferung bis hin zur Entzifferung handschriftlicher Texte. Es gibt beispielsweise eine Million griechischer Papyri weltweit, die noch nie gelesen wurden. Zehntausende davon liegen in der Papyrussammlung der Österreichischen Nationalbibliothek. Auf solche Schätze an historischem Wissen zielen wir ab. Dieses LLM ist der Beginn einer äußerst spannenden Reise für die Erforschung der Antike."

Apollo wird auf einem hochspezialisierten Corpus trainiert, der etwa 600 Millionen Wörter aus historischen griechischen Texten und zehntausende publizierte Inschriften und Papyri umfasst. Die Zusammenarbeit mit Mistral und Sail Reply bietet eine vertrauenswürdige und sichere Umgebung auf europäischen Infrastrukturen und ermöglicht es, mit strengen Datenschutz- und Datensicherheitsanforderungen das Potenzial generativer KI voll auszuschöpfen.