FAU-Informatiker entwickeln digitale Assistenten für die Geisteswissenschaften

Papsturkunde (Bild: Klaus Herbers)
Ziel des Projektes „Schrift und Zeichen“ ist es, anhand von päpstlichen Urkunden den Austausch zwischen Rom und einzelnen Bistümern und Orden im Mittelalter besser zu verstehen. Manuell ist das Konvolut von tausenden Originalen und Faksimiles kaum zu bewältigen. Hier kommen die Informatiker der FAU ins Spiel. (Bild: Klaus Herbers)

Die Informatik geht fremd

Vincent Christlein kann Handschriften deuten. Der Charakter der Schreiber ist dem Informatiker von der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) dabei allerdings völlig egal. Christlein kann anhand von dynamischen Oberlängen, sanft geschwungenen G-Schleifen, energischen T-Strichen und etlichen anderen Merkmalen die Umstände der Entstehung eines Textes ablesen.

Vincent Christlein ist Experte für maschinelles Sehen und Bildverarbeitung am Lehrstuhl für Mustererkennung der FAU. Er hat gemeinsam mit Forscherkollegen Software entwickelt, die in der Lage ist, handgeschriebenen Texten Informationen über die Entstehungszeit des Dokuments, den Ort, an dem es geschrieben wurde, oder sogar den Schreiber bestimmen, auch wenn der schon hunderte Jahre tot ist.

Digital Humanities bergen unschätzbares Potenzial für die Wissenschaft

Gerade für die Untersuchung historischer Dokumente ist das noch junge Wissenschaftsfeld der Digital Humanities, der digitalen Geisteswissenschaften – und im besonderen Vincent Christleins Software – ein unschätzbares Hilfsmittel. Das konnte der Nachwuchswissenschaftler unter anderem im vom Bundesforschungsministerium geförderten Projekt „Schrift und Zeichen“ unter Beweis stellen.

In diesem Projekt haben es sich Historiker aus Erlangen und München zum Ziel gesetzt, anhand von päpstlichen Urkunden den Austausch zwischen Rom und einzelnen Bistümern und Orden im mittelalterlichen Europa besser zu verstehen. Doch manuell ist das Konvolut von tausenden Originalen und Faksimiles kaum zu bewältigen. Hier kommen die Informatiker ins Spiel.

Doch auch diese standen zunächst vor einer Herausforderung: Den Inhalt analoger, maschinengeschriebener Textdokumente automatisch zu erfassen, ist heute vergleichsweise einfach: Per OCR- Schrifterkennung (OCR – Optical Character Recognition) werden Seiten in Zeilen, Zeilen in Wörter und Wörter in Buchstaben zerlegt, mit hinterlegten Mustern abgeglichen und zu digitalen Dokumenten zusammengesetzt.

Doch die jahrhundertealten Papsturkunden sind nicht immer gut erhalten. Schriften sind verblasst, Falze gerissen, Dokumente mit Flecken verunreinigt. Außerdem sind viele Originale unscharf fotografiert worden und die Fotografien teilweise vergilbt. Also haben die FAU-Informatiker ein Tool entwickelt, das die Schrift zunächst aus den Urkunden extrahiert, um sie weiter analysieren zu können.

Im zweiten Schritt geht es darum, die Schreiber zu identifizieren. Die handschriftlichen Wörter und Absätze werden dabei als Ganzes betrachtet. Mit einer neu entwickelten Methode, bei der die Merkmale an der Kontur der Buchstaben erfasst werden, ordnet die Software Dokumente automatisch dem passenden Autor zu.

FAU-Software lüftet Geheimnisse von Bach-Noten und Luther-Portraits

Mithilfe dieser Tools können die FAU-Informatiker nicht nur Papsturkundenforscher unterstützen, sondern auch andere geisteswissenschaftliche Forschungsvorhaben deutlich erleichtern – und zum Beispiel die Urheberschaft von Kompositionen klären. So lagern im Bach-Archiv in Leipzig unzählige Notenblätter aus dem weit verzweigten Musikergeschlecht. Viele davon sind weder datiert noch signiert und so unmöglich einem der Mitglieder der Familie Johann Sebastian Bachs zuzuordnen. Hier konnten Vincent Christlein und seine Kollegen in einer Vorstudie wertvolle Unterstützung leisten.

Auch in der bildenden Kunst leisten die Software-Tools der FAU-Informatiker wertvolle Dienste. Ganz aktuell in einem Projekt von Erlanger, Nürnberger und Kölner Wissenschaftlern, das herausfinden will, wie Martin Luther wirklich aussah. Mit anhaltender Legendenbildung und wachsender Verehrung entstanden nämlich immer mehr Bilder des außergewöhnlichen Kirchenmanns: Luther als frommer Mönch, als Junker Jörg, als Reformator oder als Ehemann gemeinsam mit seiner Frau Katharina von Bora. Doch sah Luther wirklich so aus, wie auf den Bildern dargestellt?

Bekannt ist, dass Lucas Cranach d. Ä. Studien auf Papier nach der lebenden Person anfertigte und die Gemälde dann mit Werkstattmitarbeitern seriell produzierte. Aber eine solche Studie ist nicht erhalten. Also wann und wie sind die Bildnisse von Luther überhaupt entstanden? Halten sie ihn tatsächlich in einem spezifischen Moment seines Lebens fest? Oder sind sie Zeugnisse für die nachträgliche Heroisierung und Verehrung des Reformators? Neben anderen Analyseverfahren spielt in dem Projekt die Software der FAU-Informatiker eine wichtige Rolle. Es gilt, Luther-Porträts aus den Jahren 1519 bis 1530 digital zu erfassen und durch spezielle Analyseverfahren in ihren relativen Ähnlichkeitsverhältnissen darzustellen.

Ein Forschertraum wird wahr: Rare historische Drucke online als Volltext

Das neueste Projekt der Bildverarbeitungsexperten an der FAU und ihrer Partner in Mainz und Leipzig stellt erneut die Schriftanalyse in den Mittelpunkt – und könnte Forschern bald lange Reisen um die Welt ersparen, um in staubigen Archiven einzigartige Bücher zu studieren. Denn Ziel der Informatiker ist es, eine Software zu entwickeln, um Drucke aus dem 15. bis 18. Jahrhundert digital verfügbar zu machen – und nicht nur als Scan, wie es in den vergangenen 20 Jahren vorangetrieben wurde, sondern als durchsuchbaren Volltext.

Hier stehen die Forscherkollegen von Vincent Christlein allerdings vor einer ähnlichen Herausforderung wie sie die Papsturkunden stellten: Die Bücher sind nicht immer gut erhalten und teils schwer entzifferbar. Außerdem sind der bisher existierenden OCR-Software die verwendeten alten Schriftarten und deren Varianten oft nicht bekannt. Hier gilt es, ähnliche Schriftarten zusammenzufassen und der Software beizubringen, die Typen zu erkennen. Außerdem soll die neue Software ihre künftigen Nutzer dabei unterstützen, selbst Schrifterkennungstools zu trainieren, unbekannte alte Schriftarten zu lesen. Eine mühsame Aufgabe, die jedoch Forschern weltweit ganz neue Einblicke und Einsichten ermöglichen wird.

Kontakt:

Vincent Christlein
Tel.: 09131/85-20281
vincent.christlein@fau.de
https://lme.tf.fau.de/person/christlein/

Prof. Dr.-Ing. Andreas Maier
Tel.: 09131/85-27883
andreas.maier@fau.de
https://lme.tf.fau.de/person/maier/