Fa­kul­täts­über­grei­fen­des DFG-Pro­jekt im Be­reich Di­gi­tal Hu­ma­ni­ties an der Uni­ver­si­tät Pa­der­born ge­st­ar­tet

Neues Forschungsprojekt im Bereich Digital Humanities an der Universität Paderborn: „InterGramm“ untersucht den Sprachausbau im Mittelniederdeutschen. Die Deutsche Forschungsgemeinschaft (DFG) fördert das Vorhaben mit rund einer halben Million Euro. Prof. Dr. Doris Tophinke (Fakultät für Kulturwissenschaften), Jun.-Prof. Dr. Michaela Geierhos (Fakultät für Wirtschaftswissenschaften) und Prof. Dr. Eyke Hüllermeier (Fakultät für Elektrotechnik, Informatik und Mathematik) arbeiten an einer interaktiven Grammatikanalyse historischer Texte. 

Das empirische Forschungsvorhaben untersucht den Sprachausbau des Mittelniederdeutschen vom 13. Jahrhundert bis zum Schreibsprachenwechsel im 16./17. Jahrhundert, mit dem das Mittelniederdeutsche seine Geltung als Schriftsprache an das Frühneuhochdeutsche verliert. Es leistet damit einen Beitrag zur Rekonstruktion der bislang erst punktuell untersuchten grammatischen Entwicklung des Mittelniederdeutschen als historischer Schriftsprache. Die Untersuchung konzentriert sich auf städtische Rechtssatzungen. Diese sind lokalisier- und datierbar, sodass sich die zeiträumliche Entwicklungsdynamik der Grammatikentwicklung nachvollziehen lässt.

Entwickelt wird ein interaktives Verfahren, das maschinelles Lernen und Expertenfeedback kombiniert. Auf diese Weise soll ein zentrales Problem bestehender Annotationsverfahren für historische Texte gelöst werden. Denn existierende Methoden zur maschinellen Grammatikanalyse setzen statische grammatische Kategorien (wie z. B. Konjunktion, Präposition etc.) voraus, was der historischen Dynamik der Grammatik – in der es auch Mischformen gibt – nicht gerecht wird. Eine sich in dieser Zeit erst nach und nach entwickelnde Grammatik mittels regelbasierter Textanalyseverfahren und Methoden des maschinellen Lernens im Korpus zu „entdecken“ und auf diese Weise den Sprachwandel evidenzbasiert zu rekonstruieren ist ein Novum. Da dies gleichermaßen sprach- bzw. grammatikhistorisches Wissen sowie Kenntnisse im Bereich der Computerlinguistik und Informatik voraussetzt, ist das Vorhaben als fächerübergreifendes Projekt konzipiert, das eine enge Kooperation der Fächer über den gesamten Förderzeitraum verlangt.