Volltextdigitalisierung der Staats- und Gelehrte[n] Zeitung des Hamburgischen Unpartheyischen Correspondenten und ihrer Vorläufer (1712-1851)
Material
Im Forschungsprojekt wurden 212 Ausgaben einer der bekanntesten und auflagenstärksten Zeitung des 18. und beginnenden 19. Jahrhunderts, der Staats- und Gelehrte[n] Zeitung des Hamburgischen unpartheyischen Correspondenten und ihrer Vorläufer, so Stats – u. gelehrte Zeitung des hollsteinischen unpartheyischen Correspondenten (1721-1727) für (sprach)historische Untersuchungen erschlossen. - Eine kurze Übersicht über die einzelnen Arbeitsschritte - von der Bildbearbeitung bis zur Volltextdigitalisierung und deren Publikation - findet sich in einer PDF-Datei.
Der Correspondent besaß überregionale Geltung und hatte auch für kleinere, regional orientierte Zeitungen Vorbildcharakter. Mit den Ausgaben von 1712 bis 1851 wurde eine Zeitspanne erfasst, die als „Sattelzeit“ der Pressekommunikation bezeichnet werden kann, da der Zeitungsmarkt expandierte, die Auflagenzahlen sich stark erhöhten, breitere Leserschichten erreicht und das Textsortenspektrum erweitert wurde. Der Correspondent stellt insofern eine Arbeitsgrundlage für alle Wissenschaftler/innen dar, die sich mit der Genese der modernen Zeitungskommunikation auseinandersetzen wollen bzw. Zeitungen als wichtiges Material der Kommunikations-, Sozial- und Kulturgeschichte erachten. Die Zusammensetzung der ausgewählten Ausgaben erfasst das Zeitungsmaterial in Zeitschnitten von 20 Jahren, wobei sowohl besondere historische Ereignisse, so die Französische Revolution, als auch Besonderheiten der Zeitungsentwicklung, so die Umstellung des Correspondenten auf eine Tageszeitung im Jahr 1830, erfasst werden.
Ziele
Im Projekt wurde eine Volltextdigitalisierung und strukturelle Aufbereitung der Texte orientiert an den P5-Richtlinien der Text Encoding Initiative (TEI) durchgeführt. Diese Volltextdigitalisierung entstand partiell in Zusammenarbeit mit dem an der Berlin-Brandenburgischen Akademie der Wissenschaften angesiedelten „Deutschen Textarchiv“ (DTA), in dem ein Referenzkorpus zur Entwicklung der neuhochdeutschen Sprache ab dem 17. Jahrhundert erstellt wird. Das am DTA entwickelte TEI-P5-basierte Format zur Textauszeichnung, das DTA-Basisformat (DTABf), wird als ‚Best Practice‘ für historische Textdaten im BMBF-geförderten Verbundprojekt CLARIN-D empfohlen und wurde auch im Projekt entsprechend verwendet.
Zentrale fachwissenschaftliche Fragestellungen
Hochwertige Volltexttranskriptionen gehen über reine Bilddigitalisierungen und über OCR erzeugte Volltexte hinaus. Die Konvertierung alter Zeitungen in ein XML-Format ermöglicht eine nach Fachinteressen differenzierte Nutzung: Neben der problemlosen Erschließung von Inhalten nach bestimmten Schlagworten erlaubt die Überführung in ein XML-Basisformat eine linguistische Indizierung, so dass sich Lemma- und Morphemstrukturen bzw. syntaktische Kategorien ermitteln und hinsichtlich ihres Wandels untersuchen lassen. Im Volltext digitalisierte Quellen sind jedoch auch eine gute Voraussetzung dafür, Inhalte qualitativ in Hinsicht auf sprachfunktionale, pragmatische, text- und diskurslinguistische Fragen auszuwerten und sind deshalb auch für angrenzende Wissenschaften interessant. So stellen Zeitungen eine wichtige sprachhistorische Quelle dar, wobei die Leistung der Zeitungen und Zeitungsschreiber für die Entwicklung der deutschen Sprache gerade im 18. Jahrhundert kaum gewürdigt worden ist. Die Digitalisierung der Zeitungen des hier vorgesehenen Zeitraums kann also als ein erster Schritt begriffen werden, um die sprachlichen und textsortenspezifischen Entwicklungen von Zeitungen detaillierter erforschen. Folgende Forschungsfragen könnten perspektivisch bearbeitet werden:
- Wie entwickelt sich das Spektrum der innerhalb von Zeitungen vertretenen Textsorten im 18. Jahrhundert?
- Wie entwickelt sich das sprachliche Profil einzelner Textsorten?
- Bleibt die zum Teil komplexe Kanzleisyntax mit entsprechenden sprachlichen Prestigesignalen erhalten?
- Welche Wortschatzressourcen sind vorhanden?
- Werden Techniken der Leserorientierung und Verständnisförderung ausgebaut?
- Wie verhalten sich Zeitungen zu allgemeinen sprachlichen Entwicklungstendenzen im 18. und beginnenden 19. Jahrhundert?
Dabei ist hervorzuheben, dass die Auseinandersetzung mit einem zentralen Quellenmaterial im Längsschnitt für das 18. Jh. noch nicht geleistet worden, da sich die Sprachgeschichte in diesem Zeitraum eher auf sprachbewusstseinsgeschichtliche Quellen (Grammatiken u. ä.) konzentriert hat. Insofern eröffneten Longitudinalstudien die Möglichkeit, die Bedeutung des metasprachlichen Diskurses ebenso wie den Sprachgebrauch der zeitgenössischen Presse einzuschätzen. Mit der Digitalisierung von Zeitungen aus dem 18. und 19. Jahrhundert lässt sich die Vorgeschichte heutiger Pressesprache, die durch das Deutsche Referenzkorpus (DeReKo) bzw. COSMAS II (Corpus Search, Management and Analysis System) gut erschlossen ist, rekonstruieren und eine wichtige sprachliche Varietät und deren Rolle aussondern.
Nutzen der Volltextdigitalisierung – Forschungsperspektiven
Fach- und disziplinenübergreifende Nutzbarkeit
Die Bild- und Volltextdigitalisierung des Hamburgischen Correspondenten, ihre freie Zugänglichkeit sowie die Recherche- und Suchinstrumente des Deutschen Textarchivs ermöglichen Untersuchungen in den verschiedensten Forschungsfeldern, zum Beispiel:
- in der Pressehistorik,
- in der (historischen) Linguistik,
- in der Medienwissenschaft,
- in den Sozialwissenschaften,
- in den Geschichtswissenschaften,
- in den Literaturwissenschaften.
Gleichzeitig stellt das Projekt einen Beitrag zur Förderung und Weiterentwicklung der Volltextdigitalisierung als Grundlage für nachhaltige Nutzbarkeit und Zugänglichkeit historischen Bild- und Textmaterials vom 18. und 19. Jahrhundert dar.
Bereitstellung historischen Zeitungsmaterials aus dem 18./19. Jahrhundert
Das digitalisierte Material (Korpus HC) ergänzt u.a. das Mannheimer Korpus historischer Zeitungen (MKHZ) vom Institut für Deutsche Sprache, das besonders aus dem 18. Jahrhundert nur vereinzelt Textdigitalisate beinhaltet. Mit der Verfügbarkeit der Volltextdigitalisate des Correspondenten kann die Forschungslücke der Untersuchung der Zeitungssprache im 18. und 19. Jahrhundert in Ansätzen geschlossen werden.
Suchen und Recherchieren im Deutschen Textarchiv Berlin (DTA)
Jede Zeitungsausgabe enthält Auszeichnungen zur Makrostruktur (Unterteilung in Rubriken, Unterrubriken, Artikel, Anzeigen etc.). Dank automatischer linguistischer Annotationen können detaillierte Suchanfragen auf den Ebenen der Morphologie, Lexikologie und der Syntax gestellt werden.
Suchanfragen mit der linguistischen Suchmaschine DDC
Mithilfe der DDC-eigenen Suchsyntax sind u.a. folgende Suchanfragen möglich:
- einfache Wortsuche (@Beispiel für die genaue Wortform Beispiel)
- Trunkierungen (*ieren für alle Lexeme auf –ieren)
- Phrasensuchen („der junge Mann“)
- Wortartensuchen (VVFIN für finite Verben)
- Lexempositionen im Satz (allein with $.=0 für allein am Satzanfang)
Mithilfe der Suchanfragen können bestimmte Forschungshypothesen schnell überprüft werden. Neben quantitativen und qualitativen Analysen können auch Vergleichsanalysen mit historischem Textmaterial anderer Textgattungen durchgeführt werden.
Nutzbarkeit und Forschungsperspektiven für die Linguistik
Das Material ist von großem sprachhistorischen Interesse, da sich in den frühen Zeitungen Entwicklungstendenzen auf verschiedenen linguistischen Untersuchungsebenen zeigen, etwa:
- Homogenisierung und Ausdifferenzierung zeitungsspezifischer Textsorten (Faktenmeldungen, Ereignisdarstellungen, Verlaufsberichte),
- Entwicklung ausgabenübergreifender Sparten und Rubriken (politische Berichterstattung vs. Anzeigenteil vs. Feuilleton),
- Erweiterung des Textsortenprofils (etwa: der Gelehrte Artikel als Frühform des heutigen Feuilletons; die Werbeanzeigen im Anzeigenteil der Zeitung),
- Profilierung kommunikativer Prinzipien zur Lösung zeitungsspezifischer kommunikativer Aufgaben,
- Ablösung von der Kanzleisprache als Prestigevarietät hin zu einer eher adressatenorientierten Bürgersprache (lexikalisch und syntaktisch).
Projektvorstellung - Vortragsaktivitäten
- Deutsches Textarchiv, Berlin
- Institut für Deutsche Sprache, Mannheim
- Universität Regensburg
Projektleitung und Projektmitarbeiter/innen
Prof. Dr. Britt-Marie Schuster
Manuel Wille, M.A.
Arnika Lutz, M.A.
Katrin Schubert
Sabrina Wilmer
Anschrift:
Universität Paderborn
Institut für Germanistik und Vergleichende Literaturwissenschaft
Warburger Straße 100
33098 Paderborn
05251 - 60-2868
05251 - 60-3093
Das Projekt wurde in der Programmlinie „Infrastrukturelle Förderung für die Geistes- und Gesellschaftswissenschaften“ vom Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen gefördert.