Computational methods for investigating syntactic change

  • Diachronic syntactic analyses suffer from a lack of annotated historical language data. In this thesis, computational methods for the automatic syntactic analysis of modern and historical German are developed, which help to overcome the natural limitations of manual annotation. The thesis describes experiments on topological field analysis, chunking, and constituency parsing with the goal of automatically detecting extraposition in arbitrary data. All annotation steps are evaluated using the newly developed FairEval method. The best results are obtained with statistical models trained on part-of-speech tags as input. In an example analysis, the developed methods are applied to large collections of modern and historical texts to explore different factors for the extraposition of relative clauses, demonstrating the practical value of computational approaches for linguistic studies. Models, data, and code from the thesis are freely available online.
  • Diachrone syntaktische Analysen leiden bislang unter einem Mangel annotierter historischer Sprachdaten. In dieser Arbeit werden computerlinguistische Methoden zur automatischen syntaktischen Analyse von modernem und historischem Deutsch entwickelt, die die natürlichen Grenzen manueller Annotation überwinden. Die Arbeit beschreibt Experimente zur topologischen Felderanalyse, Chunking und Konstituentenparsing mit dem Ziel, automatisch Extrapositionen in beliebigen Daten zu erkennen. Alle Annotationsschritte werden mit der neu entwickelten FairEval-Methode evaluiert. Die besten Ergebnisse erzielen auf Wortarten trainierte statistische Modelle. In einer Beispielanalyse werden die entwickelten Methoden auf große Sammlungen moderner und historischer Texte angewandt, um Faktoren für die Extraposition von Relativsätzen zu erforschen und den praktischen Nutzen computergestützter Ansätze für die linguistische Forschung zu demonstrieren. Modelle, Code und Daten stehen online frei zur Verfügung.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Katrin OrtmannGND
URN:urn:nbn:de:hbz:294-96590
DOI:https://doi.org/10.13154/294-9659
Subtitle (English):automatic identification of extraposition in modern and historical German
Referee:Stefanie DipperORCiDGND, Heike ZinsmeisterGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2023/03/14
Date of first Publication:2023/03/14
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Philologie
Date of final exam:2023/02/01
Creating Corporation:Fakultät für Philologie
Tag:Deutsch; Evaluation; Historische Sprachwissenschaft; Historische Syntax; Mündlichkeit; Register (Linguistik)
GND-Keyword:Computerlinguistik; Korpus (Linguistik); Satzanalyse; Extraposition; Annotation
Institutes/Facilities:Sprachwissenschaftliches Institut
Dewey Decimal Classification:Sprache / Sprache, Linguistik
faculties:Fakultät für Philologie
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht