Computational methods for investigating syntactic change
- Diachronic syntactic analyses suffer from a lack of annotated historical language data. In this thesis, computational methods for the automatic syntactic analysis of modern and historical German are developed, which help to overcome the natural limitations of manual annotation. The thesis describes experiments on topological field analysis, chunking, and constituency parsing with the goal of automatically detecting extraposition in arbitrary data. All annotation steps are evaluated using the newly developed FairEval method. The best results are obtained with statistical models trained on part-of-speech tags as input. In an example analysis, the developed methods are applied to large collections of modern and historical texts to explore different factors for the extraposition of relative clauses, demonstrating the practical value of computational approaches for linguistic studies. Models, data, and code from the thesis are freely available online.
- Diachrone syntaktische Analysen leiden bislang unter einem Mangel annotierter historischer Sprachdaten. In dieser Arbeit werden computerlinguistische Methoden zur automatischen syntaktischen Analyse von modernem und historischem Deutsch entwickelt, die die natürlichen Grenzen manueller Annotation überwinden. Die Arbeit beschreibt Experimente zur topologischen Felderanalyse, Chunking und Konstituentenparsing mit dem Ziel, automatisch Extrapositionen in beliebigen Daten zu erkennen. Alle Annotationsschritte werden mit der neu entwickelten FairEval-Methode evaluiert. Die besten Ergebnisse erzielen auf Wortarten trainierte statistische Modelle. In einer Beispielanalyse werden die entwickelten Methoden auf große Sammlungen moderner und historischer Texte angewandt, um Faktoren für die Extraposition von Relativsätzen zu erforschen und den praktischen Nutzen computergestützter Ansätze für die linguistische Forschung zu demonstrieren. Modelle, Code und Daten stehen online frei zur Verfügung.
Author: | Katrin OrtmannGND |
---|---|
URN: | urn:nbn:de:hbz:294-96590 |
DOI: | https://doi.org/10.13154/294-9659 |
Subtitle (English): | automatic identification of extraposition in modern and historical German |
Referee: | Stefanie DipperORCiDGND, Heike ZinsmeisterGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2023/03/14 |
Date of first Publication: | 2023/03/14 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Philologie |
Date of final exam: | 2023/02/01 |
Creating Corporation: | Fakultät für Philologie |
Tag: | Deutsch; Evaluation; Historische Sprachwissenschaft; Historische Syntax; Mündlichkeit; Register (Linguistik) |
GND-Keyword: | Computerlinguistik; Korpus (Linguistik); Satzanalyse; Extraposition; Annotation |
Institutes/Facilities: | Sprachwissenschaftliches Institut |
Dewey Decimal Classification: | Sprache / Sprache, Linguistik |
faculties: | Fakultät für Philologie |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |