Investigation of functional RNA structures using deep learning and experiment-guided computational approaches
Untersuchung funktionaler RNA-Strukturen mit Deep Learning und experimentell gestützten Methoden
- RNA secondary structures fulfill diverse regulatory functions in the cell. Their investigation is therefore key to understanding biological processes. The Lead-Seq method established here makes an important contribution to this by enabling transcriptome-wide mapping of RNA secondary structures in vivo. Another method presented here complements the in silico prediction of RNA structures. In an inverse folding based pre-training approach, deep learning methods are enhanced with prior knowledge from the thermodynamic model. This enables the inference of features from only a few data points, as shown in the example of transcription terminators. Last, a novel quartet loss is introduced that continues the integration of existing knowledge in deep learning methods. The trained models reproduce a known phylogeny and can be used to identify which features evolve along the given tree.
- RNA-Sekundärstrukturen übernehmen diverse regulatorische Funktionen in der Zelle. Ihre Untersuchung ist daher ein wichtiger Schlüssel zum Verständnis biologischer Prozesse. Die hier etablierte Methode Lead-Seq leistet dazu einen wichtigen Beitrag, indem sie die transkriptomweite Kartierung von Sekundärstrukturen in vivo ermöglicht. Eine weitere hier vorgestellte Methode ergänzt die in silico Vorhersage von RNA-Strukturen. In einem auf inverser Faltung basierendem Pretraining Ansatz werden Deep Learning Methoden um Vorwissen aus dem thermodynamischen Modell ergänzt. Dies ermöglicht die Ableitung von Merkmalen aus nur wenigen Datenpunkten, wie am Beispiel von Transkriptionsterminatoren gezeigt wird. Zuletzt wird ein neuartiger Quartet Loss eingeführt, der die Integration von bestehendem Wissen in Deep Learning fortsetzt. Die trainierten Modelle reproduzieren eine bekannte Phylogenie und können verwendet werden um Merkmale zu identifizieren, welche entlang des gegebenen Baums evolvieren.
Author: | Vivian Bernadette BrandenburgORCiDGND |
---|---|
URN: | urn:nbn:de:hbz:294-105716 |
DOI: | https://doi.org/10.13154/294-10571 |
Referee: | Franz NarberhausORCiDGND, Axel MosigORCiDGND |
Document Type: | Doctoral Thesis |
Language: | English |
Date of Publication (online): | 2020/09/20 |
Date of first Publication: | 2022/09/20 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Biologie und Biotechnologie |
Date of final exam: | 2023/03/21 |
Creating Corporation: | Fakultät für Biologie und Biotechnologie |
GND-Keyword: | Bioinformatik; Deep learning; RNS; Phylogenie; Transkriptomanalyse |
Institutes/Facilities: | Lehrstuhl für Biologie der Mikroorganismen |
Dewey Decimal Classification: | Naturwissenschaften und Mathematik / Biowissenschaften, Biologie, Biochemie |
faculties: | Fakultät für Biologie und Biotechnologie |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |