Investigation of functional RNA structures using deep learning and experiment-guided computational approaches

Untersuchung funktionaler RNA-Strukturen mit Deep Learning und experimentell gestützten Methoden

  • RNA secondary structures fulfill diverse regulatory functions in the cell. Their investigation is therefore key to understanding biological processes. The Lead-Seq method established here makes an important contribution to this by enabling transcriptome-wide mapping of RNA secondary structures in vivo. Another method presented here complements the in silico prediction of RNA structures. In an inverse folding based pre-training approach, deep learning methods are enhanced with prior knowledge from the thermodynamic model. This enables the inference of features from only a few data points, as shown in the example of transcription terminators. Last, a novel quartet loss is introduced that continues the integration of existing knowledge in deep learning methods. The trained models reproduce a known phylogeny and can be used to identify which features evolve along the given tree.
  • RNA-Sekundärstrukturen übernehmen diverse regulatorische Funktionen in der Zelle. Ihre Untersuchung ist daher ein wichtiger Schlüssel zum Verständnis biologischer Prozesse. Die hier etablierte Methode Lead-Seq leistet dazu einen wichtigen Beitrag, indem sie die transkriptomweite Kartierung von Sekundärstrukturen in vivo ermöglicht. Eine weitere hier vorgestellte Methode ergänzt die in silico Vorhersage von RNA-Strukturen. In einem auf inverser Faltung basierendem Pretraining Ansatz werden Deep Learning Methoden um Vorwissen aus dem thermodynamischen Modell ergänzt. Dies ermöglicht die Ableitung von Merkmalen aus nur wenigen Datenpunkten, wie am Beispiel von Transkriptionsterminatoren gezeigt wird. Zuletzt wird ein neuartiger Quartet Loss eingeführt, der die Integration von bestehendem Wissen in Deep Learning fortsetzt. Die trainierten Modelle reproduzieren eine bekannte Phylogenie und können verwendet werden um Merkmale zu identifizieren, welche entlang des gegebenen Baums evolvieren.

Download full text files

Export metadata

Metadaten
Author:Vivian Bernadette BrandenburgORCiDGND
URN:urn:nbn:de:hbz:294-105716
DOI:https://doi.org/10.13154/294-10571
Referee:Franz NarberhausORCiDGND, Axel MosigORCiDGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2020/09/20
Date of first Publication:2022/09/20
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Biologie und Biotechnologie
Date of final exam:2023/03/21
Creating Corporation:Fakultät für Biologie und Biotechnologie
GND-Keyword:Bioinformatik; Deep learning; RNS; Phylogenie; Transkriptomanalyse
Institutes/Facilities:Lehrstuhl für Biologie der Mikroorganismen
Dewey Decimal Classification:Naturwissenschaften und Mathematik / Biowissenschaften, Biologie, Biochemie
faculties:Fakultät für Biologie und Biotechnologie
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht