Verbund

GenomeNet – Entwicklung und Evaluierung von GenomeNet für die de novo Identifizierung von noch unbekannten genomischen Strukturen und zur probabilistischen DNA-Sequenzimputation

Das Verbundprojekt GenomeNet beschäftigt sich mit der Genomik, genauer gesagt mit der Modellierung genomischer Daten. Es ist eine der größten Herausforderungen in den Lebenswissenschaften, die Komplexität der Dynamik und der Organisation des Genoms besser zu verstehen. Trotz großer Fortschritte in jüngster Zeit ist die funktionelle Relevanz eines großen Teils des Genoms nach wie vor unbekannt. Ein vielversprechender Ansatz um auf dem Gebiet der Genomik mehr Einsicht zu gewinnen ist die Anwendung der Deep Learning Methode, die in anderen Bereichen bereits erfolgreich eingesetzt wurde. Es sind jedoch verschiedene Deep-Learning-Netzwerk-Architekturen für verschiedene Arten von Datendarstellungen passend. Bisher ist noch nicht bekannt, welche Architekturen oder Kombinationen davon genau für das Modellieren von Genomen geeignet sein könnten.

Hier setzt GenomeNet an: Im Rahmen des Projekts soll ein sogenanntes tiefgehendes neuronales Netzwerk (Deep Neural Network) zur Modellierung genomischer Daten entwickelt werden. Die neuartige Methode soll die sogenannte modellbasierte Optimierung nutzen, um eine spezielle Deep-Learning-Architektur für die Verarbeitung von Genomen zu finden. Es ist geplant, das Netzwerk mit öffentlich verfügbaren Genomen zu trainieren. Der Einsatzbereich des neuen Netzwerkes ist vielseitig: Es soll sowohl für die De-novo-Identifizierung noch unbekannter Strukturen, für die Imputation (Vervollständigung) fehlender Nukleotide als auch für die Entwicklung dateneffizienter Klassifizierungssysteme, die weniger markierte Daten als bislang benötigen, eingesetzt werden.

Teilprojekte

Teilprojekt Braunschweig

Förderkennzeichen: 031L0199A
Gesamte Fördersumme: 378.864 EUR
Förderzeitraum: 2020 - 2022
Projektleitung: Prof. Dr. Alice McHardy
Adresse: Helmholtz-Zentrum für Infektionsforschung GmbH
Inhoffenstr. 7
38124 Braunschweig

Teilprojekt Braunschweig

Teilprojekt München

Förderkennzeichen: 031L0199B
Gesamte Fördersumme: 269.348 EUR
Förderzeitraum: 2020 - 2022
Projektleitung: Prof. Dr. Bernd Bischl
Adresse: Ludwig-Maximilians-Universität München - Fakultät für Mathematik, Informatik und Statistik - Institut für Statistik
Ludwigstr. 33
80539 München

Teilprojekt München