Verbund

BSmadeEZ - Aufbau und Optimierung einer de.NBI Cloud-Plattform für DNA-Methylierung

Das Verbundprojekt BSmadeEZ beschäftigt sich mit dem Thema DNA-Methylierung. Bei diesem Prozess werden Methylgruppen enzymatisch an die DNA gebunden, die dadurch die biologische Funktion der DNA beeinflussen und steuern. Um DNA-Methylierungswerte genomisch zu beurteilen, wird vielfach die sogenannte Ganzgenom-Bisulfit-Sequenzierung (WGBS) angewendet. Die daraus resultierenden Bisulfit-Sequenzierdaten dienen als Grundlage für viele weitere Untersuchungen. Für alle Anwendungen ist es dabei sehr wichtig, dass sich die Verarbeitung dieser Daten genau reproduzieren lässt.

Hier setzt BSmadeEZ an: Im Rahmen des Projekts sollen zunächst die besten Workflows für die WGBS-Auswertung identifiziert werden. Dazu ist geplant, die derzeit verfügbaren Workflows zu vergleichen, indem standardisierte Kriterien zur Bewertung der Pipelines konzipiert und angewendet werden. Im zweiten Teil des Projekts ist vorgesehen, eine neuartige Pipeline-Management-Plattform (EpiCWL) zu entwickeln und geeignete Pipelines für die Verarbeitung der Bisulfit-Sequenzierungsdaten vom ganzen Genom zur Verfügung zu stellen. Mit der geplanten EpiCWL-Plattform soll zum einen eine einfache Möglichkeit geschaffen werden, mit der die Analyse-Ergebnisse schnell und unkompliziert geteilt werden können. Des Weiteren schafft sie die Voraussetzungen dafür, dass ein hochstandardisierter und reproduzierbarer Leistungsvergleich der Workflows durchgeführt werden kann. Insbesondere soll künftig eine nahtlose Skalierung – von einem einzelnen Computer über einen Hochleistungs-Computercluster bis hin zu einer Cloud-Umgebung – möglich sein. Es ist geplant, die im Rahmen der Software-Entwicklung gewonnenen Erfahrungen der Öffentlichkeit zugänglich zu machen, so dass Programmiererinnen und Programmierer bei zukünftigen Entwicklungsarbeiten davon profitieren können.

Teilprojekte

Abgeschlossen

Teilprojekt Berlin

Förderkennzeichen: 031L0162A
Gesamte Fördersumme: 97.680 EUR
Förderzeitraum: 2019 - 2021
Projektleitung: Christian Lawerenz
Adresse: Berliner Institut für Gesundheitsforschung - Zentrum Digitale Gesundheit
Kapelle-Ufer 2
10117 Berlin

Teilprojekt Berlin

Abgeschlossen

Teilprojekt Heidelberg

Förderkennzeichen: 031L0162B
Gesamte Fördersumme: 170.890 EUR
Förderzeitraum: 2019 - 2021
Projektleitung: Dr. Pavlo Lutsik
Adresse: Deutsches Krebsforschungszentrum (DKFZ) - Epigenomik und Krebsrisikofaktoren (C010)
Im Neuenheimer Feld 280
69120 Heidelberg

Teilprojekt Heidelberg