Fördermaßnahme

CompLS – Computational Life Sciences

Veröffentlichung der Bekanntmachung: 2017
Förderzeitraum: 2019 - 2023
Gesamte Fördersumme: bis zu 14,8 Mio. Euro
Anzahl der Projekte: 13 Verbünde und 14 Einzelprojekte, insgesamt 47 Zuwendungsempfänger

1. Ziele der Fördermaßnahme

Der Fortschritt im Bereich experimenteller Methoden und moderner (Hochdurchsatz-) Technologien ist ein wichtiger Treiber für Innovationen in der biologischen und medizinischen Forschung. Zukünftig werden vermehrt quantitative, zeitaufgelöste Messungen zellulärer Systeme durchgeführt. Gleichzeitig nimmt auch die Menge der digitalisierten Daten in der Patientenversorgung und klinischen Forschung rasant zu. Um all diese stark heterogenen Daten wirkungsvoll zu analysieren, zu interpretieren und nutzbar zu machen sind intelligente Algorithmen und integrative systemmedizinische Workflows erforderlich.

Hier setzt die Fördermaßnahme „Computational Life Sciences“ an. Ziel ist es, durch die Entwicklung innovativer Methoden und Softwarewerkzeuge zur bioinformatischen Verarbeitung, Modellierung und Simulation auf aktuelle Bedarfe in den Lebenswissenschaften einzugehen. Dadurch sollen der lebenswissenschaftlichen Forschung in Deutschland effiziente und zuverlässige Hilfsmittel zur Verfügung gestellt werden, um die durch neueste experimentelle Methoden oder die Zusammenführung verschiedener Modalitäten gewonnenen Daten geeignet zu modellieren und zu analysieren. Insgesamt sind bis 2021 vier Auswahlrunden mit einem jährlichen Förderaufruf im Rahmen der Fördermaßnahme geplant.

2. Stand der Fördermaßnahme

Alle 2018 zur Förderung ausgewählten Projekte der ersten Auswahlrunde sind 2019 gestartet. Die zur Förderung ausgewählten Projekte der zweiten Auswahlrunde mit dem Fokusthema „Deep Learning in der Biomedizin“ werden Anfang 2020 mit ihren Forschungsarbeiten beginnen. Ende Oktober 2019 erfolgte der Förderaufruf zur dritten Auswahlrunde, diesmal mit dem thematischen Fokus „Maschinelles Lernen für die Krebsforschung“. Durch die Zusammenarbeit von Experten aus dem Bereich des maschinellen Lernens und den Lebenswissenschaften sollen neue, innovative Methoden und Softwarewerkzeuge entwickelt werden, um biomedizinische Forschungsdaten effizienter auszuwerten. Ziel ist es, die Erforschung der einer Krebserkrankung zugrundeliegenden komplexen physiologischen und pathologischen Prozesse zu unterstützen. Die Forschungsvorhaben der dritten Auswahlrunde sollen neue Anwendungsfelder für maschinelles Lernen in der Krebsforschung erschließen und die besonderen methodischen Herausforderungen in diesem Bereich angehen.

Einzelprojekte

BINDA - Neues Softwarepaket und Mustererkennungsalgorithmen für große, hochdimensionale neuronale Datensätze

Förderkennzeichen: 031L0167
Gesamte Fördersumme: 447.907 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Martin Vinck
Adresse: Ernst Strüngmann Institut gGmbH
Deutschordenstr. 46
60528 Frankfurt am Main

BINDA - Neues Softwarepaket und Mustererkennungsalgorithmen für große, hochdimensionale neuronale Datensätze

Das Einzelprojekt BINDA beschäftigt sich mit dem Thema Datenverarbeitung in den Neurowissenschaften. In den vergangenen 30 Jahren hat sich die Messtechnik, mit der einzelne Nervenzellen und Hirnströme untersucht werden können, stark verbessert. Waren früher nur Einzelmessungen mit einer einzigen Elektrode möglich, so können heute mehr als 1000 Messkanäle gleichzeitig Daten liefern. Dank dieses technologischen Fortschrittes stehen nun sehr große Datensätze zur Verfügung, mit denen beispielsweise das kollektive Verhalten von Nervenzellen erforscht werden kann. Die für eine solche Datenanalyse notwendigen Software-Werkzeuge müssen jedoch immer komplexere Berechnungen ausführen und stoßen in immer kürzeren Abständen an ihre Kapazitätsgrenzen.

Hier setzt BINDA an: Im Rahmen des Projekts soll ein Paket neuer Softwarewerkzeuge und mathematischer Techniken entwickelt werden, mit dem in Hochleistungsrechnern hochkomplexe neuronale Datensätze untersucht werden können. Es soll künftig möglich sein, elektrophysiologische Daten des Gehirns effektiv zu analysieren und zu visualisieren. Ein Schwerpunkt der geplanten Analysemöglichkeiten liegt auf der Darstellung von Interaktionen und der Frage nach Korrelationen zwischen Nervenzellen. Es ist vorgesehen, entsprechende Algorithmen zu entwickeln und mit ihrer Hilfe aus den Datensätzen signifikante Muster zu extrahieren. Die geplante Open-Source-Plattform soll unter anderem über modernste Methoden des maschinellen Lernens verfügen, mit denen immer wiederkehrende Aktivitätsmuster von Nervenzellen erkannt werden können.

Die neu entwickelten Methoden und Softwarewerkzeuge werden die Grundlagenforschung in den Neurowissenschaften wesentlich verbessern und mittelfristig auch im klinischen Umfeld Anwendung finden.

CLARITY - Die Entwicklung einer kombinierten physisch-genetischen Karte für eine Milchrindrasse in Deutschland

Förderkennzeichen: 031L0166
Gesamte Fördersumme: 238.337 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Dörte Wittenburg
Adresse: Leibniz-Institut für Nutztierbiologie
Wilhelm-Stahl-Allee 2
18196 Dummerstorf

CLARITY - Die Entwicklung einer kombinierten physisch-genetischen Karte für eine Milchrindrasse in Deutschland

Das Einzelprojekt CLARITY beschäftigt sich mit dem Thema Populationsgenetik am Beispiel der Züchtung von Milchkühen. In der Tierzucht spielt das detaillierte Verständnis der komplexen Zusammenhänge bei der Rekombinationsrate sowie der exakten genetischen Verortung von Eigenschaften auf dem Chromosom eine entscheidende Rolle. Für die gezielte Vererbung von Eigenschaften ist es wichtig, sowohl den physischen Abstand (gemessen in Zentimetern) als auch den genetischen Abstand (gemessen in Basenpaaren) zwischen den einzelnen molekularen Markern genau zu kennen. Diese Werte unterscheiden sich bei jedem Tier und werden daher in Genomdatenbanken gesammelt. Die Datenbanken müssen regelmäßig auf den neusten Stand gebracht und mit einem aktuellen Index versehen werden, was sehr zeitaufwändig und rechenintensiv ist. Im Rahmen des Projekts soll dieser Prozess beschleunigt und erleichtert werden.

Es ist geplant, geeignete Analysewerkzeuge zu entwickeln bzw. zu verbessern und mit ihrer Hilfe am Beispiel einer deutschen Milchrindrasse eine Übersichtskarte der verschiedenen molekularen Markerabstände zu entwickeln. Dafür sollen umfangreiche Genotypdaten detailliert analysiert sowie ein bereits vorhandenes statistisches Modell weiter verfeinert werden. Die Analyseergebnisse werden anschließend in einer Datenbank veröffentlicht, die im Rahmen von Open Access allen Forscherinnen und Forschern zur Verfügung steht.

Die Datenbank wird offen für Erweiterungen um andere Rinderrassen sein und den Vergleich mit weiteren Spezies erlauben. Die im Rahmen des Projekts entwickelten Analysewerkzeuge werden sich zudem gut auf weitere Anwendungsfelder übertragen lassen.

Cohort-SV - Auffinden und Genotypisieren von struktureller Variation in Sequenzierungsdaten ganzer Genome für große Kohorten

Förderkennzeichen: 031L0180
Gesamte Fördersumme: 324.066 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Birte Kehr
Adresse: Charité - Universitätsmedizin Berlin - Berliner Institut für Gesundheitsforschung - JRG Genome Informatics
Charitéplatz 1
10117 Berlin

Cohort-SV - Auffinden und Genotypisieren von struktureller Variation in Sequenzierungsdaten ganzer Genome für große Kohorten

Das Einzelprojekt Cohort-SV beschäftigt sich mit Verbesserungen bei der Analyse von Genom-Sequenzierungsdaten. Mit diesen Analysen können verschiedene Formen der genetischen Variation aufgedeckt werden, neben Varianten einzelner Nukleotide und kleinen Insertionen bzw. Deletionen insbesondere auch sogenannte genomische Strukturvarianten (SV). Untersuchungen dieser Strukturvarianten tragen wesentlich zu einem besseren Verständnis von menschlichen Merkmalen und von Krankheiten bei. Die Identifizierung und Genotypisierung der Strukturvarianten ist derzeit jedoch – insbesondere bei umfangreichen Kohorten – eine große rechnerische Herausforderung, da die aktuell zur Verfügung stehenden Analyseprogramme trotz hohen Personaleinsatzes und großer Rechenkapazität oft nur ungenaue Ergebnisse liefern.

Im Rahmen von Cohort-SV soll nun ein neues Analysetool entwickelt werden, mit dem sich genomische Strukturvarianten künftig besser, d.h. skalierbarer, effizienter, mit höherer Genauigkeit und benutzerfreundlicher als bislang analysieren lassen. Das neue Analyseprogramm soll insbesondere in der Lage sein, die Daten von vielen Personen zusammen zu analysieren, so dass eine genomische Strukturvariante schneller identifiziert werden kann. Gleichzeitig ist geplant, auch die Arbeitsleistung des Programms in Bezug auf die Laufzeit und den Rechenspeicherverbrauch zu optimieren, indem die zur Analyse benötigte Datenmenge reduziert wird.

Mit dem neuen Analysetool lassen sich künftig eine Vielzahl komplexer biologischer Studien – beispielsweise zu Mutationsraten und ihren Auswirkungen auf Krankheiten – durchführen und wesentlich effizienter als bislang die vorhandenen genomischen Daten nutzen.

Data2Dynamics - Modellierung großer biologischer Systeme – Erweiterung der Modellierungssoftware

Förderkennzeichen: 031L0179
Gesamte Fördersumme: 275.108 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Jens Timmer
Adresse: Albert-Ludwigs-Universität Freiburg - Fakultät für Mathematik und Physik - Physikalisches Institut - Abt. Dynamische Prozesse in den Lebenswissenschaften
Hermann-Herder-Str. 3
79104 Freiburg

Data2Dynamics - Modellierung großer biologischer Systeme – Erweiterung der Modellierungssoftware

Das Einzelprojekt Data2Dynamics beschäftigt sich mit der Verbesserung bzw. Erweiterung des systembiologischen Softwarepaketes Data2Dynamics (D2D). Das in der Arbeitsgruppe von Prof. Timmer entwickelte Softwarepaket ermöglicht es, nichtlineare dynamische Modelle im Bereich der Systembiologie zu erstellen. Das Hauptaugenmerk liegt dabei auf der Datenanalyse sowie der Parameter- und Unsicherheitsschätzung. D2D kann eine Vielzahl an Daten und Messmethoden einfach miteinander verknüpfen, so Modelle und Parameter gemeinsam trainieren und Vorhersagen daraus ableiten. Insbesondere die Möglichkeit der Unsicherheitsabschätzung hat dazu beigetragen, dass das frei zugängliche Softwarepaket bei vielen Fragestellungen erfolgreich eingesetzt wird. Bislang ist die Anwendung jedoch auf relativ kleine Modelle beschränkt, auch werden für die Erstellung und die Analyse der dynamischen Modelle sowohl Expertenwissen als auch Programmierkenntnisse benötigt.

Hier setzt das Vorhaben Data2Dynamics an: Im Rahmen des Projekts soll das D2D-Softwarepaket in drei Richtungen weiterentwickelt werden. Es ist geplant, die Leistungsfähigkeit bei der Modellierung zu erhöhen, die Benutzerfreundlichkeit zu steigern sowie durch das Einbeziehen weiterer Tests die Zuverlässigkeit zu verbessern. Künftig sollen insbesondere auch große Datenmengen zur Modellierung herangezogen werden können. Es ist zudem vorgesehen, die Unterstützung bekannter Datenstandards zu erweitern und eine Schnittstelle für etablierte Programme aus den Bereichen Datenanalyse und Modellierung zu integrieren.

Durch die geplanten Änderungen werden künftige Analysen und Simulationen von dynamischen biologischen Systemen wesentlich realitätsnäher als bislang modelliert werden können, und auch das biotechnologische bzw. medizinische Anwendungspotential wird durch die geplanten Verbesserungen deutlich erhöht.

DIAS - Datenintegration, Analyse und Services in ProteomicsDB

Förderkennzeichen: 031L0168
Gesamte Fördersumme: 987.712 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Bernhard Küster
Adresse: Technische Universität München - Wissenschaftszentrum Weihenstephan - Forschungsdepartment Biowissenschaftliche Grundlagen - Lehrstuhl für Proteomik und Bioanalytik
Emil-Erlenmeyer-Forum 5
85354 Freising

DIAS - Datenintegration, Analyse und Services in ProteomicsDB

Das Einzelprojekt DIAS beschäftigt sich mit dem Thema Proteomik, der systematischen Erforschung der Gesamtheit aller Proteine. Proteine zählen zu den wichtigsten aller Biomoleküle und steuern nahezu alle Vorgänge in lebenden Organismen. Wie überall in der modernen biowissenschaftlichen Forschung wurden auch bei der Erforschung der Proteine in den vergangenen Jahren große Datenmengen erzeugt. Um diese Daten effizient nutzen zu können, werden immer komplexere bioinformatische Anwendungen benötigt. Insbesondere die Verknüpfung der heterogenen Daten untereinander gewinnt derzeit stark an Bedeutung und erfordert große Innovationsanstrengungen im bioinformatischen Bereich.

Im Rahmen von DIAS sollen daher nun Bioinformatik-Werkzeuge weiterentwickelt und verbessert werden. Hauptziel dabei ist es, künftig einfach und zuverlässig proteomische Daten mit Daten aus anderen biowissenschaftlichen Forschungsbereichen zusammenzubringen und analysieren zu können. Die geplanten Arbeiten bauen auf der in der Arbeitsgruppe von Prof. Küster entwickelten und bereits erprobten Datenbank ProteomicsDB auf und sollen deren Funktionen und Möglichkeiten in wichtigen Bereichen erweitern. Es ist unter anderem vorgesehen, den Wissenschaftlerinnen und Wissenschaftlern künftig programmgesteuert Zugriff auf alle in ProteomicsDB gespeicherten Daten zu ermöglichen. Auch eine benutzerdefinierte Datenanalyse der eigenen Daten innerhalb der Datenbank sowie der Zugriff auf verschiedene Massenspektren-Bibliotheken für beliebige Organismen mit sequenziertem Genom sollen künftig möglich sein.

Durch die geplanten Verbesserungen werden sich in Zukunft neue Modelle für komplexe biologische Zusammenhänge erzeugen lassen, die mittelfristig bei klinischen Entscheidungsfindungsprozessen eingesetzt werden könnten.

GeoMine: Methoden zur geometrischen Mustersuche in Proteinstruktursammlungen

Förderkennzeichen: 031L0172
Gesamte Fördersumme: 388.952 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Matthias Rarey
Adresse: Universität Hamburg - Fakultät für Mathematik, Informatik und Naturwissenschaften - Zentrum für Bioinformatik (ZBH)
Bundesstr. 43
20146 Hamburg

GeoMine: Methoden zur geometrischen Mustersuche in Proteinstruktursammlungen

Das Einzelprojekt GeoMine beschäftigt sich mit Verbesserungen bei der Erforschung von Proteinstrukturen. Die Untersuchung von Proteinstrukturen spielt seit vielen Jahren eine Schlüsselrolle in der molekularbiologischen Forschung. Alle verfügbaren Informationen darüber werden weltweit in einer zentralen Protein-Datenbank gesammelt und gespeichert. Lebenswissenschaftlerinnen und -wissenschaftler der ganzen Welt haben dank eines internetbasierten Dienstes freien Zugriff auf die vorhandenen Daten. Der bestehende Dienst ermöglicht bislang die Anwendung zahlreicher elementarer Untersuchungsmethoden, nicht jedoch komplexere Ansätze wie die Erforschung dreidimensionaler Proteinstrukturen oder die räumliche Arbeitsweise von Proteinen.

Hier setzt GeoMine an: Im Rahmen des Projekts sollen neue Analysemethoden entwickelt werden, um künftig auch räumliche Proteinstrukturen detailliert erforschen zu können, insbesondere die Bindung von Stoffen oder anderen Proteinen an ein Protein. Mit dem neuen Softwarewerkzeug ließen sich beispielsweise geometrische Muster in Proteinen unabhängig von der Proteinsequenz oder der exakten chemischen Struktur des bindenden Moleküls untersuchen. Ausgehend von dem in der Arbeitsgruppe von Prof. Rarey entwickelten Softwarewerkzeug PELIKAN sollen Algorithmen, Datenbanken und eine einfach zu bedienende Nutzeroberfläche entwickelt und zu einem erweiterten internetbasierten Dienst ausgebaut werden. Neben der Möglichkeit, künftig individuell maßgeschneiderte Untersuchungen durchführen und Arbeitshypothesen überprüfen zu können, liegt der Schwerpunkt der Werkzeugentwicklung auf der praktischen Ausgestaltung des neuen Dienstes. Durch neuartige Schnittstellen mit zwei- und dreidimensionalen Elementen soll insbesondere die Anfrageerstellung intuitiv gestaltet werden und ohne große Vorkenntnisse bedienbar sein.

Es ist geplant, das neue Softwarewerkzeug in den ProteinPlus-Dienst des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) zu integrieren, es so schnell und effizient bekannt zu machen und seine Reichweite rasch zu erhöhen.

horizontal4meta - Ein neues Paradigma der Sequenzsuche ermöglicht die Hochdurchsatz-Funktionvorhersage mikrobieller Proteine in metagenomischen Sequenzierdaten

Förderkennzeichen: 031L0185
Gesamte Fördersumme: 540.601 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Johannes Soeding
Adresse: Max-Planck-Institut für biophysikalische Chemie
Am Faßberg 11
37077 Göttingen

horizontal4meta - Ein neues Paradigma der Sequenzsuche ermöglicht die Hochdurchsatz-Funktionvorhersage mikrobieller Proteine in metagenomischen Sequenzierdaten

Das Einzelprojekt horizontal4meta beschäftigt sich mit der Entwicklung neuer Ansätze für die Analyse sogenannter metagenomischer Sequenzierdaten. Mithilfe dieser Daten lässt sich die Funktion eines Proteins alleine anhand einer abgelesenen Nukleotid-Sequenz sowie eines Vergleiches mit verwandten und funktionell ähnlichen Proteinen bestimmen. Die für diesen sogenannten vertikalen Informationstransfer zur Verfügung stehenden Referenzdatenbanken und Computerprogramme stoßen mittlerweile an ihre Grenzen, da die Menge der metagenomischen Sequenzierdaten durch den Einsatz neuer Sequenziertechnologien in immer größerem Umfang und Tempo steigt. Für sorgfältige Untersuchungen fehlt die Zeit, so dass nur noch schnelle, aber weniger genaue Analyseverfahren Anwendung finden.

Im Rahmen von horizontal4meta soll daher mit einem völlig neuen Ansatz eine innovative bioinformatische Analysesoftware entwickelt werden, mit der künftig die Proteinfunktion schneller und präziser als derzeit vorhergesagt werden kann. Die neue Suchmethode basiert auf der Idee des horizontalen Informationstransfers und baut auf der in der Arbeitsgruppe von Dr. Söding entwickelten schnellen und empfindlichen Sequenzsuch-Software MMseqs2 auf. Es ist geplant, zunächst Gruppen von benachbarten Genen zu identifizieren, die eine gemeinsame Funktion ausüben (horizontaler Ansatz). Die Ergebnisse sollen anschließend durch Sequenzprofil-Suchen mit dem vertikalen Informationstransfer verknüpft werden und so das gesamte Potential der vorhandenen Daten ausschöpfen. Der neue Ansatz wird damit wesentlich dazu beitragen, mikrobiologische Forschung und biotechnologische Entdeckungen in Zukunft zu beschleunigen.

InCelluloProtStruct - Hybridansatz zur Vorhersage der Supertertiär- und Quartärstruktur von Proteinen und Proteinkomplexen in Zellen

Förderkennzeichen: 031L0182
Gesamte Fördersumme: 478.375 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Holger Gohlke
Adresse: Heinrich-Heine-Universität Düsseldorf - Mathematisch-Naturwissenschaftliche Fakultät - Pharmazie - Institut für Pharmazeutische und Medizinische Chemie - Abt. Pharmazeutische Biochemie
Universitätsstr. 1
40225 Düsseldorf

InCelluloProtStruct - Hybridansatz zur Vorhersage der Supertertiär- und Quartärstruktur von Proteinen und Proteinkomplexen in Zellen

Das Einzelprojekt InCelluloProtStruct beschäftigt sich mit der Aufklärung von komplexen Proteinstrukturen. Viele biologische Prozesse werden nicht nur durch einzelne Proteine, sondern durch Proteinkomplexe gesteuert, die aus mehreren Proteinen bestehen und eine sogenannte Quartärstruktur bilden. Erst wenn man weiß, wie die Struktur eines solchen Proteinkomplexes aussieht, kann man seine Funktionen auch verstehen und von ihm gesteuerte Signalwege gezielt beeinflussen. Es gibt bereits Methoden, mit denen die Struktur eines Proteinkomplexes teilweise untersucht werden kann. Diese Methoden stoßen jedoch immer wieder an ihre Grenzen, insbesondere dann, wenn Wechselwirkungen innerhalb des Proteinkomplexes Einfluss auf die Struktur nehmen. Benötigt werden neue innovative Strukturaufklärungsansätze, die die Gesamtheit der molekularen Wechselwirkungen in einem zellulären Kontext berücksichtigen.

Hier setzt InCelluloProtStruct an: Im Rahmen des Projekts soll ein vollautomatischer computergestützter Arbeitsablauf entwickelt und validiert werden, mit dem qualitativ hochwertige Proteinkomplexmodelle vorhergesagt werden können. Grundlage für die geplante Software-Entwicklung sind verschiedene Softwarewerkzeuge, die in den vergangenen Jahren in der Arbeitsgruppe von Prof. Gohlke entwickelt wurden. Es ist geplant, sogenannte Meta-Ansätze zu verwenden, die mehrere Strukturvorhersagemethoden und Quellen verfügbarer biologischer Informationen miteinander verknüpfen. Es ist vorgesehen, mithilfe experimenteller Daten aus Strukturanalysen die Modellbildung zu überprüfen und zu steuern.

Die fertige Softwarelösung soll den Wissenschaftlerinnen und Wissenschaftlern frei zur Verfügung gestellt werden. Für die Kooperation mit der Industrie sind zusätzliche Lizenzmodelle geplant.

SABIO-VIS - Visualisierung und Validierung von kinetischen Daten in SABIO-RK für die Nutzung durch Modellierer, Kuratoren und Experimentalisten

Förderkennzeichen: 031L0178
Gesamte Fördersumme: 387.928 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Ulrike Wittig
Adresse: HITS gGmbH - Abt. Scientific Databases and Visualization (SDBV)
Schloß-Wolfsbrunnenweg 35
69118 Heidelberg

SABIO-VIS - Visualisierung und Validierung von kinetischen Daten in SABIO-RK für die Nutzung durch Modellierer, Kuratoren und Experimentalisten

Das Einzelprojekt SABIO-VIS beschäftigt sich mit der SABIO-RK-Datenbank, die biochemische Reaktionen und deren kinetische Parameter aus der Literatur speichert. In der Datenbank wurden in den letzten zehn Jahren über 230.000 kinetische Parameter in unterschiedlicher Qualität hinterlegt. Sowohl quantitativ als auch qualitativ hat die SABIO-RK-Datenbank damit nun ein Level erreicht, bei dem es sich lohnt, neue Datenanalyse-Werkzeuge zu entwickeln und zu nutzen. Konkret sollen im Rahmen des Projekts SABIO-VIS verschiedene Visualisierungsmethoden entwickelt werden, mit denen künftig gezielt die kinetischen Daten untersucht, validiert und in ihrer Qualität kontrolliert werden können.

Der Schwerpunkt der Methodenentwicklung liegt dabei auf den Anforderungen von Modelliererinnen und Modellierern, die die Hauptnutzergruppe der SABIO-RK-Datenbank darstellen. Für diese sollen verlässliche Visualisierungsmethoden entwickelt werden, die sie bei der Suche nach nützlichen Daten für eine Modellentwicklung unterstützen, ohne dabei die Korrektheit der einzelnen Daten erneut überprüfen zu müssen. Es ist geplant, eine Visualisierung der kinetischen Parameter zu ermöglichen, die nach bestimmten nutzerabhängigen Suchkriterien erfolgt. Auch mögliche Abweichungen oder Ungenauigkeiten der kinetischen Parameter sollen künftig bildlich hervorgehoben bzw. quantifiziert werden können. Es ist zudem vorgesehen, Methoden zur Analyse und zur Zusammenfassung der Daten aufgrund gemeinsamer Kriterien wie beispielsweise experimentelle Bedingungen zu entwickeln.

Die Ergebnisse des Projektes werden die Nutzbarkeit der SABIO-RK-Datenbank stark verbessern. Mit den neuen Möglichkeiten lassen sich größere Datensätze analysieren und neue Zusammenhänge darstellen, so dass sich zahlreiche neue Einblicke und Erkenntnisse aus den vorhandenen Daten gewinnen lassen werden.

SCTP - Standardisierung der CT Perfusion für die klinische Anwendung in der onkologischen Bildgebung

Förderkennzeichen: 031L0163
Gesamte Fördersumme: 230.228 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Stephan Skornitzke
Adresse: Ruprecht-Karls-Universität Heidelberg - Medizinische Fakultät und Universitätsklinikum Heidelberg - Radiologische Klinik - Diagnostische und Interventionelle Radiologie
Im Neuenheimer Feld 110
69120 Heidelberg

SCTP - Standardisierung der CT Perfusion für die klinische Anwendung in der onkologischen Bildgebung

Das Einzelprojekt SCTP beschäftigt sich mit dem Thema Computertomographie (CT), einem bildgebenden Verfahren in der Radiologie. Mit der 1972 eingeführten Untersuchungsmethode kann heute eine Vielzahl von Erkrankungen diagnostiziert werden. Neben der Untersuchung von Knochenbrüchen, Blutungen und Schwellungen wird die Computertomographie auch für Durchblutungsmessungen eingesetzt. Diese sogenannte CT-Perfusion ermöglicht es, nicht-invasiv den Blutfluss zu messen, womit das Verfahren zur verbesserten Diagnose und Therapieverfolgung von Tumorerkrankungen beiträgt. Ein großes Hindernis für den breiten Einsatz in der klinischen Praxis ist bislang die fehlende Standardisierung der für die CT-Perfusion verwendeten Aufnahmeprotokolle, der eingesetzten Software und bei der anschließenden Interpretation der Ergebnisse.

Im Rahmen des Projekts SCTP sollen daher die bestehenden Methoden und Verfahren in der CT-Perfusion vereinheitlicht werden. Es ist geplant, alle verwendeten Modelle zu untersuchen und zu validieren sowie die eingesetzte Verarbeitungs-Software für die Nachbereitung von Untersuchungsergebnissen einer fundierten Qualitätskontrolle zu unterziehen. Zudem ist vorgesehen, die Messunsicherheit in Abhängigkeit der Aufnahmeparameter abzuschätzen, um damit eine bessere Vergleichbarkeit der Ergebnisse herzustellen.

Die Ergebnisse des Projekts werden die Einsatzrate der CT-Perfusionstechnik in der klinischen Praxis deutlich steigern und wesentlich dazu beitragen, dass CT-Perfusion verlässlicher als bisher zur onkologischen Bildgebung im Rahmen einer Krebstherapie herangezogen werden kann.

SPlaT-DM - Computersimulationsplattform für Topologie-gesteuerte Morphogenese

Förderkennzeichen: 031L0160
Gesamte Fördersumme: 741.675 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Carl Modes
Adresse: Max-Planck-Institut für Molekulare Zellbiologie und Genetik
Pfotenhauerstr. 108
01307 Dresden

SPlaT-DM - Computersimulationsplattform für Topologie-gesteuerte Morphogenese

Das Einzelprojekt SPlaT-DM beschäftigt sich mit der Entwicklung von Computermodellen, die die Entstehung von Organen und Geweben – die sogenannte Morphogenese – simulieren. Derzeitige Modelle arbeiten mit statischen Organstrukturen, die auf gemittelte Werte zurückgreifen. Es existieren bislang keine belastbaren Computermodelle, mit denen beispielsweise die embryonale Entwicklung, das Wachstum von Organoiden oder die Heilung und Regeneration von Organen vorhergesagt werden kann. Ziel des Projektes ist es daher, mehrskalige, physikgetriebene Rechenmodelle zu entwickeln, um die Morphogenese virtuell am Computer darstellen zu können.

Es ist geplant, hierfür einen neuartigen Lösungsansatz zu entwickeln und ihn in eine bereits bestehende Simulationsplattform zu implementieren. Der innovative Ansatz greift dabei auf Fortschritte beim Verständnis der physikalischen Theorie aktiver Gewebemechanik zurück und soll eine Analogie zur Physik dreidimensionaler Flüssigkristalle nutzen. Dort können punktförmige topologische Defekte, die miteinander interagieren, nahezu beliebige Formänderungen herbeiführen. Die aktuellen Erkenntnisse aus diesem Bereich der Physik sollen im Rahmen des Projekts in die Simulationsplattform OpenFPM für biologische Gewebe integriert werden. Die biophysikalische Simulationsumgebung der Morphogenese soll dabei aus einer minimalen Anzahl von biologischen Eingabeparametern berechnet werden. Gleichzeitig wird angestrebt, sie modular zu gestalten, wodurch Nutzerinnen und Nutzer die Struktur und Funktionalität einer Simulation mit einfachen Mitteln an ihre jeweiligen Bedürfnisse anpassen können.

STML - Werkzeuge für Zellbiologische Raum-Zeit-Modelle in den Lebenswissenschaften

Förderkennzeichen: 031L0158
Gesamte Fördersumme: 541.200 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Dr. Sven Sahle
Adresse: Ruprecht-Karls-Universität Heidelberg - Fakultät für Biowissenschaften - Centre for Organismal Studies (COS) - Modellierung Biologischer Prozesse
Im Neuenheimer Feld 267
69120 Heidelberg

STML - Werkzeuge für Zellbiologische Raum-Zeit-Modelle in den Lebenswissenschaften

Das Einzelprojekt STML beschäftigt sich mit der Entwicklung von zellbiologischen Raum-Zeit-Modellen. Die Modellierung am Rechner ist heute ein wichtiger und etablierter Bestandteil in der biologischen Forschung. Mit experimentellen Daten werden mathematische Modelle erstellt, mit deren Hilfe Hypothesen biologischer Fragestellungen simuliert und analysiert werden. Bisher war die Mehrheit der erstellten Modelle räumlich homogen, d.h. typische experimentelle Beobachtungen bezogen sich lediglich auf die Konzentration oder die Menge verschiedener biochemischer Komponenten. Die zugehörigen mathematischen Modelle beruhten auf gewöhnlichen Differentialgleichungen. In den letzten Jahren wurden zunehmend Techniken entwickelt, mit denen auch quantitative Untersuchungen an lebenden Zellen unter dem Mikroskop möglich sind. Die dabei erzeugten großen Raum-Zeit-Datenmengen stehen nun für detaillierte Raum-Zeit-Modelle zu Verfügung.

Im Rahmen des Projekts STML sollen jetzt Softwarewerkzeuge entwickelt werden, die diese Mikroskop-Daten nutzen, um solche neuen Modelle zu erstellen, zu simulieren und zu testen. Es ist geplant, dafür auf zwei Softwarewerkzeugen – COPASI und DUNE – aufzubauen, die im Bereich der mathematischen Modellierung biologischer Netzwerke bereits etabliert sind. Beide sollen weiterentwickelt und in einer Anwendung integriert werden. Ein besonderer Schwerpunkt wird dabei auf die Benutzerfreundlichkeit der Methoden und der Analysewerkzeuge gelegt. Anwenderinnen und Anwender sollten beim Arbeiten mit einem Raum-Zeit-Modell zwar über biologisches Spezialwissen, nicht aber notwendigerweise über spezielle Programmierungskenntnisse verfügen müssen. Im Gegensatz zur Arbeit mit homogenen Raum-Modellen fehlen bislang solche einfach zu bedienenden Werkzeuge bei der Raum-Zeit-Modellierung weitgehend.

Die geplante Anwendung wird der Öffentlichkeit frei zur Verfügung gestellt, so dass eine große Verbreitung der neuen Modelle sowohl in der Forschung als auch in der industriellen Entwicklung möglich sein wird.

TissueResolver - Eine Toolbox mit Webapplikation zur Berechnung zelltypspezifischer Genexpression

Förderkennzeichen: 031L0173
Gesamte Fördersumme: 531.275 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Prof. Dr. Rainer Spang
Adresse: Universität Regensburg - Institut für Funktionelle Genomik - Lehrstuhl für statistische Bioinformatik
Am BioPark 9
93053 Regensburg

TissueResolver - Eine Toolbox mit Webapplikation zur Berechnung zelltypspezifischer Genexpression

Das Einzelprojekt TissueResolver beschäftigt sich mit dem Thema Krebsforschung, genauer gesagt mit der Verknüpfung und Auswertung von Tumorgewebedaten. In den letzten 20 Jahren wurde Tumorgewebe detailliert und im großen Stil molekularbiologisch untersucht. Unter Berücksichtigung des klinischen Krankheitsverlaufs wurden für zahlreiche Tumorgewebeproben sogenannte Genexpressionsprofile ermittelt und bioinformatisch ausgewertet. Verbesserungen in der Analysetechnik ermöglichen es seit einigen Jahren, Genexpressions-Veränderungen auch in den einzelnen Tumor-Zelltypen aufzuklären und entsprechende Einzelzell-Profile zu erstellen. Da die jeweiligen Profile über unterschiedliche Zusatzinformationen verfügen, sollen sie nun noch stärker miteinander verknüpft werden, um dadurch ihr gesamtes Potential zu erschließen. Insbesondere im Bereich der personalisierten Medizin sollen so wertvolle neue Einsichten in die Funktion von Tumorgewebe gewonnen werden.

Hier setzt TissueResolver an: Im Rahmen des Projekts sollen neue Methoden und Software-werkzeuge entwickelt werden, mit deren Hilfe sich die verschiedenen existierenden Genexpressionsprofile zusammenführen und gemeinsam analysieren lassen. Es ist geplant, die zelltyp-spezifischen Profile mit den Genexpressionsprofilen der Tumorgewebe zu kombinieren und Informationen, die nur im Tumorgewebeprofil zu finden sind, auf die zelltyp-spezifischen Profile zu übertragen. Es ist unter anderem vorgesehen, mittels künstlicher Intelligenz aus Einzelzellprofilen zu lernen, wie sich aus älteren Tumorgewebeprofilen höher auflösende Informationen gewinnen lassen, die etwa zur weiteren Aufklärung der zelltyp-spezifischen Genexpression beitragen können.

Die geplanten Arbeiten werden durch den bioinformatischen Ansatz wesentlich schneller neue Daten und Erkenntnisse liefern als das mit klassischen Laborexperimenten möglich wäre und so die Aufklärung der einzelnen Genexpressionsprofile deutlich beschleunigen.

UGEWS-HYBRID - Entwicklung eines Web Services zur Analyse von genomweiten Interaktionen durch einen FPGA-GPU-Hybridcomputer

Förderkennzeichen: 031L0165
Gesamte Fördersumme: 339.110 EUR
Förderzeitraum: 2019 - 2022
Projektleitung: Jun.-Prof. David Ellinghaus und Dr.-Ing. Jan Kässens
Adresse: Christian-Albrechts-Universität zu Kiel - Universitätsklinikum Schleswig-Holstein - Campus Kiel - Institut für Klinische Molekularbiologie
Arnold-Heller-Str. 3
24105 Kiel

UGEWS-HYBRID - Entwicklung eines Web Services zur Analyse von genomweiten Interaktionen durch einen FPGA-GPU-Hybridcomputer

Das Einzelprojekt UGEWS-HYBRID beschäftigt sich mit dem Thema Erbkrankheiten, die durch einen sogenannten Einzelnukleotid-Polymorphismus (SNP, gesprochen: „Snip“) ausgelöst werden. Ein SNP ist eine geerbte genetische Variation auf einem Chromosom, die aus einem einzelnen Basenpaar besteht und die vererbt werden kann. In den letzten zehn Jahren wurde in genomweiten Assoziationsstudien eine Vielzahl sogenannter Risiko-SNPs für komplexe, d.h. von mehreren Faktoren abhängige Erkrankungen identifiziert. Für die meisten komplexen Erkrankungen konnte die Wahrscheinlichkeit einer SNP-Vererbung bislang nicht aufgeklärt werden. Es wird vermutet, dass die Vererbbarkeit von der Interaktion der genetischen Varianten abhängt. Genomweite Vergleichsstudien dazu wurden begonnen, befinden sich aufgrund des enormen Rechenaufwandes für die Berechnung von Milliarden möglicher Kombinationen aber immer noch in ihrer Anfangsphase.

Hier setzt UGEWS-HYBRID an: Ziel des Projekts ist es, der internationalen Wissenschaftsgemeinde einen ultraschnellen internetbasierten Dienst zur Verfügung zu stellen, mit dem innerhalb kurzer Zeit Vergleichsstudien für genomweite Daten durchgeführt werden können. Es ist geplant, für den neuen Dienst bioinformatische Werkzeuge zu entwickeln, mit denen genetische Varianten, die für komplexe Erkrankungen verantwortlich sind, identifiziert werden können. Der Rechenaufwand soll dort, wo es möglich ist, reduziert werden, indem häufig genutzte Algorithmen auf schnellen und besonders energieeffizienten Hochleistungsrechnern implementiert werden. Zudem ist vorgesehen, Schnittstellen zu bereits bestehenden Infrastrukturen wie der Cloud des Deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) zu entwickeln und so die Anzahl der Nutzerinnen und Nutzer zu maximieren.

Mit dem neuen Computermodell wird eine Grundlage für zukünftige Forschungsplattformen auf nationaler und internationaler Ebene geschaffen, mit denen sich verschiedenste Krankheitsursachen künftig erfolgreich erforschen lassen werden.