Einzelprojekt

Datagit - Kombination von Katalogen, Datenbanken und Verteilungslogistik in eine Daten-Distribution

Förderkennzeichen: 01GQ1411
Fördersumme: 205.974 EUR
Förderzeitraum: 2014 - 2017
Projektleitung: Prof. Michael Hanke
Adresse: Otto-von-Guericke-Universität Magdeburg, Fakultät für Naturwissenschaften, Institut für Psychologie II - Neuropsychologie
Universitäts-Campus, Gebäude 24
39106 Magdeburg

Ziel dieses Projektes ist es, die technischen Schwierigkeiten bei der Verbreitung und Nachnutzung von wissenschaftlichen Originaldaten auszuräumen, um so die Zusammenarbeit unabhängiger Arbeitsgruppen im schrittweisen Forschungsprozess zu verbessern. Dazu wird das erfolgreiche Modell einer Software-Distribution zur Anwendung beim "data-sharing" adaptiert. Analog zum Software-Pendant werden alle Komponenten einer "Daten Distribution" entwickelt: Datenpaket-Manager, Paket-Archiv, Schnittstellen für automatisierte und interaktive Nutzung. Die Arbeiten basieren auf zwei Grundprinzipien: 1) Nutzung existierender, unabhängiger Daten-Hosting Dienstleister als Fundament für eine dezentrale data-sharing Plattform. 2) Nutzung einer bereits etablierten Software für Datenverwaltungs- und -transport-Logistik: git-annex, welche wiederum auf dem weit verbreiteten Git Versionskontroll-System aufbaut. Das fertige System "DataGit" wird es erlauben, mit einer einzigen Schnittstelle auf eine große Bandbreite von Daten zugreifen zu können - von einer einzelnen Datei auf dem Webserver einer Arbeitsgruppe bis hin zu großen Datensammlungen auf Portalen wie openfmri.org. DataGit ist kompatibel mit allen Betriebssystemen und präsentiert Nutzern den Datenzugriff nach vertrauten Konzepten wie Dateien und Verzeichnissen, während Nutzerautorisierung und Datentransport transparent abgewickelt werden.  Die Entwicklung der data-sharing middleware und die Integration der unterschiedlichen data-hosting Dienstleister werden vom US-Partner übernommen. Die deutsche Arbeitsgruppe konzentriert sich auf die Entwicklung und Evaluation aller Werkzeuge und Schnittstellen, die direkt von DataGit-Nutzern verwendet werden (Datenpaket-Verwaltung, graphische Oberfläche). Die Arbeiten werden initial unabhängig durchgeführt und beginnend mit dem vierten Projektquartal in enger Zusammenarbeit zu einem einheitlichen System verzahnt, welches zum Projektende vollständig dokumentiert und universell einsetzbar sein wird.