Was ist Forschungsdatenmanagement ?

Was ist Forschungsdatenmanagement?

Die Forschungsdaten-Leitlinien der TU Darmstadt verstehen unter Forschungsdatenmanagement (FDM) „den gesamten Umgang mit digitalen Daten in der Forschung, von der Planung ihrer Generierung über ihre Verwendung und Verarbeitung in Forschungsvorhaben bis hin zu ihrer permanenten Archivierung oder aber auch Löschung“. Weiter heißt es: „Dies beinhaltet insbesondere die disziplinspezifische Dokumentation ihrer Entstehung, die sichere Speicherung, die fachgerechte Aufbereitung und ggf. die geeignete Veröffentlichung.“

Somit umfasst FDM alle nachhaltigen Methoden und Verfahren, die angewendet werden können um Forschungsdaten zu sichern und ihre langfristige Nachnutzbarkeit zu gewährleisten. Der Prozess des Forschungsdatenmanagements beginnt also bereits bei der Planung eines Forschungsvorhabens! Zur Veranschaulichung dessen hat sich der Forschungsdaten-Lebenszyklus (Data curation life cycle) eingebürgert:

Lebenszyklus von Forschungsdaten
Lebenszyklus von Forschungsdaten

Das Lebenszyklusmodell zeigt die sequentiellen Schritte, die Forschungsdaten im Prozess von Forschung immer wieder durchlaufen:

1) Mit der Planung eines Forschungsvorhabens beginnt der Zyklus. Häufig wird dabei auf bereits vorhandene Daten Bezug genommen.

2) Im nächsten Schritt der Durchführung und Datenerhebung (oder auch der Datenübernahme) werden neue digitale Rohdaten / Primärdaten erzeugt (bzw. vorhandene Forschungsdaten in das eigene Projekt eingebracht).

3) Durch Datenauswertung und -verarbeitung werden aus Roh- und Eingabedaten die für die Beantwortung der wissenschaftlichen Fragestellung und ggf. für die Publikation relevanten Daten generiert.

4) Alle Daten müssen zunächst vorläufig gesichert / zwischengespeichert werden.

5) Vor der Archivierung von Daten steht eine fundierte Auswahl und Dokumentation der zu bewahrenden Daten. Dies umfasst auch die bewusste Löschung von z.B. nicht mehr benötigten Zwischenstufen. Die Anreicherung mit geeigneten Metadaten spielt dabei ebenso eine große Rolle wie die Dokumentation der Verarbeitungsschritte und ggf. die Bewahrung der dazu benötigten Software-Umgebung.

6) Die Archivierung setzt häufig noch eine Konversion in dauerhafte Dateiformate voraus. Einen guten Überblick für gängige Datentypen bieten die Seiten des RADAR-Projekts. Eine dauerhaft sichere Archivierung kann nur in einer auf Langfristigkeit angelegten Infrastruktur erfolgen, die nicht an Projektlaufzeiten gebunden ist. Die Langzeitarchivierung (LZA) digitaler Daten erfolgt daher am besten in zentralen Strukturen..

7) Ausgewählte Daten können und sollten frei verfügbar gestellt oder auf Anfrage verbreitet werden, um die eigenen Forschungsergebnisse für andere besser nutzbar zu machen. Wichtig ist dabei die persistente Adressierung und der Nachweis in geeigneten Datenbanken.

8) Dadurch kann letztlich auch gewährleistet werden, dass die Daten für neue Forschungen wiederverwendet oder weiter verarbeitet werden können.