Inhalt: Interview: Zehn Fragen zum Forschungsdatenmanagement (FDM) an Dr. Ulrike Stahl

Portrait: Dr. Ulrike Stahl. — Dr. Ulrike Stahl, Leiterin der Arbeitsgruppe Forschungsdatenmanagement am JKI. (© Hahn/JKI)

1. Beginnen wir mit einer grundlegenden Frage: Was sind überhaupt Forschungsdaten?

Forschungsdaten entstehen tagtäglich am JKI, sei es bei Versuchen im Freiland, im Gewächshaus oder im Labor. Die erhobenen Daten sind dabei sehr divers, da sie die gesamte pflanzliche Produktionskette abdecken und unterschiedlichste Methoden eingesetzt werden. Neben traditionellen Ansätzen wie der visuellen Beobachtung kommen auch moderne, datenlastige Technologien wie Sequenzierung, Massenspektrometrie, Sensortechnik oder bildgebende Verfahren zum Einsatz. Dabei entstehen unter anderem genetische Daten, Bilddaten, Zeitreihen von Wetter- und Satellitendaten aber auch Literaturdaten oder Analysedaten wie Skripte und Modellierungsdaten.

2. Warum ist es so wichtig, mit den Forschungsdaten verantwortungsbewusst und nachhaltig umzugehen, sie also zu „managen“?

Abgesehen von den technischen Herausforderungen durch rasant wachsende Datenmengen und rechenintensivere Analysen gibt es die berechtigte Forderung, dass öffentlich finanzierte Forschungsdaten bereitgestellt und archiviert werden. Es gibt da sowohl gesetzliche Vorgaben als auch Erwartungen von Wissenschaftscommunity und -förderung. Es muss sichergestellt werden, dass die erzeugten Daten auch von anderen genutzt und analysiert werden können, die die Daten nicht selbst erhoben haben. Das dient der Transparenz in der Forschung und erlaubt zudem, Daten auch in anderen Kontexten zu nutzen. Deshalb wird ein effektives und nachhaltiges Forschungsdatenmanagement zunehmend wichtiger.

3. Bitte nennen Sie ein Beispiel für ein solches Nachnutzungsszenario von Forschungsdaten?

Angenommen, am JKI wurden umfangreiche genetische Daten von verschiedenen Pflanzensorten im Rahmen einer Studie zur Verbesserung der Resistenz gegenüber bestimmten Krankheiten gesammelt. Diese Daten enthalten Informationen zu spezifischen Genvarianten und ihrer Korrelation mit der Resistenz gegenüber den Krankheiten. Forschende, die sich nicht direkt mit Pflanzenkrankheiten befassen, Ernteerträge steigern wollen, könnten diese Daten nutzen, um zu prüfen, ob bestimmte genetische Merkmale, die die Krankheitsresistenz beeinflussen, auch Auswirkungen auf die Ertragseigenschaften haben. Durch die Nachnutzung des vorhandenen Datensatzes könnten somit neue Erkenntnisse gewonnen werden, ohne selbst eine umfangreiche genetische Studie zu den Pflanzensorten durchführen zu müssen. Dies setzt aber voraus, dass die primär erhobenen Forschungsdaten ausführlich dokumentiert und auf geeignete Weise abgelegt wurden. Das Beispiel verdeutlicht, wie die Verfügbarkeit und Nachnutzung von Forschungsdaten dazu beitragen könnten, Synergien zwischen verschiedenen Forschungsbereichen zu schaffen und so den Fortschritt in unterschiedlichen wissenschaftlichen Kontexten zu fördern.

4. Welche konkreten Anforderungen werden denn an die Forschungsdaten gestellt?

Die Anforderungen sind vielfältig und ergeben sich aus verschiedenen Richtlinien und Gesetzen, wie der Guten Wissenschaftlichen Praxis, dem E-Government-Gesetz und dem Datennutzungsgesetz. Hinzu kommen verschiedene Vorgaben zum Beispiel von Fördergebern. Gemäß der Guten Wissenschaftlichen Praxis ist eine transparente, nachvollziehbare und reproduzierbare Forschung entscheidend. Dazu gehört die Pflicht, Forschungsdaten sorgfältig zu dokumentieren und zu archivieren. E-Government-Gesetz und Datennutzungsgesetz legen Wert auf die Bereitstellung und verantwortungsvolle Nutzung von Forschungsdaten und betonen, dass Daten für die Öffentlichkeit zugänglich gemacht werden müssen. Gleichzeitig sollen Datenschutz und Datensicherheit gewährleistet sein. Fördergeber fordern häufig die Erstellung von Datenmanagementplänen. Diese Pläne sollen die Datenerfassung, -speicherung, -dokumentation und -zugänglichkeit detailliert beschreiben, um eine nachhaltige und effektive Nutzung der Forschungsdaten sicherzustellen.

5. Wie positioniert sich das JKI zum Thema Forschungsdatenmanagement?

Am JKI existiert seit 2017 eine eigene Leitlinie zum Umgang mit Forschungsdaten, die für alle Mitarbeiterinnen und Mitarbeiter gilt, die aktiv mit Forschungsdaten umgehen. Im Fokus steht die korrekte, vollständige, unverfälschte und verlässliche Speicherung der Daten. Das JKI befürwortet zudem einen offenen Ansatz nach dem FAIR-Prinzip. Das Akronym FAIR steht hierbei für findable (auffindbar), accessible (zugänglich), interoperable (mit anderen Daten kombinierbar) und reusable (nachnutzbar). Unabhängig von externen Anforderungen streben wir am JKI zudem projektspezifische Datenmanagementpläne an. Die Leitlinie legt außerdem klare Verantwortlichkeiten für den Umgang mit Forschungsdaten fest.

6. Das JKI bekennt sich also zu einer transparenten, verantwortungsbewussten und nachhaltigen Praxis im Forschungsdatenmanagement. Wie erreichen wir das Ziel?

Das eigens dafür ins Leben gerufene dreiköpfige Team Forschungsdatenmanagement entwickelt hierfür Konzepte, Services und technische Lösungen. So bauen wir zum Beispiel eine FDM-Servicestelle als erste Anlaufstelle für Forschende auf. Wir wollen FDM-Fahrpläne entwickeln, also die Abläufe und Ansprechpersonen entlang des Datenlebenszyklus klar definieren. Uns schwebt zudem eine Art FDM-Inventarkatalog vor, der eine Übersicht über die weit mehr als 100 Wissensportale, Datenbanken und Management-Softwarelösungen sowie unzähligen Forschungsinfrastrukturen am JKI gibt, mit denen aktuell bereits Forschungsdaten erzeugt, gemanagt und bereitgestellt werden. Und da ein effektives und nachhaltiges FDM bereits mit der Planung eines Forschungsvorhabens beginnt, planen wir ein JKI-weites Online-Tool, das unsere Forschenden künftig dabei unterstützen soll, Datenmanagementpläne zu erstellen. Zudem finden regelmäßig Schulungen und Workshops statt, wie zuletzt das zweitägige Seminar im Rahmen des Young Scientist Meetings 2023 in Dossenheim. Darüber hinaus kooperiert das JKI zum Thema mit anderen Forschungseinrichtungen.

7. Apropos Kooperationen, vermutlich sind viele Einrichtungen innerhalb der Agrarforschung gerade mit den gleichen Herausforderungen konfrontiert?

Ja, das stimmt. In der deutschen Agrar-Forschungslandschaft werden verschiedene Typen von Forschungsdaten erhoben und auf unterschiedliche Weise gespeichert. Das Spektrum der Datenformate reicht von Laborergebnissen über Satellitenbilder bis hin zu qualitativen Interviews mit Landwirtinnen und Landwirten. Die schiere Datenmenge durch die neuen technischen Möglichkeiten wächst immer rasanter. Das wirft die Frage auf, wie und wo Forschungsdaten gespeichert werden, wo die rechenintensiven Analysen stattfinden, wer diese durchführt und wann und in welcher Form sie für andere bereitgestellt werden. Da geht es um kostenintensive technische Infrastruktur wie Speicherplatz, Rechnerleistungen, Programme und Plattformen und um Synergien wie gemeinsame Datenerhebung und Nutzung der Strukturen und Vermeidung von Doppelungen. Damit wir künftig noch besser voneinander profitieren können, müssen wir uns auf Standards einigen und gemeinsam entsprechende Strukturen schaffen.

8. Stehen wir in Sachen Forschungsdatenmanagement mit anderen Einrichtungen im Austausch?

Das JKI ist im Forschungsdatenmanagement gut vernetzt. Innerhalb der Ressortforschung des Bundeslandwirtschaftsministeriums ist das JKI-Team Teil der AG Forschungsdatenmanagement. Unter dem Dach des Think Tanks Digitalisierung der sieben Schwestereinrichtungen des BMEL werden hier FDM-Belange der beteiligten Einrichtungen diskutiert, und es wird nach Synergien und gemeinsamen Lösungen gesucht.

Seit November 2022 beteilig sich das JKI zudem als eine von 29 Wissenschaftseinrichtungen am Konsortium FAIRagro , einem von insgesamt 27 Konsortien im Rahmen der Nationalen Forschungsdateninfrastruktur, kurz NFDI. Die NFDI wird gefördert von Bund und Ländern wobei die Gemeinsame Wissenschaftskonferenz über die Förderung entschieden hat. Die NFDI verfolgt das Ziel, wertvolle Datenbestände von Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem systematisch zu erschließen, zu vernetzen und nachhaltig sowie qualitativ nutzbar zu machen. FAIRagro soll dabei eine offene Infrastruktur für Daten aus der Agrosystemforschung schaffen.

9. Was machen wir als JKI in FAIRagro konkret?

Das JKI ist mit insgesamt acht Personen im FAIRagro-Konsortium aktiv. Wir koordinieren die Interaktion mit der Agrosystem-Forschungscommunity mit dem Ziel, die Community zu konsolidieren und zu vernetzen, in FAIRagro Entwicklungen einzubinden und beim Datenmanagement zu unterstützen sowie dazu aus- und fortzubilden. Darüber hinaus bringen wir uns fachlich im Bereich datengetriebene und modellbasierte Analysen sowie mit unserer Geodatenexpertise ein. Wir entwickeln anhand konkreter Anwendungsfälle Lösungen für das Forschungsdatenmanagement. Neben der raumzeitlichen Geodatenbank JKI-DataCube sowie der JKI-Geonode-Plattform zur Kuratierung von Metadatensätzen bringt das JKI die Infrastruktur OpenAgrar mit ein. Das ist das gemeinsame Repositorium der Ressortforschung des BMEL in Deutschland. Weitere Details finden sich auf der FAIRagro-Webseite oder auch in der JKI-Pressinfo, in der der Anwendungsfall „Strukturierung von Pflanzenschutzdaten“ und die Einbindung unserer Geodatenkompetenz beschrieben werden.

10. Sagen Sie doch bitte zum Abschluss noch kurz etwas zu ihrer Person und Funktion?

Ich leite derzeit das FDM-Team am JKI, bin die Open-Data-Koordinatorin und fungiere somit als interne und externe Ansprechpartnerin für die Bereitstellung unbearbeiteter, offener Daten. Wir sind der Einheit Digitalisierung und Künstliche Intelligenz zugeordnet. Zu meinem Team gehören der Data Steward Dr. Matthias Senft sowie Christoph Sinn als Data Architect. Neben meinen Aufgaben bei FAIRagro bin ich derzeit auch Sprecherin der AG-FDM unter dem Dach des bereits erwähnten Think Tanks Digitalisierung.