header_bild

FAIR Dateninfrastruktur für Agrarsysteme


Laufzeit

2023-03-01 bis 2027-12-31

Projektleitung

  • Markus, Möller


Zuständige Fachinstitut

Institut für Pflanzenbau und Bodenkunde


Kooperationspartner

  • Digitalisierung / Künstliche Intelligenz (JKI)
  • Institut für Strategien und Folgenabschätzung (JKI)
  • Leibniz-Zentrum für Agrarlandschaftsforschung (ZALF) e.V.


Gesamtziel des Projektes

Datenqualität ist eine Voraussetzung für die Wiederverwendbarkeit von Daten. Pflanzenbaurelevante Daten sind durch Heterogenität mit unterschiedlichen Qualitätsanforderungen und offenen Fragen gekennzeichnet. Dazu gehören beispielsweise die Abhängigkeit von räumlichen, spektralen und zeitlichen Auflösungen von Zeitreihendaten von Modellierungsergebnissen, Unsicherheiten in Bezug auf Datenaggregationsstufen und ihre skalenspezifische Repräsentativität, die Genauigkeit und Vollständigkeit von Phänotypisierungs- und Altdaten sowie die Plausibilität von Daten aus landwirtschaftlichen Langzeit-Feldexperimenten (LTE). Zusammenfassend lässt sich sagen, dass eine Überprüfung, Kuratierung und Dokumentation der Datenqualität erforderlich ist; es fehlen jedoch noch von der Gemeinschaft entwickelte Standardkriterien. Basierend auf bestehenden und repräsentativen Agrosystem-Datensätzen, die sich auf FAIRagro Use Cases beziehen, werden relevante Datenqualitätsmetriken unter besonderer Berücksichtigung von Data-fitness-for-use-Aspekten identifiziert, formalisiert und in anwendungsspezifische Abfragen übertragen. Die Arbeit führt zu einer beispielhaften Daten-Fitness-Kurationsfibel und einer Kurations-Geodaten/LTE-Daten-Checkliste für die Datenverantwortlichen. Die Ergebnisse unterstützen die Definition zusätzlicher FAIRagro-Qualitäts-Metadaten-Deskriptoren und fließen in den FAIRagro-Bestands- und Suchdienst ein. Identifizierung relevanter Datenqualitätsaspekte des Agrarsystems: Zur besseren Transparenz werden exemplarische Datennutzungsprofile dokumentiert, kommentiert und visualisiert. Darüber hinaus werden relevante Datenqualitätsaspekte, die für typische Anwendungen in Agrarsystemen im Zusammenhang mit LTE und Geodaten erforderlich sind, auf der Grundlage von Use Caes und Community Workshops identifiziert und dokumentiert. Formalisierung der Daten für die Nutzung: Wir machen einen wichtigen Schritt von eher generischen Datenqualitätsstandards hin zu einer anwendungsspezifischen Formalisierung der Gebrauchstauglichkeit von Daten in einem multidimensionalen Anwendungs-Daten-Matrix-Rahmen. Es wird ein ausgewählter Satz von Datenfitness-Elementen in den FAIRness-Messvorlagen sowie ein Vorschlag für neue Metadatenelemente zur Klassifizierung der Datenfitness entwickelt. Für typische Daten aus Langzeitexperimenten und für Geodaten wird ein Visualisierungs- und Dokumentationssystem für die Beziehungen zwischen der Qualität der Eingabedaten und der erwarteten Qualität des Ergebnisses einer Analyse konstruiert. Definition von anwendungsspezifischen Abfragen: Sobald beispielhafte Datenqualitätsmetriken veröffentlicht sind, werden wir typische anwendungsspezifische Abfragen festlegen, die dokumentiert, in der Community vorgestellt und diskutiert sowie operationalisiert werden sollen. Die formale technische Repräsentation und begleitende Beispiele, z.B. für Abfragen, werden zur Verfügung gestellt, was die Auffindbarkeit von Datensätzen, die für spezifische Anwendungen geeignet sind, erleichtern wird. Solche Abfragen können dann entweder von Datennutzern oder über suchmaschinenähnliche Schnittstellen gestellt werden.


Mittelgeber

Deutsche Forschungsgemeinschaft e.V.