ALAMEDA: A scalable multi-domain Metadata management platform

Die modernen Erdwissenschaften produzieren eine ständig wachsende Menge an Daten. Diese bestehen aus Messungen/Beobachtungen und beschreibenden Informationen (Metadaten) sowie semantischen Klassifikationen (Semantik). Je nach geowissenschaftlichem Parameter werden Metadaten in einer Vielzahl unterschiedlicher Datenbanken, Standards und Semantiken gespeichert, was die Interoperabilität in Bezug auf eingeschränkten Datenzugriff, Austausch, Durchsuchbarkeit und Vergleichbarkeit erschwert. Beispiele für gängige Datentypen mit sehr unterschiedlichen Strukturen und Metadatenanforderungen sind Karten, geochemische Daten aus Feldproben oder Zeitseriendaten, die mit Sensoren an einzelnen Punkten gemessen werden, wie zum Beispiel Niederschlag oder Bodenfeuchtigkeit.

Derzeit besteht eine erhebliche Lücke zwischen den Möglichkeiten von Datenbanken, Metadaten zu erfassen, und deren praktischer Anwendung. ALAMEDA ist eine modulare, strukturierte Plattform für das Metadatenmanagement, die die Kurierung, Kompilation, Verwaltung, Visualisierung, Speicherung und den Austausch von Metainformationen aus Labor-, Feld- und Modellierungsdatensätzen ermöglicht. Als Pilotanwendung wird ALAMEDA sich auf stabile Isotopen- und Bodenfeuchtigkeitsdaten konzentrieren und es Nutzern ermöglichen, Metadaten über Organisations-, System- und Domänen-Grenzen hinweg zu suchen, zuzugreifen und zu vergleichen.

ALAMEDA deckt fünf Hauptkategorien von Metadaten ab:

  1. Beobachtungen & Messungen

  2. Proben- & Datenhistorie

  3. Sensoren & Geräte

  4. Methoden & Verarbeitung

  5. Umweltmerkmale (räumlich & zeitlich)

Diese Kategorien sind hierarchisch strukturiert, miteinander verknüpft und mit spezifischen Metadatenattributen (z. B. Name, Datum, Ort, Methoden zur Probenvorbereitung, Messung und Datenverarbeitung usw.) gefüllt. Für den Pilotfall werden alle Metadaten durch bestehende und gut etablierte Datenmanagement-Tools (z. B. mDIS, Medusa usw.) bereitgestellt.

Innerhalb von ALAMEDA wird alle Informationen zusammengeführt und über Web-Oberflächen zugänglich gemacht. Das Projekt legt zudem einen Fokus auf Funktionen wie die Metadaten-Kurierung durch intuitive grafische Benutzeroberflächen, die Verwendung etablierter Standards, den Einsatz von domänenkontrollierten Vokabularen sowie die Bereitstellung von Schnittstellen für eine standardisierte Verbreitung aggregierter Informationen. Schließlich soll ALAMEDA in den DataHub (Hub-Terra) integriert werden.

ALAMEDA ist ein gemeinsames Projekt der Helmholtz-Zentren GFZ and UFZ, das im Rahmen des HMC-Projektkohorte 2021 gefördert wird.

Projektvortrag vom "HMC Project Welcome Meeting” März 2022
https://helmholtz-metadaten.de/storage/1025/2022-03-30_ALAMEDA_HMC-Welcome.pdf
Hauptkontaktperson Oliver Rach
Projektpartner GFZ, UFZ
Projektdauer 01.05.2022 - 31.10.2024

Publikationen:

Gunnar Pruß; Conference presentation “Using HELIPORT in the Context of the HMC Project ALAMEDA”, First HELIPORT Workshop, HZDR Dresden-Rossendorf, 12.-14.06.2023; 10.5281/zenodo.8064045.

Marc Hanisch; Conference presentation “Containerizing HELIPORT - Development and Deployment with Docker”, First HELIPORT Workshop, HZDR Dresden-Rossendorf, 12.-14.06.2023; 10.5281/zenodo.8064045.

Rach, O., Poster “ALAMEDA – A scalable multi-domain metadata management platform”, HMC Conference 2022, https://events.hifis.net/event/469/contributions/3314/