EReMiD – Förderung der Wiederverwendung von Mikrobiomdaten

Förderung der Wiederverwendung von Mikrobiomdaten (EReMiD): KI-unterstützte Kategorisierung von Datentypen und Ontologie-Angleichung über verschiedene Disziplinen hinweg.

Das Sequence Read Archive (SRA) enthält die meisten Mikrobiom-Sequenzierungsdaten, doch über 75 % sind nicht FAIR-konform, was den Fortschritt in den Bereichen Gesundheits- und Umweltwissenschaften behindert.

Ziel dieses Projekts ist es, die Helmholtz HUBs Erde und Umwelt sowie Gesundheit durch zwei komplementäre Ansätze zu verbinden: (1) KI-unterstützte Identifizierung und Korrektur von Datentypen, um verwaiste Daten auffindbar und wiederverwendbar zu machen, und (2) die Vernetzung von Ontologien aus den Bereichen Mensch (HMGU) und Terrestrisch (UFZ) durch die Anwendung von Wörterbüchern zur Vereinheitlichung von bis zu 8,2 Millionen SRA-Datensätzen. Durch die Angleichung dieser Ontologien werden wir die Datenzugänglichkeit und Interoperabilität über Forschungsfelder hinweg in drei Zentren verbessern. Zusätzlich werden wir Workshops durchführen, um die nächste Generation junger Wissenschaftler durch die Graduiertenschulen der Zentren auszubilden. Diese Workshops werden ein Research Object Crate fördern, das die Health- und Earth-and-Environment-HUBs miteinander verbindet und robuste Metadatenstandards innerhalb der Helmholtz Metadata Collaboration unterstützt.

EReMiD ist ein gemeinsames Projekt der Helmholtz-Zentren UFZ and HMGU, gefördert im Rahmen der HMC Projektkohorte 2024.

Projektpartner UFZ, HMGU