MicroMacS – Mikrobiom-Maschine für die Synthese

Mikrobiom-Maschine für die Synthese: Domänenspezifische Anwendung von FAIR-Datenbewertungen für die automatisierte Metadaten-Erfassung
Die Sequenzierung hat die Lebenswissenschaften revolutioniert und riesige Mengen an einheitlichen, öffentlich verfügbaren Sequenzdaten erzeugt. Ein großes Hindernis für die Wiederverwendung von Daten ist das historische Fehlen einer Kuratierung der Sequenzdaten und Metadaten sowie das Fehlen von Verknüpfungen zwischen Sequenzdaten und peer-reviewed wissenschaftlichen Artikeln, die diese beschreiben und ihren Kontext liefern. Die Anreicherung von Metadaten für zuvor archivierte Sequenzdaten stellt eine dringende Herausforderung dar. Wir werden einen Forscher einstellen, der MicroMacS entwickelt, eine öffentlich verfügbare, modulare Pipeline, die Artikel mit Sequenzdaten durch Textparsing verknüpft, KI einsetzt, um experimentelle Metadaten zu extrahieren, und grundlegende Sequenzqualitätsprüfungen durchführt, sodass Nutzer die Wiederverwendbarkeit von Datensätzen einfach bewerten können, was die Interoperabilität erhöht und bestehende Metadaten anreichert. MicroMacS wird das Update-Protokoll für MiCoDa, die weltweit größte kuratierte prokaryotische Metabarcoding-Datenbank, werden. MicroMacS wird die Wiederverwendung von Sequenzdaten fördern und die Open-Science-Forschung in den Lebenswissenschaften beschleunigen.
MicroMacS ist ein gemeinsames Projekt der Helmholtz-Zentren UFZ and HMGU, gefördert im Rahmen der HMC Projektkohorte 2024.