MetaCook: The Metadata Cookbook

Die Bedeutung von Metadaten beim Teilen von FAIR-Daten kann nicht genug betont werden. Das MetaCook-Projekt wurde ursprünglich als ein kochbuchähnliches Set von Anleitungen zur Entwicklung hochwertiger Vokabulare und anschließend Metadaten konzipiert. Wir haben uns jedoch entschieden, das Kochbuch in eine interaktive Software namens VocPopuli umzuwandeln, die die kollaborative Entwicklung von kontrollierten Vokabularen ermöglicht. Auf diese Weise können Benutzer aus allen Bereichen und mit unterschiedlichem Erfahrungslevel VocPopuli einfach navigieren und interaktive Anleitungen erhalten, anstatt Listen von Anweisungen zu lesen. Durch die Verwendung von VocPopuli wird sichergestellt, dass die entwickelten Vokabulare selbst FAIR sind.
VocPopuli bietet die Möglichkeit, das Vokabular sofort auf Datensätze anzuwenden, die in elektronischen Laborbüchern (ELNs) gespeichert sind. Ein Beispiel ist die bereits etablierte Integration mit Kadi4Mat, und wir implementieren derzeit dasselbe für Herbie.
Funktional bietet VocPopuli einige Hauptfunktionen:
Der GitLab-Login wird verwendet, um Benutzerbeiträge mit Versionsnummern von Begriffen und Vokabularen zu verknüpfen.
Die Herkunft jedes Begriffs kann sowohl über die Benutzeroberfläche von VocPopuli als auch über die Commit-Historie und Branches von GitLab verfolgt werden.
Jeder Begriff enthält: Bezeichnung, Synonyme, Übersetzungen, erwarteten Datentyp, weiter gefasste Begriffe, verwandte interne/externe Begriffe, Up/Downvotes, kollaboratives Diskussionsforum, visuellen Verlaufsgraphen.
Jedes Vokabular enthält: Metadaten über seinen Inhalt, eine hierarchische Struktur der Begriffe, eine Menge zulässiger benannter Beziehungen, ein Git-Repository.
Im Backend werden die Daten von VocPopuli in einer Graph-Datenbank gespeichert.
SKOS und PROV (in Arbeit) sind optionale Exporte.
Jede Ressource kann digitalisiert werden: Laborverfahren, Laborproben, ELN, ELN-Export, Datenanalyse.
FAIR Vokabulare enthalten genügend Informationen, die ihre Umwandlung in Ontologien ermöglichen. Wir überprüfen dies mit einem Prototyp der zweiten Software namens OntoFAIRCook. Zum Zeitpunkt des Schreibens ist OntoFAIRCook als Kommandozeilenwerkzeug verfügbar und wird in eine benutzerfreundliche Weboberfläche umgewandelt.
MetaCook ist ein gemeinsames Projekt der Helmholtz-Zentren KIT and Hereon, gefördert im Rahmen der HMC Projektkohorte 2021.
https://helmholtz-metadaten.de/storage/1027/2022-03-30_Metadata-Coockbook_HMC-Welcome.pdf

Publikationen:
Martin Held; Talk ”Electronic Lab Notebooks Compiling Big Datasets for Machine Learning Analysis”, Microscopy Conference, 26.02 – 02.03.2023.
Ilia Bagov, Nick Garabedian, Floriane Bresser, Malte Flachmann, Christian Greiner, Milosz Meller, Nuoyao Ye; Workshop “An End-to-End Framework for FAIR Data in Experimental Materials Tribology”, NFDI-MatWerk Conference, 27.-29.06.2023.
Nick Garabedian, Ilia Bagov, Malte Flachmann, Nuoyao Ye, Miłosz Meller, Floriane Bresser, Christian Greiner; Poster “(Do) We Produce FAIR Data”, 1st Conference on Research Data Infrastructure, 12.-14.09.2023.
Nick Garabedian, Ilia Bagov, Malte Flachmann, Nuoyao Ye, Miłosz Meller, Floriane Bresser and Christian Greiner; Poster “Generate, Store, and Publish FAIR Data in Experimental Sciences“, 19th International Conference on Semantic Systems, 20.-22.09.2023.
Nick Garabedian; Tutorial “VocPopuli and Kadi4Mat for FAIR Data Collection in Experimental Sciences”, 2023 NFDI4Ing Conference, 27.-.28.09.2023.
Nick Garabedian, Martin Held, Ilia Bagov, Fabian Kirchner; Workshop “An End-to-End Framework for FAIR Data in Experimental Materials Science”, HMC Conference 2023, 10.-12.10.2023.
Malte Flachmann, Jakob Biesinger, Max Gorenflo, Ilia Bagov, Christian Greiner, Nikolay Garabedian; Research data “Copper Tribology FAIR Data Experiments - Sapphire Counterbody”, https://doi.org/10.5281/zenodo.8024881.
Fabian Kirchner; Invited Talk ”From ontologies to knowledge graphs with the ELN Herbie (short)”, MSE Day, 14.11.2023.
Fabian Kirchner; Talk ”From ontologies to knowledge graphs with the ELN Herbie (extended)”, HMC dialogue, 08.12.2023.
Ilia Bagov, Malte Flachmann, Nikolay Garabedian, Torben Tiezema, Yulong Li, Julia Rau, Ines Blatter, Antje Dollmann, Michael Seitz, Christian Greiner; Controlled vocabulary ”Vocabulary of Materials Tribology Lab at KIT”, https://doi.org/10.5281/zenodo.7923148.
Ilia Bagov, Nick Garabedian, Nuoyao Ye, Miłosz Meller, Floriane Bresser; Software ”VocPopuli”, https://gitlab.com/metacook/vocpopuli.
Garabedian, N., et al., Poster “MetaCook: FAIR Vocabularies Cookbook”, HMC Conference 2022, https://doi.org/10.5281/zenodo.7125644.
Bagov, I., et al., Poster abstract, “Collaborative Metadata Definition using Controlled Vocabularies, and Ontologies”, First International Conference on FAIR Digital Objects 2022, https://doi.org/10.3897/rio.8.e94931.
Garabedian, et al., Presentation, “Collaborative Metadata Definition using Controlled Vocabularies, and Ontologies - FAIR Data Showcase in Experimental Tribology”, NFDI4Ing Conference 2022, https://doi.org/10.5281/zenodo.7362038 (Contribution 844).
Garabedian, N., et al., Video “Big (Open) Data in Tribology. Big (Open) Data in Experimental Science.” https://www.youtube.com/watch?v=ts1LeM2hVpQ.
Garabedian, N., et al., Video, “Give Tribological Data a Meaning: VocPopuli and PIDs”, https://www.youtube.com/watch?v=ts1LeM2hVpQ.
Garabedian, N., Video, “HMC Project MetaCook – start your FAIR journey with VocPopuli”, https://doi.org/10.5446/60349.