MetaSupra - Interoperabilität für das Sammeln von Oberflächendaten von der Oberfläche zur Struktur

MetaSupra nutzt die Fortschritte im Bereich der Large Language Models (LLMs), um den Prozess der Anreicherung von Metadaten in FAIR-konformen Repositories zu beschleunigen. Es ist ein gemeinsames Projekt der Helmholtz-Zentren KIT und FZJ, das im Rahmen der HMC-Projektkohorte 2023 gefördert wird.
Konkret wird MetaSupra SupraBank erweitern, eine Plattform, die maschinenlesbare physikalisch-chemische Parameter und Metadaten zu intermolekularen Wechselwirkungen in Lösung bereitstellt. Durch den Einsatz von LLMs wollen wir Daten-Crawler entwickeln, die in der Lage sind, kontextspezifische Informationen aus der chemischen Literatur zu extrahieren, die Datenerfassung zu vereinfachen und FAIR-Repositories zu kuratieren. Diese Crawler-Software soll zugänglich gemacht werden, so dass sie von anderen Helmholtz-Zentren übernommen werden kann. Darüber hinaus wird MetaSupra veranschaulichen, wie der Nutzen von Repositorien für Korrelationsstudien, maschinelles Lernen und Bildungszwecke durch die Integration von quantenchemisch berechneten molekularen Parametern erheblich gesteigert werden kann, und es als Modell für andere chemische Repositorien positionieren und seine Integration in IUPAC-Aktivitäten vorantreiben.