Häufig gestellte Fragen
Hier finden Sie Antworten zu allgemeinen Fragen über Metadaten und HMC.
Sollten Sie weiterführende Fragen haben, wenden Sie sich bitte an unser HMC Office oder den für Sie passenden Metadaten-Bereich. Sollten Sie Fragen zur HMC-Projektausschreibung haben, finden Sie hier FAQs dazu.
Metadaten sind Daten über Daten.
Metadaten werden immer dann erstellt und verwendet, wenn es um die Dokumentation von wissenschaftlicher Tätigkeit und die daraus entstehenden Daten geht. Sie enthalten die Informationen, die das Auffinden, die Abrufbarkeit, die Nachvollziehbarkeit sowie die Nachnutzung von Daten im Sinne der FAIR-Prinzipien ermöglichen.
Eine detailliertere Definition des Begriffes Metadaten und anderer relevanter Begriffe finden Sie im Glossar.
Metadaten sind ein Teil der Dokumentation Ihres Forschungsprozesses - Metadaten beschreiben Ihre Daten und wie Sie sie erhoben haben. Die Aufzeichnung von Metadaten, z. B. von Versuchsprotokollen, erleichtert Ihnen und Ihren Mitarbeitenden die Planung geeigneter Analysen. Und in der Zukunft werden Sie bereits alle Details Ihrer Arbeit haben, wenn es an der Zeit ist, zu veröffentlichen oder eine neue Analyse durchzuführen.
Wenn Sie Ihre Daten in ein digitales Repositorium hochladen (was häufig von Geldgebern und Fachzeitschriften verlangt wird), müssen Sie wahrscheinlich auch die zugehörigen Metadaten bereitstellen. Wenn Sie die Verwaltung von Metadaten von Anfang an in Ihr Projekt einbeziehen, sparen Sie später Zeit.
Unabhängig davon, wie Sie Ihre Daten veröffentlichen oder weitergeben, ermöglicht die Angabe von Metadaten anderen, Ihre Forschungsergebnisse leichter zu finden und zu verwerten. Ihre Arbeit wird besser sichtbar sein und häufiger zitiert werden!
Eine der größten Hürden für das Erfassen von Metadaten - deren einfache Verfügbarkeit - lässt sich am Zeitpunkt der Erfassung festmachen.
Der Aufwand, Metadaten nachträglich zu erheben und einem Datensatz hinzuzufügen, ist oft erheblich. Daher sollte die Erhebung von Metadaten schon möglichst während der Erhebung der Daten selber geschehen.
Zu diesem Zeitpunkt sind Informationen direkt verfügbar und können auf oft einfache Weise automatisch oder semi-automatisch erfasst und mitgespeichert werden. Das Wissen der Forscherin/des Forschers über die Erhebung, Bearbeitung und Analyse von Forschungsdaten kann hier strukturiert festgehalten werden und geht so nicht verloren.
Die Frage, welche Metadaten die „richtigen“ für einen bestimmten Datensatz sind, hängt vom wissenschaftlichen Kontext und den Daten selbst ab. Die folgenden Themenfelder sind sehr wichtig und sollten bedacht werden:
Vokabularien: Zur Beschreibung eines Datensatzes sollte ein bestehendes, anerkanntes und kontrolliertes Vokabular genutzt werden. Das stellt sicher, dass die erstellte Beschreibung allgemein verständlich und mit anderen Datensätzen interoperabel bleibt.
PID: Die Vergabe von persistenten Identifikatoren (engl. persisten identifier, PIDs), wie z.B. DOIs für Forschungsdaten, kann es ermöglichen, Daten dauerhaft auffindbar und zitierfähig zu machen. Damit steigen die Reputation und Sichtbarkeit der Autorin/des Autors. PIDs können ein Baustein sein, Metadaten maschinenlesbar zu machen.
Repositorien: Um Daten zu veröffentlichen, muss ein passendes Repositorium identifiziert werden. Anforderungen und Bedarfe an die Qualitätskontrolle der eingespeisten Daten und/oder die Vorhaltezeit von Daten können fachgebietsspezifisch sehr unterschiedlich sein. Re3Data oder die Datenbanken von NIH und NHS können gute Startpunkte sein, um ein passendes Repositorium zu finden.
Lizenzierung: Eine Lizenzierung der Daten über eine Open-Content-Lizenz ermöglicht die maßgeschneiderte Vergabe von Rechten an nachfolgende Nutzende. Hierzu können z.B. die von Open Data Commons für offene Daten und offene Datenbanken entwickelten Lizenzen für Forschungsdaten verwendet werden.
Datenschutz: Bevor Daten veröffentlicht werden, ist zwingend zu prüfen, ob die Daten Geschäftsgeheimnisse enthalten oder ob eine Veröffentlichung mit den Persönlichkeitsrechten Dritter in Konflikt steht. Außerdem können Förderbescheide, Arbeits- oder Dienstleistungsverträge Bestimmungen enthalten, die eine Veröffentlichung der Daten nicht oder nur unter bestimmten Bedingungen zulassen. Informationen hierzu sollten Sie bei der/dem für Ihr Forschungsinstitut zuständigen Datenschutzbeauftragen erfragen oder in den für Ihr Institut geltenden Data Policies recherchieren. Eine Übersicht der institutionellen Policies finden Sie hier.
Spezifische Anwendungen von Metadaten-Best-Practices können je nach Fach und Anwendungshintergrund sehr unterschiedlich sein und in ihrer Größe vom Kleinprojekt bis zu einem institutionellen Kontext reichen.
HMC betreut unterschiedlichste Use Cases und kann Ihnen somit Fallbeispiele liefern, die in vielen Aspekten Ähnlichkeit mit Ihrer Situation haben und so als Orientierung dienen können. Weitere Informationen finden Sie in den Informationsseiten der Metadaten-Hubs.
Als Metadaten sollten alle Informationen erfasst werden, die die Interpretierbarkeit und Nachvollziehbarkeit Ihrer Daten sicherstellen.
Um die speziell für Ihr Projekt wichtigen Metadaten zu identifizieren, kann es helfen, einen Datenmanagementplan (DMP) aufzustellen. Hierzu gibt es vielfältige Unterstützung.
Ein „minimaler Satz“ an Metadaten sollte folgende Fragen beantworten können:
Wer hat die Daten gesammelt bzw. erhoben?
Wann und wo wurden die Daten erhoben?
Warum/wozu wurden die Daten erhoben?
Welche Art von Daten wurden gesammelt?
Wie wurden die Daten erhoben?
Wie sind die Daten gespeichert (Format & Struktur)?
Wurden die Daten analysiert/verarbeitet (RAW vs. analysierte Daten)?
Wurden, und wenn ja, wie wurden die Daten bearbeitet & analysiert (Roh- vs. analysierte Daten, Filter, Selektion, etc.)?
Wurde die Qualität der Daten überprüft/sichergestellt?
Wie kann auf die Daten zugegriffen werden?
HMC und die Metadaten-Hubs unterstützen Sie gern bei weiteren Fragen. Wir möchten Ihnen helfen, zu einem „optimalen Satz“ an Metadaten zu gelangen.
Bei Fragen zu Metadaten können Sie sich gern an HMC wenden. Alle relevanten Kontaktdaten finden Sie hier. Wir arbeiten für und mit den Forschenden und Datenmanagenden der Helmholtz-Gesellschaft. Generell ist unsere Arbeit in nationale und internationale Initiativen eingebettet und wir arbeiten auch mit HGF-externen Interessierten zusammen.
Die „Nationale Forschungsdateninfrastruktur“ (NFDI) besteht aus fachspezifischen Konsortien, die auf dem Gebiet des Forschungsdatenmanagements in Deutschland arbeiten.
Die „European Open Science Cloud“ (EOSC) ist eine Initiative der Europäischen Kommission zur Bereitstellung einer Open-Science-Infrastruktur für Europa.
HMC arbeitet eng sowohl mit NFDI und EOSC sowie anderen Initiativen zusammen um sicherzustellen, dass unsere Arbeit der globalen Forschungsgemeinschaft zugutekommt.
Re3Data kann Ihnen helfen, fachspezifische Repositorien zu identifizieren, in denen Datensätze aufbewahrt werden.
Das Portal DataCite kann genutzt werden, um DOI-referenzierte Datensätze zu finden.
Datenbanken, die fachbereichsagnostisch Daten aufbewahren, können auch direkt durchsucht werden - z.B. Zenodo, Data Dryad oder Figshare.
Für Fragen, spezifisch für Ihren Fachbereich, nehmen Sie bitte Kontakt mit Ihrem Metadaten-Hub auf.
Triplestores sind Datenbanksysteme, die für die Speicherung von Tripel unter Verwendung des RDF optimiert sind. Ein Tripel beschreibt Informationen in Form von Subjekt, Prädikat und Objekt, wie zum Beispiel Himmel
hat Farbe
blau
. Alle Entitäten, die wie ein Graph aufgebaut sind (z.B. OWL Ontologien, Knowledge Graphs), können in einem Tripelstore gespeichert werden, ebenso auch Formate wie eine Graphdatenbank.