Metadata in Yoda
Metadata is "data over data" en bestaat uit informatie die wereldwijd gestandaardiseerd is en gebruikt wordt door datacatalogi. Voorbeelden zijn de naam van het datapakket, de maker ervan, de bewaartermijn van het pakket, enz. Metadata dient meerdere doelen in Yoda, de belangrijkste daarvan zijn:
- De inhoud van een dataset beschrijven voor een breed publiek.
- Het publiek informeren of de data toegankelijk is en hergebruikt kan worden en zo ja, onder welke voorwaarden.
- Voorschrijven hoe de gegevens moeten worden geciteerd en wie moet worden genoemd.
- Digitale archivarissen en IT-medewerkers informeren over hoe lang de data bewaard moeten worden.
- Om het vinden van de dataset in gegevenscatalogi te vergemakkelijken.
Metadata toevoegen in Yoda
Yoda vergemakkelijkt het toevoegen van gestructureerde metadata aan je onderzoeksdata. Het invoeren van gestructureerde metadata is een voorwaarde voor het archiveren van een datapakket. Om gestructureerde metadata aan een map toe te voegen, navigeer je naar de map in het Yoda portaal en druk je op de knop "Metadata".
Zodra je metadata hebt toegevoegd en op de knop " Save" hebt geklikt, worden de metadata in een specifiek formaat opgeslagen in de map. Yoda gebruikt hiervoor bestanden met de naam "yoda-metadata.json".
Ongestructureerde metadata kunnen als bestand aan de dataset worden toegevoegd, bijvoorbeeld in een "Readme.txt" of "Codebook.pdf" bestand.
Het metadataformulier
Standaard bestaat het Yoda metadataformulier uit ongeveer 30 velden. Raadpleeg de metadata-elementenlijst hieronder voor een gedetailleerde beschrijving van de elementen.
* Alle verplichte velden zijn gemarkeerd met een asterisk.
Sommige metadata-elementen bestaan uit meerdere velden. Als je bijvoorbeeld een persoonsidentificator invoert, moet je ook het type identificator opgeven.
Sommige velden kunnen meerdere waarden hebben. Om een waarde toe te voegen, druk je op het "+"-teken naast het veld.
Metadata hergebruiken
Gestructureerde metadata kunnen worden hergebruikt. Het metadataformulier bevat een knop "Klonen van bovenliggende map". Je kunt deze functie bijvoorbeeld gebruiken om een map op projectniveau te maken met verschillende submappen voor data. Gemeenschappelijke metadata-elementen voor het project kunnen worden ingevoerd in de map op projectniveau. Deze metadata kunnen dan worden gekopieerd naar de gegevensmappen.
Je kunt ook het bestand "yoda-metadata.json" van een map naar een andere map kopiëren om de metadata te kopiëren.
Eigenschappen en toelichtingen
- M Verplicht (Mandatory)
- R Aanbevolen voor optimale vindbaarheid (Recommended for optimal findability)
- O Optioneel (Optional)
Nr | Eigenschap | Verplichting | Toelichting | Opmerkingen |
1 | Title | M | Een goed omschrijvende titel voor je dataset, mag niet langer zijn dan ongeveer 200 tekens. |
|
2 | Description | M | Beschrijf je dataset, bijv. het onderwerp, de steekproefgrootte, methodologie, enz. Het is het beste om deze beschrijving beknopt te houden. Uitgebreide documentatie moet worden toegevoegd aan een tekstbestand met de naam README. |
|
3 | Discipline | R | Het (deel)vakgebied van het onderzoek | De lijst bevat een combinatie van onderzoeksvakgebieden en deelvakgebieden. De gebruikte standaard is de OECD FOS 2007. Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. |
4 | Version | O | Versienummer van je dataset. Handig als je later een bijgewerkte versie van je dataset moet publiceren. | Yoda kent niet automatisch versienummers toe aan datapakketten. Als je meerdere versies maakt, kun je zelf het versienummer registreren volgens je eigen versiebeheerschema. |
5 | Language of the data | O | De hoofdtaal van je dataset. | Dit element wordt gezien als een mogelijk hulpmiddel om de bruikbaarheid van een dataset voor een specifieke persoon te beoordelen. De gebruikte norm is ISO 639/1. |
6a | Collection Process - Start Date | R | Geef aan wanneer je bent begonnen met het verzamelen van de data voor deze dataset | Als je op het veld klikt, verschijnt er een kalender die je kunt gebruiken om de datum te kiezen. |
6b | Collection Process - End Date | R | Geef aan wanneer je klaar bent met het verzamelen van de gegevens voor deze dataset | Als je op het veld klikt, verschijnt er een kalender die je kunt gebruiken om de datum te kiezen. |
7 | Location(s) covered | R | Als je gegevens gekoppeld zijn aan bepaalde locaties, geef dan plaatsnamen op. | Engelse naamgevingsconventie heeft de voorkeur. Het wordt aanbevolen om de voorkeursspelling uit de Getty Thesaurus of Geographic Names waar mogelijk. Eén locatie per regel. Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
8a | Period Covered - Start period | O | Een indicatie van de begindatum van de periode waarop je dataset betrekking heeft | Als je op het veld klikt, verschijnt er een kalender die je kunt gebruiken om de datum te kiezen. |
8b | Period Covered - End Period | O | Een indicatie van de einddatum van de periode waarop je dataset betrekking heeft | Als je op het veld klikt, verschijnt er een kalender die je kunt gebruiken om de datum te kiezen. |
9 | Tags | R | Vrij tekstveld voor het toevoegen van (doorzoekbare) trefwoorden aan je dataset | Je kunt de trefwoorden vrij kiezen. Je kunt het beste slechts één trefwoord per regel toevoegen. Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
10a | Related Data package | R | De manier waarop het huidige datapakket gerelateerd is aan een ander datapakket. | In dit onderdeel kun je een 'gerelateerde' dataset en de aard van die relatie invoeren. Je kunt bijvoorbeeld aangeven dat een andere dataset de ruwe data bevat door IsSourceOf te selecteren in dit veld en de informatie van het andere datapakket in te voeren in de velden eronder. Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. |
10b | Related Data package - Title | R If 10a | Titel van het datapakket met betrekking tot het huidige datapakket. | Er wordt niet automatisch gecontroleerd of titel en persistent identifier overeenkomen. Maximale lengte: 255 tekens.. |
10d | Related Data package – Type | R If 10e | Het type van de persistente identifier van het gerelateerde datapakket. | Voorbeeld: "DOI". Vul de gewone ID in, geen URL |
10e | Related Data package – Identifier | R If 10d | De persistente identifier van het gerelateerde datapakket. |
|
11 | Retention Period | M | Het minimale aantal jaren dat de gegevens in het archief worden bewaard. De standaardwaarde is 10 jaar. | In dit veld kunnen alleen gehele getallen worden ingevoerd. Het beleid voor het omgaan met het verstrijken van de bewaartermijn van een datapakket moet nog worden gedefinieerd. |
12 | Retention Information | O | Te gebruiken voor opmerkingen over de bewaarperiode. | Geef een reden als je afwijkt van de standaardwaarde van tien jaar. Als je er zeker van wilt zijn dat gegevens langer bewaard blijven, dan kan datamanagement vragen om extra zorg te besteden aan het kiezen van duurzame bestandsformaten. |
13 | Embargo enddate | O | Als er een embargo op de dataset rust, op welke datum loopt het embargo dan af? | Deze functionaliteit is nog niet volledig geïmplementeerd. Neem contact op met de datamanager als je een gegevenspakket met een embargo wilt publiceren. |
14 | Data type | M | Geef het datatype aan. | Als er geen type is geselecteerd, neemt Yoda aan dat het type"Data package" is. |
15 | Data Classification | M | Geef de classificatie van de data aan. | Vertaling naar EUR Classifications: Public=Public (laag), Basic=Internal (medium), Sensitive=Confidential (hoog), Critical=Secret (zeer hoog) |
16 | Name of Collection | O | Als dit datapakket deel uitmaakt van een grotere (conceptuele) verzameling datapakketten, kun je hier de naam van de verzameling invoeren. | De onderzoeksgroep moet ervoor zorgen dat alle andere datapakketten in de collectie met dezelfde collectienaam worden gearchiveerd. Maximale lengte: 255 tekens. |
17a | Funder | O | De naam/namen van de organisatie(s) die het onderzoek financiert/financieren. Als je deze eigenschap gebruikt, voeg dan ook het toekenningsnummer toe. | Voorbeeld: "NWO". Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
17b | Award Number | R if 17a | Het subsidienummer dat is uitgegeven door de financierende organisatie |
|
19 | Remarks | O | Opmerkingen van de datamanager |
|
20a | Creator of Data package - Name | M | De belangrijkste onderzoekers die betrokken waren bij het produceren van de gegevens, in volgorde van prioriteit. | Dit veld kan meerdere waarden hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
20b | Creator of Data package – Affiliation | M | De organisatorische of institutionele verbintenis van de maker | Voorbeeld: "Vrije Universiteit Amsterdam". De verbintenis van de maker van een gegevenspakket kan van belang zijn als het onduidelijk is wie de eigenaar van de gegevens is. In het algemeen wordt de organisatie waaraan de maker verbonden was beschouwd als de eigenaar. Elke maker kan meerdere verbintenissen hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
20c | Creator of Data package – Persistent Identifier: Type | M if 20d | Geef het type persistente persoonsidentificatie aan. | Bijvoorbeeld AuthorID, ORCID of ResearcherID. Meerdere waarden zijn mogelijk. Voer ten minste een ORCID in als deze beschikbaar is. |
20d | Creator of Data package – Persistent Identifier: Identifier | R | De Persistent Identifier. | Als je niet zeker weet of iemand een persistente identifier heeft, kun je dit controleren bij de grote drie providers: AuthorID, ORCID, ResearcherID. Elke maker kan meerdere persistente identifiers hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
21 | Contributor to Data Package - Name | R | De instelling of persoon die verantwoordelijk is voor het verzamelen, beheren, verspreiden of anderszins bijdragen aan de ontwikkeling van de bron. Voor software, als er een andere entiteit is die "de code bewaart, archiveert, publiceert, afdrukt, distribueert, vrijgeeft, uitgeeft of produceert", gebruik dan het bijdraagtype "Hosting Institution" voor de codeopslagplaats. | Meerdere waarden mogelijk - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
21a | Contributor to Data Package - Type | M if 21 | Vul in wat voor soort bijdrage de geregistreerde persoon heeft geleverd aan dit datapakket. | Zie de datacite documentatie voor nadere toelichting. |
21b | Contributor to Data Package - Affiliation | M if 21 | De organisatorische of institutionele verbintenis van de bijdrager. | Bijvoorbeeld Erasmus Universiteit Rotterdam. Elke bijdrager kan meerdere verbintenis hebben - gebruik het plusteken om meerdere waarden toe te voegen. Maximale lengte: 255 tekens. |
21c | Contributor to Data Package - Persistent Identifier: Type | M if 21d | Geef het type persistente persoonsidentificatie aan. | Elke bijdrager kan meerdere persistente identifiers hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
21d | Contributor to Data Package - Persistent Identifier: Identifier | R | De unieke persoonsidentificatie | Elke bijdrager kan meerdere identifiers hebben - gebruik het plusteken om meer waarden toe te voegen. Maximale lengte: 255 tekens. |
25 | License | M | De licentie waaronder je het datapakket aanbiedt voor gebruik door derden. De voorkeurswaarde voor open data is CC By 4.0. | Elk pakket moet worden gearchiveerd met een licentie - zelfs als je niet van plan bent om de gegevens te publiceren of te laten hergebruiken in welke vorm dan ook. We bieden een aantal mogelijke licenties aan in een vervolgkeuzelijst. Als je niet weet welke licentie je moet kiezen, neem dan contact op met de datamanager. Op het moment dat je een datapakket publiceert, wordt de relevante licentietekst in het datapakket gekopieerd. Als je kiest voor een aangepaste licentie, moet je de aangepaste licentietekst opslaan in een bestand met de naam License.txt in de hoofdmap. Neem eerst contact op met de datamanager als je met aangepaste licenties wilt werken |
26 | Data Package Access | M | Moet je dataset na archivering toegankelijk zijn voor derden? | Open Access betekent dat de dataset voor iedereen toegankelijk is. Restricted Access betekent dat de dataset alleen op aanvraag verkrijgbaar is. Closed Access betekent dat de dataset in principe niet gedeeld kan worden. |
Deze pagina is het laatst bijgewerkt in juli 2023. Heb je niet-werkende links gevonden of (schijnbaar) niet correcte informatie? Stuur dan een mail met het onderwerp 'Website content' naar datasteward@eur.nl.