Introductie
Datadocumentatie is zowel een product als een proces. Als proces is het de actieve en continue registratie van relevante informatie over de verzamelde of verwerkte data gedurende de onderzoekscyclus. Als product is datadocumentatie een overkoepelende term voor meerdere categorieën feiten en details over jouw onderzoeksdata. Deze kunnen zijn:
- Documentatie over data-objecten of datasets, bijvoorbeeld: de bestandsformaten van de data, de software die nodig is om ze te lezen, codeboeken en de betekenis van codes en/of variabelen.
- Documentatie over het proces van dataverzameling, bijvoorbeeld: lab notebooks, vragenlijsten, handleidingen, dagboeken, etc.
- Administratieve metadata: informatie die de oorsprong, het doel, de tijd, de geografische locatie, de maker, de toegang en de gebruiksvoorwaarden van datasets beschrijft. Deze informatie wordt gebruikt om gegevens in repositories of archieven te vinden of te indexeren.
Voordelen
Datadocumentatie brengt verschillende voordelen met zich mee. De belangrijkste zijn:
- Het helpt alle details over jouw data te onthouden.
- Het verhoogt de reproduceerbaarheid van je onderzoek.
- Het helpt bij het produceren van hoogwaardige data.
- Het maakt het gebruik van data door samenwerkingpartners makkelijker.
- Het vergroot de vindbaarheid en zichtbaarheid van je data in repositories.
- Het dient als een sterk bewijs van wetenschappelijke integriteit.
Datadocumentatie of metadata?
Een term die vaak wordt gebruikt in verband met datadocumentatie is metadata, of 'data over data'. In de praktijk worden deze termen vaak door elkaar gebruikt. Wel is het nuttig onderscheid te maken tussen ongestructureerde en gestructureerde documentatie/metadata.
Ongestructureerde documentatie of metadata omvat alle informatie over de onderzoeksdata die onderzoekers willen verstrekken als context voor hun dataset en is leesbaar voor mensen. Dit kunnen algemene README-bestanden zijn met gedetailleerde informatie over het gehele onderzoeksproject, inclusief onderzoeksvragen en methodologie, maar ook gedetailleerde informatie over data-objecten, zoals interviews of veldwerknotities.
Gestructureerde documentatie of metadata is een speciaal type metadata-object dat zowel in gewone taal als in .xml kan worden geschreven en een reeks informatievelden bevat die een bepaalde waarde aannemen (bijvoorbeeld temperatuur: 30 °C). Als zodanig zijn gestructureerde metadata computerleesbaar en worden ze gebruikt voor het indexeren of ophalen van datasets in repositories of archieven, net zoals metadata in een bibliotheekcatalogus je helpen de boeken die je nodig hebt uit de bibliotheekzoekmachine te halen. Gestructureerde metadata worden gecreëerd conform specifieke metadatastandaarden.
Deze pagina is voor het laatst bijgewerkt in januari 2023. Heb je niet-werkende links of (schijnbaar) onjuiste informatie gevonden? Stuur dan een e-mail met als titel 'Website content' naar datasteward@eur.nl.