Zorg ervoor dat je data klaar is om te worden gedeeld voordat je het uploadt naar het EUR Data Repository. Dit voorkomt onnodige vertraging in het publiceren van je data.
Hieronder vind je een lijst met zaken waarmee je rekening moet houden bij het gereed maken van je data. Idealiter zijn deze al geadresseerd tijdens het schrijven van je data management plan aan het begin van je onderzoek. In dat geval kost het gereed maken van je data weinig extra tijd.
Op alle persoonsgegevens is de EU-privacywetgeving, de Algemene Verordening Gegevensbescherming (AVG), van toepassing. Persoonsdata zijn alle stukjes informatie of combinaties van stukjes informatie die de participanten aan je onderzoek direct of indirect kunnen identificeren. Voorbeelden zijn: naam, e-mailadres, IP-adres, studentnummer.
De AVG stelt eisen waaraan moet worden voldaan voordat je persoonsdata kunt publiceren. Denk hierbij aan het verwijderen van persoonsdata die niet nodig zijn bij hergebruik van data, het zo onherleidbaar mogelijk maken van de identiteit van de participant, en hoe de toestemming voor het hergebruiken van persoonsdata eruit moet zien, etc.
Als je data gebruikt die eigendom is van een bedrijf of organisatie, of een contract of overeenkomst bent aangegaan met een derde partij, controleer dan of je de gegevens mag delen en onder welke voorwaarden. Dit omvat ook intellectuele eigendomsrechten, auteursrechten en gebruiksvoorwaarden die van toepassing kunnen zijn wanneer je b.v. sociale media of andere online platforms gebruikt om gegevens te verzamelen.
Kies een raamwerk om jouw bestanden een titel te geven die de inhoud weerspiegelt zodat jij en anderen snel de juiste bestanden kunnen vinden. Kenmerken die je in de titel op zou kunnen nemen zijn: datum waarop het bestand is aangemaakt, locatie, projectnummer, versienummer. Andere zaken om rekening mee te houden zijn een consequente naamgeving van bestanden, het kort maar beschrijvend houden van bestanden (<25 tekens), het vermijden van speciale tekens of spaties, het gebruik van hoofdletters en liggende streepjes in plaats van punten of spaties of slashes, het gebruik van een vast datumformaat (bijv. ISO 8601: JJJJMMDD), en het gebruik van versienummers.
Voorbeelden: 20200125_DMP_V3.pdf, 20200211_IC_Template.pdf, 20190719_Image_Cropped.jpg, 20210628_Data_Processed.sav.
Zorg ervoor dat het bestandsformaat dat je kiest past bij de data die je wilt delen en ook langdurige toegang garandeert. Gebruik daarom een formaat dat vaak gebruikt wordt, een open specificatie heeft en onafhankelijk is van specifieke software, leveranciers, of ontwikkelaars.
Dat betekent dus dat formaten zoals Word en Excel niet de voorkeur hebben, ook al worden ze vaak gebruikt. Meer duurzame alternatieven zijn PDF- en CVS-formaat. Een lijst met voorkeursformaten vind je hier.
Open data gaat niet alleen over het databestand zelf. Even belangrijk is de begeleidende documentatie die de context weergeeft waarin de gegevens zijn verzameld en beschrijft hoe deze zijn verzameld en geanalyseerd. Deze verzameling bestanden wordt vaak het ‘publicatiepakket’ genoemd en bevat alles wat nodig is om het onderzoek te reproduceren of de data te hergebruiken.
Voorbeelden van bestanden die in een publicatiepakket moeten worden opgenomen zijn: het [onbewerkte] databestand, een codeboek met de variabelen en categorieën, de syntax of code die is gebruikt om de data te analyseren, de gebruikte vragenlijst of een lijst van interviewvragen, de [transcripties van] audio- of video-opnamen en een leesmij-bestand waarin de methode en stappen worden beschreven die je hebt gebruikt om de gegevens te analyseren.
Als je vragen hebt of hulp nodig hebt bij het voorbereiden van je gegevens, kun je contact opnemen met je facultaire datasteward. Als het nodig is zal de data steward je doorsturen naar een privacy- of juridisch adviseur.