Volkstellingen behoren tot de meest waardevolle en betrouwbare statistische bronnen van het verleden. Ze zijn vaak de enige bron voor het bestuderen van demografische en sociaal-economische veranderingen over lange perioden. Digital humanities onderzoeker Ashkan Ashkpour publiceerde voor het eerst de complete volkstellingen in één database, en nu kunnen gebruikers het landschap van de Nederlandse historische tellingen verkennen of eigen datasets en tools ontwikkelen. Hij verdedigt zijn proefschrift donderdag 17 januari aan de Erasmus Universiteit Rotterdam.
Ashkpour gebruikte Semantische Web-technologieën voor de harmonisatie van grote datasets binnen het sociaal-historische domein, met name de volkstellingen. Door de jaren heen hebben de volkstellingen verschillende transformaties ondergaan om ze toegankelijker te maken, maar de gegevens waren nog steeds erg lastig om mee te werken, vooral bij analyse over langere perioden.
Harmonisatie is een eerste vereiste om longitudinaal onderzoek met deze gegevens mogelijk te maken. Hierbij wordt de diversiteit in gegevensformaten, structuur en inhoud in een uniform systeem omgezet.
Als uitkomst van dit onderzoek ontwikkelde Ashkpour een 'brongerichte harmonisatie workflow' en bijbehorend 'datamodel' op basis van RDF en het Linked Open Data concept. De Workflow en tools stellen gebruikers in staat om historische datasets op een gestructureerde, iteratieve en verantwoordelijke manier te harmoniseren.
Daarnaast zijn intuïtieve oplossingen ontwikkeld waarmee gebruikers eenvoudig gestructureerde gegevens zoals de volkstellingen kunnen omzetten naar ‘Linked Data’, door simpelweg Excel-tabellen in te kleuren. Door toepassing van deze methoden en innovatieve technieken zijn de volledige volkstellingen, met in totaal 2249 tabellen, geconverteerd naar RDF en online beschikbaar gemaakt voor anderen.
Door voor het eerst de complete volkstellingen in één database te hebben, kunnen gebruikers het landschap van de Nederlandse historische tellingen verkennen (iets wat voorheen niet mogelijk was) of eigen datasets en tools ontwikkelen bovenop onze gegevens.
Daarnaast harmoniseerde Ashkpour systematisch een deelverzameling van de gegevens met de woningtypen en demografische variabelen voor de periode 1795-2010. Dit heeft bijgedragen aan o.a. het creëren van nieuwe sociaal-historische variabelen en classificatiesystemen in het Semantische Web, zoals de Woningtype Classificatie en LICR (Linked Internationaal Classificatie van Religie). Door gebruik te maken van open methoden en technologieën bieden we een praktische basis aan andere onderzoekers op het gebied van ‘Digital Humanities’ voor het harmoniseren van complexe historische datasets.
- Gerelateerde content