Om grip te krijgen op de ontwikkelingen op het gebied van tekstanalyse met behulp van Machine Learning (ML) en Artificial Intelligence (AI) heeft de Universiteitsbibliotheek (UB) een interdisciplinair team opgezet, het Future Library Lab (FLL). Dit team bestaat uit experts met verschillende, maar overlappende expertises: software architectuur, AI en ML, bibliotheekwetenschap en datawetenschap. Zo kan de UB experimenteren met de toepassingen van ML en AI op bibliotheekgegevens en andere datasets, met behulp van supervised en unsupervised technieken.
Diensten en samenwerking
Patiëntervaringsverhalen
De UB beschikt over een grote, vooral Nederlandstalige, collectie van patiëntervaringsverhalen over lichamelijke beperkingen en ziekten als kanker, Alzheimer en psychose. Deze collectie is een rijke bron voor onderzoekers, actief op het gebied van gezondheidsbeleid en citizen science. Momenteel werkt het FLL samen met een team van onderzoekers van de Erasmus School of Health Policy and Management (ESHPM) om het potentieel van deze collectie voor hun onderzoek te verkennen.
Summa
Summa is een doorzoekbaar multi-tenant platform dat gegevens uit verschillende bronnen kan opnemen, transformeren, samenvoegen en verbeteren via zogenaamde pipelines. Met dit platform kan het FLL een uitgebreid overzicht van EUR-publicaties presenteren, verrijkt met een extra laag, door AI gegenereerde, metadata. Summa is zo ontworpen dat het ook andere tekstbestanden, zoals patiëntervaringsverhalen, kan verwerken.
Computer gegenereerde metadata
Het FLL heeft tot doel extra lagen metadata te genereren voor wetenschappelijke publicaties die de vindbaarheid van de publicaties verbeteren en aanvullende informatie aan de gebruikers verschaffen over de inhoud van de documenten.
Vereenvoudigde versies van wetenschappelijke publicaties
Met de toepassing van zogenaamde Large Language Models (LLM's) kan het FLL vereenvoudigde versies van academische publicaties aanbieden zonder de strekking van de publicatie geweld aan te doen. Deze dienst kan docenten helpen bij het presenteren van cursusmateriaal dat anders minder toegankelijk is door het gebruik van jargon en complex taalgebruik.
Trends in wetenschappelijk onderzoek
Het FLL probeert inzicht te verschaffen in de trends binnen wetenschappelijk onderzoek, binnen en buiten de EUR, door databases als Pure, OpenAlex en RePEc samen te voegen en door gebruik te maken van Natural Language Programming (NLP) en AI.
Research sprints
Het FLL helpt onderzoekers bij het verzamelen van data via de application programming interface (API’s) van de UB of via webscraping. Het biedt ook ondersteuning bij het werken met datasets: verkennende data-analyse (EDA), opschonen, analyseren en visualiseren. En natuurlijk met text mining en ML. Enkele van onze recente samenwerkingen zijn die met:
- Erasmus School of Health Policy & Management (ESHPM (welzijnsinstrument).
- Erasmus MC/TU Delft (patiëntervaringsverhalen sarcoïdose).
- ISS (beoordeling van onderzoeksactiviteiten).
Overige samenwerkingsverbanden
Het team ondersteunt ook een team onderzoekers bij de Erasmus School of History, Culture and Communication (ESHCC), dat in samenwerking met de TU Delft een EUR large language model (LLM) bouwt, als onderdeel van het Convergence-project.
Workshops
- Programmeren met Python (introductie);
- Programmeren met Python (gevorderd);
- Introductie ‘machine learning’ (ML).
Teamleden
- Nick Jelicic
- Jasper Op de Coul
- Farzane Zahra Zarepour
Meer informatie
Neem voor meer informatie contact op met het Future Library Lab Team via: fll.library@eur.nl