Extra informatie koppelen aan basisobjecten - hoe moeilijk is dat?

demonstrator
31 januari 2020

In het kader van Doorontwikkeling in Samenhang, werkt het ministerie van BZK aan meer samenhang in het stelsel van geo(basis)registraties. Zij doet dit door initiatieven bij elkaar te brengen en gezamenlijk op te laten trekken die het gebruik van de Basisregistraties verbeteren.

Aan Geonovum is gevraagd te verkennen hoe je geodata in samenhang beschikbaar zou kunnen stellen. Hoe moeilijk of makkelijk is het om extra informatie te koppelen aan basisobjecten? Om dit te verkennen heeft Geonovum met hulp van Netage een demonstrator gemaakt.

Wat is onderzocht

Als je informatie uit overheidsdata wilt hebben, dan wil je die kunnen ophalen zonder zelf op zoek te moeten naar de juiste combinatie van datasets. Je wilt het zo simpel dat je een vraag stelt en de computer een antwoord geeft.

Aan de hand van user stories met toenemende complexiteit is verkend hoe makkelijk je op dit moment een vraag kunt beantwoorden als je het antwoord uit verschillende datasets moet samenstellen. Om enige structuur aan te brengen, hebben we datasets ontsloten via API’s als dat nog niet het geval was.

demonstrator

Wat zijn de bevindingen

We constateren dat een API een sterk hulpmiddel is als je met voorgedefinieerde (veelgestelde) vragen een dataset bevraagt. Dit gebeurt bijvoorbeeld al bij Haal Centraal. Wanneer je vragen stelt waarbij het antwoord moet worden samengesteld op basis van meerdere bronnen, zijn API’s daar echter niet standaard op toegerust. Om dàt voor elkaar te krijgen moet je extra handelingen verrichten en hoe meer datasets zijn betrokken, hoe complexer dat wordt. Voor het over datasets heen kunnen vragen stellen, biedt een knowledge graph (linked data) meer perspectief.

Onze aanbeveling op basis van het experiment is daarom om niet alleen op API’s te focussen bij het toegankelijk maken van data, maar ook te kijken naar een infrastructuur van een of meerdere “knowledge graphs” (linked data).

Een “quick win” ligt daarbij in het beter benutten van de stelselcatalogus. De stelselcatalogus geeft aan hoe registraties aan elkaar gerelateerd zijn. In veel datasets ontbreken verwijzingen naar een identifier uit een basisregistratie. Als je die identifiers wel hebt, zijn relaties tussen de datasets digitaal inzichtelijk en navolgbaar te maken.  

Meer weten?

Gerelateerd nieuws