Gebruikershulpmiddelen

Site-hulpmiddelen


hergebruik

Hergebruik van overheidsdata

Open Data is per definitie niet alleen gericht op transparantie, maar ook op het hergebruik ervan. De overheid stelt haar data ter beschikking, zodat anderen hier nieuwe doeleinden voor kunnen vinden. Met de invoering van de Wet hergebruik van overheidsinformatie, hoeft een hergebruiker niet af te wachten tot de overheid een bepaalde dataset ter beschikking stelt. In artikel 3 is namelijk het 'recht op verzoek' geïntroduceerd: een ieder een verzoek om hergebruik kan richten tot een met een publieke taak belaste instelling, waarbij hij vermeldt welke informatie hij wenst te gebruiken. De verzoeker hoeft daarbij geen belang te stellen, en kan dus data in een herbruikbaar formaat naar wens opvragen.

Herbruikbaarheid

Open data moet makkelijk te hergebruiken zijn. Artikel 5 van de Who stelt dat overheidsinformatie in een open en machinaal leesbaar formaat en lang elektronische weg ter beschikking moet worden gesteld. Open data gaat daarom hand in hand met open standaarden.

ICT-standaarden beschrijven de manier waarop gegevens uitgewisseld worden. 'Open' betekent in dit geval dat de beschrijving van de standaard openbaar is en door anderen vrij gebruikt mag worden. 'Standaard' suggereert dat het een formaat betreft waar veel verschillende partijen mee overweg kunnen. De toepassing van open standaarden bij open data zorgt er dus voor dat de gegevens makkelijker hergebruikt kunnen worden.1)

De overheid gebruikt het gangbare 5-sterren model van Tim Berners Lee om aan te geven hoe bruikbaar een dataset is. Elke extra ster levert voordelen op voor de hergebruikers, maar vraagt om extra investering van de aanbieder.2). Het model kent de volgende categorieën:

AANTAL STERREN INHOUD VOORBEELD
1 ster Beschikbaar op het web, met een open licentie PDF
2 sterren Data is machine leesbaar en bevat een open licentie Excel
3 sterren De dataset is beschikbaar in een open bestandsformaat CSV
4 sterren Bovenstaande + gebruik open standaarden van het W3C (RDF en SPARQL) om objecten in de data te identificeren, zodat anderen naar die objecten kunnen verwijzen. RDF
5 sterren Bovenstaande + link je data aan data van anderen, om meer context te verstrekken. RDF

Volgens deze definitie kan een pdf-bestand dus ook open data zijn. Het voldoet hiermee aan de Wet Hergebruik van Overheidsinformatie die stelt dat het in een 'open en machinaal leesbaar formaat' beschikbaar gesteld moet worden. De analysemogelijkheden zijn echter een stuk beperkter bij een pdf, dan met een dataset met meer sterren.

Volgens onze geïnterviewde is het echter lastig om data op het niveau van 5-sterren te brengen:

Om de datakwaliteit te verbeteren worden op data.overheid.nl bijvoorbeeld ook kwaliteitssterren toegekend aan de dataset: deze laten zien hoe 'herbruikbaar' deze is. 'Linked data' krijgt vijf sterren. Dit is echter lastig te realiseren, want als organisaties hun data willen linken, dan moeten zij het onderling eens zijn over de gehanteerde definities en de wijze waarop de data gestructureerd wordt.

In de beslisboom van de Gemeente Rotterdam wordt (daarom ook) enkel 'indien mogelijk' voorgeschreven om van een open formaat gebruik te maken:

Linked Open Data

Er wordt de laatste jaren veel gesproken over 'linked open data': een dataset die 5 kwaliteitssterren heeft. Hierbij worden verschillende datasets aan elkaar gerelateerd door middel van gemeenschappelijke kenmerken.3) Dit maakt het makkelijker om gerelateerde gegevens te vinden, samenhang te creëren tussen (anders losse) data, duurzaam te verwijzen (er wordt hier bijv. niet 'absoluut' verwezen naar organisatie X, maar 'relatief' naar een organisatie met de naam X) en om geattendeerd te worden wanneer verwante gegevens veranderen.

Vooralsnog richt de meeste Linked Open Data (van de Nederlandse overheid) zich vooral op wet- en regelgeving en overheidspublicaties. Hier bestaat ook een centraal overzicht van, wat het relatief eenvoudig maakt om deze data te 'linken'. Een verbinding op basis van bijv. gegevens waarvan verschillende definities gehanteerd worden is veel lastiger. Er liggen op dit gebied dus nog veel kansen: goede verbindingen maken het mogelijk om veel meer gegevens in een analyse te betrekken.

Hergebruik in de praktijk

Er zijn talrijke voorbeelden van toepassingen die overheidsdata hergebruiken. Een bekend voorbeeld is Buienradar dat meetgegevens van de KNMI-gebruikt. Een ander voorbeeld is het CBS dat een schat aan gegevens beschikbaar stelt op haar website. Deze zijn in diverse formaten te downloaden en worden dan ook veel gebruikt voor analyses in de wetenschap op journalistiek.

Het is echter nooit precies te zeggen (of voorspellen) waar open data wordt hergebruikt. Vanwege het open karakter, is het onduidelijk wie een dataset gedownload heeft en voor welke toepassingen deze gebruikt wordt. Dit maakt het lastig om de waarde van open data te kwantificeren (zie ook het lemma over de business case). Op data.overheid.nl mag -als overheidswebsite- ook geen informatie verzameld worden over de bezoekers. Wel kan er worden gemonitord hoe vaak een bepaalde dataset wordt gedownload; dit kan mogelijk ook iets zeggen over het hergebruik.

Organisaties zijn niettemin vaak wel op de hoogte van (enkele) hergebruik-toepassingen. Op data.overheid.nl kan op een dataset feedback worden geleverd. Dit wordt in de praktijk ook gedaan door hergebruikers die bijv. onregelmatigheden tegenkomen of zich afvragen of er ook aanvullende gegevens beschikbaar zijn. Verder komen data-eigenaren en -afnemers ook tegen op diverse gebruikersbijeenkomsten. Er is in Nederland echter geen register van open-data-toepassingen. In Frankrijk biedt het open-data-portaal wel een dergelijk overzicht, al zal dit om de eerder genoemde reden ook niet uitputtend zijn.

Het is voor het draagvlak binnen organisaties om data te (blijven) openbaren, wel belangrijk dat zij weten hoe dit hergebruikt wordt. Dit kan volgens Marieke Schenk echter ook gestimuleerd worden:

Een andere manier om het enthousiasme te houden is om het hergebruik van data te stimuleren, door bijvoorbeeld hackatons of challenges te organiseren. Op die manier nodig je mensen uit om actief met de data aan de slag te gaan en zie je de resultaten van het hergebruik.

Casus 'verkeerd' hergebruik

Bij het hergebruik van data is het altijd belangrijk om inzicht te krijgen in de context waarin deze verzameld is, en de betekenis van de gemeten gegevens. De verstrekker heeft een zorgplicht om dit zo goed mogelijk te beschrijven. Toch gaat dit nog wel eens mis. De Volkskrant kopte in november 2016 op haar voorpagina 'Zorgen over ruim helft kinderopvangverblijven'. Deze conclusie werd getrokken uit inspectierapporten van de GGD. Hierin kwamen vier kleurcodes voor. Uit een reconstructie bleek:

Het is verkeerd gegaan bij de categorie geel, dat staat voor 'geen of lichte zorg over actuele situatie, lichte zorg over nabije toekomst'. Dit kan betekenen dat er op dit moment geen punt van zorg bestaat, maar dat dit in de nabije toekomst kan veranderen. Bijvoorbeeld omdat er veel verloop is van personeel, licht de projectleider van de GGD toe.4)

De Volkskrant Ombudsvrouw concludeert daarom dat deze gele categorie eigenlijk niet meegerekend had moeten worden bij het percentage verblijven waarover 'zorgen' bestaan. De data is hier dus verkeerd geïnterpreteerd, waardoor het is hergebruikt om verkeerde conclusies te trekken.

1)
Voor meer informatie over open standaarden bij de Rijksoverheid, zie: https://www.rijksoverheid.nl/onderwerpen/digitale-overheid/inhoud/open-overheid
2)
Zie deze website waar per ster de kosten en baten genoemd worden: http://5stardata.info/en/
3)
Zie voor meer informatie: http://koop.overheid.nl/linkeddata
4)
Volkskrant, “Was de voorpagina over kinderopvang 'onwaar'?”, 26 november 2016, http://www.volkskrant.nl/opinie/was-de-voorpagina-over-kinderopvang-onwaar~a4422524/
hergebruik.txt · Laatst gewijzigd: 2017/04/02 23:25 door richard