Formuleer hoe je de benodigde data bruikbaar maakt en verwerkt. Onderzoek daarbij ook of het juridisch is toegestaan en ethisch wenselijk is om de data te gebruiken voor het gekozen doel.
De volgende acties kunnen onderdeel zijn van het verzamelen, bruikbaar maken en verwerken van data:
- Maak inzichtelijk welke data nodig is;
- Inventariseer welke data in huis is;
- Verkrijg de data die nodig is;
- Maak de data open (indien van toepassing);
- Verwerk de data;
- Denk aan een procedure voor het opruimen van data na gebruik.
Tools bij het verzamelen, bruikbaar maken en verwerken van data
De Vier Dataprincipes
De Vier Data Principes van Digital Society zijn essentieel om de maatschappelijke uitdagingen en kansen van digitalisering te begrijpen. Ze stellen eisen aan de hand van 4 anagrammen aan zowel data (‘FAIR’), datawetenschap (‘FACT’), de digitale samenleving (‘SHARED’) als systemen (‘ROBUST’).
Verantwoord datadelen voor AI
De Nederlandse AI Coalitie publiceerde een rapport van de Werkgroep Data Delen. De proposities in dit rapport moeten de basis gaan vormen voor het verantwoord datadelen ten behoeve van AI-toepassingen.
Dashboards met waarde voor de hele organisatie
Met deze tool is het mogelijk om binnen de organisatie het gesprek aan te gaan over dashboards. Het organiseren van dashboards is een proces dat vaak technologisch wordt aangevlogen. De datawerkplaats van de Universiteit Utrecht vond in samenwerking met de gemeente Woerden dat het menselijke aspect net zo belangrijk is.
Formulier datamanagementplan
Het datamanagementplan van de NWO helpt projectleiders om in een vroeg stadium na te denken over de wijze waarop data verzameld wordt en de veilige opslag ervan. Dit verloopt via de FAIR-principes om het hergebruik van data te bevorderen. Opgesteld voor wetenschappers, maar geeft ook bruikbare inzichten aan overheidsorganisaties.
Hoe het CBS data anonimiseert
In dit praktijkvoorbeeld staat omschreven hoe het CBS data anonimiseert en wat het belang daarvan is bij het verwerken van gegevens.
Handreiking anonimiseren door Community van Data Experts Zorggegevens Informatieberaad Zorg
Deze handreiking is bedoeld als hulpmiddel voor organisaties die overwegen data open te publiceren. De handreiking helpt om een weg te zoeken tussen enerzijds transparantie en anderzijds de noodzakelijke privacybescherming van de personen op wie hun data betrekking hebben.
Data.overheid.nl
In het nationale dataportaal van de Nederlandse overheid vind je door de Nederlandse overheid beschikbaar gestelde data. Data.overheid.nl begeleidt overheidsorganisaties bij het open stellen van beschikbare data en ondersteunt ‘hergebruikers’ bij het vinden van specifieke datasets.
CBS Open Data Statline
Open datasets over diverse onderwerpen, ontsloten via het CBS dataportaal. Binnen dit portaal doorzoek je alle beschikbare datasets op trefwoord of thema.
De Stelselcatalogus
De Stelselcatalogus biedt inzicht, overzicht en duiding binnen het gegevenslandschap van de overheid. Welke gegevens worden er in welke registraties bijgehouden? Welke betekenis hebben deze gegevens en hoe verhouden de gegevens uit de verschillende registraties zich tot elkaar? De Stelselcatalogus biedt voor iedereen met een bepaalde informatiebehoefte binnen het gegevenslandschap van de overheid een vertrekpunt om de gewenste informatie te vinden.
RADIO Webinar Datavisualisatie
RADIO biedt e-learning modules die dieper ingaan op de materie. Nummer 8 gaat specifiek in op werken met data: hoe gebruik je data in je werk?
Let wel: deze modules zijn alleen beschikbaar voor rijksambtenaren die hiervoor registreren met hun werkaccount.
Let wel: deze modules zijn alleen beschikbaar voor rijksambtenaren die hiervoor registreren met hun werkaccount.
Tools van NORA/GEMMA:
- Gegevenswoordenboeken: NORA omschrijft hier wat gegevenswoordenboeken zijn, wat ze kunnen toevoegen binnen gegevensmanagement en hoe je ze doeltreffend kunt gebruiken binnen je organisatie.
- Modellering van gegevens: datamodellering is een essentieel onderdeel van gegevensmanagement. Het is een goede methode om de gegevensbehoeften in kaart te brengen.
- Gegevenskwaliteit: de kwaliteit van data is in hoge mate bepalend voor de kwaliteit van de informatie die uit de data gehaald kan worden, en de kwaliteit van de besluiten die op basis van deze informatie kan worden gedaan. Hoe de kwaliteit het beste te waarborgen vertelt GEMMA op deze pagina.
- Bronregistraties en kwaliteit: per bronregistratie moeten kwaliteitsaspecten en hun normen worden benoemd. De borging van de kwaliteit is een primaire verantwoordelijkheid van de bronhouder. Deze pagina gaat dieper in op de specifieke bijdrage die bronregistraties kunnen betekenen voor de kwaliteit.
Inzichten en tips van experts en uit de praktijk
Uit interviews met experts kwamen de volgende tips naar voren:
- “Voor een discussie over artificiële intelligentie (AI), hoort een discussie over data. We moeten geen stappen overslaan. Je datahuishouding moet op één staan. ‘Garbage in’ betekent ook ‘garbage out’.” Valerie Frissen, bijzonder hoogleraar Digital Technologies & Social Change aan de Universiteit Leiden.
- “Data is vaak alleen waardevol als verschillende partijen samenwerken en de data van die organisaties bij elkaar komt.” Magchiel van Meeteren, Chief Information Officer bij BZK.
- “Het verbeteren van onze datakwaliteit is één van de hoogste prioriteit op de strategische agenda. Het is een belangrijke voorwaarde om onze secundaire, maar ook onze primaire processen optimaal in te richt.” Emine Özyenici, Chief Information Officer bij de Sociale Verzekeringsbank.