Tony Liebregts, hoofd ID-lab, Dirk Jan Oostwoud Wijdenes, GIS-specialist
Het innovatie- en datalab (ID-lab) heeft inmiddels een vaste positie in de nieuwe organisatie van de Inspectie Leefomgeving en Transport (ILT). Data scientists van het ID-lab helpen de ILT om het datagedreven toezicht te versterken en pakken de maatschappelijke uitdagingen aan waarmee de organisatie wordt geconfronteerd. Hun benadering is zowel vraaggericht als datagestuurd. Oftewel: de data-experts behandelen vragen van de business en zoeken ook op eigen initiatief naar patronen. Tony Liebregts, hoofd ID-lab, en Dirk Jan Oostwoud Wijdenes, GIS-specialist, geven een toelichting.
2021: meer maatschappelijke impact
De ILT heeft enkele jaren geleden een koerswijziging ingezet, onder de naam Koers ILT 2021. De ambitie: meer maatschappelijke impact en een risico- en informatiegestuurde werkwijze. Die werkwijze moet ervoor zorgen dat de ILT haar mensen en middelen kan inzetten waar de risico’s voor publieke belangen het grootst zijn.
Begin 2017 kreeg Tony de opdracht van het directieteam om de analysefunctie van de ILT te versterken. Tony: “Als voorloper op de aanstaande verandering wilde de directie een centraal team formeren, dat alvast begon met het genereren van informatie uit data om zo sturing te geven aan de organisatie.”
Data-analisten uit de bestaande organisatie werden samengebracht en er werden nieuwe mensen aangenomen. Zo ontstond een team van dertien medewerkers, met expertise op het gebied van machine learning, textmining, geografische informatiesystemen, remote sensing en gedragswetenschap. Tony: “Ons doel is innoveren, experimenteren met data, nieuwe toepassingen vinden en producten maken voor de organisatie waarmee we op een andere manier naar de wereld kijken.”
Werken vanuit de vraag
Het ID-lab benadert het werk vanuit twee invalshoeken. De eerste is vraaggericht. Dirk Jan: “We hebben regelmatig brainstormsessies met inspecteurs en vragen naar de problemen waarmee zij te maken hebben. Ze benoemen natuurlijk ook zelf vraagstukken. We analyseren het probleem zorgvuldig, komen tot de kern. Vervolgens onderzoeken we welke gegevens beschikbaar zijn, welke data we eventueel kunnen toevoegen en wat we voor hen kunnen betekenen.” Hij beschrijft een voorbeeld van de vraaggerichte invalshoek. Het ID-lab kreeg een verzoek van het Analysebureau Luchtvaartongevallen (ABL) van de ILT. Het ABL registreert en analyseert de verplichte meldingen van voorvallen in de Nederlandse burgerluchtvaart. De vraag was: zijn er patronen in de voorvallen die wij over het hoofd zien? Dirk Jan: “De meldingen zijn er in allerlei vormen: pdf-rapporten, websites en andere stukken tekst, in verschillende talen, ingevoerd door verschillende maatschappijen. We hebben textmining toegepast op die meldingen. Op basis daarvan brachten we de hotspots van meldingen op Schiphol in kaart. We ontdekten dat er een locatie was op Schiphol, waarvandaan veel meldingen over bijna-ongevallen kwamen. Een waardevolle bevinding.”
Werken vanuit de data
De tweede benadering start vanuit de data. Tony: “Dan beginnen we niet met een vraag, maar met een dataset. Een data scientist bestudeert de data en gaat op zoek naar patronen. Hieruit volgen verwonderpunten die hij bespreekt met de inspecteur. Sommige van die punten leiden tot nieuwe inzichten.” Bij deze datagestuurde invalshoek experimenteert het ID-lab met onder meer de mogelijkheden van remote sensing. “Zo ontdekten wij bijvoorbeeld dat een inspecteur voor bodemtoezicht satelliet- en radarbeelden kan gebruiken om te zien wat er in het verleden op een bouwlocatie heeft plaatsgevonden.”
Bij het experimenteren met data uit verschillende bronnen kan sprake zijn van privacygevoeligheid. Vooral als het om eenmanszaken gaat. Tony: “Daar zijn we alert op. We opereren nadrukkelijk binnen de marges van de privacyregels en we anonimiseren zoveel mogelijk bij presentaties en publicaties.”
Risicogestuurd toezicht op de binnenvaart
Dirk Jan vertelt over de stappen die het ID-lab heeft gezet op het gebied van risicogestuurd toezicht op de binnenvaart. “Er leefde een vraag op de werkvloer. Inspecteurs werken met een lijstje met het aantal te inspecteren schepen en besluiten dan zelf welke ze nemen. Kunnen we de inspecteurs helpen bij die keuze? Als je vermoedt welk schip niet voldoet aan een wet of norm, dan kun je dat schip eruit pikken.” Binnen de ILT worden alle inspectieresultaten in het systeem Holmes opgeslagen. Deze informatie is niet direct geschikt voor analyse, maar toch is het ID-lab ermee aan de slag gegaan. “We beschikken over een paar jaar inspectieresultaten voor de binnenvaart. We kunnen precies zien welke schepen bepaalde overtredingen hebben begaan. Die gegevens combineren we met informatie over de grootte, de vracht, de eigenaar, de leeftijd, de diepgang van het schip en meer van dergelijke gegevens. Het resultaat? Een profiel van schepen met een hoog risico.”
“De eerste uitkomsten zijn nog niet perfect, maar zijn wel zeer bemoedigend en bieden perspectief voor de toekomst”, concludeert Dirk Jan. “We willen hiermee verder en bekijken of we het model kunnen verbeteren. Daarvoor betrekken we meer data en proberen we andere analysetechnieken.”
Voor de datanerds
Het ID-lab werkt met name met Python en R.
Tips van Tony en Dirk Jan:
- Doe data experimenten altijd in samenspraak met de business, in ons geval met de inspecteurs. Zij zijn de materiedeskundigen.
- Trek zelf geen conclusies, maar deel je verwonderpunten.
- Just do it. Begin. Anders komt het niet van de grond. Als je alles wilt dichtregelen, kom je niet van de kant af.
- Wij streven naar een zekere mate van vrijheid bij de keuze voor wat we doen en hoe we dit doen. Je moet je altijd kunnen afvragen: wat is hier aan de hand? Als je een specifieke vraag krijgt, beperkt dit je focus. Als je meer onbevangen naar een probleem kijkt, zie je misschien dingen die ook belangrijk zijn.
Over de ILT
Fotografie: Studio Oostrum