02

Dit artikel hoort bij: KMarMagazine 05

Wegwijs in doolhof aan data

Ontwikkeling applicaties om data inzichtelijk te maken

KMar steeds meer datagedreven

Met de juiste software en algoritmes is het mogelijk om een enorme berg informatie snel te doorzoeken. Zo wordt de operatie nog effectiever en efficiënter.

Namen van verdachte personen, telefoongegevens, banknummers, kentekens, specifieke locaties, rare situaties, reisgegevens. Elke dag verwerken we een enorme berg data in het Bedrijfsprocessensysteem (BPS) en andere databanken. Voor rechercheurs en analisten is dit een schatkamer aan informatie om te zien welke trends en ontwikkelingen er zijn om te bepalen waar je het beste energie in kunt steken.

Door de veelheid aan data is die schatkamer al snel een doolhof. Er komen steeds grotere hoeveelheden data op ons af die we als Marechaussee moeten verwerken. Tegelijkertijd zit de juiste data vaak goed ‘verstopt’ in verslagen van verhoren en mutaties. De informatie is genoteerd in lange lappen tekst, wat betekent dat iemand die op zoek is naar relevante informatie letterlijk met eigen ogen de tekst moet lezen. Woord voor woord, en dat is tijdrovend.

Een man wordt geboeid door een marechaussee.
Tijdens controles en surveillances verzamelen marechaussees dagelijks veel informatie die zij in de systemen zetten. Dit is een schatkamer voor analisten.

Data inzichtelijk maken

Dat kan in het computertijdperk natuurlijk makkelijker en efficiënter, weten datascientists Anne en Tim van de afdeling Datavoorbereiding, onderdeel van de afdeling Intell. Sterker nog, ze weten het niet alleen, maar brengen het ook in de praktijk. Samen met collega’s maken ze slimme producten om de berg aan data inzichtelijk te maken. Om deze te gebruiken moet er eerst nog een goedkeuring komen, maar daarover verderop meer.

Zo heeft Tim een entiteiten-extractor ontwikkeld. “Entiteiten zijn gegevens die tot een persoon herleidbaar zijn. Denk bijvoorbeeld aan een kenteken. Deze applicatie kan zulke info uit lappen tekst filteren en in een overzicht zetten zodat het doorzoekbaar wordt. Zo kunnen collega’s in de Intell-organisatie zien of er meer informatie is over een bepaald kenteken. Daarnaast is het ook mogelijk om de databulk te onderzoeken op verbanden tussen zo’n kenteken en andere gegevens.”

2 marechaussees controleren vanaf een vaartuig een ander vaartuig.
Datascientists maken slimme algoritmes waarmee de operatie kan bepalen waar en wanneer de mankracht het beste kan worden ingezet.

In een oogopslag

Een ander voorbeeld van zo’n product: een applicatie die mutaties van Mobiel Toezicht Veiligheid-controles analyseert. Deze applicatie geeft inzicht in waar en wanneer operationele collega’s het beste controles uit kunnen voeren en waar ze op moeten letten. “Dit kunnen we overzichtelijk weergeven in een dashboard”, legt Anne uit. “Grenspassages worden dan afgezet tegen de gehouden controles. Zo is in één oogopslag te zien hoe effectief controles waren en wat de zwaarte van de incidenten was. Op deze manier leveren we een directe bijdrage aan informatiegestuurd optreden.“

2 marechaussees surveilleren op Schiphol.

Slimmer werken dankzij algoritmes

Bestrijding mensensmokkel

Nog een voorbeeld waar de datascientists nu aan werken: de reisroute-extractor. Voor de bestrijding van mensensmokkel zijn reisroutes zeer relevant. Deze routes kunnen met de extractor uit het Vreemdelingen Basis Systeem (VBS), BPS en SIENA berichten worden gefilterd. Door deze te vergelijken kunnen eventuele smokkelroutes in kaart worden gebracht. Omdat dit om duizenden mutaties per jaar gaat, is het onmogelijk dit handmatig te doen.

En tot slot een vierde voorbeeld: een programma dat automatisch samenvattingen maakt van mutaties. “Zo worden lappen tekst een stuk korter en beter leesbaar”, zegt Tim. “Dat scheelt tijd voor collega’s die de verslagen moeten lezen.”

2 marechaussees voeren een mutatie in op een computer.
Het is belangrijk dat collega’s hun mutaties goed in de systemen zetten, volledig en op de juiste manier. Dat maakt het mogelijk achteraf te zoeken naar grotere verbanden en nieuwe inzichten op te doen over illegale praktijken.

Correct muteren

“De kwaliteit van de data die collega’s in de systemen zetten, is voor ons werk enorm belangrijk”, zegt Tim. Het kost misschien tijd, maar gebruik van de juiste termen, invoervelden en incidentcodes vergemakkelijken de analyse achteraf. “Zorg ervoor dat je zoveel mogelijk vastlegt, want hoe meer informatie en details, hoe beter wij de operatie weer van inzicht kunnen voorzien”, aldus Anne. Zo kan een specifiek transportbedrijf dat wordt vastgelegd in een incident in Zuid-Limburg, relevant zijn voor een incident in Noord-Holland.

Een beeldscherm met computertaal.
Kentekens, bankrekeningnummers, paspoortgegevens, locaties, telefoonnummers. Stuk voor stuk bruikbare data die nu dankzij datascience uit verslagen en mutaties kan worden gefilterd.

‘Daar valt nog winst te behalen’

Juridisch en ethisch

Om de producten goed te laten aansluiten bij de wensen van werkvloer zitten op de afdeling van Anne en Tim ook collega’s met operationele ervaring. Zij zetten hun kennis in om te voorkomen dat marechaussees de producten links laten liggen. Daarnaast heeft de afdeling ook een fulltime juriste. “Onze producten moeten natuurlijk wel aan de wet- en regelgeving voldoen”, zegt Anne. “Ook kijkt zij mee in hoeverre iets ethisch verantwoord is. Als een algoritme verkeerd wordt ingezet, kan dat namelijk grote gevolgen hebben voor een persoon. Dat willen we niet en moeten we dus ten alle tijden voorkomen.”

Voordat deze producten in gebruik kunnen worden genomen, is het nu alleen even wachten op goedkeuring van de Beveiligingsautoriteit bij Defensie. Het platform waarop de producten van Anne, Tim en hun team beschikbaar gesteld worden, moet namelijk eerst zorgvuldig getest en getoetst worden. Dit is belangrijk om mistanden te voorkomen en te zorgen dat de manier van werken transparant blijft. Anne hoopt dat de goedkeuring binnenkort volgt. “Het systeem werkt goed. Straks kunnen collega’s hun energie en tijd besteden aan zaken waar echt wat te halen valt. Dat is pas informatiegestuurd werken zoals het is bedoeld.”

Datagovernance

We worden steeds meer een datagedreven organisatie. “Door de ontwikkeling van slimme technologieën kunnen we onze mankracht namelijk zo efficiënt en effectief mogelijk inzetten”, zegt majoor Marnix. Hij is stafadviseur bij bureau Datagovernance dat het werk van onder anderen Anne en Tim faciliteert door beleid te maken en randvoorwaarden te scheppen voor het werken met data.

Sinds 2018 bekijken we wat we precies met data willen doen en hoe dat er dan uit zou moeten zien. “Zo gaan we focussen op de kwaliteit van data. Collega’s moeten zich bewust zijn van de informatie die ze in de systemen zetten. Daar valt nog winst te behalen. Informatie moet juist en compleet zijn om voorspellingen te kunnen doen.”

“Ook houden wij in de gaten of het datagebruik voldoet aan de wettelijke eisen”, vervolgt Marnix. “Zo schrijven we mee aan een aanwijzing voor algoritmes en vanuit Europa komt er wetgeving waar we ons aan moeten houden. Daarin staat beschreven wat een algoritme kan en mag doen. Het moet transparant zijn hoe zoiets werkt. Daarnaast moeten we voldoen aan het kwaliteitskader big data van het Openbaar Ministerie. Zo willen we correct gebruik van big data waarborgen.”

Winnaars

De ontwikkelingen op het gebied van datascience volgen elkaar in een rap tempo op, vertellen Tim en Anne. Dit maakt het werk leuk, maar ook uitdagend. Toch lukt het om bij de KMar op hoog niveau datascience te doen. Vorig jaar heeft het team Datavoorbereiding de wedstrijd Data Wars gewonnen. Dit is een competitie waarin de verschillende datascience teams van Defensie tegen elkaar strijden.

Een motorrijder van de Marechaussee staat langs de snelweg.

Tekst kapitein Arjen de Boer | Foto's: archief Mediacentrum Defensie