Het gebruik van data is cruciaal in het inlichtingenproces om betere besluiten te kunnen nemen. Dat betoogt Roy Lindelauf, coördinator van het Data Science Centre van Defensie. In zijn bijdrage laat hij zien wat er in de academische wereld nu al mogelijk is.
Stel je ‘land X’ voor waar van alles aan de hand is. Er zijn tal van (terroristische) groeperingen die aanslagen plegen en zorgen voor een instabiele omgeving. Al enige tijd is er zicht op dat land en er loopt een NAVO-missie. Maar hoe krijg je een beter beeld van deze groeperingen? In dit fictieve scenario is er een systeem waarmee in tien jaar tijd zo’n 770 variabelen zijn verzameld. Denk aan sociale, politieke en economische informatie. Met behulp van een algoritme wordt deze grote hoeveelheid informatie geanalyseerd, waaruit een aantal ‘regels’ voortkomen. Deze regels zeggen iets over de kans dat een bepaalde groepering een aanslag gaat plegen, bijvoorbeeld op een strategisch gelegen haven in land X.
Interne verdeeldheid
Eén van die regels is dat als er 0 tot 4 leiders van deze groepering zijn omgekomen én als er financiële steun vanuit andere landen is, er een zeer grote kans op een aanslag is. Een andere regel zegt dat als er interne verdeeldheid is, de kans klein is dat er binnen drie maanden een aanslag wordt gepleegd. Deze regels worden voorgelegd aan een ‘domeindeskundige’, die een aantal beleidsopties bedenkt. Als antwoord op de eerste regel wordt besloten om ‘predictive patrolling’ in te zetten. Daarnaast wordt een ‘deep fake’ video gemaakt waarin de leiders van deze groepering bepaalde uitspraken doen die tot verdeeldheid leiden.
Aanslag voorkomen
Ondertussen draaien er op de achtergrond andere algoritmes, bijvoorbeeld om het maritieme verkeer te screenen. Dit gaat op basis van openbare data en hieruit blijkt dat er twee schepen zijn die verdacht gedrag vertonen en op weg zijn naar de strategisch gelegen haven in land X. Vervolgens wordt met een real time analyse gekeken naar personen en bedrijven die in deze haven actief zijn. Het gaat hier om een netwerk van 70.000 personen en bedrijven en veel hiervan zijn niet bekend. Met behulp van ‘machine learning’ wordt er een ‘suspicious score’ gemaakt en hier rolt een lijst met honderd verdachte personen uit. Op basis hiervan arresteert een team van de special forces een aantal verdachten en vinden ze explosieven. Een grote aanslag is voorkomen.
Ethische principes
Volgens Roy Lindelauf is dit scenario dichterbij dan we denken. ‘Alle modellen bestaan al in de academische wereld. Het kost alleen best wat tijd voordat de inlichtingendiensten er mee kunnen werken. Wel worstelen we met de vraag of je deze middelen zomaar mag ontwikkelen en inzetten. Je ziet dat er nu ook een vakgebied in ontwikkeling is waarin ethische principes, zoals privacy en transparantie, worden meegenomen in algoritmes. Met deze algoritmes is het mogelijk om met datagedreven inlichtingen de mist te verdrijven, waarbij we tegelijkertijd bepaalde normen en waarden hanteren.’