Zal men in de toekomst criminaliteit kunnen voorspellen als het weer? Hoewel dit een belachelijk sciencefictionplot lijkt, probeert men aan de UGent toch om misdaad te voorspellen aan de hand van AI. Wij spraken erover met professor criminologie, Wim Hardyns.
Met uw project BIGDATPOL (Big Data Policing) probeert u misdaad te voorspellen en te voorkomen. Hoe gaat dit precies in zijn werk?
"Binnen ons project brengen we allerhande data(stromen), gerelateerd aan criminaliteit, samen en proberen we kennis te genereren die ons toelaat om zowel preventief als proactief criminele feiten te bestuderen. Dit doen we a.d.h.v. complexe statistische modellen. We werken met onder andere machine learning en ook natural language processing. Het doel is om deze modellen de data te laten analyseren zodat we kunnen zeggen waar en wanneer er een hoger risico is op toekomstige criminaliteit."
"Eerst gaan we goed in kaart brengen waar en wanneer criminaliteit zich voordoet en dan gaan we kijken welke factoren geïdentificeerd kunnen worden. Dit steken we dan allemaal in een zelftrainend, zelfredenerend model dat ons toelaat om visueel (op een kaart) weer te geven waar het risico op criminaliteit het hoogst is. Uiteindelijk is het doel dat veiligheidsdiensten deze gegevens gaan gebruiken om beter in te schatten waar ze aanwezig moeten zijn."
"Wat wij binnen ons team doen is niet nieuw, in 2012-2013 heeft men in Amerika al eens geprobeerd om zo'n Predictive Policing systemen te introduceren. Die werden echter negatief onthaald omdat ze niet transparant waren over de gebruikte databronnen en omdat er geen aandacht was voor ethische randvoorwaarden. Dit is waar onze insteek verschilt, wij houden van bij het begin rekening met deze randvoorwaarden bij het ontwikkelen van onze datagestuurde modellen."
Welke data gebruiken jullie precies om deze modellen te trainen?
"Ten eerste gebruiken we criminaliteitsdata, die liefst zo actueel mogelijk is omdat we zien dat criminaliteit zich soms erg snel kan verplaatsen. Andere data die we gebruiken, zijn factoren die criminaliteit kunnen versterken of uitlokken, denk aan winkelstraten, treinstations, openbaar vervoer, cafés, etc. Ook verwerken we situationele data zoals bijvoorbeeld de weersomstandigheden of dat het dag/nacht was op het moment van de feiten. We kijken ook naar de fysieke omgeving. Zijn er veel vluchtwegen of groen waar mensen zich kunnen verstoppen? Al deze data brengen we samen om een geïntegreerd beeld te krijgen. De data die we gebruiken kan ook verschillen naargelang het misdaadfenomeen. de achterliggende indicatoren die je onderzoekt bij fraude, woninginbraken of sluikstorten kunnen erg verschillend zijn."
Het doel is om deze modellen de data te laten analyseren zodat we kunnen zeggen waar en wanneer er een hoger risico is op toekomstige criminaliteit
Op jullie website zeggen jullie geen voorspellingen te maken op individueel niveau, toch geven jullie daar ook aan sociodemografische gegevens te gebruiken. Zijn dit dan geen persoonlijke gegevens?
"We kijken altijd naar gemiddelden, we zullen dus uitspraken doen zoals '60% van de bewoners in deze radius zijn ouder dan 50 jaar.', maar we gaan nooit uitspraken doen op individueel niveau."
"We gebruiken ook bewust geen data rond nationaliteit en etniciteit omdat we geen munitie willen geven aan mensen die weinig van ons onderzoeksprogramma kennen en ons zouden verwijten aan etnische profilering te doen. Wat dus helemaal niet het geval is. Daarnaast hebben we genoeg variabelen om onze modellen op te bouwen zodat zo'n gegevens überhaupt niet nodig zijn."
"Ik begrijp de angst rond etnische profilering wel. In de eerste Amerikaanse modellen was dit een probleem, daar zag je vaak een feedbacklus ontstaan waar politiediensten steeds weer naar dezelfde buurten trokken waar overwegend zwarte mensen woonden. Omdat de politie steeds naar dezelfde plekken gingen, versterkten ze de criminaliteitscijfers. Zo'n feedbackloops proberen we in onze modellen actief te vermijden, we zijn zelfs bezig om anti-feedbackloops te creëren zodat de politie ook andere routes neemt en andere plaatsen bezoekt."
Jullie model zit nog in een onderzoeksfase en is nog niet in de praktijk getest?
"We zijn vanuit Gent en binnen Europa een pionier om met een wetenschappelijk gefundeerd model naar buiten te komen. De komende jaren gaan we veel testen doen, zo kunnen we zien onder welke omstandigheden die modellen het best gaan werken. Hier zullen we heel wat tijd voor nodig hebben. Vanuit een wetenschappelijke hoek kunnen we het ons wel permitteren, zolang we funding hebben. We willen het traject vooral correct afleggen. Dat kan een commerciële firma meestal niet, zij moeten zo snel mogelijk verkopen."
Hoe denkt u dat het model in de toekomst gebruikt kan worden?
"Het is vooral een proactief model, het moet als extra informatietool gebruikt worden. Politiediensten hebben al veel data en mensen met eigen inzichten op het terrein. Het is geen deterministisch model dat vertelt waar politiemensen moeten zijn op welk moment. Het is een proactief, preventief instrument om zich beter te organiseren en te verdelen."
Is het een angst van u dat de politie het ziet als een deterministisch model?
"Ja, we moeten erover waken. We gaan trainingssessies geven om aan die mensen te tonen wat het wel en niet kan. Dat is eigenlijk de volgende stap waar we nu voor staan. Dat zal een heel belangrijke zijn, want die misvattingen bestaan vandaag nog altijd."
Welke criminaliteit kunnen jullie het best voorspellen?
"We startten oorspronkelijk met woninginbraken. Omdat we hier perfect weten waar en wanneer die plaatsvonden. Nog belangrijke factoren zijn het volume en patroondetectie. Sporadisch voorkomende delicten zijn niet interessant voor dit model. Drugstransport en zwerfvuil zijn goede voorbeelden van misdaden die patroonmatig terugkomen."
In de eerste Amerikaanse modellen zag je vaak een feedbacklus ontstaan waar politiediensten steeds weer naar dezelfde buurten trokken waar overwegend zwarte mensen woonden
Kan het model ook voorspellen naar welke andere locaties criminaliteit zich mogelijk zal verplaatsen wanneer er ergens meer politiecontrole komt?
"Dat gaan we zeker kunnen doen. De bedoeling is om zoveel mogelijk gegevens te verzamelen om verplaatsingen te kunnen detecteren en te voorspellen. Dat doen we a.d.h.v. een grote test met 20 lokale politiezones in een tamelijk aaneengesloten gebied. We vragen ons af hoe criminelen kiezen om een ander doelwit te gaan selecteren en binnen welke afstand en tijdsperiodes ze dat doen. Zo hopen we verplaatsingen te voorspellen, wat heel belangrijk is want criminaliteit is van alle tijden en zal nooit stoppen."
Hoe kijk je dan naar de toekomst?
"In de verdere toekomst willen we evolueren naar een model waar alle niveaus kunnen samenkomen met het verstand dat elk fenomeen een andere aanpak vraagt."
"Dat maakt het trouwens zo tijdsintensief en dat is waar die Amerikaanse Predicitve Policing modellen volgens mij de mist ingingen. Zij hadden snel een algoritme in elkaar gestoken en dat verkocht aan politiediensten en veiligheidsdiensten, die het daar vervolgens maar mee moesten doen. Wetenschappelijke updates op basis van nieuwe data bleven uit. Ons onderzoek daarentegen is constant bezig met het uitzoeken en opschonen van nieuwe data, want dit is in wezen research die nooit stopt."





Reactie toevoegen