Bureau Dupin onderzoekt wat de meerwaarde is van de "Wisdom van de Crowd" in het onderzoeken van onopgeloste misdrijven. Dit gebeurt aan de hand van de cold case: "De Nieuwjaarsmoord". Vernieuwend aan dit onderzoek is dat Bureau Dupin vragen aan de politie/OM mag stellen. De antwoorden worden vervolgens ter beschikking gesteld aan de community van Bureau Dupin, een groep burgeronderzoekers. Deze bestaat inmiddels uit meer dan 1400 betrokken burgers die samen 'de Nieuwjaarsmoord' onderzoeken.
Doelstellingen
Op verzoek van Bureau Dupin hebben politie en OM ál de telecommunicatie-data verstrekt die in 2013 is vastgelegd in het politieonderzoek 'De nieuwjaarsmoord'; de onopgehelderde dood van Marja Nijholt in 2013. Deze data is gepseudonimiseerd (ontdaan van aan-personen-te-relateren-gegevens) ter beschikking gesteld en bestaat uit meer dan 90.000 records. Het doel is om met de nieuwste data science technieken patronen te ontdekken die in 2013 niet konden worden gevonden.
Aanpak
Om dit doel te bereiken is een groep data science studenten van de Jheronimus Academy of Data Science (JADS) samengesteld die, onder begeleiding van een hoogleraar, onderzoek doet naar de dataset. Dit onderzoek gebeurde parallel aan het onderzoek dat de rest van de community deed. De keuze om de data science groep apart van de community te laten werken, is gemaakt vanuit de gedachte dat data science een zeer specialistisch vak is en dat masterstudenten op het gebied van data science sneller en efficiënter kunnen samenwerken, dan wanneer daar mensen met geringere kennis van data science aan worden toegevoegd.
Resultaten
Ten behoeve van het onderzoek heeft de groep onderzoekers verschillende applicaties gebouwd waarmee sociaal netwerk analyse kan worden gedaan en waarmee de telecommunicatie data kan worden afgezet in tijd en in een geo-spatiele ruimte. Deze applicaties legden daadwerkelijk patronen in de data bloot, die in 2013 niet gevonden kon worden. De applicaties zijn daarom ook aan analisten van politie en het OM gedemonstreerd. Zij bleken onder de indruk van de mogelijkheden. Hoewel de patronen in de telecomdata zeer waardevolle inzichten bood, leidde deze patronen niet tot nieuwe onderzoeksrichtingen in de dood van het slachtoffer. Omdat het uitgangspunt van Bureau Dupin 'inclusiviteit' is, raakte de community ontstemd dat het onderzoek naar de data in 'afzondering' had plaatsgevonden. De community wilde de data science applicaties zélf kunnen inzetten om de data te bevragen. Echter, de tools die door de studenten waren ontwikkeld, waren niet gebruiksvriendelijk en vereiste kennis van bepaalde programmeertalen om te kunnen worden bediend.
Er is toen besloten een 'data science sessie' te organiseren waarin de werking van de applicaties zou worden uitgelegd en de applicaties -in al haar gebruiks(on)vriendelijkheid aan de community beschikbaar zouden worden gesteld. De verwachting was dat die applicaties niet of nauwelijks zouden worden gebruikt. Niets bleek echter minder waar.
In de daaropvolgende weken zijn beide data science applicaties meer dan negenduizend keer bevraagd. De server bleek niet voorbereid op dit soort aantallen en viel hierdoor herhaaldelijk uit. Wat opmerkelijk is, is dat de community elkaar geleerd heeft hoe de applicaties te gebruiken zijn. Er zijn speciale handleidingen geschreven en gebruikers die ervarener waren, hielpen nieuwe gebruikers. De community als geheel heeft zich de applicaties niet alleen eigen gemaakt, ze heeft de applicaties daadwerkelijk ingezet en daarmee een zéér indrukwekkend beeld kunnen schetsten van het sociale netwerk van het slachtoffer. Dit biedt niet alleen waardevolle inzichten in het communicatiepatroon van het slachtoffer in de laatste dagen van haar leven, het biedt zelfs nieuwe en beloftevolle onderzoeksrichtingen.
Doordat de applicaties zo intensief zijn gebruikt, heeft de community meerdere suggesties aangedragen om de data science applicaties te verfijnen en te verbeteren. De nuance van die suggesties verbaasde zelfs de data scientists. Daarom wordt binnenkort een 'omgekeerde data-science sessie' georganiseerd. Dit keer zal de community de data scientists uitleggen wat ze gedaan heeft op het gebied van data science, en wat de conclusies zijn die ze daaraan verbinden. Data scientists en community zullen in gezamenlijkheid voorstellen doen voor aanpassing van de applicaties en nieuwe onderzoeksrichtingen definiëren.
Bureau Dupin gaat zeker verder. In de afgelopen maanden hebben zich al meerdere internationale cold-case zaken aangediend. En de data science applicaties die in dit kader ontwikkeld zijn, zullen ter beschikking worden gesteld aan de community van Bureau Dupin, maar ook aan geïnteresseerden van daarbuiten. De eerste PDEng studenten zijn reeds van start gegaan om (dit keer samen met leden van de community!) de applicaties gebruiksvriendelijker te maken. De broncode zal via Github in opensource vorm ter beschikking worden gesteld zodat deze altijd -en door iedereen- kan worden aangepast en verbeterd.
Leermomenten
De lege plek aan tafel
De datascience studenten gingen afgezonderd van de community aan de slag met het onderzoek. Det resultaat was dat de community zich buitengesloten voelde en daarnaast waren de tools die door de studenten waren ontwikkeld niet toegankelijk genoeg voor mensen met minder kennis van datascience. Juist in zeer specialistische, en zich sterk ontwikkelende, gebieden als data science is het van belang dat mensen die dat graag willen, mee kunnen kijken en mee kunnen denken. Laten we er niet op voorhand al van uitgaan dat we weten wie de kennis in huis heeft. En laten we niet onderschatten wat de kracht is van gemotiveerde mensen en wat zij (ons) kunnen leren.
De canyon
'Verwacht het onverwachte'. Het was de ambitie om een zeer specialistische onderzoeksmethode te introduceren in het cold case onderzoek. Daarvoor is gezocht naar specialistische kennis op het gebied van data science en die is gevonden in het JADS. Er is daarbij echter voorbijgegaan aan het uitgangspunt van Bureau Dupin, namelijk het onderzoeken van de waarde van de "wisdom of the crowd". Hiermee is een fout gemaakt die in veel (overheids)organisaties voorkomt: Op voorhand vaststellen wie -of welke organisatie- een bepaald probleem het best kan oplossen en daarmee belangrijke en onverwachte kennis buitensluiten.
Bureau Dupin
Peter de Kock en Roel Simons vertellen over hun Briljante Mislukking
Archetypen
De lege plek aan tafel
De canyon
Projectoverzicht
Sector
ICT/IT
Projecteigenaar
Admin IvbM
Projectdatum
-
Aangemaakt
29-09-2022
Gewijzigd
31-03-2023
Weergaven
180
Tags (3)
Data Science
AI
Moordzaak
Reacties (0)
X
BriMis gebruikt cookies om je gebruikservaring te verbeteren.
Reacties (0)