Carl-Eric Rasch – Misstanden bij de Belastingdienst betekenen niet dat fraudeonderzoek met algoritmes verboden moet worden

06-07-2020 16:33

Interpretatie van een algoritme. (Pixabay)

Tijdens het racismedebat in de Tweede Kamer afgelopen week sprak Jesse Klaver (GroenLinks) zich uit dat overheidsinstellingen niet langer gebruik zouden mogen maken van algoritmes om data risico’s in te schatten. Dit stukje van het debat werd gevoed door de recente kinderopvangtoeslagfraude bij de Belastingdienst waar ook met dergelijke algoritmes wordt gewerkt. In de latere berichten die over dit dossier naar buiten kwamen bleek ook dat er wel erg veel gedupeerden waren met een ‘niet westerse achtergrond’. Een genoemde oorzaak hiervan zou ‘etnisch profileren’ door de belastingdienst zijn geweest. Een aantal belangenorganisaties en ook leden van de Tweede Kamer spraken al gauw van racisme en staatssecretaris van Financiën Alexandra van Huffelen (D66) gaf aan aangifte te gaan doen van ‘het vermoeden van twee mogelijke misdrijven rondom de fraude onderzoeken met de kinderopvangtoeslag’: knevelarij en beroepsmatige discriminatie. Even later benadrukte de staatssecretaris dat het niet gaat om aangifte tegen individuen.

‘Veel grotere financiële instellingen zoals verzekeraars maar ook een aantal overheidsinstanties werken vaak met algoritmes om fraudes op te sporen’

Ook Nationaal Ombudsman Reinier van Zutphen deed een duit in het zakje door op de steeds brozere relatie tussen overheid en burgers te wijzen. De burger begrijpt het allemaal niet meer en Van Zutphen kondigde een onderzoek naar etnisch profileren bij de overheid aan.

Bij (overheids)instellingen en bedrijven waar veel geld omgaat dat (deels) is bestemd voor particulieren en waar vooral korte lijnen met deze eindklant zijn vindt relatief veel (rechtstreekse) fraude plaats: fraude met uitkeringen of toelagen waar geen recht op is, fraude met claims voor afgesloten verzekeringen, fraude met persoonlijke gegevens of met documenten om een krediet of subsidie te ontvangen. Buiten alle phishing-achtige fraude (waar vaak derden bij zijn betrokken) bedragen dergelijke soorten fraudes al gauw miljoenen euro’s per jaar.  Daarom werken veel grotere financiële instellingen zoals verzekeraars maar ook een aantal overheidsinstanties vaak met algoritmes om fraudes op te sporen.

‘Bij fraudes is er meer dan gemiddeld sprake van een aantal kenmerken’

Het staat vast dat er evenredig meer fraudeurs zijn die een aantal kenmerken bezitten. Het hoeft natuurlijk helemaal niet zo te zijn dat áls er sprake is van één of meerdere van dergelijke kenmerken dat er dan sprake is van fraude. Soort auto, inkomensstatus, aantal ingediende claims, woonwijk, maar ook (tweede) nationaliteit spelen hierbij een rol. Bij fraudes is er meer dan gemiddeld sprake van een aantal kenmerken. In de praktijk komt het erop neer dat als een dossier meerdere van dergelijke kenmerken bezit waarbij er tevoren een aantal business rules op deze kenmerken wordt losgelaten, deze intensiever worden nageplozen.  Bij de kinderopvangtoeslagfraude leek er sprake van een soort tunnelvisie waarbij deze dossiers zonder verder grondig onderzoek al voor fraude in aanmerking kwamen.

Een aantal jaren geleden was er ook al wat ophef over de premie voor autoverzekeringen en het gerelateerde postcodegebied. In sommige postcodegebieden lag de te betalen premie gemiddeld wat hoger dan in andere gebieden omdat er meer schades werden gemeld. Dat die wijken niet lagen in Aerdenhout en Laren was duidelijk. Dat gebeurt nog steeds maar volgens de Wet Bescherming Persoonsgegevens (WBP) mogen bedrijven (vrij vertaald) geen premiebesluiten nemen op basis van alleen maar datagegevens. Ze moeten hun vastgestelde premies en in het bijzonder de logica hierachter kunnen uitleggen. Dat zou bij het opsporen van fraude en het gebruiken van algoritmes ook het geval moeten zijn.

‘Zorgvuldigheid betekent ook: gericht zoeken en niet met losse flodders schieten’

Soms gaan er stemmen op die aangeven dat gericht zoeken op kenmerken pas is toegestaan als de fraude is geconstateerd en om de fraudeur op te sporen: de kenmerken van de verdachte zijn bekend en op grond van de kenmerken gaan we zoeken.  Dus niet van tevoren (om fraude te voorkomen of om te detecteren). Voorts speelt het soort kenmerk hierbij ook nog een rol. Echte persoonlijke kenmerken (bijvoorbeeld geslacht, kleur ogen) worden op één hoop gegooid met (tweede) nationaliteit. Tweede nationaliteit is geen persoonlijk kenmerk.  Dat in Nederland de meeste mensen die een tweede nationaliteit hebben deze in veel gevallen “niet-westers” is, is een toevalligheid. Blijkbaar zit daar de angel maar dat is iets anders.  Ik betwijfel dus dat tweede nationaliteit, evenmin als inkomen, woonwijk of beroep een persoonlijk kenmerk is: het is veranderlijk. Voorkomen is echter beter dan genezen is het aloude devies.

Ik ben ervan overtuigd dat de gebruikte algoritmes bij de overheidsinstanties zoals de belastingdienst niet in het leven zijn geroepen uit ‘racistische’ overwegingen of dat ‘etnisch profileren’ het doel is. Integendeel: daar denkt geen mens aan. Fraudes kosten de belastingbetaler uiteindelijk miljoenen per jaar en er dient niet alleen zorgvuldig onderzoek te worden verricht maar er ook zorgvuldig mee te worden omgegaan. Maar zorgvuldigheid betekent ook: gericht zoeken en niet met losse flodders schieten. Anders blijft het dweilen met de kraan open.  Ik denk dat iedere burger dat heel goed begrijpt. Klaver en Van Zutphen noemen dit etnisch profileren. Ik noem dit het zoveel mogelijk voorkomen en vroegtijdig opsporen van fraude van gemeenschapsgelden op zorgvuldige wijze, onder andere door middel van een aantal niet persoonlijke kenmerken.