Weten & Tech

Big data als crack-pijp voor veiligheidsjunkies

02-07-2013 16:47


Velen zijn er pas sinds Snowden achter gekomen: er is niet alleen heel veel informatie, er wordt ook zoveel mogelijk informatie opgeslagen. Zoveel zelfs, dat slechts 2% van alle opgeslagen informatie niet digitaal is. Maar wat betekent, zoals Foreign Affairs begin vorige maand kopte, deze rise of big data nou precies voor onze maatschappij? En nog interessanter, wat betekent deze voor onze veiligheid? 

Digitalisering, datafication en jeukende handen

Deze verzameldrift van informatie valt geenszins onder digitalisering, waar bestaande (analoge) informatie digitaal wordt opgeslagen. Doordat je tegenwoordig voor een grijpstuiver petabytes aan informatie kan parkeren, is het verzamelen en opslaan van informatie niet langer een kostbare bezigheid. Voorheen moest er een onderscheid worden gemaakt in strikt noodzakelijke informatie en ‘ruis’. Althans, voor zover die luxe zich al voordeed: lang niet altijd was benodigde informatie überhaupt voorhanden.

Waar een halve eeuw geleden inlichtingendiensten nog letterlijk artikeltjes uit kranten knipten en opsloegen, is dezelfde informatie (en zoveel meer) slechts een muisklik verwijderd. Resultaat: zowel overheden als bedrijven slaan informatie op over zaken die voorheen nooit rendabel werden geacht: kroeg- en dorpspleinachtige gesprekken via Facebook en Twitter, professionele netwerken via LinkedIn, collectieve trends (in 2006 was het Bebo, in 2012 Whitney Houston) via Google Search, tot zelfs het registreren van windowshop-gedrag door centjesloze shopaholics op Pinterest. Dit valt onder de beweging van het nieuwe verschijnsel ‘datafication’: dagelijkse bewegingen, gedragingen en uitingen worden voor het eerst gecodificeerd en opgeslagen.

Correlatie, causatie en creativiteit

Elke statistische wetenschapper krijgt hier onherroepelijk jeukende handen van. De mogelijkheden zijn eindeloos. Met meer data (eigenlijk: oneindig veel datasets) zijn de toepassingen voor kwantitatief onderzoek duizelingwekkend. Meer data zal kort door de bocht gesteld leiden tot waarschijnlijk minder accuratesse, maar dat is ook niet altijd nodig met dergelijke hoeveelheden data.

Voorbeeld: de kwaliteit van de vertalingen van Google Translate groeit naarmate de aantal cross references van stukjes tekst op het web toenemen. Nauwkeurigheid groeit naarmate het volume toeneemt en Google Translate ging al de lucht in voor het “af” was.

De mogelijkheden zijn met name eindeloos wanneer het gaat om het aantonen van verbanden (correlaties) en niet zozeer om het aantonen van oorzaak (causatie): als blijkt dat iMac gebruikers duurdere hotels boeken, is het in het dagelijks leven niet interessant om te weten waarom ze dit doen. Dat ze het doen is voldoende kennis om er geld mee te verdienen – door hipsters met een iMac gewoon duurdere hotelkamers aan te bieden.

Daarnaast zeggen verbanden op zich niet altijd wat: zo is er zelfs een correlatie te vinden tussen het aantal verkochte ijsjes en gepleegde moorden. Enkel en alleen afhankelijk zijn van correlaties om iets aan te tonen, is natuurlijk zeer discutabel.

Wanneer het gaat om commerciële onderzoeken, of zelfs als basis voor de strategie van een politieke campagne (hallo Obama), gaat het alleen om wat mensen willen. Ondanks alle juichverhalen en gedans om het vuur van de wisdom of the crowds, is het collectief zelden bepalend voor politieke of wetenschappelijke vooruitgang. Zoals Henry Ford zei: “If I had asked people what they wanted, they would have said they wanted faster horses.”

Big data en veiligheid

Wat kan en zal ‘big data’ betekenen met het oog op veiligheid in de toekomst? Een sprekend voorbeeld werd door Cukier en Mayer in het eerdergenoemde artikel in Foreign Affairs gegeven met de “intelligente vloer”. IBM heeft vorig jaar een patent aangevraagd voor een Multitouch Floor: een vloer die automatisch 112 zou kunnen bellen zodra er iemand te lang stil ligt, maar ook instellingsvoorkeuren zou kunnen koppelen aan individuen door hun gewicht en steunpunten ten opzichte van de vloer te berekenen.

Cukier en Mayer geven dit voorbeeld om de positieve zijde te schetsen van datafication, maar gaan hier voorbij aan de gevolgen van deze ontwikkeling. Behalve handig, zorgt dit nogmaals voor een nieuwe boom in datafication.

Niet alleen onze online gedragingen worden opgeslagen, maar in de toekomst zullen ook onze offline gedragingen én lichamelijke kenmerken in toenemende mate worden opgeslagen en worden gebruikt voor (overigens nooit volledig anoniem) onderzoek. Oftewel: de eerste patenten richting een internet of things voor een groter publiek zijn een feit.

Big Data als crack-pijp voor veiligheidsjunkies

Big Data vergroot de mogelijkheden voor predictive analysis – voor veiligheid gaat het hierbij met name om risicocalculaties maar tegelijkertijd ook risicogedrag. Voor hier, zijn de ontwikkelingen zoals het gebruiken van predictive analysis bij militaire interventies of terrorisme van belang. Zo zijn de VS enkele jaren geleden begonnen met het gebruik van grote datasets van zowel non-technologische als technologische data om vervolgens te voorspellen waar geweldsuitbarstingen zullen plaatsvinden.

Na hoopgevende resultaten is het Witte Huis een onderzoeksprogramma gestart om te kijken hoe big data door 84 verschillende programma’s kan worden toegepast. In deze statistische modellen wordt ‘geweld’ gezien als een epidemische verspreiding en het doel is de geweldscyclus op tijd te herkennen en te doorbreken alvorens deze tot wasdom komt. Klinkt allemaal leuk en aardig alsmede heel nobel: een geweldloze samenleving. Toch bekijken we deze ontwikkelingen met argusogen, met name omdat de volgende scenario’s plausibel zijn:

1

Het creëert (en de Amerikaanse regering propageert ook zelf actief het idee) dat aanslagen zoals die in Boston kunnen worden voorkomen. Het idee een risicoloze samenleving te kunnen garanderen, is hiermee compleet. Wanneer het dan een keer misgaat (en uiteraard, dát is een garantie die wij durven te geven: het gaat onherroepelijk een keer mis) is de geleden schade voor de regering zeer groot. Alleen is het dan wel een beetje te laat om eerder afgestane vrijheden terug te eisen;

2

Kennis is macht, en degenen die deze macht bezitten zullen er niet over peinzen deze niet in te zetten om te overleven. In deze tijd is daarmee macht niet langer voorbehouden aan regeringen, maar ook aan bedrijven. Bedrijven hebben andere (en vaak veranderende) belangen dan regeringen.

Hoewel informatie die je eigen vader nog niet eens weet momenteel wordt aangewend om je producten aan te smeren – is het denkbaar dat in de toekomst het wel of niet toegang tot data verlenen aan een overheid ook politieke consequenties kan hebben. Zeker, de overheid is niet te vertrouwen – maar dit betekent niet dat bedrijven wél op de blauwe ogen zijn te vertrouwen.

3

Op een internationaal niveau is het goed mogelijk dat dictatoriale staten meer liberaliseren terwijl traditioneel open democratieën steeds autoritairder worden. Oftewel: staatsvormen groeien naar elkaar toe. Dictaturen of autoritaire regeringen dienen onherroepelijk te accepteren dat met het internet (en dus toegang tot informatie) ze de verspreiding van nieuwe ideeën niet langer volledig kunnen tegengaan. Om te overleven is een klein beetje meer openheid bittere noodzaak.

Ondertussen zullen open democratieën de verleiding niet kunnen weerstaan (tenzij ze zelf afgeluisterd worden) om de informatie ook daadwerkelijk te gebruiken in voorspellende zin. Hiermee zullen zij tegelijkertijd meer autoritaire trekken gaan vertonen. Maar toch niet Nederland?

Nou, het klinkt op de een of andere manier zeer Nederlands wanneer de overheid een bemoeizuchtige broekrok op u afstuurt aangezien u (gelet op de online en offline gedragingen van u en uw naasten) een verhoogd risico heeft op verslaving, of dat u ineens een voorlichtingsmailtje over tienerzwangerschap krijgt omdat uw puberzoon of -dochter de ontluikende seksualiteit via chatkanalen uitvent, of dat de gemeente alvast een wijkagent op de koffie stuurt wegens een verhoogd risico op huiselijk geweld: de stigmatiserende werking die hier vanuit zal gaan is evident.

Daarnaast is de verleiding levensgroot om dagelijkse dingen steeds verder te securitiseren, of beter gezegd: op een gegeven moment is zelfs een bezoekje aan de WC of gebruik van een keukentrapje onderworpen aan een risico-calculatie met bijbehorende appropriate action.

‘Risk assessment data is like a captured spy’

Zoals gezegd kan big data gigantisch veel mogelijkheden bieden, met name voor de wetenschap. De ontwikkelingen op het gebied van behavioural economics, alsmede psychologie en datamining kunnen in een interdisciplinaire onderzoeksomgeving niet alleen interessante relaties blootleggen, maar ook het gedrag ervan (gedeeltelijk) voorspellen.

Daarnaast vertelt big data vooralsnog vooral het wat en niet zozeer het hoe. In een dergelijke omgeving van voorspellende modellen, die zichzelf mogelijk in razendsnel tempo perfectioneren, is het zaak om ruimte te blijven geven aan individuele (statistisch) afwijkende ideeën. Het zijn namelijk vaak dit soort ideeën die tot nieuwe inzichten en uiteindelijk innovatie leiden.

Het is dus van groot belang deze ontwikkelingen niet heilig te verklaren: common sense moet nog altijd een spreadsheet met valide argumenten van tafel kunnen vegen. Toegang tot veel data staat niet altijd gelijk aan toegang tot de “juiste” data, oftewel: “risk assesment data is like a captured spy: if you torture it long enough, it will tell you anything you want to know.”

Brandschoon

Daarom is het, juist in deze tijd, van belang voor de (gelet op de razendsnelle ontwikkelingen in het vakgebied: met name de sociale) wetenschap brandschoon te zijn. Tegelijkertijd ligt bij de wetenschap de verantwoordelijkheid om politici en beleidsmakers met de voeten op de grond te houden door er blijvend op te wijzen dat cijfers niet altijd voor zich spreken, dat data vervuild kan zijn en dat algoritmes niet altijd kloppen.

Hoewel het op het eerste gezicht allemaal ver weg en toekomstmuziek lijkt, wordt het wel tijd om ons als burgers af te vragen wie wij vertrouwen met onze informatie en of het wel zo leuk leven is in de risicoloze samenleving die ons wordt voorgespiegeld.

Geïnstitutionaliseerd risicomijdend gedrag is gedeeltelijk gebaseerd op angst en het is nog maar de vraag of wij letterlijk willen worden geregeerd door angst. Want stel je voor dát we in de toekomst op deze wijze terroristische aanslagen, oorlogen en ziektes kunnen voorkomen: de prijs die we voor de (schijn-) veiligheid en comfort moeten betalen zal altijd ten koste gaan van hetgeen waar Westerse democratieën voor claimen te vechten, namelijk vrijheid.

Dieuwertje Kuijpers is politiek analist. Ze schreef dit artikel op persoonlijke titel en is samen met collega Stephan de Vries te volgen via het defensieblog Stukje Duiding.