Datagedreven werken, zegen of vloek?

datagedreven werken zegen of vloek

Wat is eigenlijk datagedreven werken, wat kun je er mee? Wat zijn de potentiële maatschappelijke consequenties van datagedreven werken? Datagedreven werken is, zo lijkt het op het eerste gezicht, op basis van (onbewerkte) gegevens gaan werken en (bij)sturen. En dit gaat ver. Het is namelijk vaak een excuus om héél veel data te gaan verzamelen of samenvoegen.

Heel veel mensen maken zich druk over “de QR-code”, de Europese Digitale Identiteit of een Social Credit Systeem. Persoonlijk geloof ik dat er een heel ander ‘doemscenario’ zich onder onze eigen neus kan of zal afspelen als we niet goed monitoren wat er allemaal gaande is op het gebied van datagedreven werken. Een ontwikkeling waar ik mij al geruime tijd zorgen over maak, vooral omdat gepoogd word datagedreven werken  aan te wenden voor het bereiken van gedragsverandering bij de burger. Begin jaren ’90 liep ik al tegen het fenomeen aan dat er ontzettend veel data verzameld wordt over burgers – data waar beslissingen op gebaseerd worden en waar zij geen énkele weet van hadden. Ik heb hier moeite mee. En dit fenomeen heeft onder de noemer ‘datagedreven werken’  vleugels gekregen.

Onderstaande is een verkorte versie van mijn artikel over datagedreven werken. Lees/download het volledige artikel (PDF) hier.

Datagedreven Werken

Als ICT’er heb ik altijd geleerd: gegevens (data) zijn géén informatie. Verzamelde data wordt omgezet in informatie. En met die informatie wordt iets gedaan.

Als het gaat om bedrijfsmatige data (verkoopcijfers, productiecijfers, afzetgebieden, resultaten advertentiecampagnes, sturing koopgedrag, enzovoorts) is er geen enkel bezwaar zolang er geen persoonsgegevens worden verwerkt en/of persoonsgegevens met expliciete toestemming zijn verzameld voor dit doel.

Echter, datagedreven werken wordt ook op ander gebied ingezet. Er wordt allerlei data over mensen verzameld, data van burgers. En daar worden analyses op gedaan en op basis van die analyses beslissingen genomen.

Data waar je, vanuit privacy-oogpunt, recht op inzage en correctie op moet hebben. Alleen.. niemand vertelt je dát ze die data over je verzamelen, daarmee aan het werk zijn en soms verregaande conclusies trekken op basis van die data! Laat staan dat je toestemming wordt gevraagd hiervoor.

Datagedreven werken - ambtenaar achter de laptop (Afbeelding van Gerd Altmann via Pixabay)
Bepaalt een ambtenaar achter de computer straks of uw gedrag wel ‘gewenst’ is? (Afb Gerd Altmann)

Gedragsverandering door Datagedreven werken

Het ministerie van Justitie en Veiligheid (JenV) heeft in 2019 een uitgebreid rapport gepubliceerd (mirror) waarin zij uit de doeken doen hoe zij middels datagedreven werken onder andere analyses (willen) doen op personen en gezinnen (families) en vervolgens willen gaan sturen op gedragsverandering.

Na het doornemen van het document van het Ministerie van JenV zie ik toch wel wat haken en ogen voor wat betreft het inzetten van datagedreven werken op die manier. Al was het maar wegens de enorme verzamelwoede van data (en bewaren er van) die daardoor ontstaat.

Een recent voorbeeld op dat gebied is de veiligheidsdienst. Bits of Freedom heeft hier een behoorlijk dossier over opgebouwd. De geheime diensten bewaren (nog steeds) onrechtmatig de gegevens van burgers, zo bleek recent. Ze hebben op dit gebied in juni jongstleden eindelijk een succes geboekt.

De toezichthouder heeft al aangegeven dat dit onrechtmatig is, maar de minister schuift dit oordeel terzijde en laat deze praktijk in stand. (BOF)

Dat is allemaal “big data”. Wat doen ze daar mee?

Datagedreven werken: waarom eigenlijk?

Een datagedreven werkwijze zorgt ervoor dat je sneller weet wanneer iets goed of juist niet goed gaat. Hierdoor is het mogelijk om sneller aan de knoppen te draaien om veranderingen teweeg te brengen. En niet alleen dat maar je weet ook nog eens aan welke knoppen je het beste kunt draaien voor het gewenste resultaat. (E-Mergo)

In dat geval zul je dus de data bewerkt moeten hebben of bepaalde indicatoren moeten hebben en is er geen sprake van onbewerkte, ruwe, data maar sprake van interpretatie van de data middels bijvoorbeeld een ‘dashboard’, gevoed door kunstmatige intelligentie (Artificial Intelligence, vaak afgekort tot “AI”).

Interpretatie
De dashboards/indicatoren veronderstellen kennis van de data en hoe die te interpreteren en te wegen, af te zetten, onderling. Wat weegt zwaarder? Welke handelwijze beïnvloedt de data? Wat voor vooringenomen standpunten wegen er in mee?

De weging en verwerking van data (waardoor het feitelijk weer omgezet wordt van gegevens naar een beperkte gegevensset i.c. informatie en er geen sprake meer is van werken op basis van ruwe data) zal dus zeer secuur, vrij van aannames en ethisch verantwoord moeten zijn.

Etniciteit
Bepaalde specifieke indicatoren, zo stelt JenV, mogen niet meewegen. Waardoor je eerdergenoemde interpretatie mijns inziens juist niet waardevrij maakt. In mijn optiek is vanaf dat punt de data al gemankeerd want: gefilterd.

De etnische gegevens bijvoorbeeld. Waarmee een filtering wordt gedaan op de ruwe data en er geen sprake meer is van datagedreven werken omdat relevante gegevens verwijderd zijn.

De aanname is “iedereen is gelijk”. Maar dat is een vooronderstelling die kant noch wal raakt. Juist etnische gegevens kunnen een bepaalde invloed hebben op gedrag.

Toch klinkt het raar in de oren van mensen als je dat soort feiten (etniciteit, woonomgeving, sociale situatie) juist wél laat meewegen want: “racisme”, “bevooroordeeld”, “mensen wegzetten” en “kijk maar naar de toeslagenaffaire”.

Anderzijds is het bewust buiten beschouwing laten van etniciteit, sociale omstandigheden, opleidingsniveeua e.d wel degelijk een misser als JenV gedragsverandering wil stimuleren met behulp van datagedreven werken. Immers, bepaalde (invloeden op) groepen blijven in je uiteindelijke ‘dashboard’ op die manier buiten het zicht van de mensen of systemen die je wilt beïnvloeden qua gedrag.

Profilering

de inzet van algoritmes haalt regelmatig de media – en meestal niet in positieve zin. Rond de opsporing van fraude zijn verschillende (overheids)organisaties breed uitgemeten onderuitgegaan. Ze koppelden data en voorspellende rekenmodellen aan ‘risicoprofielen’ en trokken onterechte conclusies over mogelijke misstanden.” – Frankwatching.

Er kunnen (dus) ook andere belangen (gaan) spelen bij de overheden. Bijvoorbeeld fraudebestrijding. Of het in beeld brengen van “probleemgezinnen”.

Wat zijn de bezwaren, en de nadelen, die hier aan kleven?

  • Profilering op basis van een dataset is profilering op basis van éénzijdige, onvolledige, gegevens; immers: niemand heeft een compleet dataprofiel van een burger. Beslissingen die op basis van een incompleet profiel worden genomen kunnen verstrekkende gevolgen hebben voor de betrokkene(n)!
  • De indicatoren op basis waarvan beslissingen worden genomen: hoe komen die tot stand, op basis van gedegen wetenschappelijk onderzoek en brede, geverifieerde, data-analyse of op basis van ‘ervaring’ en ‘onderbuikgevoel’?
  • Alle data die je hebt van een burger in één grote container stoppen, een datawarehouse, is dat eigenlijk wel legaal?
    • Dat een burger toestemming heeft gegeven het te gebruiken voor een bepaald doel (bijvoorbeeld vaststellen van recht op uitkering) wil niet zeggen dat je toestemming van dezelfde burger hebt het zomaar te gebruiken om een analyse te doen ten behoeve van jeugdzorg of andere doeleinden – integendeel!
    • De algemene regel is dat verstrekken van persoonsgegevens alleen mag als dat verenigbaar is met het doel waarvoor de gegevens zijn verzameld. Of dit het geval is, hangt af van de concrete omstandigheden. (Autoriteit Persoonsgegevens).
      Er mag vanaf worden geweken wanneer de verwerking van de persoonsgegevens noodzakelijk zijn om de publieke taak goed te kunnen vervullen. Het samenvoegen van data in een datawarehouse om daar middels ‘datagedreven werken’ allerlei leuke ontdekkingen mee te doen valt daar domweg niet onder.
  • Heeft de burger er weet van dat je dat doet, heeft de burger bewust, expliciet, toestemming gegeven voor gebruik van én inzage in deze data, hoe zit het met het recht op correctie?
  • Wie mag het allemaal raadplegen en waarom? Wat zijn de waarborgen dat de data op de juiste manier wordt gebruikt en door de juiste personen (en waarom zijn zij dat?) wordt geraadpleegd?
  • Is er sprake van correcte en herleidbare logging van deze dataraadplegingen? Denk aan het debacle met de GGD en inzage in gegevens door niet geautoriseerde personen en de illegale handel in deze gegevens.

Aan data en daaruit volgende categorieën liggen altijd keuzes ten grondslag. Ze reproduceren dus een perspectief op de werkelijkheid. Dat effect versterkt bovendien naarmate we die vorm van de werkelijkheid meetbaar maken.

Ten tweede: mensen stoppen andere mensen graag in een hokje. Dat helpt ons om de wereld en de mensen die we tegenkomen te begrijpen. En dat conflicteert met de kern van een dataprofiel [..] dataprofielen zijn niet consistent: verschillende ordeningsprincipes kunnen door elkaar lopen en de categorieën sluiten elkaar ook niet onderling uit. Je scoort op alles, maar niet in gelijke mate. Frankwatching.

Datragedreven werken is niet waardevrij
Datragedreven werken is niet waardevrij (Afb. Gerd Altmann)

Datagedreven werken – Zegen of Vloek?

Er valt natuurlijk nog veel meer over te zeggen, er zijn heel veel voorbeelden te vinden hoe datagedreven werken werkelijk ‘een zegen’ kan zijn maar ook een regelrechte vloek werd of kan zijn.

In heel veel zaken kan datagedreven werken heel nuttig zijn. Maar wanneer we het gaan loslaten op de burger, in handen van amateur-analysten achter een ‘dashboard’ die het verschil tussen gegevens en informatie niet eens kennen, privacyregels al helemaal niet en zich niet bewust zijn van de manier van totstandkoming van de gegevens die ze hebben alsmede de weging die wel of niet is toegepast, is er mijns inziens een enorm risico dat de gegevens tot volstrekt verkeerde conclusies leiden. Met alle gevolgen van dien (zie de voorbeelden in het uitgebreide artikel).

Belangrijk is, denk ik, dat we niet zomaar de hype moeten volgen. Een systeem of methode gebruiken ‘omdat het er nu eenmaal is’ is nooit de juiste insteek.

Als er vanuit de maatschappij geen vraag naar is, is het domweg niet zinvol hier tijd en energie in te steken. Tenzij het voor de maatschappij een, ook door de burger zo ervaren, toegevoegde waarde heeft én de burger hier – op zijn minst impliciet maar bij voorkeur expliciet – mee instemt.

____________
Dit artikel is op persoonlijke titel geschreven, geeft mijn persoonlijke observaties en mening weer en is gebaseerd op openbare bronnen.

Delen op: