Big data: zegen of vloek?
90 procent van alle beschikbare data wereldwijd is in de afgelopen twee jaar geproduceerd, en behoort nu tot een van de meest waardevolle goederen. Het zorgt voor betere inzichten in minder tijd. Maar hoe profiteert de consument daarvan? En zit het wel snor met de privacy?
Al sinds de eerste computer in 1946 in de Verenigde Staten actief werd, verwerken en slaan we data op om meer inzichten te verwerven. Al is de rekenkracht in ruim 65 jaar er bijna onnoemelijk veel keren op vooruit gegaan, het doel bleef hetzelfde: meer inzichten in minder tijd. Niet alleen rekenkracht, maar ook de opslag van data is explosief toegenomen. De hoeveelheid wereldwijd opgeslagen data ging van 287.000 terabyte in 1986 naar 667 exabyte ging 2014. Oh ja, 1 exabyte is 1000 petabyte.
Maar alle cijfers even daargelaten, het is bijna niet voor te stellen hoeveel data er midden jaren tachtig al werden opgeslagen, laat staan in deze tijd. Echter, vroeger was de techniek de limiterende factor, tegenwoordig is dat geld. De technische ontwikkelingen gaan steeds sneller en big data is in korte tijd steeds toegankelijker en relevanter geworden.
“Het is puur een financiële kwestie geworden. Hoe meer machines je neer kan zetten, des te meer data je kan verwerken, wat vaak leidt tot meer waarde. Met meer data kunnen je algoritmes tot betere uitkomsten leiden. Dit kan ook allemaal realtime. De techniek is nu zover dat het bijna alles al toelaat, het blijft alleen een kwestie van geld. Hoeveel wil ik investeren?”, aldus Arjen de Ruiter van bol.com.
Toepassingen
Maar waar gebruiken we al die data tegenwoordig dan wel niet voor? Waar je een paar jaar terug over een enkele dataset beschikte, zoals bezoekersaantallen of pageclicks, is het nu mogelijk om logische verbanden te leggen tussen een veelvoud van datasets, voor veel meer zaken dan je zou verwachten. En niet alleen partijen in de commerciële sector, maar ook overheden stappen in big data. Volgens Mark Dijksman, mede-eigenaar van Big Fellows (een bedrijf dat oplossingen bedenkt voor maatschappelijke vraagstukken met behulp van data), biedt big data voor de overheid eindeloos veel kansen, “bijvoorbeeld bij het inzichtelijk maken van zorgvragen, zelfredzaamheid van wijken in een stad of wat is de veerkracht van een wijk. Ook huiselijk geweld kun je beter inschatten en voorspellen met big data, evenals het constateren van fraude”.
Bij marktpartijen gaat het uiteindelijk om het verbeteren van conversies, dus meer verkopen. En big data is daar een middel bij, een middel om bijvoorbeeld een webshop beter te laten aansluiten op persoonlijke wensen. Een neveneffect van personalisatie kan hyper-personalisation zijn, wat inhoudt dat een individu te ver langs een route gevoerd wordt die op hem is afgestemd. Dat leidt vaak ook weer tot teveel afzondering van de groep waar men wel graag bij wil horen. Dit noemen we unique belonging (Lister, Dovey, Giddings, Grant, Kelly, 2009). Gelukkig zijn daar weer Facebook en Twitter, waar je de net gedane aankoop kan showen.
Maar ook gebruiken we data voor het maken van interne rapportages en analyses van hard- en software. Maar het gebruik van data voor verbeteringen en analyses is, zoals eerder gezegd, niks nieuws. Wat nu echter het verschil maakt, is de hoeveelheid data. Deze biedt dusdanig veel informatie dat er echt een concurrentievoordeel voor bedrijven te behalen valt.
Ook voor de publieke sector is er veel winst te behalen. Dit gebeurt op basis van de vele verbanden die gelegd kunnen worden. Echter, slechte publiciteit over veiligheid in big data leidt vaak tot terughoudendheid van consumenten en overheden om verder te participeren hierin. Maar ten onrechte. Bij bol.com zijn alle data versleuteld en er kunnen in het hele bedrijf maar een paar werknemers bij. “Er zijn weinig mensen die individuele klantgegevens nodig hebben. Eigenlijk alleen servicemedewerkers die klanten willen helpen, die moeten iets meer van die klant weten”, aldus De Ruiter.
Want big data is namelijk ook echt ‘big‘! Volgens John de Voogd, hoofd sales bij Fujitsu en IT-expert voor computable.nl, zijn dit geen gegevens die in een Excel-bestand passen of in een reguliere database. Daar is het gewoonweg te groot voor. En ook al zou je bij de data kunnen, het is versleuteld. Dus informatie eruit halen, is bijzonder lastig. En een derde reden waarom het echt veilig is: de omvang van de data is zó groot, dat het niet meer ergens heen kan, je moet zelf “naar de data toe”. ‘Virtuele afkadering’ heet dat zo mooi. Met de veiligheid zit het dan wel snor. Toch?
Inschattingsfout
Toch gaat het soms mis. Dat komt niet door de veiligheid van big data-systemen, maar door de beheerders. Zie het voorbeeld van de ING. Eerder dit jaar maakte het bekend dat het, bij wijze van proef, bankgegevens van klanten door ter beschikking zou stellen aan adverteerders. Nu is dat niet wereldschokkend, maar wat het stof zo deed opwaaien is dat het om individuele gegevens zou gaan. In een interview in Het Financieele Dagblad (beperkte toegang) stelt retaildirecteur Hagenaars van de ING het volgende: “Een tuincentrum wil graag weten dat je elk jaar in maart €150,- aan tuinspullen uitgeeft. Hij kan dan op het juiste moment een scherp aanbod doen”. Voor de bank liep dit uit op een publicitair fiasco en men zag er toch maar vanaf.
Ook betalingsverwerker Equens kwam op een zelfde manier in het nieuws, toen ze voornemens waren om de database met pintransacties (jaarlijks 2,2 miljard) te verkopen. Belangrijk verschil: bij de ING zouden de gegevens binnen de bank blijven en dus niet rechtstreeks verkocht worden. In beide gevallen bleef het gelukkig bij een voornemen, maar de wens van bedrijven is er kennelijk dus wel.
Vooralsnog staat het Nederlandse publiek niet te springen voor het delen van dergelijke gevoelige informatie. En logisch ook eigenlijk, want zonder een goede ethische verantwoording zullen er weinig consumenten zijn die daar iets voor voelen. Dijksman: “Tenzij ze er iets voor terugkrijgen, in de vorm van een korting of iets anders van waarde”.
“Omdat klanten sneller vinden wat ze zoeken, gaan ze eerder over tot een aankoop. Je maakt de webwinkel namelijk persoonlijk relevant voor de klant.” – Arjen de Ruiter, teammanager software development, bol.com.
Verkeerd beeld
Nu lijkt het een beetje alsof bedrijven niet zorgvuldig met onze gegevens omgaan en de data aan elk bedrijf willen verkopen die er grif geld voor willen neerleggen. Het is echter zaak te beseffen dat veiligheid van opgeslagen gegevens iets anders is dan het beleid dat bedrijven hanteren omtrent het delen van die gegevens met derden. Maar, zoals genoemd, big data is goed geld waard en dat is waar de integriteit van een organisatie op scherp komt te staan: kiezen of, letterlijk, delen?
We leven in een tijd waarin consumenten veel data blootgeven. Hoe vaak en waar logt iemand in op Facebook, welke zaken regel je via je DigID of wat koop je bij Zalando? Allemaal acties waarbij de desbetreffende instantie data over je opslaat. Vrij logisch dat een bedrijf daar wat mee doet, maar de consument ziet vaak alleen de negatieve gevolgen. “Weer een mail van Perry Sport en ook nog een van Zalando”, hoorde ik mijn eigen vriendin pas nog verzuchten. Maar voor alle bedrijven is het extra dienstverlening richting de klant. Juist met die data maak je als bedrijf de dienst meer op de consument afgestemd.
“Wij zijn van mening dat je als overheid niet hoeft te weten wat een individu doet; maar je moet weten wat de groep doet. Daarom gebruiken wij met name anonieme data, die direct informatie oplevert en niet herleidbaar is naar individuen.” – Monique den Bakker, communicatieadviseur gemeente Utrecht
Persoon & gemeenschap
Ook genereert het betere inzichten in minder tijd, zeker van belang voor de publieke sector. “Het is een nieuwe tijd, waarin overheden, bedrijven en de samenleving efficiënter samenwerken juist door de hulp van big data, wat weer leidt tot meer transparantie en beter (overheids)bestuur”, aldus Dijksman.
Big data draagt namelijk bij op alle niveaus van de samenleving. Denk aan zorg op afstand, volledig op de vraag afgestemd. Ook op wijkniveau is het invullen van een enquête voor de gemeente iets waar niet alleen jij, maar de hele buurt iets aan heeft. Of neem nationale veiligheid. Het afluisteren van burgers is geen populair onderwerp, maar wel een manier om de samenleving veiliger te maken. Ook verzekeringen kunnen goedkoper worden door betere fraudebestrijding met behulp van data. En de overheid zelf kan beter en kosteneffectiever werken. Zolang die gegevens alleen gebruikt worden voor het grotere goed, hebben burger en consument baat bij big data.
Zegen
Ondanks enkele nadelen die aan big data kleven, zijn het vooral de voordelen die blijven hangen. Een vraag die bij mij bleef knagen was: “Waarom zijn dan toch veel bedrijven en de publieke sector terughoudend om iets met hun data te doen?”. Navraag bij Dijksman leerde dat dit veelal te maken heeft met het silo-effect in organisaties: informatie zit vast in afdelingen, die weinig tot niet met elkaar communiceren. Maar in tijden waarin meer werk in minder tijd verzet dient te worden, staan er steeds meer professionals op die een groeiende behoefte hebben aan de slimmere inzichten en het voorspellende karakter van big data.
Big data is nu hier en dat zal het ook blijven. Het zorgt voor een betere kennis en voorspelling van de wereld. Het zal ons helpen ziekten beter te bestrijden en armoede tegen te gaan. Individuele en gemeenschappelijke voordelen zijn er absoluut en legio. Wel is en blijft het wijs om stil te staan bij de ethische keuzes omtrent verzameling en gebruik. Wat ga ik verzamelen en waarom? Past het en kan het?
Pas als die vragen beantwoord zijn met de consument of burger op de eerste plek, kun je spreken van de juiste keuze. Doe je dan niet, dan verandert de zegen langzaam in een vloek.
“Weer een mail van Perry Sport en ook nog een van Zalando”, hoorde ik mijn eigen vriendin pas nog verzuchten.
Dit heeft helemaal niets met Big Data te maken. Er zit een linkje bij die ‘afmelden’ heet.