“Big data? Big bullshit”

“Big data? Big bullshit”
, MCB
@evlems

"Als ik het achteraf zo bekijk, besef ik dat ik dat ik de perfecte achtergrond heb om met big data actief te zijn. En toch begrijp ik de hype totaal niet." En als je naar het cv van Pascal van Hattum kijkt, moet je hem gelijk geven: hij heeft bedrijfswiskunde en informatica gestudeerd en is later zelfs gepromoveerd op segmentatie van grote datasets. Zijn eerste bijbaantjes (telefonische enquêteur, data-analyse) leerden hem alles over wat er in praktijk mis kan gaan met de kwaliteit van data. Een avondopleiding NIMA-B leerde hem wat je met data kunt bereiken in marketing. Of zoals hij het zelf verwoordt: "Hoe je data mooi kunt verpakken tot iets bruikbaars." En zijn eerste werkgever verzamelde al in 2000 heel veel data over heel veel onderwerpen. 

Het is dus ook niet vreemd dat Pascal bij zijn werkgevers MarketResponse en SmartAgent de hele dag in de weer is met grote databestanden, maar met alle ophef van de laatste tijd heeft hij nogal wat moeite. In een gesprek met hem viel me op dat hij op het gebied van big data een duidelijke mening heeft. Hij treedt zelfs regelmatig op met een presentatie met de titel 'Big data, big bullshit'. Een provocerende titel, maar dat betekent niet dat Pascal negatief is over het onderwerp.

Sportbond-segmentatie

"Nee hoor, mijn werk wordt alleen maar leuker naarmate de databestanden groter en complexer worden. Ik merk ook dat ik steeds meer betrokken word bij de beslissingsprocessen van klanten. Een sportbond wil dan 'iets met big data' doen en daar worden we bij betrokken. En bij een andere vereniging mogen we een segmentatie uitvoeren op de 600.000 leden."

Maar waarom dan toch die titel? "Mijn presentatie heet 'Big data, big bullshit' omdat ik vind dat het een hype-term is die erg overtrokken wordt. Natuurlijk komen er steeds meer data op ons af, maar het probleem 'hoe analyseren we het?', is niet veranderd. Nu komen er ontzettend veel data beschikbaar, maar wordt er niet gekeken naar de context waarin het verzameld is."

In welke context? Wat heeft dat voor invloed? "Toen ik zelf data verzamelde als telefonisch enquêteur en deze later ook moest analyseren, ontdekte ik dat het jagen op significantie geen zin heeft als je onzin aan het verzamelen bent. Bij big data is het als snel significant, maar is het ook relevant? Al sinds het begin van mijn carrière kom ik mensen tegen die helemaal afgaan op iets wat significant is, ze weten het verschil niet tussen relevantie en significantie. En vooral niet dat je significantie kunt manipuleren door de steekproef op te hogen. Bij big data is het niet verwonderlijk dat er veel significant is, maar de vraag is: is het ook relevant?" 

Een sexy data scientist

ls je al deze vaktermen hoort, verwacht je niet dat mensen die omgaan met grote databestanden een sexy beroep hebben, maar volgens de Harvard Business Review is dat wel het geval. "Ha ha, ja daar stond ik ook van te kijken. Ze noemden de data scientist in 2012 'het meest sexy beroep van de 21e eeuw'. Ik voel me gevleid en neem dit graag aan, maar ben toch een andere mening toebedeeld."

"Want een data scientist haalt wat data op, bewerkt en analyseert deze, maar kan niets zonder de domeinexperts. Het gaat om een hele club met mensen. Ik zou graag de meest sexy baan op aarde willen hebben, maar ik kan het niet alleen. Het gaat om een multidisciplinair team dat tot mooie resultaten kan komen."

Pascal vindt het werk zelf ook niet zo sexy: "Het is wel mooi hoor, al die statistische modelbouw en dataverwerking, maar uiteindelijk gaat het erom dat al deze inzet zich bewijst in de praktijk. Er moet een doel bereikt worden, zoals een stijging in de sales of een hogere response, kortom een hogere ROI. Dat wat goed is voor de marketing, zeg maar."

Privacy-beschermengeltjes

Goed voor de marketing, maar hoe zit het met de privacy-discussie? Ook daar heeft Pascal een uitgesproken mening over. "Ik zag op het journaal mensen vertellen wat zij vonden van de plannen van de ING-bank om klantdata te gebruiken voor advertenties. Reacties als ‘dit kan echt niet!’, ‘ik stap over naar een andere bank’ en ‘waar blijft mijn privacy’. Ik moest lachen en vroeg me hardop af of dit dezelfde mensen zijn die het eerst een statusupdate op Facebook zetten dat zij overstappen van WhatsApp naar iets anders? Zijn dit de mensen die de meeste ‘gratis’ apps op hun smartPhone hebben? Zouden deze privacy-beschermengeltjes echt zo naïef zijn? Het gebruiken van persoonsgegevens is niks nieuws en gebeurt al jaren."

Pascal vindt het zelf wel plezierig dat bedrijven weten wat hij wil en doet. "Intelligent met de beschikbare data omgaan, zodat de alsmaar toenemende stroom informatie wat beter past bij mijn levensstijl, vind ik wel handig. Dat er producten en diensten aan mij worden aangeboden waarvan het aannemelijk is dat ik die interessant vind, is voor mij geen probleem. En als ik in de verleiding word gebracht, kan ik altijd nog beslissen het product of dienst wel of niet aan te kopen. Dat is gedifferentieerde marketing pur sang!"

"Weet je wat ik pas echt irritant en zinloos vind? Dat ik elke week een plastic map in de bus krijg met een partij folders die mij totaal niet aanspreken en daarom ook gelijk in de blauwe container verdwijnen. Of dat ik een aanbieding van Groupon krijg waarvan ik echt zoiets heb van: ‘wat moet ik hiermee?’. Ben ik te naïef als ik zeg dat ik wacht op een bedrijf dat mij een partij folders stuurt die mij wel aanspreken? Ben ik te naïef als ik denk dat Groupon heus wel eens gaat inzien dat nadat ik een cursus stuntrijden heb aangeschaft, ik echt niet zit te wachten op een cursus kinderboeken schrijven?"

Knutselen of prutsen met data 

Een heldere mening, en logisch ook natuurlijk gezien zijn achtergrond. Maar hoe gaat het zich verder ontwikkelen?

"De wereld is volop in beweging, het gaat tegenwoordig niet meer om statische data, maar om dynamisch data en modellering. Realtime." En daar mag ook geen hoogdravende term als big data opgeplakt worden? "Nee joh, dat is erg overdreven. Ik noem het nog steeds knutselen of prutsen met data. Het is creatief met data zijn. Zoveel is er niet veranderd. Nu gaat het over miljoenen records, maar in 2003 was een bestand van 50.000 al 'big'. De aantallen zijn veranderd, de problematiek niet."

'Big' is dus een groot woord voor al die data en volgens Pascal van Hattum veel te groot. Goed om te zien dat hij met zijn voeten op de grond is gebleven en niet op de hype is meegevaren. Pascal ziet de voordelen van grote datasets, maar blaast er geen lucht in. En dat is plezierig om te zien.

Credits afbeelding: threephin, licentie: CC BY (Commercieel hergebruik, inclusief aanpassing)

Delen

0
0


Er zijn 5 reacties op dit artikel

  • Dag Edwin,
    Je zit zelf in een industrie omgeving met MCB zie ik. wat zijn jouw gedachten over Big Data en industrie?

    geplaatst op
  • Wij proberen al jaren vanuit een Business Intelligence toepassing te leren van de data die we van de markt verzamelen. Het gaat om kleinere aantallen dan bij consumenten natuurlijk, maar het is de moeite waard om je er in te verdiepen.

    geplaatst op
  • Goed te horen dat bij de data miners zelf voldoende nuance aanwezig is. Groot maakt nog niet belangrijk, met "small data" kun je vaak grote resultaten halen.

    geplaatst op
  • Dat klopt Paul, het gaat niet om de grootte.

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.