Big data-successen voor het voetlicht op Data Donderdag

18 december 2013, 11:59

Op 12 december vond in de Beurs van Berlage de allerallereerste editie plaats van Data Donderdag. Data Donderdag is een initiatief van Mark van Rijmenam, Rob Dielemans en Rutger Wetzels. Mark trad deze avond op als spreekstalmeester. Sommigen zullen hem kennen als grondlegger van BigData-Startups, een online kennisplatform over, je raadt het al, big data. Data Donderdag wil uitgroeien tot een tweemaandelijkse meetup over big data, waarbij het nadrukkelijk gaat om heel concrete toepassingen. De organisatie wijst er met nadruk op dat het niet om technische verhandelingen gaat; de gemiddelde data scientist zal er dus niet zo goed aan zijn trekken komen. Managers en business owners des te meer, zo bleek op 12 december.

The value of data lies in moving from head to tail

Arjen de Ruiter van bol.com trapte de sessie af als eerste spreker. Hij liet zien hoe bol.com eraan werkt om iedere klant zijn eigen winkel aan te bieden, gebaseerd op historisch zoek- en aankoopgedrag en voorkeuren. Bol.com laat zich in belangrijke mate leiden door de filosofie van Chris Anderson in zijn boek The Long Tail: “voorspel niets, meet en reageer”. Ik mag aannemen dat de gedachte achter The Long Tail voldoende bekend is bij de lezer.

De wijze waarop bol.com big data inzet, is gebaseerd op een fundamenteel uitgangspunt: the value of data lies in moving from head to tail. De online retailer wil nicheproducten steeds beter matchen, waardoor welbeschouwd de head wat kleiner wordt en de tail wordt opgelicht. Men beweegt dus meer naar de niche toe, want daar zijn de rendementen hoger.

Iedereen zijn eigen personal shop

Hoe krijgen ze dit alles voor elkaar? Door voortdurend te werken aan verbetering van de personalisatie. Iedere bezoeker krijgt zijn personal shop voorgeschoteld, met daarin tips, verlanglijstjes, een best-verkocht-lijst, wat je allemaal bekeken hebt, etcetera. Dat moet de band met de klant steeds verder versterken. Terzijde: bol.com maakt bewust geen gebruik van retargeting, omdat dit tot nodeloze irritatie leidt.

Arjen raadt aan om stapje voor stapje met big data te beginnen. 15 miljoen clicks per dag zijn nog geen big data en 15 mln producten evenmin, maar de combinatie ervan is dat wél. De vraag naar data groeit altijd sneller dan de capaciteit. Bol.com kiest voor lineaire horizontale schaalbaarheid om de groei bij te kunnen houden. Concreet: ze zijn van 1 naar 5 naar 10 naar nu 23 nodes gegaan en volgende jaar moeten dat er 80 zijn. Arjen overtuigde de zaal dat bol.com in de voorhoede verkeert van de toepassers van big data.

Innovatiekracht

Data Donderdag wil tijdens elke editie een of twee big data-startups de kans geven zich te presenteren aan een breder publiek, juist omdat deze jonge bedrijven een drijvende kracht zullen zijn in de toepassing van big data.

De eerste korte pitch was weggelegd voor Jurjen van Rees van The ANT Works. Dit jonge Nederlandse bedrijf heeft algoritmes gebouwd waarmee het de input en output van R&D kan meten aan de hand van onder meer patenten en wetenschappelijke publicaties. Organisaties kunnen hiermee niet alleen hun eigen innovatiekracht in kaart brengen, maar ook vaststellen waar hun kernkwaliteiten liggen als het om innovatie gaat. Bovendien kan dit worden gebenchmarkt met de situatie bij concurrenten, waarbij tevens een helder inzicht wordt geboden in de samenwerkingsverbanden die deze concurrenten zijn aangegaan. Fascinerend.

Waarschijnlijkheid en nauwkeurigheid

Sander Klous trad als tweede hoofdspreker op. Hij is big data services lead bij KPMG Management Consulting. Sander is van oorsprong een gepromoveerd natuurkundige die onder meer bij CERN heeft gewerkt, maar zijn betoog was verre van technisch. Hij legde uit dat we bij big data moeten leren omgaan met waarschijnlijkheden en nauwkeurigheden. Hij onderkent drie speerpunten:

  1. Denk eerst na over de te nemen beslissing. Stel vast hoeveel betrouwbaarheid je daarvoor nodig hebt en vervolgens welke databronnen.
  2. Databronnen hebben veelal weinig met elkaar gemeen. Je moet dan op basis van waarschijnlijkheid die bronnen gaan hanteren en dat doe je met Bayesiaanse statistiek (ok, het werd heel even een beetje technisch).
  3. Gebruik technieken als Hadoop, Storm, nanotechnologie voor computergeheugens om bedrijven verder te helpen.

De resultaten die KPMG hiermee boekt, mogen er zijn. Sander liet voorbeelden zien van een sentimentsanalyse van social media voor Vodafone ten tijde van de brand in hun Rotterdamse netwerkcentrale in 2012 en een in opdracht van een bank uitgevoerde risico-analyse van hypotheken die onder water staan op basis van vraagprijzen op Funda. Het zijn twee bronnen van informatie die in de kern niet helemaal betrouwbaar zijn (vraagprijzen op Funda zijn niet de prijzen die betaald worden) en die toch relevante informatie opleveren.

Kortcyclisch opereren

Hoe pak je dit nou aan? KPMG raadt aan om kortcylisch te werken met een data scientist, een product owner, een data-expert, een visualiser, e.d. KPMG zet scrum- en agile-tactieken in. Zo moet de data scientists iedere paar dagen met andere stakeholders terugkoppelen om te voorkomen dat het project in drijfzand terechtkomt. Met deze concrete adviezen van KPMG kan iedereen zijn voordeel doen.

13 februari 2014

Deze eerste Data Donderdag smaakt naar meer: de eerste editie maakte volledig waar dat het concrete praktijkcases voor het voetlicht brengt. Zet in je agenda: de volgende staat gepland voor 13 februari. Aanmelden kan binnenkort via Meetup.com. Zorg dat je dat tijdig doet, want die 50 plaatsen zijn binnen no time vergeven, zoals afgelopen week is gebleken.

En voor degenen die nog wat extra overtuigingskracht nodig hebben: hier vind je een door Visuele Notulen gemaakt visueel verslag van deze eerste Data Donderdag, waaruit ook alle visuals in deze blogpost afkomstig zijn!

Reg van Steen
Senior Client Director bij Kantar TNS

Categorie
Tags

Marketingfacts. Elke dag vers. Mis niks!