Van een datagedreven aanpak tot data scientist

Een verslag van de negende Data Donderdag

Van een datagedreven aanpak tot data scientist

Net als de voorgaande edities was ook de negende editie van Data Donderdag weer drukbezocht. Volgens Rutger Wetzels, partner bij Anchormen en mede-initiatiefnemer van de tweemaandelijkse Data Donderdag, neemt de interesse in het combineren van big data en data science merkbaar toe. Op Data Donderdag komen vooral concrete praktijk- en klantvoorbeelden aan de orde. Ook tijdens Data Donderdag op 8 oktober 2015 bij Rockstart in Amsterdam werden weer een aantal interessante cases besproken. In dit artikel een verslag van deze interessante avond.

In 6 stappen naar een data gedreven aanpak

Maarten Toet, associate bij Station 10 (een netwerk van ervaren mediaprofessionals), is duidelijk over de uitdaging en potentie van structurele inzet van data: “Data zijn hard. Dat weten we allemaal, maar hoe maken we data zacht en sexy? Nu is de mediawereld veranderd. Er zijn nieuwe kanalen en nieuwe partijen. Die nieuwe partijen bereiken dezelfde doelgroep, terwijl het aantal kanalen is toegenomen. Ook adverteerders weten hun doelgroepen tegenwoordig heel goed te bereiken. Wil je als mediabedrijf blijven bestaan, dan moet je relevant worden voor de consument door gepersonaliseerde content aan te bieden aan gerichte doelgroepen. Die personalisering van content vraagt om een datagedreven aanpak. Maar hoe doe je dat?”

Believer op boardniveau

“Een dataproject slaagt pas als je een believer op boardniveau hebt. Het aantrekken van zo’n persoon is de eerste stap. Deze believer formuleert het lange termijnplan en de te realiseren doelstellingen (KPI’s). Stap twee: zorg voor een data driven cultuur. Je middle-management moet bezet worden met ambassadeurs, aangevuld met fact-based marketeers. Neem die mensen aan, trek ze desnoods aan de haren naar binnen. Zij zijn namelijk cruciaal voor jouw data driven cultuur. Omdat een data scientist en een marketeer niet goed met elkaar kunnen praten, heb je mensen nodig die deze twee personen aan elkaar kunnen koppelen in het multidisciplinaire team waarin ze samenwerken (stap drie).” 

Pas bij wederzijds begrip kom je bij stap vier: er kunnen modellen gebouwd worden. De business bepaalt welke modellen dat zijn. Stap vijf draait om resultaat. Vergeet eindeloos grote projecten en vier elk resultaat dat je met minimale effort op basis van bestaande data weet te behalen. Hoewel je onmogelijk alle twijfel kunt wegnemen, zorg je met A/B-testen voor ondubbelzinnige resultaten. Zo overtuig je het management.

Laatste stap: IT

Met het management aan boord is het tijd om intelligence binnen te halen. Slimme mensen maken slimme algoritmes en eigen algoritmes. Juist die eigen algoritmes helpen je onderscheidend te zijn van je concurrenten. Pas bij de zesde stap ga je investeren in IT, systemen en tools. Dat hoeven geen grote investeringen te zijn, want veel data is er al.

Data scientist: ‘the hottest job of the 21st century’

Wat houdt het vak data scientist nou werkelijk in? Friso van Vollenhoven en Stijn Tonk van GoDataDriven vertellen meer over het werk van een data scientist via een praktisch voorbeeld: de webwinkel. 

Webwinkels spreken datawetenschappers aan met de vraag om de customer experience te verbeteren, om meer te verkopen en om klanten vaker terug te laten komen. Daarbij komen de standaardvragen al gauw bovendrijven: kunnen we iets doen met aanbevelingen en met personalisatie? Waar het uiteindelijk om gaat is het optimaliseren van de conversie, dus hoe eerder een webwinkel relevante producten toont, hoe groter de kans dat mensen blijven.

“Een data scientist wil dit proces realtime bekijken. Het begint met een test: welke jurk vind je mooier, de linker of de rechter? Op basis van dertig keuzes gaan we orde scheppen in de chaos van twaalfhonderd jurken. Geen klant bekijkt namelijk al die producten, dus moeten we er in vijf minuten achter komen welke jurk de klant wil. Dat begint met een clusteranalyse, oftewel met behulp van een algoritme data indelen in groepen op basis van uiterlijke kenmerken.” 

Deep learning 

Een tweede methode om de juiste jurk bij de juiste klant te krijgen is deep learning. Momenteel zijn het nog vooral grote bedrijven als Facebook en Google die deep learning toepassen, omdat er ongelooflijk veel data voor nodig zijn. Maar er is een trucje. Deep learning is gebaseerd op biologische neurale netwerken. Deze netwerken werken met een verzameling van verschillende lagen: neuronen.

“Elke stap haalt informatie uit de vorige stap en bouwt zo op hiërarchische wijze kennis op. Die kennis wordt steeds concreter: van pixels naar het herkennen van het concept ‘gezicht’ tot het herkennen van een specifiek kattengezicht.” 

Multi armed bandits

Wanneer iemand voor het eerst jouw webshop bezoekt heb je nog geen benul van zijn of haar smaak. Het enige wat we dan redelijkerwijs kunnen zeggen is dat ieder cluster evenveel kans heeft. Dus moeten we leren exploiteren wat we al weten. Dat is het derde algoritme in de jurkjes-case: multi armed bandits. Het vertelt je het volgende: als je webshop twintig keer bezocht wordt, welke clusters maken de meeste kans om in de smaak te vallen en bekeken te worden? Clusters die een grotere kans hebben te winnen op basis van meer verzamelde data, komen sneller naar voren.

“Op basis van beperkte data de juiste jurk bij de juiste klant krijgen voor een zo hoog mogelijke conversie, dat is het werk van een data scientist in een notendop.”

Churnmethode: welke klant stapt naar de concurrent? 

Wessel Luijben is lead data science en deep learning expert bij Anchormen. Hij vertelt meer over de churnmethode: “De churnmethode helpt je bij het opsporen van klanten die willen overstappen naar de concurrent. Belangrijkste reden om naar de churnrate te kijken is geld. Als je weet welke klanten naar de concurrent willen stappen, kun je daarop inspelen.”

Een goed churnmodel bouw je op basis van drie belangrijke stappen: aanwezige data inzichtelijk maken, beginnen met een simpel model en je performance analyseren. Op basis van die analyse verbeter je je model en keer je terug naar de eerste stap. Voor dit proces heb je goede data scientists nodig.

Churn in de praktijk

“Stel, er is klantdata beschikbaar en je wilt weten welke klant gaat ‘ontsnappen’. Je begint dan met een simpel model: op welke regiocodes zijn de meest trouwe klanten te vinden? Loyaliteit meet je bijvoorbeeld op basis van de hoeveelheid aankopen. Op basis van die twee inputs bereken je een coëfficiënt van de kans dat iemand overstapt naar de concurrent. Wie een hoog coëfficiënt heeft, moet aandacht krijgen. Vervolgens kijk je in hoeveel gevallen het geselecteerde algoritme de juiste voorspelling deed.”

Door deze stappencyclus te herhalen leer je steeds beter welke attributen belangrijk zijn. In eerste instantie zijn dat de regiocode (je ziet meteen van welke gebieden je nog geen data hebt, tijd om op zoek te gaan!) en transaction count. Verder heb je vooral veel onbruikbare data, maar hoe vaker je de cyclus herhaalt des te meer manieren je vindt om de data naar jouw voordeel te gebruiken.

De laatste stap: wanneer interpreteer je data als een zekere ja of nee? Je wilt een mate van zekerheid, je wilt weten of je je algoritmes kunt vertrouwen in de praktijk en de data kunt gebruiken om je aandacht inderdaad op specifieke klanten te gaan focussen. Dat doe je door decision rules op te stellen, die je natuurlijk weer opstelt op basis van een herhaling van stappen. Dat is churn in een notendop.

De negende editie van Data Donderdag werd mede-mogelijk gemaakt door Anchormen en GoDataDriven. Een volledig verslag is te bekijken via de website. De volgende editie (#10) staat gepland op 19 november 2015, dit keer in de Beurs van Berlage Amsterdam. Meld je aan via de meetup of bekijk onze vernieuwde website waar we tijdens elk evenement een live blog en streaming uitzenden.

Credits afbeelding: Justgrimes, licentie: CC BY (Commercieel hergebruik, inclusief aanpassing)

Delen

0
1


Er zijn 2 reacties op dit artikel

  • Dank voor je verslag, Rutger.

    De stelling 'Omdat een data scientist en een marketeer niet goed met elkaar kunnen praten', en de logisch daaruit voortvloeiende conclusie 'mensen nodig die deze twee personen aan elkaar kunnen koppelen in het multidisciplinaire team (...)' vind ik persoonlijk wat zwart/wit en boud.

    Het is juist zaak voor marketeers (ook in B2B) om veel beter data-gedreven te worden en juist aan te sluiten bij de taal van de data scientist. De juiste opleidingen (juist ook online), hands-on ervaring via bijvoorbeeld Google Analytics of marketingautomatisering en zelfstudie zijn daarin van grote waarde.

    geplaatst op
  • bedankt voor je uitgebreide interessante verslag. Ik kon er vandaag niet bij zijn maar dit maakt een hoop goed

    geplaatst op

Plaats zelf een reactie

Log in zodat je (in het vervolg) nóg sneller kunt reageren

Vul jouw naam in.
Vul jouw e-mailadres in. Vul een geldig e-mailadres in.
Vul jouw reactie in.

Herhaal de tekens die je ziet in de afbeelding hieronder


Let op: je reactie blijft voor altijd staan. We verwijderen deze dus later niet als je op zoek bent naar een nieuwe werkgever (of schoonmoeder). Reacties die beledigend zijn of zelfpromotioneel daarentegen, verwijderen we maar al te graag. Door te reageren ga je akkoord met onze voorwaarden.