Guido Budziak leidt een promotieonderzoek aan de Universiteit Eindhoven naar ‘data driven decision making with web analytics’. Een belangrijk onderdeel van het onderzoek richt zich op het inzichtelijk maken van Multichannel attributie met als doel hier bewust op te kunnen ‘sturen’ en optimaliseren. Op basis van zijn eerste onderzoekservaringen heeft Guido een blog geschreven voor Marketingfacts.
Guido is senior business consultant bij Adversitement, rondde de opleiding Technische informatica af aan de Technische Universiteit Eindhoven en heeft als professioneel voetballer [keeper] onder andere gespeeld bij PSV, Top Oss en Roda JC.
Opkomst van Web analytics
Het internet, zoals het beginjaren ’90 is vormgegeven door sir Tim Berners Lee (CERN), is nooit ontworpen met de intentie online bezoekersgedrag te analyseren en begrijpen. En toch dateren de eerste web analytics pakketten al uit medio jaren ’90. Server log data met daarin de registratie van de kliks gaf de mogelijkheid om klikpaden inzichtelijk te maken. Al snel kwam de tekortkoming van server log analyse aan het licht en kwamen er speciale web analytics pakketten op basis van een zogenaamde client-side oplossing. Dit betekende dat de data werd verzameld op basis van een meetpixel (ook wel beacon genaamd) dat rechtstreeks vanuit de browser van de internetbezoeker werd verstuurd. De belangrijkste toepassing lag op het vlak van online marketing. Hits en page views werden al snel van ondergeschikt belang; het ging om conversies uit campagnes zoals search en display advertising. Binnen nagenoeg ieder pakket vormt het rapporteren op campagnes ook één van de belangrijkste functionaliteiten.
Conversie attributie
De rapporten lieten de prestaties van campagnes zien op basis van de zogenaamde ‘last credit attribution’ (in de marketing volksmond ook wel ‘last cookie counts’ genoemd). Hierbij wordt de conversie toegewezen aan de laatste campagne waarop een bezoeker heeft geklikt, voordat de conversie daadwerkelijk plaatsvindt. Hierbij is het overigens zaak de kliks die tot campagnes behoren op de juiste manier te voorzien van een ‘campagne stempel’ zodat de web analytics software dit kenmerk detecteert en de juiste boekhouding voert. Met de veelvoud aan campagnes en het feit dat mensen vaak op meerdere campagnes klikken voordat ze converteren drong zich (terecht) de vraag op of het ‘last credit attribution’ principe niet te rigide was. Worden de overige campagnes op het conversiepad van een bezoeker hiermee geen onrecht aangedaan?
Multichannel attributie
Dit gaf aanleiding tot alternatieve attribution modellen, zoals ‘first credit attribution’ en ‘weighted credit attribution’. Meer geavanceerde methoden zoals percentages die op basis van het totaal aantal voorkomens worden berekend zijn inmiddels ook gemeengoed. In alle gevallen zijn dit evaluaties op basis van zogenaamde source-centric measures; de performance van een individuele campagne bron wordt geëvalueerd. De praktijk laat zien dat de campagnes een zelf organiserend netwerk vormen. Er is sprake van interactie doordat web bezoekers meerdere campagnebronnen aanklikken. Het aantal en de combinatie verschilt per bezoeker. Google heeft in Google Analytics inmiddels een module beschikbaar waarin deze campagne paden worden gevisualiseerd. Dit is een fraaie aanvulling op de functionaliteit die tot nu beschikbaar was in de meeste web analytics software pakketten: rijen en kolommen met cijfers. De vraag is echter hoe effectief dergelijke pad-rapportages zijn. De top-10 meest voorkomende paden is goed voor 30%-40% van de conversies: de overige paden (=longtail) zijn minstens zo interessant om te begrijpen en optimaliseren. Maar het bestuderen hiervan wordt al snel een onoverzichtelijke opgave (stel slechts 10 campagne bronnen zoals ‘seach organic’, ‘paid search’ , ‘display’ met een gemiddelde padlengte van 2 campagne kliks per bezoeker; dan zijn er in theorie al 10x10=100 unieke paden mogelijk).
Bovendien is het evalueren van paden geen doel op zich. Het gaat erom inzicht te verkrijgen in de prestaties van campagnes om een (her)verdeling van het budget te bepalen. Hierbij is het van belang de interactie tussen de campagnes goed te begrijpen. Onvoorzichtig omspringen bij het reduceren van het budget voor een campagne bron kan leiden tot ‘collateral damage’ doordat deze bron een cruciale rol (zoals die van ‘broker’) in het campagnenetwerk vormt. Het is dus zaak de rol van iedere campagne bron goed in te schatten. Om dit te kunnen doen zijn methoden uit netwerk analyse noodzakelijk; dit model wordt uitgelegd tijdens Emerce eDay op 15 september 2011 (om 15.15 uur).
Gericht handelen en optimaliseren
Allereerst zal het netwerk bepaald (=automatisch geëxtraheerd) moeten worden uit de grote hoeveelheden klikdata. Daarna moeten de individuele prestatie en de rol van een campagne geëvalueerd worden. Een belangrijk aspect aan het toepassen van netwerk analyse binnen campagne evaluatie is dat het mogelijk wordt om berekeningen uit te laten voeren op basis van de onderlinge relaties tussen campagnes. Daarnaast kan er een analyse worden gemaakt van het campagnenetwerk in zijn geheel. Deze inzichten maken het mogelijk om de belangrijke vervolgstap te zetten: welke budgetten moeten verhoogd/verlaagd worden en welke effecten zijn hierbij te verwachten? Dit maakt web analytics data actionable.
Om een vergelijk te geven: de bestaande attribution modellen en campagne evaluatie methoden dienen als thermometer. Pad visualisatie kun je hierbij zien als het maken van een beter leesbare schaalverdeling.
Wat online marketing echt nodig heeft is een meet- en regelsysteem. Een systeem dat op basis van de ‘temperatuur’ concrete acties kan ondernemen om de temperatuur te verhogen of verlagen. Dan hebben we het dus over een thermostaat. Het onderzoek gaat verder in op de manier waarop deze thermostaat geconstrueerd wordt.