Kan Twitter de verkiezingsuitslag beter voorspellen dan Maurice de Hond?
Tien jaar geleden leek het voorspellen van de verkiezingsuitslag op basis van sociale media in staat om de traditionele peilingen te verslaan. Sindsdien zijn de resultaten wisselend.
Recent bleek, dat het tot nu toe niemand gelukt is om een model te ontwikkelen waarmee de verkiezingen keer op keer goed voorspeld kunnen worden. Blijven we overgeleverd aan Maurice de Hond en de zijnen met enquêtes en opiniepanels?
Het lijkt een voor de hand liggend idee: de verkiezingen voorspellen met sociale media. Op sociale media uiten mensen spontaan hun gevoelens en voorkeuren. De manier waarop mensen op sociale media over politieke partijen praten (positief of negatief) en de mate waarin, zou dus een graadmeter kunnen zijn over de populariteit van een partij. Bij elke verkiezingen is er wel iemand die een poging waagt, ook het team achter Marketingfacts. Ik schreef hierover op mijn eigen blog in 2021 en in 2012.
De wijsheid van sociale media
In de wetenschappelijke literatuur waren sinds 2010 analyses van sociale media in opkomst. Sociale media leken een bron van kennis en je kon er griepgolven, nationaal geluk en onrust mee voorspellen en nog veel meer. Destijds deed ik veel onderzoek naar de wisdom of crowds en schreef over de wijsheid van Twitter en later zelfs over het voorspellen van de toekomst met sociale media en blockchain.
In 2012 maakten diverse partijen sociale media analyses over de Nederlandse Tweede Kamerverkiezingen en zij kwamen zeer dicht in de buurt van de opiniepeilingen van bureaus als Ipsos, TNS NIPO en Maurice de Hond. Met een beetje positieve bril waren ze zelfs iets beter.
Taal- en spraakonderzoekers Eric Sanders deed het destijds behoorlijk goed met een relatief eenvoudig model dat keek naar het aantal keren dat een landelijke politieke partij in tweets werden genoemd op Twitter. Dit bleek een aardige voorspelling van de uitslag op te leveren. Eric besloot hier verder aan te werken en startte een promotieonderzoek dat hij begin dit jaar afrondde. (Download hier ‘Vox Populi. On forecasting elections with Twitter’, E Sanders, 2023).
Een volwaardig model ontwikkelen
De onderzoeker deed in die tien jaar van alles om zijn aanvankelijk eenvoudige model te verbeteren en tegemoet te komen aan kritieken. Zo maakte hij op basis van taalgebruik en woordcombinaties een inschatting van het geslacht en de leeftijd van een twitteraar om zo te kunnen corrigeren voor de representativiteit en door met weegfactoren uiteindelijk de Nederlandse bevolking na te bootsen. Andere demografische gegevens zoals sociale achtergrond, opleidingsniveau, inkomen en achtergrondzijn echter niet (goed) te achterhalen terwijl deze een belangrijke rol spelen bij politieke voorkeuren.
Tevens verbeterde hij de analyses door niet alleen naar het aantal tweets te kijken maar ook naar het sentiment (positief en negatief) en rekening te houden met humor en sarcasme.
Na tien jaar onderzoek (en vijf verkiezingen van Tweede Kamer en Provinciale Staten, in resp. 2012, 2017 en 2011, 2015 en 2019) constateert Sanders dat het niet mogelijk is om een model te ontwikkelen dat de uitslag van de (Nederlandse) verkiezingen keer op keer kan voorspellen op basis van Twitter. Wel kun je achteraf redelijk goed een reconstructie maken en achterhalen welke tweets (en achterliggende parameters) op welke manier van invloed lijken te zijn geweest.
Zo gaat het meestal bij de ‘wisdom of crowds’, een kwestie van ‘er naartoe redeneren’ met de kennis van achteraf, dan kun je zien welke factoren je hoe zwaar moet meewegen. Maar vervolgens lukt het niet daarmee de volgende verkiezing te voorspellen.
Daarom kunnen we sociale media peilingen voorlopig geen volwaardig alternatief noemen voor de traditionele peilingen en moeten we uiterst kritisch zijn wanneer zo’n peiling achteraf bezien goed uitvalt.
De ‘wisdom of crowds’ is verloren gegaan
Maar wat is er gebeurd? De technologie is weliswaar slimmer geworden omdat die steeds beter in staat is om taal te begrijpen en dus ook het gebruik van synoniemen, ironie en context. Volgens Eric Sanders lijkt het erop dat de ‘ruis’ op Twitter de afgelopen tien jaar is toegenomen. Wellicht hangt dat samen met de verkiezingscampagnes die steeds beter weten in te spelen op sociale media. Sociale media zijn de afgelopen jaren steeds meer vervuild geraakt door campagnes, haat, onzin en door nepnieuws.
Bovendien blijken media, ook de sociale, steeds meer echokamers te zijn van (de wekelijkse traditionele) opiniepeilingen. De wijsheid die sociale media hadden, door via ‘spontaniteit’ de stemvoorkeur te kunnen peilen is daarbij verloren gegaan.
In het buitenland zijn enkele succesjes geboekt met voorspellingen op basis van sociale media. Daarbij ging het echter vrijwel in alle gevallen om een duidelijk gepolariseerd speelveld met twee kampen: ‘voor’ of ‘tegen’ of ‘kandidaat A’ of B. Een stuk overzichtelijker dan het Nederlandse landschap met 18 partijen. Toch ging het bij Brexit en Trump evengoed mis (ook bij de traditionele peilers). Google gaf aan de weg te zijn kwijtgeraakt door de ‘eigen waarheden’ die door beide kampen met even groot fanatisme werden verspreid.
Laten we bij Trump niet vergeten dat, net als bij eerdere presidentsverkiezingen, het verschil tussen de ene en de andere kandidaat uiterst klein was. Trump won nipt en verloor jaren later nipt. En wie herinnert zich nog Al Gore? Dit kan gemakkelijk in de onnauwkeurigheidsmarges van een peiling vallen.
Overgeleverd aan Maurice de Hond?
Met meer inzicht in de sociale status en achtergronden van de gebruikers (kiezers) zou de representativiteit nog wat verder kunnen worden verbeterd. Ook door naast Twitter andere media te betrekken, waar minder polariserende discussies plaatsvinden en andere kiezersgroepen aanwezig zijn. Dit werd gedaan bij een ‘peiling’ via sociale media in 2021.
Verder zou het helpen als veel meer onderzoekers en commerciële (marketing)bureaus zich storten op sociale mediapeilingen. Dat zou niet alleen gezonde concurrentie opleveren maar ook versnelling kunnen opleveren in de ontwikkeling van modellen. Bovendien zijn bureaus en websites die meerdere peilingen combineren of middelen, succesvol geweest, zoals de Nederlandse Peilingwijzer en FiveThirtyEight in de Verenigde Staten.
Wat is de waarde van social media analyse voor jouw bedrijf?
De magere verkiezingspeilingen zetten ook aan het denken over wat de (voorspellende) waarde is van het analyseren van sociale media, een bedrijfstak die enorm gegroeid is. Hoe zeer laat je als bedrijf je beslissingen afhangen van de sociale media analyses? Aanvullende manieren om je klanten of de markt te leren kennen blijven noodzakelijk. Ook ‘old school’ enquêtes met hun eigen beperkingen, blijken zo gek nog niet, leren we van Ipsos, Het 1Vandaag Opiniepanel en Maurice de Hond.