Is jouw stem nog wel jouw stem?

21 februari 2018, 07:00

Lyrebird kon op basis van 30 zinnen mijn gehele stem reproduceren

Kunstmatige intelligentie, of artificial intelligence (AI), heeft betrekking op apparaten die voorgeprogrammeerd zijn om op data of impulsen uit de omgeving te reageren. Ze maken op basis daarvan zelfstandig beslissingen. Het gaat bij AI niet om de rekenkracht, maar om de mogelijkheid zelfstandig te leren en beslissingen te laten nemen door machines. Het vakgebied zit de laatste jaren in een flinke stroomversnelling en dat heeft geresulteerd in allerlei interessante experimenten. Tot op heden zag ik eindeloze mogelijkheden op het gebied van AI. De voordelen wogen zwaarder dan de nadelen. Tot aan gisteren! Toen schrok ik mij kapot.

“I’m increasingly inclined to think that there should be some regulatory oversight, maybe at the national and international level, just to make sure that we don’t do something very foolish. I mean with artificial intelligence we’re summoning the demon.” (Elon Musk)

Met de komst van de Algemene Verordening Gegevensbescherming (AVG) worden de termen data-privacy en data-ethics steeds vaker gebruikt. Heb jij als data-producent op dit moment nog wel iets te zeggen over jouw privacy? Hierbij denken we vaak aan ‘traditionele’ data, namelijk cijfertjes en getallen. Het recente AI-project van Lyrebird.ai (eerste publieke bèta) zette mij stevig aan het denken over data in de vorm van audio. Lyrebird maakt het mogelijk om binnen enkele minuten een stem te reproduceren op basis van 30 zinnen input. Hieronder het door AI gegenereerde voorbeeld van Donald Trump.

Luister het fragment hier: https://lyrebird.ai/g/hB2yarx-

De techniek bevindt zich nu in de eerste publieke beta-fase en de ontwikkeling is ongoing. Het meest verbazingwekkende aan de reproductie van Trump (ook Obama’s stem is te beluisteren), is dat het volledig op basis van oude uitspraken van Trump is gegenereerd. Geheel zonder zijn toestemming. De mogelijkheden zijn dus eindeloos, ook in ethisch opzicht. Nederland is namelijk één van de landen waar in beginsel een mondelinge overeenkomst (ook telefonisch) rechtsgeldig kan zijn. Dit geeft stof tot nadenken in hoeverre de huidige wetgeving bestemd is tegen dergelijke technologieën.

Luister het fragment hier: https://lyrebird.ai/g/Wbt3UHVr​

Domo arigato, Mr. Roboto

In plaats van één stem afhankelijk te creëren, worden alle stemmen samen gecreëerd. Des te meer stemmen er gecreëerd worden, des te makkelijker het wordt voor Lyrebird om een nieuwe stem te creëren. Natuurlijk heb ik de tool zelf ook geprobeerd. De resultaten met een relatief slechte microfoon binnen één minuut zijn al behoorlijk goed te noemen. Hoe meer zinnen je inspreekt en hoe beter de microfoon die je gebruikt om de input te gebruiken, hoe minder robotachtig je stem klinkt.

Ik heb de noodzakelijke input geleverd (30 zinnen) met een matige microfoon. Het resultaat:

Luister het fragment hier: https://lyrebird.ai/g/Am3GlyiB

Moeten we al bang worden?

Op het moment nog niet. Toch ontwikkelt machine-learning zich razendsnel en kan het volgend jaar ineens compleet anders zijn. Waar we wel waakzaam voor moeten zijn, is dat er nog geen technieken beschikbaar zijn om ‘echte’ audio te onderscheiden van ‘fake’ audio. Dus marketeers die producten of diensten online verkopen en stem als verificatie gebruiken, moeten toch serieus hun verificatie onder de loep gaan nemen. Ook customer service via de telefoon zal toch echt methodieken moeten gaan vinden om te achterhalen of de persoon aan de andere kant van de lijn wel echt de persoon is die hij zegt dat hij is. Nieuwe technieken ontwikkelen zich razendsnel en deze ontwikkelingen maken het mogelijk dat wij onze identiteit of persoonlijkheid ‘kwijt’ kunnen raken.

Ik blijf natuurlijk positief over deze spannende ontwikkelingen. Desondanks houd ik deze technieken de komende tijd wél nauwlettend in de gaten. Voor nu ga ik ga eerst maar eens een pizza bestellen met mijn ‘eigen’ stem via Lyrebird.

Dit artikel is gezamenlijk geschreven samen met Mick Bakker.

Thijs Mensink
Founder & Digital Strategy Director at kemari.digital bij Kemari

Thijs Mensink is misschien wel de belichaming van de term ‘vakidioot’, met grote passie voor brandingstrategie en conceptontwikkeling. Kan niet bestaat niet in zijn optiek en 'Stay hungry, stay foolish' is zijn motto. Thijs is iemand die altijd de grens opzoekt en er (soms) ook graag even overheen gaat. Een eigenschap waar hij uiteraard gebruik van maakt in zijn huidige functie als creatief strateeg. Momenteel is hij actief in zijn eigen agency Sticky Bandits.

Categorie
Tags

1 Reactie

    Peter

    Wordt leuk met dat andere programma wat je hoofd op een pornoster zet.


    21 februari 2018 om 15:30

Marketingfacts. Elke dag vers. Mis niks!