Hoe kloon je een stem?

Met de snelle opkomst van AI komen er ongeveer dagelijks nieuwe toepassingen bij - ook binnen de wereld van audio.

19 juni 2023, 14:30 4212 x gelezen

Ik experimenteerde met het klonen van een stem. En ik reflecteer (een beetje) op wat dit gaat betekenen voor de toekomst van podcasting en audio.

Acapela

Sinds ongeveer een maand kun je bij Acapela Group kosteloos je stem laten klonen. Dit Europese bedrijf bestaat al zo’n 30 jaar en ondersteunt vooral mensen die door bijvoorbeeld een ziekte niet meer in staat zijn om zelf te spreken. Om een synthetische stem te maken, was er altijd veel data nodig – oftewel: spraakopnames. Gemiddeld kostte het zo’n 8 uur om een stem op de juiste manier te trainen. Een groot contrast met de tijd die er nu nodig is, namelijk niet meer dan zo’n 10 minuten. Wat ook bijzonder is, is het enorme aantal beschikbare talen – inclusief Nederlands en Belgisch Nederlands. 

Het proces van klonen is vrij eenvoudig: je krijgt op een website zo’n 50 willekeurige Nederlandse zinnetjes voorgeschoteld die je moet inspreken. Vervolgens duurt het zo’n 24 uur voor je bericht krijgt dat je gekloonde stem klaarstaat. 

Het gebruiken van deze stem is eenvoudig. Je schrijft een tekstje dat naar spraak omgezet moet worden, waarna het vervolgens wordt uitgesproken. Ik deed er een testje mee en nam het resultaat op in een korte podcast, waarbij je ook mijn niet gekloonde stem hoort – ter vergelijking. Je kunt het beluisteren op SoundCloud. 

Wondercraft.ai 

Misschien nog wel meer bijzonder dan bovenstaande is Wondercraft.ai. Hiermee kun je bijna à la minute een podcast genereren, mét je eigen stem. Vooralsnog in een beperkt aantal talen; niet in het Nederlands, maar wel in het Engels. Daarbij is het ook niet gratis ,op een 7-daagse trial na. 

Om je stem te klonen, heeft deze tool genoeg aan een goede, bestaande opname. Ik heb dus een oude stemopname van zo’n 2 minuten gepakt en die geüpload. Daarna doorloop je op de site een aantal stappen, waarbij je in een paar stappen een nieuwe podcast genereert. 

In die stappen geef je de podcast onder meer een titel en omschrijf je waar het over gaat. Bij deze test nam ik voor de omschrijving van de inhoud een stukje tekst van zo’n 100 woorden van de Airborne-website, over ‘The future is audio’. Op basis hiervan gaat Wondercraft aan de slag met de preproductie van de podcast: het maakt een script, inclusief keurig intro en outro, en het zoekt de juiste muziek uit voor de soundtrack. 

Als maker kun je op dit punt eventueel nog delen in de tekst aanpassen of bijvoorbeeld andere muziek kiezen. Wanneer je tevreden bent met de gemaakte keuzes, kun je de audio laten genereren. Het resultaat vonden wij verbazingwekkend goed, zeker gezien de minimale input. Oordeel vooral ook zelf:

En nu?

Worden podcast binnenkort op deze manier massaal gegenereerd, met minimale inspanning en gekloonde stemmen? Het zal alles te maken hebben met het soort podcast. Een grappig tweegesprek tussen BN’ers of een complexe storytelling podcast is echt nog niet zomaar met AI te genereren. Nog los van het feit of we dat überhaupt zouden willen: wie wil er luisteren naar een persoonlijk verhaal, verteld door een synthetische stem en gegenereerd door AI? Maar podcasts waarin het gaat om feitelijke informatie, daarbij kunnen dit soort toepassingen een grote rol spelen.

Het maken van dagelijkse nieuwspodcast wordt daarmee bijvoorbeeld veel makkelijker én goedkoper.  te experimenteren met ‘audio as a service’ en er ervaring mee op te doen, zetten wij vanuit Airborne samen met Marketingfacts de beste longreads om in audio – voor iedereen die liever luisterend dan lezend vakkennis tot zich neemt. En wij zijn ervan overtuigd dat dit nog maar het begin is. 

Marvin Jacobs
Founder bij Airborne

Marvin is mede-oprichter van Airborne, dat sinds 2018 bestaat. Als Creative Director zet hij zijn expertise op het gebied van audio en podcasts in voor het vertellen van aansprekende merkverhalen. Hij publiceert in vak- en lifestyle-titels en spreekt geregeld op congressen over de ontwikkelingen binnen het audiolandschap

Categorie

Marketingfacts. Elke dag vers. Mis niks!