Auteurs: Jasper Vis en Frank Stokman
Media Innovation Hub test: Udio
Udio is een muziek AI-tool die je in staat stelt om op basis van een prompt, nummers in een genre van je voorkeur te genereren.
Impact
★★★★★
Indrukwekkend! Wat fijn is aan Udio is dat het je in staat stelt om snel muziek te genereren. Resultaatgericht werken kan soms nog lastig zijn, omdat de prompt nogal bepalend is voor het eindresultaat en de interpretatie van jouw prompt door de AI daarbij een grote rol speelt.
Gebruiksvriendelijkheid
★★★★★
Kenmerkend voor Udio is de eenvoud in gebruik door een heldere interface. De output, ook qua audiokwaliteit is bijzonder goed. De vrijheid die de variabelen geven om invloed te hebben op het eindresultaat, in het bijzonder de Manual mode, zijn erg fijn. Verwacht als gebruiker vrij snel resultaat; zeker als je veel experimenteert en kijkt naar hoe andere gebruikers hun prompt hebben opgebouwd.
Prijsstelling
★★★★★
Qua kosten valt het allemaal erg mee en de gratis versie biedt al heel veel opties.
Stormachtige ontwikkeling
Tegenwoordig veelvuldig in het nieuws; muziek-AI’s, waarmee je een eigen muzieknummer kunt creëren. Instrumentaal of met zang, inclusief de uitgeschreven songtekst. Wie denkt dat het gebruik van AI’s slechte muziek oplevert, zal positief verrast zijn. Want niet alleen de geluidskwaliteit, maar ook de composities zijn ‘oorstrelend’. We betrappen onszelf erop moeite te hebben met het onderscheiden van door AI gerealiseerde muziek en ‘echte’ nummers. Het levert zelfs al kleine hitjes op. Niet echt onze smaak, maar oordeel zelf:
Is het gebruik van muziek-AI’s moeilijk en complex? Zeker niet! In dit artikel leggen we je uit hoe je zelf eenvoudig aan de slag kunt gaan met de tool Udio.
Udio, opgericht door enkele ‘bright minds’ achter Google’s DeepMind, is sinds kort op de markt en maakt een stormachtige ontwikkeling door. Niet alleen door de nieuwe features die constant worden geïntegreerd, maar ook door alle aandacht die dit platform heeft gekregen zo vlak na haar release. Wie begint te spelen met Udio is gewaarschuwd: je bent de rest van de dag kwijt. Wat een lol kun je beleven aan het maken van muziek op zo’n eenvoudige manier.
Testen in de praktijk
We testen met de gratis variant van Udio, zodat lezers eenzelfde ervaring kunnen hebben. Zij die honger hebben naar meer kunnen beter een standaard abonnement nemen. Voor een eerste kennismaking met dit platform, raden we aan om de meest basic versie van Udio te gebruiken. Die kun je vinden op de ‘Home’ pagina. Voer op basis van een prompt een muziekstijl in, geef eventueel aan waar het nummer over moet gaan en klik op ‘Create’.
Udio geeft je nu twee gegenereerde nummers op basis van jouw input. Dit kan even duren, zeker wanneer je de gratis variant gebruikt, dus heb geduld. Soms lijken de nummers op elkaar en soms verschillen ze en komen ze alleen overeen op basis van enkele nuances zoals een riff, een stem of tekst. Download vervolgens jouw nummer eenvoudig als audiobestand.
Tip: Browse eens door het aanbod en luister ook eens naar de ‘Staff Picks’ en de trending nummers. Dit voor het opdoen van inspiratie en om te leren welke prompts anderen hebben ingegeven om tot een bepaald resultaat te komen.
Nieuwe en verbeterde features
Zoals we al eerder aan hebben gegeven, is er sinds de eerste release van Udio alweer veel veranderd. Alles in de wereld van AI gaat immers snel. Belangrijkste verbeteringen van de nieuwste release zijn:
- Verbeterde audiokwaliteit met model 1.5 ten opzichte van model 1.0;
- De mogelijkheid om stem separation toe te passen;
- Langere nummers tot 2 minuten zijn mogelijk met het Udio-130 model;De mogelijkheid om een audiobestand als basis in te geven aan de AI die daar vervolgens een ‘remix’ van maakt. Handig als je een interpretatie van eigen werk wilt krijgen van de AI.
Stem separation verdient nog even wat uitleg. Dit biedt namelijk de mogelijkheid om individuele instrumenten zoals drums, maar ook vocalen te separeren van de rest en als apart bestand te downloaden. Handig als je de uitkomst van Udio weer als samples wilt gebruiken voor je eigen Digital Audio Workstation-software (DAW).
Advances features
In de interface is het mogelijk om meer te sturen op een bepaald eindresultaat. De belangrijkste bespreken we hieronder.
Met de handmatige modus (manual mode) kan je het model direct input geven zonder dat het model de door jou ingegeven prompt herschrijft. Standaard herschrijft het systeem namelijk je prompts om de gemiddelde uitvoerkwaliteit te verbeteren. Als je dus op zoek bent naar specifieke geluiden en rechtstreeks met het model wilt communiceren, dan raden we je aan de handmatige modus te gebruiken.
De Advanced features geven een behoorlijk aantal instellingen die veel invloed kunnen hebben op het resultaat:
- Prompt strength: Hiermee kun je aangeven in welke mate de prompt van invloed is op je resultaat. Deze staat standaard op 50%. Geef je een hogere waarde in, dan kan dat van invloed zijn op de kwaliteit van je eindresultaat.
- Lyrics strength: Hoe lager de waarde, des te natuurlijker het geluid. Alleen kan het dan zijn dat een deel van jouw lyrics wordt genegeerd.
- Seed: Alleen van belang als je in manual mode werkt. In dat geval betekent het dat als je hier dezelfde waarde houdt, je een soortgelijke uitkomst krijgt uit het systeem met weinig variatie. Leuk om mee te spelen. Wanneer je niet in manual mode werkt, wordt dit genegeerd en krijg je een willekeurige output.
- Clip Timing: Hier geef je aan waar je wil dat de door jou gegenereerde audio moet beginnen in het verloop van het nummer en waar deze eindigt. Kan handig zijn als je werkt met de song extension feature. Daar zou je bijvoorbeeld willen dat de extension begint in het midden of juist aan het eind van je nummer.
- Lyric Timing: Deze functie geeft aan waar in jouw nummer de lyrics beginnen. Soms handig als je zoekt naar een lang muzikaal intro en dan pas de vocals wil instarten.
- Clarity (model 1.5 feature): Dit geeft aan in welke mate je wil dat je de individuele instrumenten van elkaar kunt onderscheiden. Hogere waarden kunnen leiden tot een rare mix.
- Generation Quality: Experimentele functie, maar wel van belang. Snel genereren levert mindere kwaliteit op. Op Ultra heb je de hoogste kwaliteit, maar deze duurt het langst. In onze test duurde het genereren van 2 minuten audio op Ultra-kwaliteit slechts 3.30 minuten. Indien je je nummer in een later stadium nog verder wil bewerken, zouden wij altijd voor de hoogste kwaliteit gaan.
Lyrics
Hierbij heb je de keuze uit:
- Custom: Je kunt je eigen lyrics invoegen. Handig als je het door jou geschreven teksten alleen van muziek en melodie wilt laten voorzien
- Instrumentaal
- Auto generated: Udio creëert de lyrics voor je
Tip: Probeer op basis van dezelfde prompt andere instellingen te proberen. Prompting betekent veel experimenteren om tot het gewenste resultaat te komen.
Hoe slim is Udio?
En dan de proef op de som. Laten we eens kijken hoe slim de AI nu daadwerkelijk is. Ter inspiratie, dit is wat de componist Rachmaninov ooit heeft geschreven en wat geroemd wordt als het mooiste pianoconcert ooit:
Het resultaat is toch wel erg goed te noemen. Beide gegenereerde audiobestanden hebben duidelijk de piano als leidende factor. Het lijkt in de stijl te zijn van Rachmaninov, al is bij het tweede audiobestand de toevoeging van een viool beduidend minder; althans niet in de stijl van. En dat maakt het systeem van Udio handig. Door te kiezen voor de juiste variant zijn we in staat om verder te itereren op onze keuze.
En daar komt Extension om de hoek kijken. De Extension functionaliteit geeft je de mogelijkheid om een stuk voor of na je huidige audiobestand te genereren of op een door jou aangegeven plek in het bestand. Hiermee kun je dus langere nummers maken.
Zo was het toevoegen van een outro een fluitje van een cent en klinkt het ook echt als een outro. Ook hier weer twee varianten, dus weer keuze. En zo hebben we de mogelijkheid om een audiobestand van oorspronkelijk 32 seconden uit te bouwen naar enkele minuten.
De gratis te gebruiken versie van Udio heeft beperkte features en is gelimiteerd in het aantal credits (10) dat je per dag mag spenderen. Elke generatie van 32 seconden audio kost je bij Udio 2 credits, twee minuten audio kost je 4 credits. Je krijgt hiervoor twee varianten als audio geleverd. Je hebt geen prioriteit bij de generatie van audio en het maximum te besteden credits is 100 per maand.
Leuk voor een eerste kennismaking, maar indien je meer functies wilt gebruiken, dan heb je voor €12,- per maand een standaard abonnement met 1200 credits, geen daglimiet en tevens toegang tot de volgende features:
- Stem downloads (zie stem seperation)
- Toegang tot Udio-130 2-min model (al lukte het ons om dit gewoon te gebruiken)
- Toegang tot de Audio upload feature als basis voor de AI om een muziekstuk te genereren met de door jou geuploade audio
- Geen dag limiet
- Prioriteit op de wachtrij voor audio processing
- Tot 3 gelijktijdige audio generatie processen (6 nummers)
- Inpainting, custom Cover art en meer
Het Pro account biedt 4800 credits voor €36,- per maand en meer gelijktijdige generatieve processen ten opzichte van het standaard abonnement. Losse credits kopen kan ook, maar dat is eigenlijk onvoordelig ten opzichte van een abonnement.
Tip: Gratis credits verdienen? Rechtsboven in het menu vind je de optie “Earn credits”. Hier kan je tot maximaal 10 credits per dag verdienen door te luisteren naar twee nummers en de beste te selecteren.
Inspiratie of plagiaat?
De grootste discussie en de daarmee gepaard gaande rechtszaken, gaan over hoe AI is getraind. Want een model dient getraind te worden en dat kan alleen op basis van reeds bestaande muziek. Dus hoe weet een AI-model hoe Eminem klinkt? Door naar Eminem te luisteren. Valt dat onder inspiratie, zoals wij mensen ook naar Eminem luisteren, of is het plagiaat? Een grijs gebied met een hoop haken en ogen.
De opkomst van technologie gaat altijd gepaard met weerstand, voornamelijk uit de hoek van de gevestigde orde. In dit geval bekende artiesten en de grote labels. Zij zien nieuwe muziek ontstaan wat wellicht is gebaseerd op door hen uitgebracht werk. Het is heel gemakkelijk om iets te laten genereren ‘in de stijl van’. Het klinkt vaak nog verbazingwekkend goed ook. Kijk even naar dit voorbeeld van vorig jaar:
En dat is de voornaamste reden dat bekende artiesten in het verweer komen: zij zien dat hun broodwinning gevaar loopt. Als tegenmaatregel staat de huidige prompt functionaliteit van de diverse Muziek-AI’s het overigens al niet meer toe om de namen van bekende artiesten in te geven. Daarnaast is het volgens de gebruikersvoorwaarden niet toegestaan om het werk van anderen of delen daarvan te uploaden als inspiratie.
Alle gegenereerde audio output uit Udio is daarentegen volledig jouw eigendom en mag als zodanig gebruikt worden, althans volgens de voorwaarden. Want welke spelregels gelden hier eigenlijk? We vroegen media-advocaat Gaico Bos om dit kort toe te lichten:
“De ontwikkelingen op het gebied van AI gaan razendsnel. Ontwikkelingen van wetten en regels gaan daarentegen juist tergend langzaam. Dit betekent dat AI-ontwikkelingen in de “mal” van bestaande wetten en regels gegoten moeten worden. Hieronder vallen bijvoorbeeld de grenzen tussen ‘inspiratie’ en ‘plagiaat’. Deze grenzen zullen opnieuw moeten worden ontwikkeld in het licht van AI-ontwikkelingen. Hoe dit zal aflopen is niet gemakkelijk te voorspellen. Wat wel duidelijk is, is dat er vele rechtszaken zullen volgen. Totdat deze nieuwe regels zijn uitgekristalliseerd, zullen we het moeten doen met de bestaande regels over bijvoorbeeld auteursrechten. Ook bij het maken van een muziek met behulp van een app zoals Udio.
Auteursrecht gaat over creatieve creaties van personen. Of een AI-creatie gemaakt door een app als Udio daaronder valt, is overigens maar de vraag. De rechtssystemen van veel landen vereisen voor auteursrechten dat er een vorm van een creatieve persoonlijk stempel van de “maker” is te herkennen. Het is in dat geval dus niet voldoende dat een AI-programma gewoon zelf iets creëert; er moet creatieve input van een mens aan te pas zijn gekomen. Uit de weinige jurisprudentie die er tot nu toe is over AI-creaties, blijkt dat een eenvoudige ‘prompt’ waarschijnlijk niet voldoende is om te spreken van de vereiste creatieve input.
Als er geen sprake is van persoonlijke creatieve input, kan het resultaat zijn dat originele muziek gemaakt door een app als Udio niet auteursrechtelijk beschermd is. Deze muziek is dan in wezen qua auteursrechten ‘rechten-vrij’. Iedereen kan het kopiëren of zelf uitbrengen.
De oplossing is om de door een app als Udio gemaakte muziek creatief te bewerken. Als die (na)bewerking voldoende creatief is, kunnen er wel auteursrechten rusten op de gemaakte muziek. Je kunt dan ook anderen verbieden om deze muziek te kopiëren of uit te brengen.
Een ander belangrijk aandachtspunt is dat je bij generatieve AI-toepassingen zoals Udio niet precies kunt weten of het gegenereerde resultaat niet (te) veel lijkt op een bestaand werk. Omdat bij een claim van plagiaat de ‘bewijslast’ kan omkeren, kan dit grote gevolgen hebben. Deze omkering van bewijslast houdt in dat niet degene die een claim neerlegt moet aantonen dat de muziek is gekopieerd, maar dat jij moet aantonen dat het werk niet is gekopieerd.
Het probleem daarbij is dat je bij generatieve AI-toepassingen zoals Udio, niet helemaal in de hand hebt of de gemaakte muziek niet te veel lijkt op bestaande muziek. Je kunt wel goed vastleggen welke muziek je uploadt en welke prompts je hebt gebruikt, maar je hebt geen controle over het materiaal waarop de AI-toepassing werd getraind. Het kan zijn dat de muziek die je maakt met een tool als Udio te veel lijkt op bestaande muziek, ook al was dat helemaal niet de bedoeling."
Conclusie
We hebben genoten van alle prachtige creaties, zelfs van de mindere nummers. Lag dit aan ons of begreep de AI in sommige gevallen niet wat we wilden? We hebben vrij veel audiobestanden gegenereerd en zeker te veel om met jullie te delen.
Conclusie is in ieder geval dat Udio legio mogelijkheden biedt; zeker ook als inspiratie voor bestaande artiesten. De mogelijkheid om bijvoorbeeld audiobestanden van individuele instrumenten te kunnen downloaden, zorgt ervoor dat je dit weer kan hergebruiken in een nieuwe eigen compositie. Het is mogelijk om in vele muziekstijlen nieuwe en unieke content te genereren. Van EDM tot jazz, van klassiek naar keiharde bunker techno. Niet alles is even goed en deels ook nog aan smaak onderhevig. Qua audiokwaliteit zijn de muziek AI’s sterk vooruitgegaan, waardoor het onderscheiden tussen echt en nep steeds lastiger wordt.
We beseffen dat deze nieuwe technologie impact kan hebben op sommige mensen, maar we zien ook dat het veel kansen biedt. Toch blijven wij geloven dat de mens onvervangbaar is in het creatieve proces. AI is getraind op bestaand werk en de kracht van mensen is juist om iets nieuws te bedenken of het anders te doen. We zullen altijd naar optredens blijven gaan om muziek in het ‘echt’ te beleven. Daar kan geen AI tegenop.
De rechtenkwestie zal nog wel even voortslepen, maar dat muziek AI een blijvertje is, lijkt meer dan logisch. En dat levert ongetwijfeld weer nieuwe creativiteit op.