È stata rilasciata Stable Audio 2.0, l’ultima versione del generatore di testo-musica di Stability AI, che consente agli utenti di creare tracce audio più lunghe. La nuova versione raddoppia la durata massima del suo predecessore, consentendo la generazione di brani che possono durare fino a tre minuti. Questo aggiornamento arriva dopo il lancio iniziale di Stable Audio nel settembre 2023, che era limitato alla generazione di clip audio di soli 90 secondi.
Stable Audio 2.0 utilizza un’architettura a diffusione latente che consente agli utenti di controllare il contenuto e la durata dell’audio generato specificando le richieste di testo e la durata desiderata. Il modello sottostante è stato addestrato utilizzando la musica e i metadati di AudioSparx, un’importante libreria musicale, in collaborazione con Stability AI. Stable Audio 2.0 dispone anche di una funzione di generazione da audio ad audio, che consente agli utenti di manipolare qualsiasi campione audio utilizzando i suggerimenti dell’IA basati sul testo.
La qualità della musica creata dall’intelligenza artificiale di Stable Audio 2.0 ha suscitato dibattiti: alcune parti della canzone generata sono state descritte come degne di una playlist, mentre altre assomigliano a “suoni di balena”. Gli utenti hanno la possibilità di personalizzare i loro progetti regolando la forza del prompt e controllando la quantità di audio caricato che verrà alterata. È inoltre possibile aggiungere effetti sonori come il tifo della folla o i clic della tastiera.
Stability AI si è unita ad Audible Magic per utilizzare la sua tecnologia di riconoscimento dei contenuti per monitorare e impedire il caricamento di materiale protetto da copyright sulla piattaforma. Per prevenire le violazioni del copyright, Stability AI si è anche assicurata che tutti i musicisti che hanno creato le opere nella libreria AudioSparx abbiano avuto la possibilità di scegliere di non essere utilizzati per addestrare il modello di Stable Audio.
Stable Audio 2.0 è disponibile gratuitamente sul sito web di Stable Audio e sarà presto disponibile su Stable Audio API.