MindTheChart.io
Blocco Tasto Destro e Protezione Immagini Blocco Tasto Destro e Protezione Immagini

💾 **Nvidia lancia Fugatto: il futuro dell'audio generato dall'intelligenza artificiale**

💾
**Nvidia lancia Fugatto: il futuro dell'audio generato dall'intelligenza artificiale**

Giorno: 26 novembre 2024 | Ora: 01:19

Nvidia Sviluppa un Nuovo Modello di Intelligenza Artificiale per la Creazione di Audio

Nvidia ha recentemente annunciato un innovativo modello di intelligenza artificiale chiamato Fugatto, progettato per generare effetti sonori e modificare la pronuncia umana. Questo progetto di ricerca potrebbe avere un impatto significativo su vari settori, dalla musica all'intrattenimento e ai servizi di traduzione.

Cosa è Fugatto?

Fugatto, acronimo di Foundational Generative Audio Transformer Opus 1, è un modello avanzato che permette di generare audio a partire da istruzioni in linguaggio naturale. Nvidia ha chiarito che non ci sono piani attuali per rilasciare questa tecnologia, ma le sue potenzialità sono straordinarie. Bryan Catanzaro, vicepresidente della ricerca in deep learning di Nvidia, ha dichiarato che il modello offre la possibilità di richiedere suoni specifici, aprendo così a nuove applicazioni creative.

Funzionalità del Modello

Catanzaro ha sottolineato che, a differenza di altri modelli presenti sul mercato che possono solo sintetizzare la voce o aggiungere effetti musicali, Fugatto combina entrambe le funzionalità. Questo modello può essere considerato un complemento ai modelli di generazione video e immagine, come Stable Video Diffusion di Stability AI o Sora di OpenAI. La sua innovazione principale è la capacità di generare audio partendo da semplici testi, nonché di elaborare file audio già esistenti.

Applicazioni Pratiche

Con Fugatto, gli utenti possono, ad esempio, tradurre un discorso in un'altra lingua mantenendo la voce originale della persona. Inoltre, è possibile creare un semplice motivo musicale per farlo suonare come un'orchestra o aggiungere diversi ritmi. Gli utenti possono anche caricare documenti e chiedere al modello di leggerli con qualsiasi voce desiderata, inclusa la possibilità di esprimere emozioni nel suono prodotto.

Considerazioni e Sfide

Tuttavia, Catanzaro ha avvertito che il modello non è infallibile e, come accade con altri strumenti di generazione audio e video, ha suscitato preoccupazioni tra artisti, ingegneri del suono e professionisti del settore. Nonostante ciò, l'auspicio di Catanzaro è che questa tecnologia possa fungere da strumento di esplorazione per i musicisti. "Spero che diventi un nuovo strumento per gli artisti. L'audio è sempre stato un campo di esplorazione proficuo", ha affermato, evidenziando come nuove tecnologie possano portare a forme musicali innovative.