Una nuova intelligenza artificiale open source chiamata OpenVoice offre la clonazione vocale con velocità e precisione senza precedenti.
Sviluppato dai ricercatori del MIT, della Tsinghua University e della startup canadese MyShell, OpenVoice utilizza solo pochi secondi di audio per clonare una voce e consente un controllo granulare su tono, emozione, accento, ritmo e altro ancora.
MyShell ha presentato OpenVoice in un post questa settimana, collegandosi a una ricerca pre-recensita carta spiegando la tecnologia e siti demo su MyShell e HuggingFace dove gli utenti possono provarla.
I modelli Dual AI consentono la clonazione vocale istantanea
OpenVoice comprende due modelli di intelligenza artificiale che lavorano insieme per la conversione da testo a voce e la clonazione del tono vocale.
Il primo modello gestisce lo stile linguistico, gli accenti, le emozioni e altri modelli di discorso. È stato addestrato su 30.000 campioni audio con diverse emozioni provenienti da persone di lingua inglese, cinese e giapponese. Il secondo modello di “convertitore di tono” ha imparato da oltre 300.000 campioni che comprendono 20.000 voci.
Combinando il modello vocale universale con un campione vocale fornito dall’utente, OpenVoice può clonare le voci con pochissimi dati. Ciò aiuta a generare parlato clonato molto più velocemente rispetto ad alternative come Voicebox di Meta.
Startup canadese
OpenVoice proviene dalla startup MyShell con sede a Calgary, fondata nel 2023. Con 5,6 milioni di dollari di finanziamenti iniziali e già oltre 400.000 utenti, MyShell si presenta come una piattaforma decentralizzata per la creazione e la scoperta di app AI.
Oltre alla pionieristica clonazione vocale istantanea, MyShell offre personalità chatbot originali basate su testo, generatori di meme, giochi di ruolo testuali creati dagli utenti e altro ancora. Alcuni contenuti sono bloccati dietro un canone di abbonamento. L’azienda addebita inoltre ai creatori di bot la promozione dei propri bot sulla sua piattaforma.
Rendendo open source le sue capacità di clonazione vocale Abbracciare il viso mentre monetizza il suo ecosistema di app più ampio, MyShell è in grado di aumentare gli utenti in entrambi i settori, promuovendo allo stesso tempo un modello aperto di sviluppo dell’intelligenza artificiale.
(Fotografato da Claus Grünstäudl SU Unsplash)
Guarda anche: AI & Big Data Expo: massimizzare il valore dei flussi di dati in tempo reale
Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è co-localizzato con Settimana della trasformazione digitale.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com