Lo hanno svelato i ricercatori di Meta Senza soluzione di continuitàM4Tun modello pionieristico multilingue e multitasking che facilita la traduzione e la trascrizione senza soluzione di continuità sia nel parlato che nel testo.
Internet, i dispositivi mobili, i social media e le piattaforme di comunicazione hanno inaugurato un’era in cui l’accesso ai contenuti multilingue ha raggiunto livelli senza precedenti. SeamlessM4T mira a realizzare la visione di una comunicazione e comprensione senza soluzione di continuità tra le lingue.
Vantando una gamma impressionante di funzionalità, SeamlessM4T comprende:
- Riconoscimento vocale automatico per quasi 100 lingue
- Traduzione da parlato a testo supporta quasi 100 lingue di input e output
- Traduzione da parlato a parlato per quasi 100 lingue di input e 35 lingue di output (incluso l’inglese).
- Traduzione da testo a testo per quasi 100 lingue
- Traduzione da testo a voce per quasi 100 lingue di input e 35 lingue di output (incluso l’inglese).
SeamlessM4T viene reso disponibile a ricercatori e sviluppatori con il nome CC BY-NC 4.0 licenza, incarnando l’etica della scienza aperta.
Inoltre, sono stati rilasciati i metadati di SeamlessAlign, il più grande set di dati di traduzione multimodale mai compilato, costituito da 270.000 ore di parlato e allineamenti di testo estratti. Ciò facilita l’estrazione indipendente dei dati e ulteriori ricerche all’interno della comunità.
Lo sviluppo di SeamlessM4T affronta una sfida di lunga data nel campo della comunicazione multilingue. A differenza dei sistemi precedenti, che erano limitati da una copertura linguistica limitata e dalla dipendenza da sottosistemi separati, SeamlessM4T presenta un modello unificato in grado di gestire in modo completo le attività di traduzione da parlato a parlato e da parlato a testo.
Meta si è basata su innovazioni precedenti, come ad esempio Nessuna lingua lasciata indietro (NLLB) e Traduttore vocale universale – creare questo modello multilingue unificato. Con le sue prestazioni impressionanti su lingue con poche risorse e prestazioni costantemente elevate su lingue con risorse elevate, SeamlessM4T ha il potenziale per rivoluzionare la comunicazione multilingue.
Alla base dell’architettura del modello c’è il modello multitasking UnitY, che eccelle nella generazione di testo e parlato tradotti.
UnitY supporta varie attività di traduzione, tra cui il riconoscimento vocale automatico, la traduzione da testo a testo e la traduzione da parlato a parlato, il tutto da un unico modello. Per addestrare questo modello versatile, Meta ha utilizzato tecniche avanzate come codificatori di testo e parlato, codificatori auto-supervisionati e sofisticati processi di decodifica.
Il risultato è un modello che supera i leader precedenti:
Per garantire l’accuratezza e la sicurezza del sistema, Meta aderisce a un quadro di intelligenza artificiale responsabile.
Meta afferma che sono state condotte ricerche approfondite sulla tossicità e sulla mitigazione dei pregiudizi, che hanno prodotto un modello più consapevole e reattivo ai potenziali problemi. Il rilascio pubblico del modello SeamlessM4T incoraggia la ricerca e lo sviluppo collaborativi nella comunità AI.
Man mano che il mondo diventa sempre più connesso, la capacità di SeamlessM4T di trascendere le barriere linguistiche è una testimonianza della potenza dell’innovazione guidata dall’intelligenza artificiale. Questa pietra miliare ci avvicina a un futuro in cui la comunicazione non conosce limitazioni linguistiche, consentendo un mondo in cui le persone possano veramente capirsi a prescindere dalla lingua.
È possibile trovare una demo di SeamlessM4T Qui. Il codice, il modello e i dati possono essere scaricati su GitHub.
(Credito immagine: MetaIA)
Guarda anche: Lo studio evidenzia l’impatto dei dati demografici sulla formazione dell’IA
Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è co-localizzato con Settimana della trasformazione digitale.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.