Nvidia mira a risolvere i problemi dell’IA con molte lingue

 | Intelligenza-Artificiale

Mentre l’intelligenza artificiale potrebbe sentirsi onnipresente, opera principalmente in una piccola parte delle 7000 lingue del mondo, lasciando dietro di sé una parte enorme della popolazione globale. Nvidia Mira a correggere questo evidente punto cieco, in particolare in Europa.

La società ha appena pubblicato un nuovo potente set di strumenti open source volti a dare agli sviluppatori il potere di costruire un’intelligenza artificiale di alta qualità per 25 diverse lingue europee. Ciò include le lingue importanti, ma, soprattutto, offre un’ancora di salvezza a quelle spesso trascurate da grandi tecnologie, come croato, estone e maltese.

L’obiettivo è consentire agli sviluppatori di creare il tipo di Strumenti vocali Molti di noi danno per scontato, da chatbot multilingue che ti comprendono effettivamente ai robot del servizio clienti e ai servizi di traduzione che funzionano in un batter d’occhio.

Il fulcro di questa iniziativa è GranaioUn’enorme biblioteca di discorsi umani. Contiene circa un milione di ore di audio, tutte curate per aiutare a insegnare alle sfumature del riconoscimento e della traduzione vocale.

Per utilizzare questi dati vocali, Nvidia fornisce anche due nuovi modelli AI progettati per le attività linguistiche:

  • Canary-1B-V2Un grande modello costruito per un’elevata precisione su complessi lavori di trascrizione e traduzione.
  • PARKEET-TDT-0.6B-V3che è progettato per applicazioni in tempo reale in cui la velocità è tutto.

Se sei desideroso di immergerti nella scienza dietro di esso, il carta sul granaio Sarà presentato alla Conferenza InterSpeech nei Paesi Bassi questo mese. Per gli sviluppatori desiderosi di sporcarsi le mani, il set di dati e entrambi i modelli sono già disponibili per abbracciare la faccia.

La vera magia, tuttavia, sta nel modo in cui sono stati creati questi dati. Sappiamo tutti che la formazione Ai richiede vaste quantità di datiMa di solito è un processo lento, costoso e francamente noioso di annotazione umana.

Per aggirare questo, il team di AI del discorso di Nvidia – lavorando con ricercatori di Carnegie Mellon University E Bruno Kessler Foundation – Costruito una pipeline automatizzata. Usando il proprio Nemo Toolkit, sono stati in grado di prendere audio grezzo e senza etichetta e di frustarlo in dati strutturati di alta qualità e da cui un’intelligenza artificiale può imparare.

Questo non è solo un risultato tecnico; È un grande salto per l’inclusività digitale. Significa che uno sviluppatore a Riga o Zagabria può finalmente costruire strumenti di intelligenza artificiale a propulsione vocale che comprendano correttamente le loro lingue locali. E possono farlo in modo più efficiente. Il team di ricerca ha scoperto che i loro dati di granaio sono così efficaci che ci vuole circa la metà della quantità per raggiungere un livello di precisione target rispetto ad altri set di dati popolari.

I due nuovi modelli dimostrano questo potere. Canary è francamente una bestia, che offre traduzione e qualità della trascrizione che rivaleggia su modelli tre volte le sue dimensioni, ma con un massimo di dieci volte la velocità. Parakeet, nel frattempo, può masticare una registrazione di incontri di 24 minuti in una volta, capire automaticamente quale lingua si parla. Entrambi i modelli sono abbastanza intelligenti da gestire la punteggiatura, la capitalizzazione e fornire timestamp a livello di parole, necessari per la costruzione di applicazioni di livello professionale.

Mettendo questi potenti strumenti e i metodi dietro di loro nelle mani del globale comunità degli sviluppatoriNvidia non sta solo rilasciando un prodotto. Sta dando il via a una nuova ondata di innovazione, sperando di creare un mondo in cui l’IA parla la tua lingua, non importa da dove vieni.

(Foto di Eedrian Salazar)

Vedi anche: DeepSeek Ritorna a Nvidia per il modello R2 dopo che Huawei AI Chip non è riuscito

Vuoi saperne di più sull’intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L’evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *