Una nuova era per i geni della matematica dell'intelligenza artificiale

 | Intelligenza-Artificiale

Alibaba Cloud Qwen Il team ha presentato Qwen2-Math, una serie di grandi modelli linguistici appositamente progettati per affrontare complessi problemi matematici.

Questi nuovi modelli, basati sulle fondamenta Qwen2 esistenti, dimostrano una notevole competenza nella risoluzione di sfide aritmetiche e matematiche e superano le prestazioni dei precedenti leader del settore.

Il team di Qwen ha creato Qwen2-Math utilizzando un vasto e diversificato corpus specifico per la matematica. Questo corpus comprende un ricco arazzo di risorse di alta qualità, tra cui testi web, libri, codice, domande d'esame e dati sintetici generati da Qwen2 stesso.

Una valutazione rigorosa su benchmark matematici sia in inglese che in cinese, tra cui GSM8K, Math, MMLU-STEM, CMATH e GaoKao Math, ha rivelato le eccezionali capacità di Qwen2-Math. In particolare, il modello di punta, Qwen2-Math-72B-Instruct, ha superato le prestazioni di modelli proprietari come GPT-4o e Claude 3.5 in vari compiti matematici.

“Qwen2-Math-Instruct raggiunge le migliori prestazioni tra i modelli delle stesse dimensioni, con RM@8 che supera Maj@8, in particolare nei modelli 1.5B e 7B”, ha osservato il team Qwen.

Questa prestazione superiore è attribuita all'efficace implementazione di un modello di ricompensa specifico per la matematica durante il processo di sviluppo.

A dimostrazione della sua abilità, Qwen2-Math ha ottenuto risultati impressionanti in difficili competizioni matematiche come l'American Invitational Mathematics Examination (AIME) 2024 e l'American Mathematics Contest (AMC) 2023.

Per garantire l'integrità del modello e prevenire la contaminazione, il team Qwen ha implementato solidi metodi di decontaminazione sia durante la fase di pre-training che durante quella di post-training. Questo approccio rigoroso ha comportato la rimozione di campioni duplicati e l'identificazione di sovrapposizioni con set di test per mantenere l'accuratezza e l'affidabilità del modello.

Guardando al futuro, il team Qwen ha in programma di espandere le capacità di Qwen2-Math oltre l'inglese, con modelli bilingue e multilingue in cantiere. Questo impegno per l'inclusività mira a rendere la risoluzione avanzata dei problemi matematici accessibile a un pubblico globale.

“Continueremo a migliorare la capacità dei nostri modelli di risolvere problemi matematici complessi e impegnativi”, ha affermato il team di Qwen.

Puoi trovare i modelli Qwen2 su Hugging Face Qui.

Vedi anche: Paige e Microsoft svelano modelli di intelligenza artificiale di nuova generazione per la diagnosi del cancro

Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera AI e Big Data che si svolge ad Amsterdam, California e Londra. L'evento completo è co-localizzato con altri eventi leader tra cui Conferenza sull'automazione intelligente, BloccoX, Settimana della Trasformazione DigitaleE Fiera della sicurezza informatica e del cloud.

Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.

Etichette: io sono, nuvola di Alibaba, intelligenza artificiale, matematica, modelli, donna, qwen2, qwen2-matematica

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *