Il nuovo modello di AI di Ai di Alibaba Modello di Ai stabilisce i record open source | Intelligenza-Artificiale

Il team Qwen di Alibaba ha appena rilasciato una nuova versione del loro modello di AI di ragionamento open source con alcuni benchmark impressionanti.

Incontra QWEN3-235B-A22B-Pentinaio-2507. Negli ultimi tre mesi, il team di Qwen è stato al lavoro su ciò che chiamano la “capacità di pensiero” della loro intelligenza artificiale, con l'obiettivo di migliorare sia la qualità che la profondità del ragionamento.

Il risultato dei loro sforzi è un modello che eccelle nelle cose davvero difficili: ragionamento logico, matematica complessa, problemi scientifici e codifica avanzata. In queste aree che in genere richiedono un esperto umano, questo nuovo modello Qwen sta ora stabilendo lo standard per i modelli open source.

Sui benchmark di ragionamento, l'ultimo modello AI open source di Qwen raggiunge 92.3 su AIME25 e 74.1 su Livecodebench V6 per la codifica. Detiene anche il proprio nei test di capacità più generali, segnando 79,7 su Arena-Hard V2, che misura quanto bene si allinea alle preferenze umane.

I parametri di riferimento del team Alibaba Qwen per il loro ultimo modello di ragionamento AI di AI di AI di Qwen3-235B-A22B-25b-257.

Al centro, questo è un enorme modello di AI di ragionamento del team Qwen con 235 miliardi di parametri in totale. Tuttavia, utilizza la miscela di esperti (MOE), il che significa che attiva solo una frazione di quei parametri-circa 22 miliardi-in qualsiasi momento. Pensaci come avere una grande squadra di 128 specialisti di chiamata, ma vengono portati solo gli otto più adatti per un compito specifico per lavorare su di esso.

Forse una delle sue caratteristiche più impressionanti è la sua memoria enorme. Il modello AI di ragionamento open source di Qwen ha una lunghezza del contesto nativa di 262.144 token; Un enorme vantaggio per le attività che comportano la comprensione di grandi quantità di informazioni.

Per gli sviluppatori e gli armeggiatori là fuori, il team Qwen ha reso facile iniziare. Il modello è disponibile su Abbracciare la faccia. È possibile distribuirlo utilizzando strumenti come SGLANG o VLLM per creare il tuo endpoint API. Il team indica anche il loro framework Qwen-agent come il modo migliore per utilizzare le capacità di calcio degli strumenti del modello.

Per ottenere le migliori prestazioni dal loro modello di ragionamento AI open source, il team Qwen ha condiviso alcuni suggerimenti. Suggeriscono una durata di produzione di circa 32.768 token per la maggior parte dei compiti, ma per sfide davvero complesse, dovresti aumentarlo a 81.920 token per dare all'IA abbastanza spazio per “pensare”. Consigliano inoltre di dare alle istruzioni specifiche del modello nel tuo prompt, come chiedergli di “ragionare passo per passo” per i problemi di matematica, per ottenere le risposte più accurate e ben strutturate.

Il rilascio di questo nuovo modello Qwen fornisce un ragionamento potente ma open source che può competere con alcuni dei migliori modelli proprietari là fuori, specialmente quando si tratta di compiti complessi e pieni di cervello. Sarà emozionante vedere ciò che gli sviluppatori alla fine costruiscono con esso.

(Immagine di Tung Lam)

Vedi anche: Piano d'azione AI: la leadership degli Stati Uniti deve essere “incontrastata”

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com