
Alla conferenza Apsara di Hangzhou, ospitata da Alibaba Cloud, le startup AI della Cina hanno sottolineato i loro sforzi per sviluppare grandi modelli linguistici.
Gli sforzi delle società seguono il Annuncio degli ultimi LLM di Openaicompreso il modello di trasformatore pre-addestrato generativo O1 supportato da Microsoft. Il modello ha lo scopo di affrontare compiti difficili, aprendo la strada ai progressi nella scienza, alla programmazione e alla matematica.
Durante la conferenza, Kunal Zhilin, fondatore di Moonshot AI, ha sottolineato l'importanza del modello O1, aggiungendo che ha il potenziale per rimodellare vari settori e creare nuove opportunità per le startup AI.
Zhilin ha dichiarato che l'apprendimento e la scalabilità del rinforzo potrebbero essere fondamentali per lo sviluppo dell'IA. Ha parlato della legge sul ridimensionamento, che afferma che i modelli più grandi con più dati di formazione funzionano meglio.
“Questo approccio spinge il soffitto delle capacità di intelligenza artificiale”, ha detto Zhilin, aggiungendo che Openai O1 ha il potenziale per interrompere i settori e generare nuove opportunità per le startup.
Openai ha anche sottolineato la capacità del modello di risolvere problemi complessi, che secondo lui opera in modo simile al pensiero umano. Raffinando le sue strategie e apprendendo dagli errori, il modello migliora le sue capacità di risoluzione dei problemi.
Zhilin ha affermato che le aziende con abbastanza potere informatico saranno in grado di innovare non solo negli algoritmi, ma anche nei modelli di AI di base. Vede questo come fondamentale, poiché gli ingegneri di intelligenza artificiale si affidano sempre più all'apprendimento del rinforzo per generare nuovi dati dopo aver esaurito le fonti di dati organiche disponibili.
Il CEO di Stepfun Jiang Daxin ha concordato con Zhilin ma ha dichiarato che il potere computazionale rimane una grande sfida per molte start-up, in particolare a causa delle restrizioni commerciali statunitensi che ostacolano l'accesso delle imprese cinesi a semiconduttori avanzati.
“I requisiti computazionali sono ancora sostanziali”, ha affermato Daxin.
Un addetto ai lavori di Baichuan AI ha affermato che solo un piccolo gruppo di start-up cinesi AI-tra cui Moonshot AI, Baichuan AI, Zhipu AI e Minimax-sono in grado di effettuare investimenti su larga scala nell'apprendimento del rinforzo. Queste società – collettivamente indicate come “Tigri di AI” – sono coinvolte pesantemente nello sviluppo di LLM, spingendo la prossima generazione di AI.
Altro dalla conferenza Apsara
Sempre alla conferenza, Alibaba Cloud ha fatto diversi annunci, tra cui il rilascio della sua famiglia Model Qwen 2.5, che presenta progressi nella codifica e nella matematica. I modelli vanno da 0,5 miliardi a 72 miliardi di parametri e supportano circa 29 lingue, tra cui cinese, inglese, francese e spagnolo.
Modelli specializzati come Qwen2.5-coder e Qwen2.5-Math hanno già guadagnato una certa trazione, con oltre 40 milioni di download su piattaforme che abbracciano il viso e i modelli.
Alibaba Cloud ha aggiunto al suo portafoglio di prodotti, offrendo un modello di testo a video nel suo generatore di immagini, Tongyi Wanxiang. Il modello può creare video in stili realistici e animati, con possibili usi nella pubblicità e nel cinema.
Alibaba Cloud ha presentato Qwen 2-VL, l'ultima versione del suo modello di linguaggio della visione. Gestisce i video più lunghi di 20 minuti, supporta l'annullamento delle domande basate su video ed è ottimizzato per dispositivi mobili e robotica.
Per ulteriori informazioni sulla conferenza, fare clic Qui.
(Foto di: @Guy_ai_wise Via x)

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.
Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.
Fonte: www.artificialintelligence-news.com