Come Moonshot AI ha battuto GPT-5 e Claude a una frazione del costo

 | Intelligenza-Artificiale

Una startup cinese di intelligenza artificiale, Moonshot, ha sconvolto le aspettative nello sviluppo dell’intelligenza artificiale dopo che il suo modello Kimi K2 Thinking ha superato il GPT-5 di OpenAI e il Claude Sonnet 4.5 di Anthropic su più parametri di riferimento delle prestazioni, innescando un rinnovato dibattito sulla questione se il dominio americano dell’intelligenza artificiale sia messo in discussione dall’innovazione cinese economicamente efficiente.

Moonshot AI, con sede a Pechino, valutata 3,3 miliardi di dollari e sostenuta dai giganti della tecnologia Alibaba Group Holding e Tencent Holdings, ha rilasciato il modello open source Kimi K2 Thinking il 6 novembre, realizzando quello che gli osservatori del settore chiamano un altro “Momento di ricerca profonda” – un riferimento alla precedente interruzione delle ipotesi sui costi dell’IA da parte della startup con sede a Hangzhou.

I parametri di performance mettono alla prova i modelli statunitensi

Secondo il blog GitHub dell’azienda inviareKimi K2 Thinking ha ottenuto il 44,9% al Humanity’s Last Exam, un ampio benchmark di modelli linguistici composto da 2.500 domande su un’ampia gamma di argomenti, superando il 41,7% di GPT-5.

Il modello ha inoltre ottenuto il 60,2% nel benchmark SfogliaComp, che valuta la competenza nella navigazione web e la persistenza nella ricerca di informazioni da parte di agenti di modelli linguistici di grandi dimensioni, e ha ottenuto il 56,3% per primeggiare nel benchmark Seal-0 progettato per sfidare i modelli potenziati dalla ricerca su query di ricerca del mondo reale.

VentureBeat riportato che il rilascio completamente open-weight che raggiunge o supera i punteggi del GPT-5 segna un punto di svolta in cui il divario tra i sistemi a frontiera chiusa e i modelli disponibili al pubblico è effettivamente crollato per il ragionamento e la codifica di fascia alta.

L’efficienza dei costi solleva interrogativi

La popolarità del modello è cresciuta dopo che la CNBC ha riferito che il suo costo di formazione era di soli 4,6 milioni di dollari, sebbene Moonshot AI non abbia commentato il costo. Secondo i calcoli dell’ Posta del mattino della Cina meridionaleil costo dell’interfaccia di programmazione dell’applicazione di Kimi K2 Thinking era da sei a dieci volte più economico di quello dei modelli OpenAI e Anthropic.

Il modello utilizza un’architettura Mixture-of-Experts con un trilione di parametri totali, di cui 32 miliardi attivati ​​per inferenza, ed è stato addestrato utilizzando la quantizzazione INT4 per ottenere un miglioramento della velocità di generazione di circa due volte mantenendo prestazioni all’avanguardia.

Thomas Wolf, cofondatore di Hugging Face, commentato su X che Kimi K2 Thinking era un altro caso di un modello open source che supera un modello closed source, chiedendo: “È un altro momento di DeepSeek? Dovremmo aspettarci (uno) ogni due mesi adesso?”

Capacità tecniche e limitazioni

Ricercatori di intelligenza artificiale Moonshot disse Kimi K2 Thinking ha stabilito “nuovi record attraverso benchmark che valutano il ragionamento, la codifica e le capacità degli agenti”. Il modello può eseguire fino a 200-300 chiamate sequenziali di strumenti senza interferenza umana, ragionando in modo coerente su centinaia di passaggi per risolvere problemi complessi.

Test indipendenti condotti dalla società di consulenza Artificial Analysis hanno posizionato Kimi K2 al top del suo benchmark per agenti Tau-2 Bench Telecom con una precisione del 93%, che era descritto come il punteggio più alto misurato in modo indipendente.

Tuttavia, Nathan Lambert, ricercatore presso l’Allen Institute for AI, ha suggerito che c’è ancora un ritardo di circa quattro-sei mesi nelle prestazioni grezze tra i migliori modelli chiusi e aperti, anche se lui riconosciuto che i laboratori cinesi si stanno avvicinando e stanno ottenendo ottimi risultati rispetto ai parametri di riferimento chiave.

Implicazioni di mercato e pressione competitiva

Zhang Ruiwang, un architetto di sistemi informatici con sede a Pechino, ha affermato che la tendenza delle aziende cinesi è quella di contenere i costi, spiegando: “La performance complessiva dei modelli cinesi è ancora in ritardo rispetto ai migliori modelli statunitensi, quindi devono competere in termini di rapporto costo-efficacia per avere una via d’uscita”.

Zhang Yi, capo analista della società di consulenza iiMedia, ha affermato che i costi di formazione dei modelli di intelligenza artificiale cinesi stanno registrando un “calo vertiginoso” guidato dall’innovazione nell’architettura del modello e nella tecnica di formazione e dall’input di dati di formazione di qualità, segnando un allontanamento dall’accumulo di risorse informatiche nei primi giorni.

Il modello è stato rilasciato sotto una licenza MIT modificata che garantisce pieni diritti commerciali e derivati, con una restrizione: distributori che servono oltre 100 milioni di utenti attivi mensili o generando oltre 20 milioni di dollari al mese di fatturato devono mostrare in modo ben visibile la dicitura “Kimi K2” sull’interfaccia utente del prodotto.

Risposta del settore e prospettive future

Deedy Das, partner della società di venture capital Menlo Ventures in fase iniziale, ha scritto in un post su X che “Oggi è un punto di svolta nell’intelligenza artificiale. Un modello open source cinese è il numero 1. Momento fondamentale nell’intelligenza artificiale”.

Nathan Lambert ha scritto in un articolo di Substack che il successo degli sviluppatori cinesi di intelligenza artificiale open source, tra cui Moonshot AI e DeepSeek, ha mostrato come “hanno fatto sudare i laboratori chiusi”, aggiungendo “C’è una forte pressione sui prezzi e aspettative che (gli sviluppatori statunitensi) devono gestire”.

Il rilascio posiziona Moonshot AI accanto ad altre società cinesi di intelligenza artificiale come DeepSeek, Qwen e Baichuan che stanno sfidando sempre più la narrativa della supremazia americana dell’IA attraverso innovazioni economicamente vantaggiose e strategie di sviluppo open source.

Resta da vedere se ciò rappresenti un vantaggio competitivo sostenibile o una convergenza temporanea delle capacità, poiché sia ​​le aziende statunitensi che quelle cinesi continuano a far avanzare i loro modelli.

la natura pubblica delle dichiarazioni e la reazione del mercato suggeriscono che presto potrebbero essere avviate discussioni sostanziali.

Il panorama dei chip AI sta entrando in un periodo di cambiamento. Le organizzazioni dovrebbero mantenere la flessibilità nella loro strategia infrastrutturale e monitorare come partnership come Tesla-Intel potrebbero rimodellare le dinamiche competitive della produzione di hardware AI.

Le decisioni prese oggi sulle partnership per la produzione di chip potrebbero determinare quali organizzazioni avranno accesso a un’infrastruttura IA economicamente vantaggiosa e ad alte prestazioni nei prossimi anni.

Foto di IA lunare)

Vedi anche: L’interruzione di DeepSeek: l’innovazione cinese dell’intelligenza artificiale riduce il divario tecnologico globale

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. Questo evento completo fa parte di TechEx e co-localizzato con altri importanti eventi tecnologici. Clic Qui per ulteriori informazioni

AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *