La strategia AI Agent Chip di Alibaba va oltre Nvidia | Intelligenza-Artificiale

Indice contenuti

Alibaba ha presentato un nuovo processore AI costruito appositamente per gli agenti AI, abbinando l’annuncio del chip a una roadmap pluriennale sul silicio e a un nuovo modello linguistico di grandi dimensioni, segnalando che l’azienda sta costruendo uno stack AI integrato, non solo colmando una lacuna lasciata dai controlli sulle esportazioni statunitensi.

Lo Zhenwu M890, sviluppato dalla filiale di semiconduttori di Alibaba T-Head, offre tre volte le prestazioni del suo predecessore, lo Zhenwu 810E, secondo l’azienda, secondo Reuters rapporto. Ma il salto di prestazioni è meno notevole dell’intento architettonico dietro il chip: l’M890 è costruito appositamente per gli agenti di intelligenza artificiale, dove i sistemi software devono conservare lunghi tratti di contesto, coordinarsi con altri modelli in tempo reale ed eseguire complesse attività in più fasi con un intervento umano limitato.

Tali richieste, che riguardano principalmente la larghezza di banda della memoria e la comunicazione tra modelli, sono significativamente diverse da quelle per cui sono ottimizzati i chip di inferenza standard. La differenza è importante perché ti dice qualcosa su dove Alibaba pensa che stia andando il calcolo dell’intelligenza artificiale. L’azienda non sta progettando in base al caso d’uso dominante di oggi; sta costruendo il profilo del carico di lavoro che prevede definirà l’intelligenza artificiale aziendale nei prossimi anni.

Costruito per gli agenti IA, non solo per l’inferenza

Più significativa del chip stesso è la tabella di marcia che Alibaba ha affiancato ad esso. L’M890 sarà seguito dal V900 nel terzo trimestre del 2027, che dovrebbe fornire un ulteriore incremento prestazionale di circa tre volte, seguito dal J900 nel terzo trimestre del 2028. Si tratta di una cadenza deliberata e sostenuta di aggiornamenti interni del silicio che rispecchia il tipo di cicli di prodotto tick-tock che Nvidia ha utilizzato per mantenere la sua leadership negli acceleratori AI.

Vale la pena notare il parallelo con Huawei. Huawei ha delineato una roadmap simile per i chip per la sua linea Ascend lo scorso anno, ed entrambi gli annunci riflettono la stessa realtà di fondo: le aziende tecnologiche cinesi hanno concluso che dipendere dal silicio straniero, anche in scenari in cui le restrizioni alle esportazioni potrebbero allentarsi, è un rischio strutturale che non possono accettare. La risposta è stata quella di considerare lo sviluppo dei semiconduttori come un esercizio di rafforzamento delle capacità a lungo termine piuttosto che come un problema di approvvigionamento.

L’impegno di Alibaba in questo ambito non è superficiale. L’anno scorso l’azienda ha stanziato più di 380 miliardi di yuan, circa 53 miliardi di dollari, per infrastrutture cloud e intelligenza artificiale in tre anni, il suo più grande impegno di investimento mai realizzato nel settore. L’M890 e i suoi successori sono a valle di tale spesa.

Trazione che precede l’annuncio

T-Head ha affermato di aver spedito più di 560.000 unità Zhenwu fino ad oggi, con oltre 400 clienti esterni in 20 settori che utilizzano i chip, comprese case automobilistiche e società di servizi finanziari. Si tratta di un’impronta di produzione materiale, non di hardware di laboratorio, e fornisce ad Alibaba dati di implementazione nel mondo reale su larga scala prima del lancio dell’M890.

Il nuovo chip sarà disponibile per i clienti aziendali cinesi attraverso Bailian, la piattaforma modello domestico di Alibaba Cloud, racchiuso all’interno del Panjiu AL128, un sistema server che impila 128 acceleratori M890 in un unico rack.

Il lato software dello stack

Oltre all’hardware, Alibaba ha annunciato Qwen 3.7-Max, l’ultima versione del suo modello di punta per grandi linguaggi, descritto come progettato per la codifica avanzata e attività di agente di lunga durata. La società ha affermato che il modello può funzionare ininterrottamente fino a 35 ore senza degrado delle prestazioni, una specifica di capacità che ha senso solo se si progetta per un funzionamento autonomo prolungato.

Il tempismo è intenzionale. Rilasciare un chip e un modello ottimizzati per la stessa classe di carico di lavoro nello stesso giorno è un gioco di piattaforma. Alibaba sta costruendo un circuito chiuso: il proprio silicio in T-Head, il proprio modello in Qwen, la propria fornitura cloud in Bailian. Ciascun componente rafforza gli altri e lo stack combinato è progettato per ridurre la dipendenza dei clienti aziendali da qualsiasi fornitore esterno.

Mezzo milione di chips spedite. Un successore arriverà nel 2027, un altro nel 2028. T-Head non si sta coprendo. Ad un certo punto, costruire attorno ai controlli sulle esportazioni statunitensi smetterà di essere una soluzione alternativa e inizierà a essere una strategia. Alibaba sembra aver oltrepassato quel limite.

(Fonte immagine: La Casa Bianca)

Vedi anche: Alibaba Qwen sta sfidando l’economia del modello di intelligenza artificiale proprietario

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è parte di TechEx e co-localizzato con altri importanti eventi tecnologici. Clic Qui per ulteriori informazioni

AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.

Fonte: www.artificialintelligence-news.com

Categorie

Costruito per gli agenti IA, non solo per l’inferenza

Trazione che precede l’annuncio

Il lato software dello stack

Lascia un commento Annulla risposta

Articoli Correlati

Ultimi post