La Cina può eguagliare le GPU AI di Nvidia?

 | Intelligenza-Artificiale

La strategia di stacking dei chip sta emergendo come la risposta innovativa della Cina alle restrizioni statunitensi sui semiconduttori, ma questo approccio può davvero colmare il divario prestazionale con le GPU avanzate di Nvidia? Mentre Washington stringe controlli sulle esportazioni Sulla tecnologia all’avanguardia per la produzione di chip, i ricercatori cinesi stanno proponendo una soluzione audace: impilare insieme i chip più vecchi, producibili a livello nazionale, per eguagliare le prestazioni dei chip a cui non possono più accedere.

Il concetto centrale: costruire verso l’alto invece che in avanti

La strategia di impilamento dei chip si basa su una premessa apparentemente semplice: se non puoi realizzare chip più avanzati, crea sistemi più intelligenti con i chip che puoi produrre. Wei Shaojun, vicepresidente della China Semiconductor Industry Association e professore all’Università di Tsinghua, ha recentemente illustrato al Posta del mattino della Cina meridionale un’architettura che combina chip logici da 14 nanometri con DRAM da 18 nanometri utilizzando il collegamento ibrido tridimensionale.

Ciò è importante perché i controlli sulle esportazioni statunitensi mirano specificamente alla produzione di chip logici a 14 nm e inferiori e di DRAM a 18 nm e inferiori. La proposta di Wei funziona proprio a questi confini tecnologici, utilizzando processi che rimangono accessibili ai produttori cinesi.

L’approccio tecnico prevede il cosiddetto “calcolo quasi-memoria definito dal software”. Invece di spostare i dati avanti e indietro tra processori e memoria – un grave collo di bottiglia nei carichi di lavoro dell’intelligenza artificiale – la strategia di stacking dei chip li colloca in stretta prossimità attraverso lo stacking verticale.

La tecnica di incollaggio ibrido 3D crea connessioni dirette rame-rame con passi inferiori a 10 micrometri, eliminando sostanzialmente la distanza fisica che rallenta le architetture dei chip convenzionali.

Le affermazioni sulle prestazioni e il controllo della realtà

Wei sostiene che questa configurazione potrebbe competere con le GPU da 4 nm di Nvidia riducendo significativamente i costi e il consumo energetico. Ha citato prestazioni di 2 TFLOPS per watt e un totale di 120 TFLOPS. C’è solo un problema: la GPU A100 di Nvidia, che Wei posiziona come punto di confronto, in realtà fornisce fino a 312 TFLOPS – più di 2,5 volte le prestazioni dichiarate.

La discrepanza evidenzia una domanda sulla fattibilità della strategia di stacking di chip. Sebbene l’innovazione architetturale sia reale, i divari prestazionali rimangono sostanziali. L’impilamento dei chip più vecchi non cancella magicamente i vantaggi dei nodi di processo avanzati, che offrono efficienza energetica superiore, densità di transistor più elevata e migliori caratteristiche termiche.

Perché la Cina scommette su questo approccio

La logica strategica alla base della strategia di stacking dei chip va oltre i puri parametri prestazionali. Il fondatore di Huawei, Ren Zhengfei, ha articolato la filosofia di ottenere “prestazioni all’avanguardia impilando e raggruppando i chip” piuttosto che competere nodo per nodo.” Ciò rappresenta un cambiamento nel modo in cui la Cina affronta la sfida dei semiconduttori.

Considera le alternative. TSMC e Samsung stanno spingendo verso processi a 3 e 2 nm che rimangono completamente fuori dalla portata dei produttori cinesi. Invece di combattere una battaglia impossibile da vincere per la leadership dei nodi di processo, la strategia di stacking dei chip propone invece di competere sull’architettura di sistema e sull’ottimizzazione del software.

C’è anche il problema CUDA. Il dominio di Nvidia nell’informatica basata sull’intelligenza artificiale non si basa solo sull’hardware ma sul suo ecosistema software CUDA. Wei la descrive come una “triplice dipendenza” che abbraccia modelli, architetture ed ecosistemi.

I progettisti di chip cinesi che perseguono le architetture GPU tradizionali dovrebbero replicare le funzionalità di CUDA o convincere gli sviluppatori ad abbandonare una piattaforma matura e ampiamente adottata. La strategia di stacking dei chip, proponendo un paradigma informatico completamente diverso, offre un percorso per eludere questa dipendenza.

La questione della fattibilità

La strategia di impilamento dei chip può davvero funzionare? Le basi tecniche sono solide: il chip stacking 3D è già utilizzato nelle memorie a larghezza di banda elevata e nelle soluzioni di packaging avanzate in tutto il mondo. L’innovazione sta nell’applicazione di queste tecniche per creare architetture informatiche completamente nuove piuttosto che limitarsi a migliorare i progetti esistenti.

Tuttavia, diverse sfide incombono. Innanzitutto, la gestione termica diventa molto più difficile quando si impilano più matrici di lavorazione attive. Il calore generato dai chip da 14 nm è considerevolmente più elevato rispetto ai moderni processi da 4 o 5 nm e lo stacking intensifica il problema.

In secondo luogo, i tassi di resa nell’impilamento 3D sono notoriamente difficili da ottimizzare: un difetto in qualsiasi strato può compromettere l’intera pila. In terzo luogo, l’ecosistema software necessario per utilizzare in modo efficiente tali architetture non esiste ancora e richiederebbe anni per maturare.

La valutazione più realistica è che la strategia di stacking dei chip rappresenta un approccio valido per carichi di lavoro specifici in cui la larghezza di banda della memoria conta più della velocità di calcolo pura. Le attività di inferenza dell’intelligenza artificiale, alcune operazioni di analisi dei dati e le applicazioni specializzate potrebbero potenzialmente trarne vantaggio. Ma eguagliare le prestazioni di Nvidia nell’intero spettro di attività di addestramento e inferenza dell’IA rimane un obiettivo lontano.

Cosa significa per le guerre dei chip AI

L’emergere della strategia di chip stacking come punto focale per lo sviluppo cinese dei semiconduttori segnala un perno strategico. Invece di tentare di replicare i progetti di chip occidentali con nodi di processo inferiori, la Cina sta esplorando alternative architettoniche che sfruttano i punti di forza produttivi disponibili.

Resta incerto se una strategia di chip stacking riesca a colmare il divario prestazionale con Nvidia. Ciò che è chiaro è che l’industria cinese dei semiconduttori si sta adattando alle restrizioni perseguendo l’innovazione in aree in cui i controlli sulle esportazioni hanno un impatto minore: progettazione di sistemi, tecnologia di imballaggio e co-ottimizzazione software-hardware.

Per il settore globale dell’intelligenza artificiale, ciò significa che il panorama competitivo sta diventando più complesso. L’attuale dominio di Nvidia deve affrontare le sfide dei concorrenti tradizionali come AMD e Intel e approcci architetturali completamente nuovi che potrebbero ridefinire l’aspetto di un “chip AI”.

La strategia di chip stacking, qualunque siano i suoi limiti attuali, rappresenta esattamente questo tipo di rottura dell’architettura – e vale la pena osservarla da vicino.

Vedi anche: Il nuovo chip Nvidia Blackwell per la Cina potrebbe superare il modello H20

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è parte di TechEx ed è situato in concomitanza con altri importanti eventi tecnologici, clicca Qui per ulteriori informazioni

AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *