DeepSeek Ritorna a Nvidia per il modello R2 dopo che Huawei AI Chip non è riuscito

 | Intelligenza-Artificiale

Il piano di Deepseek di addestrare il suo nuovo modello AI, R2, su Huawei’s Ascendere Chips ha fallito e ha costretto un ritiro a Nvidia, ritardando il lancio.

Per mesi, la narrazione spinta da Pechino è stata di inarrestabile progresso tecnologico e una marcia verso l’autosufficienza. Tuttavia, la realtà ha l’abitudine di mordere. I recenti problemi di Ai Darling cinese Deep -Week è un esempio di libri di testo di dove l’ambizione soddisfa la dura parete delle limitazioni tecniche.

Dopo il successo del suo modello R1 a gennaio, Deepseek si è trovato sotto pressione dalla Cina per difendere la causa nazionale. Secondo tre persone che parlano al Tempi finanziariIl messaggio era chiaro: usa i chip di Huawei, non quello di Nvidia.

Quando si è trattato di addestrare effettivamente il loro nuovo modello R2, le fonti affermano che DeepSeek si è imbattuto in “problemi tecnici persistenti” con le chip AI di Huawei. I problemi erano così fondamentali che il progetto si ferma. Una persona con conoscenza della situazione ha affermato che questo è stato il motivo principale per cui il lancio pianificato da parte del modello a maggio è stato demolito, mettendo la società sul piede posteriore in un mercato che non aspetta nessuno.

Per capire perché questo è un grosso problema, devi sapere la differenza tra formazione e inferenza dell’IA. La formazione è la parte difficile, come l’invio di uno studente all’università per anni di intenso apprendimento. Richiede quantità colossali di potenza e stabilità. L’inferenza è la parte relativamente “facile”, come fare una domanda al laureato.

Deepseek ha scoperto che mentre le patatine di Huawei potrebbero essere pronte per l’esame finale, non erano ancora all’altezza del estenuante corso universitario. La società non aveva altra scelta che tornare ai potenti sistemi di Nvidia per fare la formazione. Le fonti affermano che il team di Deepseek sta ancora cercando di far funzionare il modello R2 con le patatine Huawei per la fase di inferenza meno esigente.

Due persone hanno confermato che Huawei ha persino inviato la propria squadra di ingegneri agli uffici di Deepseek per aiutarli a far funzionare il modello R2 sulle loro chip. Ma anche con gli esperti nella stanza, non sono riusciti a fare una corsa di allenamento di successo.

Parla con chiunque nel settore e ti diranno che questa non è una grande sorpresa. Il CEO di Huawei Ren Zhengfei ha anche detto All’inizio di quest’anno Che gli Stati Uniti “abbiano esagerato i risultati di Huawei” e la società “non è ancora così eccezionale”, notando che le sue migliori patatine sono ancora una generazione dietro.

Tuttavia, Pechino sta ancora attivamente spingendo i suoi giganti tecnologici come favorire l’hardware locale, con il Financial Times che riporta che le aziende ora devono giustificare gli ordini di Nvidia chip H20 conforme all’esportazione. Fa parte di una strategia per costruire un campione interno, ma può costringere le aziende a fare scelte tecnicamente-inferiori.

A parte i problemi che affrontano l’utilizzo delle patatine di Huawei per l’allenamento, il fondatore di Deepseek Liang Wenfeng ha detto alla sua squadra di essere insoddisfatto dei progressi complessivi verso il modello R2. Si dice che li stia spingendo a mirare più in alto e costruire qualcosa che possa mantenere l’azienda tra i leader del settore dell’IA.

Per tutte le direttive dall’alto verso il basso e l’orgoglio nazionale, le leggi dell’ingegneria si applicano ancora. La storia di Deepseek ricorda che nella razza globale per la supremazia dell’IA, non ci sono scorciatoie. La Cina sta giocando a un gioco lungo, ma per ora la corona delle prestazioni rimane saldamente sulla testa di Nvidia.

Vedi anche: Ren Zhengfei: China’s Ai Future e Long Game di Huawei

Vuoi saperne di più sull’intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L’evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *