: Oltre la tassa Nvidia: la strategia dietro il chip OpenAI Jalapeño | Intelligenza-Artificiale

Indice contenuti

La traiettoria finanziaria di OpenAI dipende fortemente dai costi dell’infrastruttura, una realtà che ha guidato lo sviluppo del nuovo chip personalizzato OpenAI Jalapeño. Sviluppato in collaborazione con Broadcom, il circuito integrato specifico per l’applicazione (ASIC) rappresenta un tentativo diretto di mitigare le pesanti spese in conto capitale associate all’hardware di terze parti.

Mentre Nvidia attualmente detiene un margine di profitto stimato del 75% sui suoi processori di fascia alta, OpenAI opera su margini più ristretti, mantenendo circa 33 centesimi di profitto su ogni dollaro generato dopo aver tenuto conto delle sue ingenti spese operative. L’onere finanziario derivante dalla gestione di modelli linguistici di grandi dimensioni su larga scala è grave.

L’anno scorso, mantenere reattivi i server ChatGPT era costato a OpenAI l’incredibile cifra di 8,4 miliardi di dollari. Con la piattaforma che ora attira 900 milioni di utenti settimanali, si prevede che i costi operativi raggiungeranno circa 14 miliardi di dollari quest’anno. Nei prossimi otto anni, OpenAI ha impegnato circa 1,4 trilioni di dollari in potenza di calcolo, una scommessa enorme per un’azienda che attualmente genera 25 miliardi di dollari di entrate annuali.

Progettazione di hardware per l’inferenza LLM

Il chip OpenAI Jalapeño, soprannominato il primo “processore di intelligenza” dell’azienda, è costruito appositamente per l’inferenza di modelli di linguaggio di grandi dimensioni (LLM) piuttosto che per carichi di lavoro di intelligenza artificiale generici. OpenAI ha fornito la progettazione architettonica di base in base alle roadmap dei modelli specifici e ai sistemi di servizio, mentre Broadcom ha gestito l’ingegneria del silicio e l’integrazione della rete ad alte prestazioni.

TSMC gestisce la produzione fisica a Taiwan e Celestica ha il compito di costruire i sistemi di schede e rack. Secondo OpenAI, i primi campioni di laboratorio stanno già eseguendo carichi di lavoro di frontiera, incluso un modello GPT-5.3-Codex-Spark inedito, alla frequenza e alla potenza di produzione target.

Richard Ho, capo del programma hardware di OpenAI, ha osservato che l’architettura riduce al minimo lo spostamento dei dati per spingere l’utilizzo realizzato più vicino alle prestazioni di picco teoriche. A differenza degli acceleratori generici adattati dai carichi di lavoro IA legacy, questa architettura bilancia in modo specifico le risorse di elaborazione, memoria e rete per risolvere i colli di bottiglia legati allo spostamento dei dati tipici del servizio LLM interattivo.

Per raggiungere questo obiettivo su larga scala, la piattaforma integra il silicio di rete Tomahawk di Broadcom direttamente nel progetto, consentendo ai processori personalizzati di comunicare attraverso enormi ambienti di data center in cluster.

Il volano dell’integrazione verticale

Passando al silicio personalizzato, OpenAI passa dall’essere un semplice livello software a una società di infrastrutture integrata verticalmente^{. Questa strategia full-stack abbraccia l’intera pipeline: architettura del chip, kernel software, sistemi di memoria, pianificazione della rete e livello applicativo finale^{. Proprio come lo stretto legame di Apple tra hardware proprietario e iOS, OpenAI può ora ottimizzare la propria infrastruttura attorno alle esatte roadmap del modello interno^.}}

Questa integrazione alimenta un volano operativo continuo^{. Una maggiore efficienza dell’infrastruttura riduce il costo sia dei modelli di formazione che di servizio^{. Un servizio più conveniente porta a prodotti migliori e più reattivi, il che fa sì che il volume degli utenti e le entrate vengano reinvestiti nella prossima generazione di infrastrutture personalizzate^.}}

Superare il vantaggio del ritardatario

Introducendo il proprio silicio, OpenAI entra in un panorama in cui i suoi principali concorrenti hanno trascorso quasi un decennio a sviluppare hardware proprietario. Google ha iniziato a implementare le sue Tensor Processing Unit (TPU) nel 2015 e ora controlla circa un quarto della capacità di elaborazione globale dell’intelligenza artificiale al di fuori della catena di fornitura di Nvidia.

Amazon ha spedito oltre un milione di chip personalizzati, mentre Meta e Microsoft continuano ad ampliare la propria infrastruttura.

“Jalapeño fa parte della nostra strategia infrastrutturale full-stack a lungo termine per rendere il computing più abbondante”, ha affermato Greg Brockman, presidente e co-fondatore di OpenAI. “Progettando noi stessi una parte maggiore dello stack, possiamo servire più intelligenza con maggiore efficienza.”

Per colmare questo divario temporale, OpenAI ha accelerato la fase di sviluppo. Il chip OpenAI Jalapeño è passato da una progettazione vuota alla produzione su nastro, il passaggio finale prima della produzione fisica, in soli nove mesi. I team di ingegneri hanno raggiunto questo obiettivo utilizzando i modelli linguistici di OpenAI per automatizzare e ottimizzare parti del processo di progettazione hardware.

Ciò crea un ciclo di feedback unico in cui i modelli offerti agli utenti vengono attivamente sfruttati per costruire l’infrastruttura fisica che eseguirà le iterazioni future. L’inizio della distribuzione dell’hardware nei data center è previsto entro la fine del 2026.

Il CEO di Broadcom, Hock Tan, ha confermato che il lancio si espanderà insieme ai partner infrastrutturali, tra cui Microsoft, per prepararsi all’integrazione dei data center su scala gigawatt.

(Foto di OpenAI)

Vedi anche: Omio scala lo sviluppo di prodotti di viaggio utilizzando modelli OpenAI

Banner per gli eventi AI & Big Data Expo di TechEx.

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è parte di TechEx ed è situato in concomitanza con altri importanti eventi tecnologici, clicca Qui per ulteriori informazioni

AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.

Fonte: www.artificialintelligence-news.com

Categorie

Progettazione di hardware per l’inferenza LLM

Il volano dell’integrazione verticale

Superare il vantaggio del ritardatario

Lascia un commento Annulla risposta

Articoli Correlati

Ultimi post