Poiché l’adozione dell’intelligenza artificiale ha continuato ad aumentare negli ultimi due mesi, una cosa è diventata abbondantemente chiara, ovvero non c’è abbastanza potenza computazionale per tutti (qualcosa che è diventato dolorosamente ovvio man mano che i fornitori di servizi cloud hanno accumulato liste d’attesa lunghe mesi per istanze GPU di fascia alta). E, a differenza della breve mania delle GPU per il mining di criptovalute di solo pochi anni fa, la crisi odierna è guidata dalla domanda reale proveniente dalla ricerca e dalle implementazioni dell’intelligenza artificiale.
Per ragioni di prospettiva, Amazon Web Services lo è stato ricarica circa $ 98 l’ora per un server da 8 GPU caricato con i chip H100 di alto livello di Nvidia, mentre alcune piattaforme GPU decentralizzate offrono hardware comparabile per soli $ 3 l’ora. In mezzo a questo netto divario di prezzo di 30 volte, Singularity Compute, il braccio infrastrutturale del pioniere dell’intelligenza artificiale decentralizzata SingularityNET, ha annunciato l’implementazione di fase I del suo primo cluster GPU NVIDIA di livello aziendale in un data center all’avanguardia in Svezia.
Sotto a partenariato insieme all’operatore svedese Conapto, il cluster di Singularity utilizza hardware NVIDIA all’avanguardia (comprese le GPU H200 e L40S di prossima generazione) in una struttura di Stoccolma alimentata interamente da energia rinnovabile.
Cosa c’è in offerta esattamente?
Il cluster, progettato per essere ad alta densità, funge da base sia per i tradizionali carichi di lavoro aziendali che per i progetti dell’Artificial Superintelligence (ASI) Alliance, un ecosistema di intelligenza artificiale decentralizzato guidato da SingularityNET. Offre modalità di accesso flessibili che rispecchiano le esigenze dei moderni sviluppatori di intelligenza artificiale in cui le aziende possono noleggiare intere macchine su bare metal, avviare macchine virtuali basate su GPU o persino attingere a endpoint API dedicati per l’inferenza dell’intelligenza artificiale.
In termini reali, ciò significa che un’organizzazione può potenzialmente addestrare da zero interi modelli di machine learning di grandi dimensioni, perfezionare modelli esistenti su set di dati personalizzati o eseguire inferenze pesanti per applicazioni come l’intelligenza artificiale generativa, il tutto utilizzando l’infrastruttura di Singularity.
Sul fronte operativo, vale la pena ricordare che la partnership sarà gestita dal famoso fornitore di servizi cloud e partner NVIDIA Cudo Compute, con quest’ultimo che garantirà la fornitura tempestiva del cluster di affidabilità di livello aziendale e del supporto richiesto dai progetti di intelligenza artificiale mission-critical. Sull’intero sviluppo, il Dr. Ben Goertzel, fondatore di SingularityNET e co-presidente dell’ASI Alliance, ha affermato:
“Mentre l’intelligenza artificiale accelera verso l’AGI e oltre, l’accesso a un’elaborazione ad alte prestazioni ed eticamente allineata sta diventando un fattore determinante per chi modella il futuro. Abbiamo bisogno di un’elaborazione potente configurata per l’interoperabilità con reti decentralizzate che eseguono una ricca varietà di algoritmi IA che eseguono compiti per popolazioni diverse. L’implementazione della nuova GPU in Svezia è una pietra miliare significativa sulla strada verso una superintelligenza artificiale globale veramente aperta.”
Un sentimento simile è stato ripreso anche dal CEO di Singularity Compute, Joe Honan, il quale ritiene che il lancio non riguardi solo una semplice capacità di elaborazione aggiuntiva, ma piuttosto un passo verso un nuovo paradigma nell’infrastruttura AI, sottolineando che le GPU NVIDIA del cluster forniranno le prestazioni e l’affidabilità richieste dall’intelligenza artificiale moderna, sostenendo allo stesso tempo i principi di apertura, sicurezza e sovranità nel modo in cui viene fornito il calcolo.
In questo contesto più ampio, vale anche la pena ricordare che il cluster svedese è destinato a fungere da spina dorsale per ASI:Cloud, il nuovo servizio di inferenza del modello AI di Singularity sviluppato in collaborazione con Cudo. Per approfondire, ASI:Cloud fornisce agli sviluppatori un accesso basato su portafoglio a un’API compatibile con OpenAI per l’inferenza del modello, offrendo un percorso agevole per passare dalle funzioni serverless fino ai server GPU dedicati.
I primi clienti sono già stati inseriti nel cluster svedese, e il team lascia intendere che questo è solo l’inizio dell’ingresso nella mischia di hardware aggiuntivo e di nuove posizioni geografiche. Pertanto, per una comunità che è stata spesso all’avanguardia nella rivoluzione in corso dell’intelligenza artificiale e della blockchain, questa implementazione sembra essere un passo tangibile verso l’obiettivo a lungo termine di un’infrastruttura AI decentralizzata e distribuita a livello globale.
La corsa per l’elaborazione basata sull’intelligenza artificiale è in corso e si sta riscaldando rapidamente
Dall’inizio del decennio, il settore tecnologico ha investito ingenti investimenti nelle infrastrutture dell’intelligenza artificiale, e solo nel 2025 ciò è avvenuto testimoniato oltre 1 trilione di dollari in nuovi progetti di data center incentrati sull’intelligenza artificiale. Anche gli stati-nazione sembrano essere d’accordo con la Francia, per esempio svelato un piano a sorpresa da oltre 100 miliardi di euro per potenziare l’infrastruttura dell’intelligenza artificiale.
Tuttavia, non tutti possono spendere miliardi per risolvere l’attuale carenza di calcolo, con la conseguente nascita di approcci alternativi come reti GPU decentralizzate o distribuite (che possono attingere ad hardware distribuito in molte località e operatori).
In altre parole, se gli anni 2010 hanno premiato coloro che hanno accumulato dati, gli anni 2020 apparentemente ricompenseranno coloro che controllano la potenza di calcolo. All’interno di quel futuro, sforzi come il nuovo cluster GPU di Singularity Compute incarnano una crescente determinazione a democratizzare chi potrà dare forma al prossimo capitolo dell’intelligenza artificiale (principalmente ampliando la provenienza del calcolo dietro di esso). Si prospettano tempi interessanti.
Fonte: www.artificialintelligence-news.com
