Con l'evoluzione delle applicazioni di intelligenza artificiale, aumentano le richieste all'infrastruttura di rete, soprattutto in termini di latenza e connettività.
Il supporto di distribuzioni AI su larga scala introduce nuovi problemi e gli analisti prevedono che il traffico correlato all'AI rappresenterà presto una parte importante del traffico di rete totale. Il settore deve essere preparato a gestire questa ondata in modo efficace. F5 sta adattando le sue soluzioni per gestire la complessità dei carichi di lavoro AI e la sua tecnologia ora include l'elaborazione in tempo reale di dati multimodali.
L'IA presenta sia opportunità che rischi in termini di sicurezza, in quanto ha la capacità di migliorare la protezione e al contempo abilitare le minacce informatiche guidate dall'IA. La collaborazione tra hyperscaler, telco e aziende tecnologiche è fondamentale per stabilire reti ottimizzate per l'IA. La collaborazione e l'innovazione continuano a cambiare il panorama delle reti AI e F5 si impegna a guidare i progressi in quest'area.
In anticipo AI & Big Data Expo EuropaKunal Anand, Chief Technology and AI Officer di F5, parla del ruolo dell'azienda e delle iniziative intraprese per rimanere all'avanguardia nelle soluzioni di rete basate sull'intelligenza artificiale.
Notizie AI: Man mano che le applicazioni AI si evolvono, le richieste di infrastrutture di rete diventano più complesse. Quali sono le principali sfide che il settore deve affrontare in termini di latenza e connettività nel supportare distribuzioni AI su larga scala?
Italiano: F5 ha scoperto che l'AI ha trasformato drasticamente le architetture delle applicazioni. Alcune aziende stanno investendo miliardi di dollari in fabbriche AI, enormi cluster GPU, mentre altre preferiscono soluzioni basate su cloud o modelli di linguaggio di piccole dimensioni (SLM) come alternative meno costose.
Le architetture di rete si stanno evolvendo per affrontare queste sfide. Le fabbriche di intelligenza artificiale operano su stack di rete distinti, come InfiniBand con GPU specifiche come H100 o la prossima serie Blackwell di NVIDIA. Allo stesso tempo, le tecnologie basate su cloud e i cloud GPU stanno avanzando.
Una tendenza importante è la gravità dei dati, in cui i dati delle organizzazioni sono bloccati in ambienti specifici. Ciò ha guidato l'evoluzione delle architetture multi-cloud, consentendo ai carichi di lavoro di collegarsi ai dati tra gli ambienti per la generazione aumentata dal recupero (RAG).
Con l'aumento delle richieste RAG, le organizzazioni si trovano ad affrontare una latenza maggiore a causa delle risorse limitate, siano esse derivanti da archivi dati ampiamente utilizzati o da set limitati di server GPU.
Notizie AI: Come gli analisti prevedono Il traffico correlato all'AI costituirà presto una parte significativa del traffico di rete. Quali sfide uniche pone questo afflusso di traffico generato dall'AI per l'infrastruttura di rete esistente e come pensi che il settore si stia preparando?
Italiano: F5 ritiene che entro la fine del decennio la maggior parte delle applicazioni sarà basata o guidata dall'intelligenza artificiale, il che richiederà un'espansione lungo tutta la catena dei servizi di rete. Queste applicazioni utilizzeranno le API per comunicare con le fabbriche di intelligenza artificiale e i servizi di terze parti, accedere ai dati per RAG e potenzialmente esporre le proprie API. In sostanza, le API saranno la colla che terrà insieme questo ecosistema, come hanno suggerito gli analisti.
Guardando al futuro, si prevede che il traffico correlato all'IA dominerà il traffico di rete man mano che l'IA si integra sempre di più in applicazioni e API. Man mano che l'IA diventa centrale in praticamente tutte le applicazioni, il traffico correlato all'IA aumenterà naturalmente.
Notizie sull'intelligenza artificiale: con le applicazioni di intelligenza artificiale sempre più complesse e l'elaborazione di dati multimodali in tempo reale, in che modo F5 sta adattando le sue soluzioni per garantire che le reti possano gestire in modo efficiente questi carichi di lavoro dinamici?
Italiano: F5 guarda a questo da molte angolazioni. Nel caso di RAG, quando i dati, che siano immagini, flussi binari o testo, devono essere recuperati da un archivio dati, il metodo è lo stesso indipendentemente dal formato dei dati. I clienti spesso vogliono un rapido bilanciamento del carico Layer 4, gestione del traffico e capacità di controllo, tutte funzioni in cui F5 eccelle. L'azienda fornisce alle organizzazioni servizi di bilanciamento del carico, gestione del traffico e sicurezza, garantendo a RAG un accesso efficiente ai dati. F5 ha anche abilitato il bilanciamento del carico tra le fabbriche di IA.
In alcuni casi, le grandi organizzazioni gestiscono enormi cluster di GPU con decine di migliaia di GPU. Poiché i carichi di lavoro AI sono imprevedibili, queste GPU potrebbero essere disponibili o non disponibili a seconda del carico di lavoro. F5 garantisce un routing del traffico efficiente, mitigando l'imprevedibilità dei carichi di lavoro AI.
F5 migliora le prestazioni, aumenta la produttività e aggiunge funzionalità di sicurezza per le organizzazioni che costruiscono fabbriche e cluster di intelligenza artificiale.
Notizie sull'intelligenza artificiale: poiché l'intelligenza artificiale aumenta la sicurezza, ma al tempo stesso pone delle minacce informatiche, quali approcci sta adottando F5 per rafforzare la sicurezza e la resilienza della rete rispetto a queste sfide in continua evoluzione?
Italiano: Ci sono molte sfide diverse legate all'IA in arrivo. Gli aggressori stanno già impiegando l'IA per generare nuovi payload, trovare scappatoie e lanciare attacchi unici. Ad esempio, ChatGPT e i trasformatori visivi hanno la capacità di violare i CAPTCHA, in particolare quelli interattivi. Dimostrazioni recenti hanno mostrato la sofisticatezza di questi attacchi.
Come visto nei precedenti modelli di sicurezza, ogni volta che gli aggressori ottengono un vantaggio con una nuova tecnologia, i difensori devono raccogliere la sfida. Ciò spesso richiede di riconsiderare i modelli di sicurezza, come passare da “consenti tutto, nega qualcosa” a “consenti qualcosa, nega tutto”. Molte organizzazioni stanno esplorando soluzioni per combattere le minacce guidate dall'intelligenza artificiale.
F5 sta facendo grandi investimenti per restare al passo con le minacce guidate dall'intelligenza artificiale. Come parte del suo programma di intelligence F5, l'azienda sta sviluppando, addestrando e distribuendo modelli, supportati dal suo AI Center of Excellence.
All'inizio di quest'anno, F5 ha lanciato un AI data fabric, con un team dedicato allo sviluppo di modelli che servono l'intera azienda, dalla creazione di policy alla distribuzione di insight. F5 ritiene di essere ben posizionata per affrontare queste crescenti problematiche.
Notizie sull'intelligenza artificiale: quale ruolo svolgono le partnership nello sviluppo della prossima generazione di reti ottimizzate per l'intelligenza artificiale, in particolare tra hyperscaler, società di telecomunicazioni e aziende tecnologiche?
Italiano: Le partnership sono importanti per lo sviluppo dell'IA. Lo stack dell'IA è complesso e coinvolge diversi componenti, tra cui elettricità, data center, hardware, server, GPU, memoria, potenza di calcolo e uno stack di rete, che devono funzionare tutti insieme. È insolito che una singola organizzazione supervisioni tutto dall'inizio alla fine.
F5 si concentra sulla creazione e sul mantenimento delle partnership necessarie in termini di elaborazione, networking e archiviazione per supportare l'intelligenza artificiale.
AI News: Come concepisce F5 il proprio ruolo nel progresso delle reti basate sull'intelligenza artificiale e su quali iniziative vi state concentrando per rimanere all'avanguardia nelle soluzioni di rete basate sull'intelligenza artificiale?
Italiano: F5 si impegna a sviluppare la sua piattaforma tecnologica. L'AI Data Fabric, lanciato all'inizio di quest'anno, collaborerà con l'AI Center of Excellence per preparare l'organizzazione al futuro.
F5 sta anche formando solide partnership, con annunci a venire. L'azienda è entusiasta del suo lavoro e del rapido ritmo del cambiamento globale. Il punto di vista unico di F5, l'elaborazione del traffico mondiale, le consente di correlare le informazioni sui dati con le tendenze del settore. F5 intende anche essere più disponibile riguardo alla sua ricerca e ai suoi modelli, con alcuni contributi open source in arrivo a breve.
Nel complesso, F5 è incredibilmente ottimista sul futuro. L'impatto trasformativo dell'IA è notevole ed è un momento emozionante per far parte di questo cambiamento.
(Immagine di Lucent_Designs_dinoson20)
Vuoi saperne di più sull'intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera AI e Big Data che si svolge ad Amsterdam, California e Londra. L'evento completo è co-localizzato con altri eventi leader tra cui Conferenza sull'automazione intelligente, BloccoX, Settimana della Trasformazione DigitaleE Fiera della sicurezza informatica e del cloud.
Esplora altri prossimi eventi e webinar sulla tecnologia aziendale forniti da TechForge Qui.
Fonte: www.artificialintelligence-news.com