Con il suo sistema WorldGen, Meta sta spostando l’uso dell’intelligenza artificiale generativa per i mondi 3D dalla creazione di immagini statiche a risorse completamente interattive.
Il principale collo di bottiglia nella creazione di esperienze immersive di calcolo spaziale, sia per i giochi consumer, gemelli digitali industrialio simulazioni di formazione dei dipendenti – è stata per lungo tempo la natura ad alta intensità di lavoro della modellazione 3D. La produzione di un ambiente interattivo richiede tipicamente team di artisti specializzati che lavorano per settimane.
WorldGen, secondo un nuovo rapporto tecnico di Meta Laboratori di realtàè in grado di generare mondi 3D attraversabili e interattivi da un singolo messaggio di testo in circa cinque minuti.
Sebbene la tecnologia sia attualmente di livello di ricerca, l’architettura WorldGen affronta specifici punti critici che hanno impedito all’intelligenza artificiale generativa di essere utile nei flussi di lavoro professionali: interattività funzionale, compatibilità del motore e controllo editoriale.
Gli ambienti di intelligenza artificiale generativa diventano mondi 3D veramente interattivi
Il principale difetto di molti modelli esistenti di conversione testo in 3D è che danno priorità alla fedeltà visiva rispetto alla funzione. Approcci come lo splatting gaussiano creano scene fotorealistiche che sembrano impressionanti in un video ma spesso mancano della struttura fisica sottostante richiesta affinché un utente possa interagire con l’ambiente. Le risorse prive di dati sulle collisioni o di fisica della rampa hanno un valore minimo o nullo per la simulazione o il gioco.
WorldGen si discosta da questo percorso dando priorità alla “traversabilità”. Il sistema genera una mesh di navigazione (navmesh) – una mesh poligonale semplificata che definisce le superfici calpestabili – insieme alla geometria visiva. Ciò garantisce che un suggerimento come “borgo medievale” produca non solo un insieme di case, ma un layout spazialmente coerente in cui le strade sono libere da ostacoli e gli spazi aperti sono accessibili.
Per le imprese questa distinzione è vitale. UN gemello digitale di una fabbrica o una simulazione di formazione sulla sicurezza per ambienti pericolosi richiedono dati fisici e di navigazione validi.
L’approccio di Meta garantisce che l’output sia “pronto per il motore di gioco”, il che significa che le risorse possono essere esportate direttamente in piattaforme standard come Unity o Motore irreale. Questa compatibilità consente ai team tecnici di integrare flussi di lavoro generativi nelle pipeline esistenti senza bisogno di hardware di rendering specializzato che altri metodi, come i campi di radianza, spesso richiedono.
La linea di produzione in quattro fasi di WorldGen
I ricercatori di Meta hanno strutturato WorldGen come una pipeline di intelligenza artificiale modulare che rispecchia i flussi di lavoro di sviluppo tradizionali per la creazione di mondi 3D.
Il processo inizia con la pianificazione della scena. Un LLM funge da ingegnere strutturale, analizzando il messaggio di testo dell’utente per generare un layout logico. Determina il posizionamento delle strutture chiave e delle caratteristiche del terreno, producendo un “blocco” – uno schizzo 3D approssimativo – che garantisce che la scena abbia un senso fisico.
La successiva fase di “ricostruzione della scena” costruisce la geometria iniziale. Il sistema condiziona la generazione sul navmesh, garantendo che quando l’IA “allucina” i dettagli, non posizioni inavvertitamente un masso in una porta o blocchi un percorso di uscita antincendio.
La “scomposizione della scena”, la terza fase, è forse la più rilevante per la flessibilità operativa. Il sistema utilizza un metodo chiamato AutoPartGen per identificare e separare i singoli oggetti all’interno della scena, distinguendo un albero dal terreno o una cassa dal pavimento di un magazzino.
In molti modelli generativi “a scatto singolo”, la scena è un unico pezzo di geometria fuso. Separando i componenti, WorldGen consente agli editor umani di spostare, eliminare o modificare risorse specifiche dopo la generazione senza danneggiare il mondo intero.
Per l’ultimo passaggio, il “miglioramento della scena” lucida le risorse. Il sistema genera texture ad alta risoluzione e perfeziona la geometria dei singoli oggetti per garantire che la qualità visiva resti invariata quando sono vicini.

Realismo operativo nell’uso dell’intelligenza artificiale generativa per creare mondi 3D
L’implementazione di tale tecnologia richiede una valutazione dell’infrastruttura attuale. Gli output di WorldGen sono mesh strutturate standard. Questa scelta evita il vincolo del fornitore associato alle tecniche di rendering proprietarie. Ciò significa che un’azienda di logistica che costruisce un modulo di formazione VR potrebbe teoricamente utilizzare questo strumento per prototipare rapidamente i layout, quindi consegnarli agli sviluppatori umani per il perfezionamento.
La creazione di una scena completamente strutturata e navigabile richiede circa cinque minuti con hardware sufficiente. Per gli studi o i dipartimenti abituati a tempi di consegna di più giorni per il blocco dell’ambiente di base, questo miglioramento dell’efficienza sta letteralmente cambiando il mondo.
Tuttavia, la tecnologia presenta dei limiti. L’attuale iterazione si basa sulla generazione di un’unica vista di riferimento, che limita la scala dei mondi che può produrre. Non può ancora generare nativamente mondi aperti estesi che si estendono per chilometri senza unire più regioni insieme, il che rischia di incoerenze visive.
Il sistema attualmente rappresenta inoltre ciascun oggetto in modo indipendente senza riutilizzo, il che potrebbe portare a inefficienze di memoria in scene molto grandi rispetto alle risorse ottimizzate manualmente in cui un singolo modello di sedia viene ripetuto cinquanta volte. Le iterazioni future mirano ad affrontare dimensioni del mondo più grandi e una latenza inferiore.
Confronto di WorldGen con altre tecnologie emergenti
La valutazione di questo approccio rispetto ad altre tecnologie di intelligenza artificiale emergenti per la creazione di mondi 3D offre chiarezza. World Labs, un concorrente nel settore spaziale, utilizza un sistema chiamato Marble che utilizza simboli gaussiani per ottenere un elevato fotorealismo. Anche se visivamente sorprendenti, queste scene basate su simboli spesso peggiorano in termini di qualità quando la telecamera si allontana dal centro e possono perdere fedeltà a soli 3-5 metri dal punto di vista.
La scelta di Meta di produrre geometrie basate su mesh posiziona WorldGen come uno strumento per lo sviluppo di applicazioni funzionali piuttosto che solo per la creazione di contenuti visivi. Supporta fisica, collisioni e navigazione in modo nativo, funzionalità non negoziabili per il software interattivo. Di conseguenza, WorldGen può generare scene di 50×50 metri che mantengono l’integrità geometrica ovunque.
Per i leader nei settori tecnologico e creativo, l’arrivo di sistemi come WorldGen offre nuove entusiasmanti possibilità. Le organizzazioni dovrebbero verificare i propri attuali flussi di lavoro 3D per identificare dove il “blocco” e la prototipazione assorbono la maggior parte delle risorse. Gli strumenti generativi sono meglio impiegati in questo caso per accelerare l’iterazione, piuttosto che tentare di sostituire immediatamente la produzione di qualità finale.
Allo stesso tempo, gli artisti tecnici e i level designer dovranno passare dal posizionare manualmente ogni vertice alla guida e alla cura degli output dell’IA. I programmi di formazione dovrebbero concentrarsi sulla “pronta ingegneria per il layout spaziale” e sulla modifica delle risorse generate dall’intelligenza artificiale per i mondi 3D. Infine, sebbene l’output sia standard, il processo di generazione richiede un sacco di computer. Per l’adozione sarà necessario valutare le capacità di rendering on-premise rispetto a quelle sul cloud.
Il 3D generativo serve al meglio come moltiplicatore di forza per il layout strutturale e la popolazione delle risorse piuttosto che come sostituto totale della creatività umana. Automatizzando il lavoro fondamentale di costruzione di un mondo, i team aziendali possono concentrare i propri budget sulle interazioni e sulla logica che guidano il valore aziendale.

Vuoi saperne di più sull’intelligenza artificiale e sui big data dai leader del settore? Guardare Fiera dell’intelligenza artificiale e dei big data che si svolge ad Amsterdam, in California, e a Londra. L’evento completo è parte di TechEx ed è situato in concomitanza con altri importanti eventi tecnologici tra cui Fiera della sicurezza informatica. Clic Qui per ulteriori informazioni
AI News è alimentato da Media TechForge. Esplora altri prossimi eventi e webinar sulla tecnologia aziendale Qui.
Fonte: www.artificialintelligence-news.com
