Il modello AI di Odyssey trasforma il video in mondi interattivi | Intelligenza-Artificiale

Indice contenuti

L'Odyssey di AI Lab, con sede a Londra, ha lanciato un'anteprima di ricerca di un modello che trasforma il video in mondi interattivi. Inizialmente concentrandosi sui modelli mondiali per la produzione di film e giochi, il team di Odyssey è inciampato su potenzialmente un mezzo di intrattenimento completamente nuovo.

Il video interattivo generato dal modello AI di Odyssey risponde agli input in tempo reale. Puoi interagire con esso usando la tastiera, il telefono, il controller o alla fine anche i comandi vocali. Le persone di Odyssey lo stanno fatturando come una “prima versione di Holodeck”.

L'intelligenza artificiale sottostante può generare cornici video dall'aspetto realistico ogni 40 millisecondi. Ciò significa che quando si preme un pulsante o fai un gesto, il video risponde quasi istantaneamente, creando l'illusione che stai effettivamente influenzando questo mondo digitale.

“L'esperienza oggi sembra esplorare un sogno glitch: raw, instabile, ma innegabilmente nuovo”, secondo Odyssey. Non stiamo parlando di elementi visivi lucidati e di qualità AAA qui, almeno non ancora.

Non la tua tecnologia video standard

Diventiamo un po 'tecnico per un momento. Cosa rende questa tecnologia video interattiva generata dall'IA diversa, per esempio, un videogioco standard o CGI? Tutto dipende da qualcosa che Odyssey chiama un “modello mondiale”.

A differenza dei tradizionali modelli video che generano interi clip in una volta, i modelli mondiali funzionano con frame per frame per prevedere cosa dovrebbe venire dopo in base allo stato corrente e a qualsiasi input utente. È simile a come i modelli di linguaggio di grandi dimensioni prevedono la parola successiva in una sequenza, ma infinitamente più complessa perché stiamo parlando di fotogrammi video ad alta risoluzione piuttosto che di parole.

“Un modello mondiale è, al centro, un modello di dinamica condizionata dall'azione”, come afferma Odyssey. Ogni volta che interagisci, il modello prende lo stato attuale, la tua azione e la storia di ciò che è accaduto, quindi genera il prossimo fotogramma video di conseguenza.

Il risultato è qualcosa che sembra più organico e imprevedibile di un gioco tradizionale. Non esiste una logica pre-programmata che dice “Se un giocatore fa X, allora accade”-Insieme, l'IA sta facendo la migliore ipotesi su ciò che dovrebbe accadere in base a ciò che ha imparato guardando innumerevoli video.

Odyssey affronta le sfide storiche con il video generato dall'IA

Costruire qualcosa del genere non è esattamente una passeggiata nel parco. Uno dei maggiori ostacoli con video interattivo generato dall'IA è mantenerlo stabile nel tempo. Quando stai generando ogni frame in base a quelli precedenti, piccoli errori possono aggravarsi rapidamente (un fenomeno I ricercatori chiamano “Drift”.)

Per affrontare questo obiettivo, Odyssey ha usato quello che chiamano un “modello di distribuzione stretta”, essenzialmente pre-allenare la loro AI su filmati video generali, quindi perfezionandolo su un set più piccolo di ambienti. Questo compromesso significa meno varietà ma migliore stabilità in modo che tutto non diventa un bizzarro pasticcio.

La società afferma che stanno già facendo “progressi rapidi” sul loro modello di nuova generazione, che apparentemente mostra “una gamma più ricca di pixel, dinamiche e azioni”.

Gestire tutta questa fantasiosa tecnologia AI in tempo reale non è economico. Attualmente, l'infrastruttura che alimenta questa esperienza costa tra £ 0,80- £ 1,60 (1-2) per ora dell'utente, basandosi su cluster di GPU H100 sparse negli Stati Uniti e nell'UE.

Potrebbe sembrare costoso per lo streaming di video, ma è notevolmente economico rispetto alla produzione di contenuti tradizionali di giochi o film. E Odyssey prevede che questi costi cadono ulteriormente man mano che i modelli diventano più efficienti.

Video interattivo: il prossimo mezzo di narrazione?

Nel corso della storia, le nuove tecnologie hanno dato alla luce nuove forme di narrazione: dai dipinti delle caverne a libri, fotografia, radio, film e videogiochi. Odyssey crede che il video interattivo generato dall'IA sia il prossimo passo in questa evoluzione.

Se hanno ragione, potremmo guardare il prototipo di qualcosa che trasformerà intrattenimento, istruzione, pubblicità e altro ancora. Immagina video di formazione in cui puoi praticare le abilità insegnate o esperienze di viaggio in cui puoi esplorare le destinazioni dal tuo divano.

L'anteprima della ricerca disponibile ora è ovviamente solo un piccolo passo verso questa visione e più una prova del concetto che un prodotto finito. Tuttavia, è uno sguardo intrigante a ciò che potrebbe essere possibile quando i mondi generati dall'IA diventano parchi giochi interattivi piuttosto che solo esperienze passive.

Puoi provare l'anteprima della ricerca Qui.

Vedi anche: Telegram e Xai Forge Grok Ai

Vuoi saperne di più sull'intelligenza artificiale e sui big da parte dei leader del settore? Guardare AI e Big Data Expo si svolge ad Amsterdam, in California e a Londra. L'evento completo è co-localizzato con altri eventi principali tra cui Conferenza di automazione intelligente, Blockx, Settimana di trasformazione digitaleE Cyber Security & Cloud Expo.

Esplora altri prossimi eventi tecnologici aziendali e webinar alimentati da TechForge Qui.

Fonte: www.artificialintelligence-news.com