Google DeepMind all'ICLR 2024

 | Intelligenza-Artificiale

Ricerca

Pubblicato

Sviluppare agenti IA di nuova generazione, esplorare nuove modalità e sperimentare l'apprendimento fondamentale

La prossima settimana, i ricercatori sull’intelligenza artificiale di tutto il mondo convergeranno al 12 Conferenza internazionale sulle rappresentazioni dell'apprendimento (ICLR), che si svolgerà dal 7 all'11 maggio a Vienna, in Austria.

Raia Hadsell, vicepresidente della ricerca presso Google DeepMind, terrà un keynote riflettendo sugli ultimi 20 anni nel settore, evidenziando come le lezioni apprese stanno plasmando il futuro dell'intelligenza artificiale a beneficio dell'umanità.

Offriremo anche dimostrazioni dal vivo che mostrano come portiamo in realtà la nostra ricerca fondamentale, dallo sviluppo di Trasformatori di robotica alla creazione di toolkit e modelli open source come Gemma.

Quest'anno i team di Google DeepMind presenteranno più di 70 documenti. Alcuni punti salienti della ricerca:

Agenti di problem solving e approcci di ispirazione umana

I modelli linguistici di grandi dimensioni (LLM) stanno già rivoluzionando gli strumenti avanzati di intelligenza artificiale, ma il loro pieno potenziale rimane inutilizzato. Ad esempio, gli agenti IA basati su LLM in grado di intraprendere azioni efficaci potrebbero trasformare gli assistenti digitali in strumenti IA più utili e intuitivi.

Gli assistenti IA che seguono le istruzioni del linguaggio naturale per svolgere attività basate sul web per conto delle persone rappresenterebbero un enorme risparmio di tempo. In una presentazione orale introduciamo WebAgentun agente basato su LLM che impara dall'esperienza personale per navigare e gestire attività complesse su siti Web del mondo reale.

Per migliorare ulteriormente l'utilità generale degli LLM, ci siamo concentrati sul potenziamento delle loro capacità di risoluzione dei problemi. Dimostriamo come abbiamo raggiunto questo obiettivo dotando un sistema basato su LLM di un approccio tradizionalmente umano: produrre e utilizzare “strumenti”. Separatamente, presentiamo una tecnica di formazione che garantisce che i modelli linguistici vengano prodotti in modo più coerente risultati socialmente accettabili. Il nostro approccio utilizza uno spazio di prova sandbox che rappresenta il valori della società.

Superare i confini nella visione e nella codifica

Il nostro modello Dynamic Scene Transformer (DyST) sfrutta i video reali di una singola telecamera per estrarre rappresentazioni 3D degli oggetti nella scena e dei loro movimenti.

Fino a poco tempo fa, i grandi modelli di intelligenza artificiale si concentravano principalmente su testo e immagini, gettando le basi per il riconoscimento di modelli e l’interpretazione dei dati su larga scala. Ora, il campo sta progredendo oltre questi regni statici per abbracciare le dinamiche degli ambienti visivi del mondo reale. Con l’avanzare dell’informatica a tutti i livelli, è sempre più importante che il codice sottostante venga generato e ottimizzato con la massima efficienza.

Quando guardi un video su uno schermo piatto, cogli intuitivamente la natura tridimensionale della scena. Le macchine, tuttavia, faticano a emulare questa capacità senza una supervisione esplicita. Mostriamo il nostro Trasformatore di scene dinamiche (DyST), che sfrutta i video reali di una singola telecamera per estrarre rappresentazioni 3D degli oggetti nella scena e dei loro movimenti. Inoltre, DyST consente anche la generazione di nuove versioni dello stesso video, con il controllo dell'utente sugli angoli di ripresa e sui contenuti.

L’emulazione delle strategie cognitive umane rende anche migliori i generatori di codici AI. Quando i programmatori scrivono codice complesso, in genere “scompongono” l’attività in sottoattività più semplici. Con ExDecintroduciamo un nuovo approccio di generazione del codice che sfrutta un approccio di scomposizione per migliorare le prestazioni di programmazione e generalizzazione dei sistemi di intelligenza artificiale.

In parallelo carta riflettore esploriamo il nuovo utilizzo dell'apprendimento automatico non solo per generare codice, ma per ottimizzarlo, introducendo a set di dati per un solido benchmarking delle prestazioni del codice. L'ottimizzazione del codice è impegnativa e richiede ragionamenti complessi e il nostro set di dati consente l'esplorazione di una gamma di tecniche ML. Dimostriamo che le strategie di apprendimento risultanti superano le ottimizzazioni del codice realizzate dall'uomo.

ExeDec introduce un nuovo approccio di generazione del codice che sfrutta un approccio di scomposizione per migliorare le prestazioni di programmazione e generalizzazione dei sistemi di intelligenza artificiale

Promuovere l’apprendimento fondamentale

I nostri team di ricerca stanno affrontando le grandi domande dell’intelligenza artificiale, dall’esplorazione dell’essenza della cognizione meccanica alla comprensione di come si generalizzano i modelli avanzati di intelligenza artificiale, lavorando anche per superare le principali sfide teoriche.

Sia per gli esseri umani che per le macchine, il ragionamento causale e la capacità di prevedere gli eventi sono concetti strettamente correlati. In una presentazione in evidenza, esploriamo come l'apprendimento per rinforzo è influenzato dagli obiettivi di formazione basati sulla previsionee tracciare parallelismi con i cambiamenti nell’attività cerebrale legati anche alla previsione.

Se gli agenti dell’intelligenza artificiale sono in grado di generalizzare bene a nuovi scenari è perché, come gli esseri umani, hanno appreso un modello causale sottostante del loro mondo? Questa è una domanda fondamentale nell’intelligenza artificiale avanzata. In una presentazione orale, riveliamo che tali modelli hanno infatti appreso un modello causale approssimativo dei processi che hanno prodotto i dati di addestramento e discuterne le profonde implicazioni.

Un’altra questione critica nell’intelligenza artificiale è la fiducia, che dipende in parte dalla precisione con cui i modelli riescono a stimare l’incertezza dei loro risultati, un fattore cruciale per un processo decisionale affidabile. Abbiamo fatto progressi significativi nella stima dell’incertezza nell’ambito del deep learning bayesianoutilizzando un metodo semplice e sostanzialmente gratuito.

Infine, esploreremo l'equilibrio di Nash (NE) della teoria dei giochi, uno stato in cui nessun giocatore trae vantaggio dal cambiare la propria strategia se gli altri mantengono la propria. Al di là dei semplici giochi a due giocatori, anche l’approssimazione di un equilibrio di Nash è computazionalmente intrattabile, ma in una presentazione orale, possiamo rivelare nuovi approcci all’avanguardia nella negoziazione di accordi dal poker alle aste.

Riunire la comunità dell’intelligenza artificiale

Siamo lieti di sponsorizzare l'ICLR e sostenere iniziative tra cui Strano nell'intelligenza artificiale E Donne nell'apprendimento automatico. Tali partenariati non solo rafforzano le collaborazioni di ricerca, ma promuovono anche una comunità vivace e diversificata nel campo dell’intelligenza artificiale e dell’apprendimento automatico.

Se sei all'ICLR, assicurati di visitare il nostro stand e i nostri colleghi di Google Research della porta accanto. Scopri la nostra ricerca pionieristica, incontra i nostri team che ospitano workshop e interagisci con i nostri esperti che presentano durante la conferenza. Non vediamo l'ora di connetterci con te!

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *