L'ultima ricerca di DeepMind all'ICLR 2023 | Intelligenza-Artificiale

Indice contenuti

Ricerca verso modelli di intelligenza artificiale in grado di generalizzare, scalare e accelerare la scienza

La prossima settimana segna l’inizio dell’11 Conferenza internazionale sulle rappresentazioni dell’apprendimento (ICLR), che si svolgerà dal 1 al 5 maggio a Kigali, in Ruanda. Questa sarà la prima grande conferenza sull’intelligenza artificiale (AI) ospitata in Africa e il primo evento dal vivo dall’inizio della pandemia.

Ricercatori da tutto il mondo si riuniranno per condividere il loro lavoro all’avanguardia nel deep learning che abbraccia i campi dell’intelligenza artificiale, della statistica, della scienza dei dati e di applicazioni tra cui la visione artificiale, i giochi e la robotica. Siamo orgogliosi di sostenere la conferenza come sponsor Diamond e campione DEI.

Quest’anno i team di DeepMind presenteranno 23 articoli. Ecco alcuni punti salienti:

Domande aperte sul percorso verso l’AGI

I recenti progressi hanno dimostrato le incredibili prestazioni dell’intelligenza artificiale nel testo e nelle immagini, ma sono necessarie ulteriori ricerche affinché i sistemi possano generalizzare su diversi domini e scale. Questo sarà un passo cruciale nel percorso verso lo sviluppo dell’intelligenza generale artificiale (AGI) come strumento di trasformazione nella nostra vita quotidiana.

Presentiamo un nuovo approccio in cui i modelli imparare risolvendo due problemi in uno. Addestrando i modelli a guardare un problema da due prospettive contemporaneamente, imparano a ragionare su compiti che richiedono la risoluzione di problemi simili, il che è utile per la generalizzazione. Abbiamo anche esplorato il capacità di generalizzazione delle reti neurali confrontandoli con la gerarchia dei linguaggi di Chomsky. Testando rigorosamente 2200 modelli in 16 attività diverse, abbiamo scoperto che alcuni modelli faticano a generalizzarsi e che potenziarli con la memoria esterna è fondamentale per migliorare le prestazioni.

Un’altra sfida che affrontiamo è come farlo compiere progressi su compiti a lungo termine a livello di espertidove le ricompense sono poche e rare. Abbiamo sviluppato un nuovo approccio e un set di dati di formazione open source per aiutare i modelli a imparare a esplorare in modi simili a quelli umani su orizzonti temporali a lungo termine.

Approcci innovativi

Man mano che sviluppiamo capacità di intelligenza artificiale più avanzate, dobbiamo garantire che i metodi attuali funzionino come previsto ed efficientemente per il mondo reale. Ad esempio, sebbene i modelli linguistici possano produrre risposte impressionanti, molti non sono in grado di spiegare le loro risposte. Introduciamo a metodo per utilizzare modelli linguistici per risolvere problemi di ragionamento in più fasi sfruttando la loro struttura logica sottostante, fornendo spiegazioni che possono essere comprese e verificate dagli esseri umani. D’altro canto, gli attacchi avversari sono un modo per sondare i limiti dei modelli di intelligenza artificiale spingendoli a creare risultati errati o dannosi. L’addestramento sugli esempi contraddittori rende i modelli più resistenti agli attacchi, ma può andare a scapito delle prestazioni su input “regolari”. Mostriamo che aggiungendo adattatori possiamo creare modelli che ci consentono di controllare questo compromesso al volo.

L’apprendimento per rinforzo (RL) si è rivelato efficace per una serie di sfide del mondo realema gli algoritmi RL sono generalmente progettati per svolgere bene un compito e faticano a generalizzare a nuovi. Proponiamo distillazione dell’algoritmoun metodo che consente a un singolo modello di generalizzare in modo efficiente a nuovi compiti addestrando un trasformatore a imitare le storie di apprendimento degli algoritmi RL in diversi compiti. I modelli RL apprendono anche per tentativi ed errori, il che può richiedere un notevole dispendio di dati e di tempo. Per il nostro modello sono stati necessari quasi 80 miliardi di frame di dati Agente 57 per raggiungere prestazioni di livello umano in 57 giochi Atari. Condividiamo un nuovo modo di farlo allenarsi a questo livello utilizzando 200 volte meno esperienzariducendo notevolmente i costi informatici ed energetici.

L’intelligenza artificiale per la scienza

L’intelligenza artificiale è un potente strumento che consente ai ricercatori di analizzare grandi quantità di dati complessi e comprendere il mondo che ci circonda. Diversi articoli mostrano come l’intelligenza artificiale stia accelerando il progresso scientifico e come la scienza stia facendo progredire l’intelligenza artificiale.

Prevedere le proprietà di una molecola dalla sua struttura 3D è fondamentale per la scoperta di farmaci. Noi presentiamo un metodo di denoising che raggiunge un nuovo stato dell’arte nella previsione delle proprietà molecolari, consente il pre-addestramento su larga scala e generalizza su diversi set di dati biologici. Introduciamo anche una novità trasformatore che può effettuare calcoli di chimica quantistica più accurati utilizzando solo i dati sulle posizioni atomiche.

Infine, con FIGnettraiamo ispirazione dalla fisica per modellare le collisioni tra forme complesse, come una teiera o una ciambella. Questo simulatore potrebbe avere applicazioni nella robotica, nella grafica e nella progettazione meccanica.

‍

Consulta l’elenco completo di Documenti di DeepMind e programma degli eventi all’ICLR 2023.