Google DeepMind all'ICML 2024

 | Intelligenza-Artificiale

Ricerca

Pubblicato

Esplorare l'AGI, le sfide della scalabilità e il futuro dell'intelligenza artificiale generativa multimodale

La prossima settimana la comunità dell'intelligenza artificiale (IA) si riunirà per il 2024 Conferenza internazionale sull'apprendimento automatico (ICML). In programma dal 21 al 27 luglio a Vienna, in Austria, la conferenza è una piattaforma internazionale per mostrare gli ultimi progressi, scambiare idee e dare forma al futuro della ricerca sull'intelligenza artificiale.

Quest'anno, i team di Google DeepMind presenteranno più di 80 documenti di ricerca. Al nostro stand, presenteremo anche il nostro modello multimodale on-device, Gemelli Nanola nostra nuova famiglia di modelli di intelligenza artificiale per l'istruzione chiamata ImparaLM e faremo una dimostrazione TatticaAIun assistente AI che può aiutare con le tattiche calcistiche.

Qui presentiamo alcune delle nostre presentazioni orali, in evidenza e poster:

Definizione del percorso verso AGI

Cos'è l'intelligenza artificiale generale (AGI)? L'espressione descrive un sistema di intelligenza artificiale che è almeno capace quanto un essere umano nella maggior parte dei compiti. Man mano che i modelli di intelligenza artificiale continuano a progredire, definire come potrebbe apparire l'AGI in pratica diventerà sempre più importante.

Presenteremo un quadro per classificare le capacità e i comportamenti dei modelli AGI. A seconda delle loro prestazioni, generalità e autonomia, il nostro documento categorizza sistemi che vanno dai calcolatori non AI ai modelli AI emergenti e altre nuove tecnologie.

Dimostreremo anche che l'apertura è fondamentale per la creazione di un'intelligenza artificiale generalizzata che va oltre le capacità umane. Mentre molti recenti progressi dell'IA sono stati guidati da dati esistenti su scala Internet, i sistemi aperti possono generare nuove scoperte che estendono la conoscenza umana.

All'ICML presenteremo Genie, un modello in grado di generare una serie di ambienti giocabili basati su prompt di testo, immagini, foto o schizzi.

Scalare i sistemi di intelligenza artificiale in modo efficiente e responsabile

Per sviluppare modelli di intelligenza artificiale più grandi e più capaci sono necessari metodi di formazione più efficienti, un più stretto allineamento con le preferenze umane e migliori garanzie della privacy.

Ti mostreremo come utilizzare tecniche di classificazione invece di regressione semplifica la scalabilità dei sistemi di apprendimento con rinforzo profondo e il raggiungimento di prestazioni all'avanguardia in diversi domini. Inoltre, proponiamo un nuovo approccio che prevede la distribuzione delle conseguenze delle azioni di un agente di apprendimento per rinforzoaiutando a valutare rapidamente nuovi scenari.

I nostri ricercatori presentano un approccio di mantenimento dell'allineamento che riduce la necessità di supervisione umana e un nuovo approccio alla messa a punto di modelli linguistici di grandi dimensioni (LLM)basato sulla teoria dei giochi, allinea meglio l'output di un LLM con le preferenze umane.

Noi criticare l'approccio dei modelli di formazione sui dati pubblici e la messa a punto solo con la formazione “differenzialmente privata”e sostengono che questo approccio potrebbe non garantire la riservatezza o l'utilità che spesso si sostiene.

VideoPoet è un modello linguistico di grandi dimensioni per la generazione di video zero-shot.

Nuovi approcci nell'intelligenza artificiale generativa e nella multimodalità

Le tecnologie di intelligenza artificiale generativa e le capacità multimodali stanno ampliando le possibilità creative dei media digitali.

Noi presenteremo VideoPoetache utilizza un LLM per generare video e audio all'avanguardia da input multimodali tra cui immagini, testo, audio e altri video.

E condividi Genio (ambienti interattivi generativi), in grado di generare una gamma di ambienti giocabili per l'addestramento di agenti di intelligenza artificiale, basati su prompt di testo, immagini, foto o schizzi.

Infine, introduciamo Lente magicaun nuovo sistema di recupero delle immagini che utilizza istruzioni testuali per recuperare immagini con relazioni più ricche che vanno oltre la somiglianza visiva.

Supportare la comunità dell'intelligenza artificiale

Siamo orgogliosi di sponsorizzare ICML e promuovere una comunità diversificata nell'intelligenza artificiale e nell'apprendimento automatico supportando iniziative guidate da Disabilità nell'intelligenza artificiale,Queer nell'intelligenza artificiale,LatinX nell'intelligenza artificiale ELe donne nell'apprendimento automatico.

Se partecipi alla conferenza, visita gli stand di Google DeepMind e Google Research per incontrare i nostri team, assistere a dimostrazioni dal vivo e scoprire di più sulla nostra ricerca.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *