Ricerca
Due nuovi sistemi di intelligenza artificiale, ALOHA Unleashed e DemoStart, aiutano i robot a imparare a svolgere compiti complessi che richiedono movimenti agili
Le persone svolgono molti compiti quotidianamente, come allacciare le scarpe o stringere una vite. Ma per i robot, imparare questi compiti altamente abili è incredibilmente difficile da fare bene. Per rendere i robot più utili nella vita delle persone, devono migliorare nel contatto con oggetti fisici in ambienti dinamici.
Oggi presentiamo due nuovi articoli che illustrano i nostri ultimi progressi nell'ambito dell'intelligenza artificiale (IA) nella ricerca sulla destrezza dei robot: ALOHA scatenato che aiuta i robot ad apprendere come svolgere compiti complessi e nuovi di manipolazione a due braccia; e DemoAvvia che utilizza simulazioni per migliorare le prestazioni reali di una mano robotica con più dita.
Aiutando i robot ad apprendere dalle dimostrazioni umane e a tradurre le immagini in azioni, questi sistemi stanno aprendo la strada a robot in grado di svolgere un'ampia gamma di compiti utili.
Migliorare l'apprendimento tramite imitazione con due bracci robotici
Finora, la maggior parte dei robot AI avanzati sono stati in grado di raccogliere e posizionare oggetti utilizzando solo un braccio. In il nostro nuovo articolopresentiamo ALOHA Unleashed, che raggiunge un alto livello di destrezza nella manipolazione bi-braccio. Con questo nuovo metodo, il nostro robot ha imparato ad allacciare un laccio delle scarpe, appendere una maglietta, riparare un altro robot, inserire un ingranaggio e persino pulire una cucina.
Il metodo ALOHA Unleashed si basa sul nostro ALOHA 2 piattaforma che si basava sull'originale ALOHA (un sistema hardware open source a basso costo per la teleoperazione bimanuale) da Università di Stanford.
ALOHA 2 è significativamente più abile rispetto ai sistemi precedenti perché è dotato di due mani che possono essere facilmente telecomandate per scopi di formazione e raccolta dati e consente ai robot di imparare a svolgere nuovi compiti con meno dimostrazioni.
Abbiamo anche migliorato l'ergonomia dell'hardware robotico e potenziato il processo di apprendimento nel nostro ultimo sistema. Innanzitutto, abbiamo raccolto dati dimostrativi azionando da remoto il comportamento del robot, eseguendo compiti difficili come allacciare le scarpe e appendere le magliette. Quindi, abbiamo applicato un metodo di diffusione, prevedendo le azioni del robot da rumori casuali, in modo simile a come il nostro Immagine modello genera immagini. Questo aiuta il robot ad apprendere dai dati, così da poter svolgere le stesse attività da solo.
Apprendimento dei comportamenti robotici da poche dimostrazioni simulate
Controllare una mano robotica abile è un compito complesso, che diventa ancora più complesso con ogni dito, articolazione e sensore aggiuntivi. In un altro nuovo documentopresentiamo DemoStart, che utilizza un algoritmo di apprendimento di rinforzo per aiutare i robot ad acquisire comportamenti abili nella simulazione. Questi comportamenti appresi sono particolarmente utili per forme di realizzazione complesse, come mani con più dita.
DemoStart impara prima dagli stati facili e, nel tempo, inizia ad apprendere da stati più difficili finché non padroneggia un compito al meglio delle sue capacità. Richiede 100 volte meno dimostrazioni simulate per imparare a risolvere un compito in simulazione rispetto a quanto solitamente necessario quando si impara da esempi del mondo reale per lo stesso scopo.
Il robot ha raggiunto un tasso di successo di oltre il 98% in una serie di compiti diversi in simulazione, tra cui il riorientamento di cubi con un certo colore visibile, il serraggio di un dado e di un bullone e la sistemazione di utensili. Nella configurazione reale, ha raggiunto un tasso di successo del 97% nel riorientamento e nel sollevamento di cubi e del 64% in un compito di inserimento di una spina in una presa che richiedeva coordinazione e precisione con dita alte.
Abbiamo sviluppato DemoStart con MuJoCoil nostro simulatore di fisica open source. Dopo aver padroneggiato una serie di attività di simulazione e aver utilizzato tecniche standard per ridurre il divario tra simulazione e realtà, come la randomizzazione del dominio, il nostro approccio è stato in grado di trasferire quasi zero-shot al mondo fisico.
L'apprendimento robotico in simulazione può ridurre i costi e i tempi necessari per eseguire esperimenti fisici reali. Ma è difficile progettare queste simulazioni e, inoltre, non sempre si traducono con successo in prestazioni nel mondo reale. Combinando l'apprendimento per rinforzo con l'apprendimento da alcune dimostrazioni, l'apprendimento progressivo di DemoStart genera automaticamente un curriculum che colma il divario tra simulazione e realtà, rendendo più facile trasferire la conoscenza da una simulazione a un robot fisico e riducendo i costi e i tempi necessari per eseguire esperimenti fisici.
Per consentire un apprendimento più avanzato dei robot attraverso una sperimentazione intensiva, abbiamo testato questo nuovo approccio su una mano robotica a tre dita, chiamata DEX-EEche è stato sviluppato in collaborazione con Robot Ombra.
Il futuro della destrezza dei robot
La robotica è un'area unica della ricerca sull'intelligenza artificiale che mostra quanto bene i nostri approcci funzionino nel mondo reale. Ad esempio, un modello linguistico di grandi dimensioni potrebbe dirti come stringere un bullone o allacciarti le scarpe, ma anche se fosse incarnato in un robot, non sarebbe in grado di svolgere quelle attività da solo.
Un giorno, i robot AI aiuteranno le persone con tutti i tipi di compiti a casa, sul posto di lavoro e altro ancora. La ricerca sulla destrezza, compresi gli approcci di apprendimento efficienti e generali che abbiamo descritto oggi, contribuirà a rendere possibile quel futuro.
C'è ancora molta strada da fare prima che i robot possano afferrare e maneggiare oggetti con la stessa facilità e precisione delle persone, ma stiamo facendo progressi significativi e ogni innovazione rivoluzionaria è un altro passo nella giusta direzione.
Fonte: deepmind.google