Comprendere il mondo fisico è un’abilità fondamentale che la maggior parte delle persone impiega senza sforzo. Tuttavia, ciò rappresenta ancora una sfida per l’intelligenza artificiale; se vogliamo implementare sistemi sicuri e utili nel mondo reale, vogliamo che questi modelli condividano il nostro senso intuitivo della fisica. Ma prima di poter costruire questi modelli, c’è un’altra sfida: come misureremo la capacità di questi modelli di comprendere il mondo fisico? Cioè, cosa significa comprendere il mondo fisico e come possiamo quantificarlo?

Fortunatamente per noi, gli psicologi dello sviluppo hanno trascorso decenni a studiare ciò che i bambini sanno del mondo fisico. Lungo il percorso, hanno scolpito la nebulosa nozione di conoscenza fisica in un insieme concreto di concetti fisici. E hanno sviluppato il paradigma della violazione delle aspettative (VoE) per testare questi concetti nei neonati.

Nel nostro articolo pubblicato oggi su Nature Human Behavior, abbiamo esteso il loro lavoro e reso open source il file Set di dati sui concetti fisici. Questo set di dati video sintetico porta il paradigma VoE per valutare cinque concetti fisici: solidità, persistenza dell’oggetto, continuità, “immutabilità” e inerzia direzionale.

Con un punto di riferimento per la conoscenza fisica in mano, ci siamo impegnati a costruire un modello in grado di apprendere informazioni sul mondo fisico. Ancora una volta, abbiamo cercato ispirazione negli psicologi dello sviluppo. I ricercatori non solo hanno catalogato ciò che i bambini sanno del mondo fisico, ma hanno anche ipotizzato i meccanismi che potrebbero consentire questo comportamento. Nonostante la variabilità, questi resoconti hanno un ruolo centrale per l’idea di scomporre il mondo fisico in un insieme di oggetti che evolvono nel tempo.

Ispirati da questo lavoro, abbiamo costruito un sistema che abbiamo soprannominato PLATO (Physics Learning through Auto-encoding and Tracking Objects). PLATONE rappresenta e ragiona sul mondo come un insieme di oggetti. Fa previsioni su dove saranno gli oggetti in futuro in base a dove sono stati in passato e con quali altri oggetti stanno interagendo.

Dopo aver addestrato PLATO su video di semplici interazioni fisiche, abbiamo scoperto che PLATO ha superato i test nel nostro set di dati Physical Concepts. Inoltre, abbiamo addestrato modelli “piatti” che erano grandi quanto (o addirittura più grandi) di PLATO ma non utilizzavano rappresentazioni basate su oggetti. Quando abbiamo testato questi modelli, abbiamo scoperto che non superavano tutti i nostri test. Ciò suggerisce che gli oggetti sono utili per l’apprendimento della fisica intuitiva, supportando le ipotesi della letteratura sullo sviluppo.

Volevamo anche determinare quanta esperienza fosse necessaria per sviluppare questa capacità. La prova della conoscenza fisica è stata dimostrata in bambini di appena due mesi e mezzo di età. Come se la cava PLATO in confronto? Variando la quantità di dati di allenamento utilizzati da PLATO, abbiamo scoperto che PLATO poteva apprendere i nostri concetti fisici con appena 28 ore di esperienza visiva. La natura limitata e sintetica del nostro set di dati significa che non possiamo fare un confronto identico tra la quantità di esperienze visive ricevute dai neonati e PLATO. Tuttavia, questo risultato suggerisce che la fisica intuitiva può essere appresa con relativamente poca esperienza se supportata da una predisposizione induttiva per rappresentare il mondo come oggetti.

Infine, volevamo testare la capacità di generalizzazione di PLATO. Nel set di dati Physical Concepts, tutti gli oggetti nel nostro set di test sono presenti anche nel set di training. E se testassimo PLATO con oggetti mai visti prima? Per fare ciò, abbiamo sfruttato un sottoinsieme di un altro sintetico set di dati sviluppato dai ricercatori del MIT. Questo set di dati sonda anche la conoscenza fisica, anche se con aspetti visivi diversi e una serie di oggetti che PLATO non ha mai visto prima. PLATO è stato superato senza alcuna riqualificazione, nonostante sia stato testato su stimoli completamente nuovi.

Ci auguriamo che questo set di dati possa fornire ai ricercatori una comprensione più specifica delle capacità del loro modello di comprendere il mondo fisico. In futuro, questo potrà essere ampliato per testare più aspetti della fisica intuitiva, aumentando l’elenco dei concetti fisici testati e utilizzando stimoli visivi più ricchi, tra cui nuove forme di oggetti o persino video del mondo reale.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *