
Riferimenti
(1) Oudeyer, Pierre-Yves, Frédéric Kaplan e Verena V. Hafner. “Sistemi di motivazione intrinseca per lo sviluppo mentale autonomo”. Transazioni IEEE sul calcolo evolutivo 11.2 (2007): 265-286.
(2) Schmidhuber, Jürgen. “Teoria formale della creatività, del divertimento e della motivazione intrinseca (1990-2010).” Transazioni IEEE sullo sviluppo mentale autonomo 2.3 (2010): 230-247.
(3) Schmidhuber, Jürgen. “Una possibilità per implementare la curiosità e la noia nei controllori neurali della costruzione di modelli.” Proc. della conferenza internazionale sulla simulazione del comportamento adattivo: dagli animali agli animati. 1991.
(4) Pathak, Deepak et al. “Esplorazione guidata dalla curiosità mediante previsione auto-supervisionata.” Conferenza internazionale sull’apprendimento automatico. PMLR, 2017.
(5) Sekar, Ramanan et al. “Pianificare l’esplorazione tramite modelli mondiali autocontrollati.” Conferenza internazionale sull’apprendimento automatico. PMLR, 2020.
(6) Abdolmaleki, Abbas et al. “Massima ottimizzazione politica a posteriori.” prestampa di arXiv arXiv:1806.06920 (2018).
(7) Wulfmeier, Markus et al. “Trasferimento compositivo nell’apprendimento per rinforzo gerarchico”. prestampa di arXiv arXiv:1906.11228 (2019).
(8) Riedmiller, Martin et al. “Imparare giocando e risolvendo da zero compiti con ricompense sparse.” Conferenza internazionale sull’apprendimento automatico. PMLR, 2018.
(9) Riedmiller, Martin et al. Prestampa arXiv “Raccogli e deduci” arXiv:2108.10273 (2021).
Fonte: deepmind.google