Appunti

(1) Abramson, J., Ahuja, A., Barr, I., Brussee, A., Carnevale, F., Cassin, M., Chhaparia, R., Clark, S., Damoc, B., Dudzik, A. e Georgiev, P., 2020. Imitare l’intelligenza interattiva. arXiv prestampa arXiv:2012.05672.

(2) Abramson, J., Ahuja, A., Brussee, A., Carnevale, F., Cassin, M., Fischer, F., Georgiev, P., Goldin, A., Harley, T. e Hill, F., 2021. Creazione di agenti interattivi multimodali con imitazione e apprendimento autosuperato. arXiv prestampa arXiv:2112.03763.

(3) Abramson, J., Ahuja, A., Carnevale, F., Georgiev, P., Goldin, A., Hung, A., Landon, J., Lillicrap, T., Muldal, A., Richards, B. e Santoro, A., 2022. Valutazione degli agenti interattivi multimodali. arXiv prestampa arXiv:2205.13274.

(4) Bai, Y., Jones, A., Ndousse, K., Askell, A., Chen, A., DasSarma, N., Drain, D., Fort, S., Ganguli, D., Henighan, T. e Joseph, N., 2022. Formare un assistente utile e innocuo con l’apprendimento rinforzato dal feedback umano. arXiv prestampa arXiv:2204.05862.

(5) Christiano, PF, Leike, J., Brown, T., Martic, M., Legg, S. e Amodei, D., 2017. Apprendimento profondo per rinforzo dalle preferenze umane. Progressi nei sistemi di elaborazione delle informazioni neurali, 30.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *