Apprendimento per rinforzo: metodi del gradiente politico | Intelligenza-Artificiale - Intelligenza Artificiale

Apprendimento per rinforzo: metodi del gradiente politico

| Intelligenza-Artificiale

Insegnare a un'auto ad attraversare una montagna utilizzando i metodi del gradiente politico in Python: un'immersione matematica profonda nell'apprendimento per rinforzo

Immagine generata da DALL-E

Immagina di voler insegnare a un cane a prendere una palla. All'inizio il cane non ha idea di cosa fare quando lanci la palla. Potrebbe correre in direzioni diverse, ignorare…

Fonte: towardsdatascience.com

Lascia un commento Annulla risposta