Apprendimento per rinforzo: metodi del gradiente politico

 | Intelligenza-Artificiale

Insegnare a un'auto ad attraversare una montagna utilizzando i metodi del gradiente politico in Python: un'immersione matematica profonda nell'apprendimento per rinforzo

Immagine generata da DALL-E

Immagina di voler insegnare a un cane a prendere una palla. All'inizio il cane non ha idea di cosa fare quando lanci la palla. Potrebbe correre in direzioni diverse, ignorare…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *