INSEGNAMENTO RAFFORZATIVO
L’apprendimento per rinforzo è uno dei campi più affascinanti dell’apprendimento automatico. A differenza dell’apprendimento supervisionato, i modelli di apprendimento per rinforzo possono apprendere processi complessi in modo indipendente, anche senza dati ben tabulati.
Per me è molto divertente vedere gli agenti IA vincere ai videogiochi, ma puoi anche utilizzare l’apprendimento per rinforzo per risolvere problemi aziendali. Esprimilo semplicemente come un gioco e il gioco è fatto! Devi solo definire…
- l’ambiente in cui vive il tuo agente,
- quali decisioni può prendere il tuo agente e
- come sono il successo e il fallimento.
Prima di continuare, leggi il mio articolo introduttivo sull’apprendimento per rinforzo. Ti fornisce un contesto in più e ti mostra come condurre da solo una forma semplice ma efficace di apprendimento per rinforzo. Serve anche come base per questo articolo.
In questo articolo imparerai il profondo Q-learning, perché ne abbiamo bisogno e come implementarlo tu stesso per padroneggiare un gioco che sembra molto più difficile di quelli del mio altro articolo.
Puoi trovare il codice in il mio Github.
Nell’articolo collegato sopra, abbiamo condotto Q-learning per far giocare a un agente alcuni giochi semplici con small spazi di osservazione discreti. Nel gioco Frozen Lake, ad esempio, hai 16 campi (=stati o osservazioni, d’ora in poi userò questi termini in modo intercambiabile) su cui puoi posizionarti nella mappa 4×4. Nel versione da palestra del gioco di carte Blackjackci sono 32 · 11 · 2 = 704 stati.
Inefficienze del Q-Learning
Fonte: towardsdatascience.com