Sb3, il coltellino svizzero della RL applicata |  di James Koh, Ph.D. |  Ottobre 2023

 | Intelligenza-Artificiale

A voi la scelta del modello, con qualsiasi ambiente

Immagine creata da DALL·E 3 in base al messaggio “Crea un’immagine dall’aspetto realistico di un coltellino svizzero aperto”.

Stablebaseline3 (sb3) è come un coltellino svizzero. È uno strumento di utilità multifunzione, che può essere utilizzato per molti scopi. E, proprio come un coltellino svizzero può salvarti la vita se sei bloccato in una giungla, sb3 può salvarti la vita in ufficio, quando hai scadenze apparentemente impossibili da rispettare.

Questa guida utilizza gymnasium=0.28.1 e stable-baselines=2.1.0. Se utilizzi versioni diverse, o magari fai riferimento anche ad altre vecchie guide, potresti non ottenere i risultati riportati di seguito. Ma non preoccuparti, qui viene fornita anche una guida all’installazione. Ti garantisco che puoi ottenere i risultati se segui le mie istruzioni.

Stablebaseline3 è facile da usare. È anche ben documentato e puoi seguire i tutorial da solo. Ma…

  • Hai fatto riferimento a guide più vecchie (magari quelle che utilizzavano gym), solo per trovare errori sulla tua macchina?
  • Riesci a garantire sempre la compatibilità?
  • E se volessi usarlo gymnasiuml’ambiente e modificare forse le ricompense?
  • Sai come strutturare i tuoi compiti in modo tale che i modelli SOTA possano essere applicati in poche righe?

Questo è l’obiettivo di questo articolo! Dopo aver letto questa dimostrazione guidata, potrai…

  1. Risolvi ambienti classici con modelli sb3, visualizza i risultati e salva (o carica) il modello addestrato in poche righe di codice. (Sezione 3.1)
  2. Comprendere come verificare la compatibilità dello spazio di azione e dello spazio di osservazione. (Sezione 3.2)
  3. Impara come avvolgere gymnasiumambienti in modo che sia possibile utilizzare qualsiasi modello sb3, senza alcuna restrizione box O discrete. (Sezione 4.1)
  4. Impara come avvolgere gymnasiumambienti per la formazione della ricompensa. (Sezione 4.2)
  5. Scopri come creare ambienti personalizzati per renderli compatibili con sb3, con modifiche minime al codice originale che potrebbe seguire una struttura diversa. (Sezione 5)

Crea un ambiente virtuale e configura le relative dipendenze. Mi rivolgo alla maggioranza: qui la guida è creata utilizzando Windows…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *