Albero dei pensieri che suggeriscono.  Risolvere problemi in più fasi con i LLM… |  di Cameron R. Wolfe, Ph.D.  |  Dicembre 2023

 | Intelligenza-Artificiale

Risolvere problemi in più fasi con i LLM attraverso la pianificazione e l’esplorazione deliberate…

(Fotografato da Giovanni Siemens SU Unsplash)

Quando i modelli linguistici di grandi dimensioni (LLM) iniziarono a guadagnare popolarità, furono criticati per i loro difetti nel risolvere problemi complessi basati sul ragionamento. Sebbene l’incremento di questi modelli (ovvero, più parametri e più dati) abbia fornito un miglioramento delle prestazioni quasi uniforme tra le attività, non abbiamo riscontrato praticamente alcun aumento delle prestazioni nelle attività basate sul ragionamento con i moderni LLM. La situazione è cambiata con la proposta di tecniche di suggerimento avanzate, come la catena di suggerimenti (2) e l’autocoerenza (3). Tali metodi ci hanno mostrato che i LLM sono più che capaci di ragionare e risolvere problemi complessi in più fasi. Devono solo essere adeguatamente incoraggiati a sfruttare appieno queste capacità.

“Forse è sorprendente che alla base di tutto questo progresso ci sia ancora il meccanismo autoregressivo originale per la generazione del testo, che prende decisioni a livello di token una per una e in modo da sinistra a destra.” — da (1)

Anche se un’adeguata guida può consentire ai LLM di risolvere problemi complessi, queste tecniche mancano. Cioè, in genere io) fornire un suggerimento al LLM e ii) aspettarsi che il modello utilizzi la previsione del token successivo per generare una soluzione completa. Alcuni approcci possono generare soluzioni in modo graduale (ad esempio, il suggerimento dal minimo al massimo (8)), ma il LLM segue comunque un unico percorso di ragionamento invece di esplorare diverse potenziali soluzioni. Per problemi complessi in cui le decisioni iniziali possono far deragliare completamente una soluzione, un simile approccio non sarà sufficiente, il che è un problema dato che gli LLM sono ora comunemente usati come risolutori di problemi generici in una varietà di applicazioni pratiche. In poche parole, abbiamo bisogno di un approccio di suggerimento che esegua una pianificazione ed esplorazione più deliberata durante la risoluzione dei problemi.

In (1), gli autori propongono un approccio di questo tipo – chiamato Tree of Thoughts prompting – che risolve i problemi scomponendoli esplicitamente in una serie di pensierio passaggi intermedi. Simile alla sequenza di pensieri, la sequenza di pensieri ad albero genera una soluzione che è semplicemente una sequenza di pensieri individuali. Tuttavia, questo approccio va oltre consentendo di considerare più percorsi di ragionamento contemporaneamente: formare un albero di potenziali pensieri o percorsi di ragionamento – ed esplorando questo…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *