
Man mano che ne impariamo di più, i modelli linguistici di grandi dimensioni (LLM) diventano sempre più interessanti. Questi modelli possono risolvere accuratamente una varietà di compiti complessi. Allo stesso tempo, però, hanno difficoltà con alcune funzionalità che noi, come esseri umani, consideriamo basilari! Ad esempio, gli LLM commettono comunemente errori aritmetici, non hanno accesso alle informazioni attuali e faticano persino a comprendere la progressione del tempo. Date queste limitazioni, potremmo chiederci cosa si può fare per rendere i LLM più capaci. Gli LLM sono condannati a subire queste limitazioni per sempre?
Molti progressi nella razza umana sono stati catalizzati dall’accesso a strumenti nuovi e innovativi (ad esempio, il macchina da stampa O computer). La stessa conclusione potrebbe applicarsi ai LLM? All’interno di questa panoramica, studieremo una recente direzione di ricerca che mira a insegnare agli LLM come utilizzare strumenti esterni, che sono resi disponibili tramite semplici API text-to-text. Utilizzando questi strumenti, gli LLM possono delegare attività come l’esecuzione di operazioni aritmetiche o la ricerca di informazioni correnti a uno strumento specializzato. Quindi, le informazioni restituite da questo strumento possono essere utilizzate come contesto dal LLM durante la generazione di output, portando a risposte più accurate e fondate.
Concedere a un LLM l’accesso a uno strumento esterno è un modo affidabile per risolvere alcuni dei limiti che questi modelli devono affrontare. Tuttavia, gli LLM non sapranno come utilizzare gli strumenti in modo naturale, il che solleva la domanda: Come insegniamo al nostro modello a sfruttare strumenti esterni? In questa sezione esploreremo alcune delle opzioni a nostra disposizione ed elencheremo vari strumenti utili per creare applicazioni LLM.
Diversi tipi di apprendimento
Insegnare a un LLM a sfruttare gli strumenti non è diverso dall’imparare a risolvere qualsiasi altro compito con un LLM. Poiché questi modelli apprendono in un paio di modi diversi, esamineremo…