LaTM, CREATOR e altri framework a circuito chiuso per l’utilizzo degli strumenti LLM…

(Fotografato da Todd Quackenbush SU Unsplash)

In recenti rassegne, abbiamo esplorato l’utilità di integrare modelli linguistici di grandi dimensioni (LLM) con strumenti esterni. A questi modelli può essere insegnato a sfruttare gli strumenti in vari modi. Tuttavia, dovremmo renderci conto che gli LLM esistenti che seguono gli strumenti sfruttano solo un insieme limitato di strumenti potenziali (3), mentre la gamma di problemi che vogliamo risolvere con i LLM è quasi infinita! Tenendo presente tutto ciò, diventa chiaro che un simile paradigma è limitante: saremo sempre in grado di trovare scenari che richiedono strumenti che ancora non esistono. In questa panoramica, esploreremo la ricerca recente che mira a risolvere questo problema fornendo agli LLM le competenze per creare i propri strumenti. Un simile approccio traccia un’interessante analogia con la vita umana, poiché la capacità di fabbricare strumenti ha portato a importanti progressi tecnologici. Ora esploriamo l’impatto di tecniche simili sull’evoluzione dei LLM.

“Secondo le lezioni apprese dalle tappe fondamentali dell’evoluzione umana, un punto di svolta cruciale è stato il fatto che gli esseri umani hanno acquisito la capacità di fabbricare i propri strumenti per affrontare le sfide emergenti. Ci imbarchiamo in un’esplorazione iniziale per applicare questo concetto evolutivo al regno dei LLM. — da (1)

(da (1, 2))

Prima di saperne di più sugli LLM per la creazione di strumenti, ci sono alcuni concetti di base che dobbiamo aggiornare. Abbiamo trattato molte di queste idee in recenti panoramiche, ma le esamineremo nuovamente brevemente ora per rendere la nostra discussione sulle pubblicazioni recenti più completa e comprensibile.

Perché dovremmo usare gli strumenti?

(da (3, 8, 9))

Nelle panoramiche precedenti, abbiamo appreso alcuni diversi tipi di strumenti che possono essere integrati con gli LLM per migliorarne le prestazioni, come ad esempio:

  • Strumenti di base (calcolatrici, motori di ricerca, ecc.) (collegamento)
  • API del modello di deep learning (collegamento)

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *