Cos’è la Prompt Architecture negli LLM?

 | Intelligenza-Artificiale

Dall’ingegneria tempestiva all’architettura tempestiva

Immagine dell’autore. (generato dall’IA)

Riassumere.

È iniziato con una sola parola.
Non soddisfatti dei risultati, abbiamo riprovato.

Riassumi i punti più importanti dell’articolo.

Il prompt engineering ci insegna che i prompt più specifici sono migliori.

Individua le tre argomentazioni più importanti avanzate nell’articolo e valuta la forza dell’argomentazione dell’autore sulla base delle prove fornite. Ci sono punti in cui ritieni che l’argomentazione potrebbe essere più forte o più convincente?

Nel corso del tempo, abbiamo imparato a includere maggiori dettagli per guidare i nostri LLM preferiti a fornire le risposte migliori.

Una recente architettura di prompt chiamata Least to Most prompting. (1)

Le tecniche di ingegneria rapida stanno diventando sistemi sempre più complessi ed elaborati, a volte costituiti da molti componenti. La definizione di ingegneria tempestiva potrebbe essere limitante nel definire sistemi così complessi.

In questo articolo, voglio proporre un’etichetta più accurata per i sistemi multicomponente che si interfacciano con gli LLM:

Architettura tempestiva.

La storia dell’ingegneria rapida

I modelli linguistici moderni hanno sviluppato un’impressionante capacità di affrontare compiti nuovi dopo aver visto solo un paio di esempi. Questa capacità si chiama apprendimento contestuale, ed è il motivo principale per cui il nostro prompt engineering funziona così bene.

I ricercatori ritengono che l’apprendimento in contesto funzioni perché la formazione preliminare insegna al modello le competenze generali necessarie per i compiti linguistici. Poi, al momento del test, deve solo riconoscere lo schema e applicare le sue abilità. I modelli più grandi lo fanno ancora meglio, rendendoli sorprendentemente adattabili a vari compiti legati al linguaggio naturale. (2)

In passato, avresti avuto bisogno di migliaia di esempi etichettati per mettere a punto un modello linguistico per una nuova attività. Ma con l’apprendimento in contesto, puoi fornire al modello la descrizione dell’attività nella sua finestra di contesto e…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *