Costruire un sistema avanzato basato su LLM | Intelligenza-Artificiale

Indice contenuti

introduzione

Questo articolo riguarda la creazione di un sistema basato su LLM (Large Language Model) con ChatGPT AI-1. Si prevede che i lettori siano a conoscenza delle basi di Prompt Engineering. Per comprendere meglio i concetti si può fare riferimento a: https://www.analyticsvidhya.com/blog/2023/08/prompt-engineering-in-generative-ai/

Questo articolo adotterà un approccio passo-passo. Considerando l’enormità dell’argomento, abbiamo diviso l’articolo in tre parti. È la prima delle tre parti. Un singolo prompt non è sufficiente per un sistema e approfondiremo la parte di sviluppo di un sistema basato su LLM.

obiettivi formativi

Iniziare con la creazione di sistemi basati su LLM.
Capire come funziona un LLM.
Comprendere i concetti di token e formato della chat.
Applicare classificazione, moderazione e una catena di ragionamento per costruire un sistema.

Questo articolo è stato pubblicato come parte del Blogathon sulla scienza dei dati.

Meccanismo di funzionamento del LLM

In un processo di generazione di testo, viene fornito un prompt e viene chiesto a un LLM di compilare le cose che completeranno il prompt fornito.

Per esempioLa matematica è ________. LLM potrebbe riempirlo con “un argomento interessante, madre di tutta la scienza, ecc.”

Il modello linguistico di grandi dimensioni apprende tutto questo attraverso l’apprendimento supervisionato. Nell’apprendimento supervisionato, un modello apprende un input-output attraverso dati di addestramento etichettati. Il processo esatto viene utilizzato per la mappatura XY.

Per esempioClassificazione dei feedback negli alberghi. Recensioni come “la stanza era fantastica” verrebbero etichettate come recensioni con sentimento positivo, mentre “il servizio era lento ” è stato etichettato come sentimento negativo.

L’apprendimento supervisionato implica l’ottenimento di dati etichettati e quindi l’addestramento del modello di intelligenza artificiale su tali dati. La formazione è seguita dalla distribuzione e, infine, dalla chiamata dei modelli. Ora daremo una nuova recensione all’hotel come una posizione pittoresca e, si spera, il risultato sarà un sentimento positivo.
Esistono due tipi principali di modelli linguistici di grandi dimensioni, il LLM di base e il LLM ottimizzato per le istruzioni. Per approfondire i concetti si può fare riferimento ad un mio articolo, il cui link è riportato di seguito.