Tutorial per principianti di IA generativa: costruiamo localmente un semplicissimo sistema RAG (Retrieval Augmented Generation), passo dopo passo
UN Generazione aumentata di recupero (STRACCIO) è come un assistente intelligente che ti aiuta. Immagina di scrivere su un argomento. Hai una certa conoscenza nella tua testa (come un'intelligenza artificiale generativa), ma potresti non ricordare tutto. Quindi, cerchi informazioni nei libri o su Internet (questa è la parte del “recupero”). Una volta trovate le informazioni giuste, puoi utilizzarle per scrivere il report con parole tue (questa è la parte di “generazione”). Quindi, un sistema RAG è uno strumento che combina la propria conoscenza (come la memoria) con la capacità di cercare altre fonti di informazioni (come libri o appunti), per generare (scrivere) una risposta o completare un'attività.
Di solito, la complessità e le esigenze dei sistemi RAG richiedono l'uso di computer potenti o servizi cloud. In questo tutorial, costruiremo una generazione aumentata di recupero molto semplice sistema localmente (cioè senza servizi online durante la fase di funzionamento), passo dopo passo, con framework o strumenti all'avanguardia. La procedura qui delineata è fondamentalmente elementare e si discosta notevolmente dagli standard industriali stabiliti. Lo scopo di questo tutorial non è costruire il sistema RAG definitivo, ma piuttosto esaminare ciascun componente un po' in dettaglio per acquisire una comprensione più profonda dei meccanismi sottostanti. Questo articolo è rivolto ai principianti del mondo GenAI. Ogni pezzo di codice qui mostrato è riportato anche nel file Repository GitHub di easyRAG.
Pronto? Andiamo!
Usiamo Anaconda in questo tutorial. Se non lo hai sul tuo computer, per favore, scaricalo dal sito Web ufficiale e installalo (basta seguire le istruzioni dello script di installazione).
Quindi, all'interno di una sessione terminale, possiamo iniziare a creare l'ambiente con alcuni pacchetti che utilizzeremo durante il processo
conda create -n easyrag -c nvidia -c conda-forge -v python==3.9 cuda-toolkit==12.4.0 jupyterlab==4.1.4 ipywidgets==8.1.2 wikipedia==1.4.0 mypy==1.8.0 accelerate==0.27.0…
Fonte: towardsdatascience.com