Costruisci il tuo RAG ed eseguilo localmente sul tuo laptop: ColBERT + DSPy + Streamlit |  di Shuyi Yang |  Marzo 2024

 | Intelligenza-Artificiale

fotografato da Tamara no SU Unsplash

Tutorial per principianti di IA generativa: costruiamo localmente un semplicissimo sistema RAG (Retrieval Augmented Generation), passo dopo passo

UN Generazione aumentata di recupero (STRACCIO) è come un assistente intelligente che ti aiuta. Immagina di scrivere su un argomento. Hai una certa conoscenza nella tua testa (come un'intelligenza artificiale generativa), ma potresti non ricordare tutto. Quindi, cerchi informazioni nei libri o su Internet (questa è la parte del “recupero”). Una volta trovate le informazioni giuste, puoi utilizzarle per scrivere il report con parole tue (questa è la parte di “generazione”). Quindi, un sistema RAG è uno strumento che combina la propria conoscenza (come la memoria) con la capacità di cercare altre fonti di informazioni (come libri o appunti), per generare (scrivere) una risposta o completare un'attività.

Di solito, la complessità e le esigenze dei sistemi RAG richiedono l'uso di computer potenti o servizi cloud. In questo tutorial, costruiremo una generazione aumentata di recupero molto semplice sistema localmente (cioè senza servizi online durante la fase di funzionamento), passo dopo passo, con framework o strumenti all'avanguardia. La procedura qui delineata è fondamentalmente elementare e si discosta notevolmente dagli standard industriali stabiliti. Lo scopo di questo tutorial non è costruire il sistema RAG definitivo, ma piuttosto esaminare ciascun componente un po' in dettaglio per acquisire una comprensione più profonda dei meccanismi sottostanti. Questo articolo è rivolto ai principianti del mondo GenAI. Ogni pezzo di codice qui mostrato è riportato anche nel file Repository GitHub di easyRAG.

Pronto? Andiamo!

Usiamo Anaconda in questo tutorial. Se non lo hai sul tuo computer, per favore, scaricalo dal sito Web ufficiale e installalo (basta seguire le istruzioni dello script di installazione).

Quindi, all'interno di una sessione terminale, possiamo iniziare a creare l'ambiente con alcuni pacchetti che utilizzeremo durante il processo

conda create -n easyrag -c nvidia -c conda-forge -v python==3.9 cuda-toolkit==12.4.0 jupyterlab==4.1.4 ipywidgets==8.1.2 wikipedia==1.4.0 mypy==1.8.0 accelerate==0.27.0…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *