Una guida passo passo per scoprire e sfruttare la potenza dei database vettoriali
Introduzione
Cosa c’è di così speciale nei database vettoriali?
Come associamo il significato di una frase a una rappresentazione numerica?
In che modo ciò aiuta la nostra app LLM?
Perché non possiamo semplicemente fornire al LLM tutti i dati che abbiamo?
Tutorial pratico: incorporamenti di testo e metriche di distanza
1. Testo da incorporare
2. Traccia 384 dimensioni in 2 utilizzando PCA
3. Calcolare la metrica della distanza
Verso i negozi di vettori
Come accelerare la ricerca di somiglianza?
Quali sono i diversi Vector Store tra cui possiamo scegliere?
Tutorial pratico: configura il tuo primo negozio di vettori
1. Installa la crominanza
2. Ottieni/crea un client e una raccolta chroma
3. Aggiungi alcuni documenti di testo alla raccolta
4. Estrai tutte le voci dal database nel file Excel
5. Interrogare la raccolta
I database vettoriali sono un argomento caldo in questo momento. Le aziende continuano a raccogliere fondi per sviluppare i propri database vettoriali o per aggiungere funzionalità di ricerca vettoriale ai database SQL o NoSQL esistenti.
I database vettoriali consentono di cercare e confrontare rapidamente grandi raccolte di vettori. Ciò è così interessante perché i modelli di incorporamento più aggiornati sono altamente in grado di comprendere la semantica/significato dietro le parole e di tradurli in vettori. Ciò ci consente di confrontare in modo efficiente le frasi tra loro.
Fonte: towardsdatascience.com