2023 è stato, di gran lunga, l’anno più prolifico nella storia della PNL. Questo periodo ha visto l’emergere di ChatGPT insieme a numerosi altri modelli linguistici di grandi dimensioni, sia open source che proprietari.
Allo stesso tempo, la messa a punto degli LLM è diventata molto più semplice e la concorrenza tra i fornitori di cloud per l’offerta GenAI si è intensificata in modo significativo.
È interessante notare che anche la domanda di RAG personalizzati e pienamente operativi è salita alle stelle in vari settori, con ogni cliente desideroso di avere la propria soluzione su misura.
Parlando di quest’ultimo punto, ovvero la creazione di RAG pienamente funzionanti, nel post di oggi parleremo di a carta che esamina lo stato attuale dell’arte nella costruzione di tali sistemi.
Senza ulteriori indugi, diamo un’occhiata 🔍
Ho iniziato a leggere questo pezzo durante le mie vacanze
ed è un must.
Copre tutto ciò che devi sapere sul framework RAG e sui suoi limiti. Elenca anche le tecniche moderne per migliorarne le prestazioni nel recupero, nell’aumento e nella generazione.
L’obiettivo finale di queste tecniche è rendere questo framework pronto per la scalabilità e l’uso in produzione, in particolare per i casi d’uso e i settori in cui la qualità delle risposte è importante *molto*.
Non discuterò tutto in questo documento, ma ecco le idee chiave che, a mio parere, renderebbero il tuo RAG più efficiente.
Poiché i dati che indicizziamo determinano la qualità delle risposte del RAG, il primo compito è curarli il più possibile prima di acquisirli. (Immondizia in entrata e in uscita vale ancora qui)
Puoi farlo rimuovendo informazioni duplicate/ridondanti, individuando documenti irrilevanti e verificando l’accuratezza dei fatti (se possibile).
Se la manutenibilità del RAG è importante, è necessario aggiungere anche meccanismi di aggiornamento…
Fonte: towardsdatascience.com