Utilizzo della ricerca ibrida, della classificazione gerarchica e dell’incorporamento degli insegnanti per affrontare documenti specifici del dominio che presentano somiglianze con la nostra configurazione RAG.
Carsales è una piattaforma automobilistica leader, al servizio dei mercati delle auto e dei veicoli lifestyle in Australia, Cile, Corea del Sud e Stati Uniti. La nostra ambizione è ridefinire l’esperienza di acquisto e vendita di automobili, stabilendo standard senza precedenti. A tal fine, una delle nostre caratteristiche fondamentali è uno strumento di ricerca completo che analizza decine di migliaia di articoli editoriali relativi alle automobili. Al momento abbiamo integrato la Ricerca Google, adattata esclusivamente per i nostri contenuti editoriali e presentata tramite un iframe, i risultati, sebbene decenti, si basavano principalmente su associazioni lessicali (parole chiave), a volte perdendo la vera essenza o semantica/significato dietro una query di ricerca.
Ad esempio, una ricerca per “Qual è il numero di airbag della Toyota Corolla 2020?” produrrebbe risultati per qualsiasi articolo con le parole “Toyota Corolla e airbag”, ecc. Tuttavia, questi articoli discutono principalmente dei richiami degli airbag piuttosto che del numero effettivo di airbag. C’è una forte richiesta da parte del business non solo di migliorare questo strumento dal punto di vista tecnologico, ma anche di riprogettare la sua interfaccia per renderlo più perfettamente integrato nel nostro sito web, andando oltre un semplice risultato di ricerca di Google in un iframe.
Nel luglio 2023 abbiamo organizzato uno dei nostri hackathon globali semestrali. Questo evento vede in genere la partecipazione di vari dipartimenti in cui vengono formati i team, presentate le idee e, in un periodo ristretto di 3 giorni, vengono trasformate in prototipi funzionanti. Con la crescente importanza dei Large Language Models (LLM), abbiamo identificato un progetto ideale per questo hackathon: rinnovare il nostro strumento di ricerca utilizzando un LLM. Inoltre, abbiamo vinto l’hackathon! Ringraziamo il nostro fantastico team che ha lavorato duramente su questo!
In questo articolo inizieremo delineando il concetto fondamentale del nostro progetto. Successivamente, parleremo del nostro approccio RAG preliminare. Successivamente, evidenzieremo le sfide…
Fonte: towardsdatascience.com